DeepDyve zanurkuje w Głęboką Sieć
W kwietniu bieżącego roku Google zapowiedziało, że zindeksuje tzw. Głęboką Sieć (ang. Deep Web, Hidden Web), czyli te zasoby Internetu, które normalnie nie są dostępne dla wyszukiwarek. Prace nad tym trwają. Tymczasem w tej dziedzinie firmie z Mountain View wyrósł niespodziewanie poważny konkurent. Wyszukiwarka DeepDyve, która powstała m.in. dzięki technologiom opracowanym na potrzeby Human Genome Project, to darmowe narzędzie do przeszukiwania baz danych, periodyków naukowych, nieustrukturyzowanej informacji i tych wszystkich źródeł danych, do których Googlebot wciąż nie potrafi zajrzeć.
Nowa wyszukiwarka wcześniej znana była jako Infovell. Teraz skupia całą swoją moc na naukach biologicznych, bazach patentów i danych z Wikipedii – do tej pory zindeksowała już pół miliarda poświęconych temu stron. Jednak to nie koniec – już wkrótce zajmie się indeksowaniem treści związanych z naukami fizycznymi, szczególnie w obszarach IT, ekologii i energetyki. Do końca roku indeks DeepDyve ma urosnąć do miliarda stron.
William Park, dyrektor generalny DeepDyve, powiedział, że według badań firmy analitycznej IDC ponad 42 miliony klientów spędza 25 godzin miesięcznie w Sieci na wyszukiwaniu informacji biznesowych i osobistych – a rezultaty, jakie uzyskują, oraz narzędzia, z których muszą korzystać, przynoszą im tylko frustrację. Park stwierdził zatem: „DeepDyve udostępnia wymagającym klientom jakościową informację, którą znaleźć można tylko w Ukrytej Sieci, wraz z funkcjonalnościami pozwalającymi na łatwe znalezienie, przefiltrowanie i zorganizowanie wyników”.
Celem DeepDyve jest doprowadzenie tej technologii do takiego stanu, by po wpisaniu kilku słów albo wklejeniu całego nawet artykułu z danej dziedziny do paska wyszukiwania użytkownicy byli w stanie znaleźć wszystkie powiązane artykuły w Głębokiej Sieci. W tym celu wykorzystywany jest algorytm o nazwie KeyPhrases, indeksujący fragmenty tekstu składające się nawet z 20 słów. Początkowo technologia ta została stworzona dla rozpoznawania długich łańcuchów DNA, dlatego nie ma niczego wspólnego z zagadnieniami semantycznymi. Park powiedział: „Jedyne, co tu zachodzi, to dopasowywanie wzorców, KeyPhrases jest bowiem całkowicie niezależny od języka”.
Wyszukiwanie w DeepDyve.
Dzięki tej technologii wyszukiwanie może bazować na dużej liczbie znaków – może ich być nawet 25 000. Dla porównania: Google Scholar pozwala na kwerendy składające się maksymalnie z 32 słów. – „Jeśli szukasz sekwencji dla niebieskich oczu, może być ona bardzo długa, dlatego zapytanie nie może być krótkie” – wyjaśnił Park. Algorytm będzie skanował całe łańcuchy tekstu pod kątem znajomych segmentów, szeregował je pod kątem zadanych kryteriów, a finalnie lokalizował najbardziej odpowiedni artykuł spośród tych, w których daną treść znaleziono. – „To czysta statystyka, podobnie jak to jest w genomice” – podsumował Park.
Nowa wyszukiwarka oczywiście nie zastąpi Google'a, ale dla ludzi na poważnie zajmujących się nauką, techniką czy kulturą może być prawdziwym wybawieniem – wiedza, którą można znaleźć w Sieci, wciąż jest jedynie niewielkim ułamkiem tego, co zostało np. wydane w periodykach naukowych.
źródło: TechWorld.com
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
Nazwa padła ofiarą szantażystów, inni polscy hosterzy też zagrożeni?
22
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Premiera Diablo 3 wzbudziła dyskusję na temat gier, które zawsze chcą być online
19
Nowy problem z Windows 8: bootuje się za szybko
10
Amerykańscy rodzice straszeni „e-narkotykami” dostępnymi w Sieci
21
Anonymous upubliczniają 1,7 GB danych wykradzionych Departamentowi Sprawiedliwości USA
11
Blueseed: libertariańska sztuczna wyspa przyciągnęła już ponad sto startupów z całego świata
8
Rewolucja w Firefoksie, nowa łatka czterokrotnie ograniczyła zużycie pamięci
20
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
CVDazzle: makijaż jest w stanie pokonać automatyczne systemy ulicznego monitoringu
3
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Ubuntu 12.04 LTS już dostępny: stabilna dystrybucja na następne pięć lat?
28
Zostań webmasterem polskiego rządu, zarobisz na komfortowe życie dla siebie i swojej rodziny
33
Społeczność
Dave Smith Jestem Pastor Dave Smith prywatny pożyczkodawca pieniądze, z czego ponad...
marcusm Fajna reklama produktu za 500 zł
rza a to starsze aplikacje nie będą działać i kompilacja pod Windows SDK 7.1...
Krzaczor @Jakub Szymański: Możesz zalinkować do opisów jakichś polskich przypadków...
Krzaczor Ale oprogramowanie skompilowane dla Windows 7 ruszy przecież na ósemce...
ankaa Ja to czytam "plejsnow", a nie placek nał :) Nie wiem, co macie z tym...
veramird Są jeszcze studenci i msdaa co pozwoli dużej grupie używać pisać dalej za...
- Najdmen.pl: Konta www z wyłączonym licznikiem transferu od IONIC.pl (1)
- 2BE.PL: [Oferta] Promocja jak złoto w 2BE.PL (1)
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
Polecane książki
Praca
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |









