Akademickie projekty indeksują ukryte zasoby Sieci
Latem 2008 roku wyszukiwarka Google zindeksowała swój bilionowy adres WWW. Ten przełomowy moment miał jednak dla inżynierów z Mountain View nutę goryczy. Ich produkt nadal uwzględnia tylko ułamek danych znajdujących się w Internecie.
Informacje finansowe, katalogi e-sklepów, rozkłady lotów, dane medyczne i wszystkie inne zasoby przechowywane w bazach danych są w wielu wypadkach niewidoczne nawet dla zaawansowanych wyszukiwarek. Nie mają one bowiem dostępu do tak zwanej Głębokiej Sieci – czyli tych wszystkich danych, które są tak przygotowywane, by być dostępnymi tylko dla użytkowników danych serwisów.
Amerykańscy naukowcy pracują nad rozwiązaniami, które mają zrewolucjonizować proces tropienia danych w Internecie. Chodzi nie tylko o podwyższenie jakości dostarczanych linków, ale przekształcenie zasad, na jakich firmy promują się w Sieci i przekazują informacje potencjalnym klientom.
Anand Rajaraman – współzałożyciel firmy Kosmix, startupu zajmującego się zagadnieniami Głębokiej Sieci – uważa, że „Internet, który możemy przeszukiwać przy pomocy zwykłych robotów indeksujących to tylko wierzchołek góry lodowej”. Dlatego Kosmix pracuje nad oprogramowaniem, które pozwoli na analizowanie zawartości publicznych baz danych.
„Naszym celem nie jest znalezienie igły w stogu siana, lecz raczej wspieranie użytkowników w eksploracji tego stogu” – stwierdził Rajaraman. Danych jest jednak bardzo dużo, przeglądanie wszystkiego nie ma sensu. Dlatego tak ważne są technologie semantyczne oraz mechanizmy umożliwiające rozpoznanie poziomu dostępu oferowanego przez poszczególne bazy.
Doskonale rozumie to Google, które pracuje nad własnym rozwiązaniem w tym zakresie. Na czele grupy zadaniowej stoi Alon Halevy, były wykładowca informatyki Uniwersytetu Stanu Waszyngton. Celem jest stworzenie nowej generacji robota indeksującego, który będzie sprawdzał zawartość każdej bazy danych, wysyłając słowa kluczowe powiązane z jej ogólną tematyką.
Podobny projekt realizuje profesor Juliana Freire z Uniwersytetu Stanu Utah. Inicjatywa DeepPeep również bazuje na „zgadywaniu” zawartości baz danych. Trudno mówić w tym wypadku o pełnym rozpoznaniu treści. Profesor Freire twierdzi jednak, że jej mechanizm może zindeksować 90% dowolnego zbioru informacji.
| Zapraszamy do zapoznania się z jedną z najskuteczniejszych wyszukiwarek do przeszukiwania Głębokiej Sieci, o której pisaliśmy w listopadzie ubiegłego roku w tekście DeepDyve zanurkuje w Głęboką Sieć. |
Źródło: NYTimes.com
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
Nazwa padła ofiarą szantażystów, inni polscy hosterzy też zagrożeni?
22
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Premiera Diablo 3 wzbudziła dyskusję na temat gier, które zawsze chcą być online
19
Nowy problem z Windows 8: bootuje się za szybko
10
Amerykańscy rodzice straszeni „e-narkotykami” dostępnymi w Sieci
21
Anonymous upubliczniają 1,7 GB danych wykradzionych Departamentowi Sprawiedliwości USA
11
Blueseed: libertariańska sztuczna wyspa przyciągnęła już ponad sto startupów z całego świata
8
Rewolucja w Firefoksie, nowa łatka czterokrotnie ograniczyła zużycie pamięci
20
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
CVDazzle: makijaż jest w stanie pokonać automatyczne systemy ulicznego monitoringu
3
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Ubuntu 12.04 LTS już dostępny: stabilna dystrybucja na następne pięć lat?
28
Zostań webmasterem polskiego rządu, zarobisz na komfortowe życie dla siebie i swojej rodziny
33
Społeczność
Doniek Szkoda że strona z demo nie działa - non stop się przeładowuje
bartez Niech zaczną jeszcze bardziej ograniczać programistów, to zdziwią się ilu...
Dave Smith Jestem Pastor Dave Smith prywatny pożyczkodawca pieniądze, z czego ponad...
marcusm Fajna reklama produktu za 500 zł
rza a to starsze aplikacje nie będą działać i kompilacja pod Windows SDK 7.1...
Krzaczor @Jakub Szymański: Możesz zalinkować do opisów jakichś polskich przypadków...
Krzaczor Ale oprogramowanie skompilowane dla Windows 7 ruszy przecież na ósemce...
- Najdmen.pl: Konta www z wyłączonym licznikiem transferu od IONIC.pl (1)
- 2BE.PL: [Oferta] Promocja jak złoto w 2BE.PL (1)
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
Polecane książki
Praca
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |








