publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
skomentuj »

TAGI: wyszukiwarka , deep web , deep peep , kosmix

2009-02-23 11:43  |  Wojciech Wowra

Akademickie projekty indeksują ukryte zasoby Sieci

Akademickie projekty indeksują ukryte zasoby Sieci

Latem 2008 roku wyszukiwarka Google zindeksowała swój bilionowy adres WWW. Ten przełomowy moment miał jednak dla inżynierów z Mountain View nutę goryczy. Ich produkt nadal uwzględnia tylko ułamek danych znajdujących się w Internecie.

Informacje finansowe, katalogi e-sklepów, rozkłady lotów, dane medyczne i wszystkie inne zasoby przechowywane w bazach danych są w wielu wypadkach niewidoczne nawet dla zaawansowanych wyszukiwarek. Nie mają one bowiem dostępu do tak zwanej Głębokiej Sieci – czyli tych wszystkich danych, które są tak przygotowywane, by być dostępnymi tylko dla użytkowników danych serwisów.

Amerykańscy naukowcy pracują nad rozwiązaniami, które mają zrewolucjonizować proces tropienia danych w Internecie. Chodzi nie tylko o podwyższenie jakości dostarczanych linków, ale przekształcenie zasad, na jakich firmy promują się w Sieci i przekazują informacje potencjalnym klientom.

Anand Rajaraman – współzałożyciel firmy Kosmix, startupu zajmującego się zagadnieniami Głębokiej Sieci – uważa, że „Internet, który możemy przeszukiwać przy pomocy zwykłych robotów indeksujących to tylko wierzchołek góry lodowej”. Dlatego Kosmix pracuje nad oprogramowaniem, które pozwoli na analizowanie zawartości publicznych baz danych.

„Naszym celem nie jest znalezienie igły w stogu siana, lecz raczej wspieranie użytkowników w eksploracji tego stogu” – stwierdził Rajaraman. Danych jest jednak bardzo dużo, przeglądanie wszystkiego nie ma sensu. Dlatego tak ważne są technologie semantyczne oraz mechanizmy umożliwiające rozpoznanie poziomu dostępu oferowanego przez poszczególne bazy.

Doskonale rozumie to Google, które pracuje nad własnym rozwiązaniem w tym zakresie. Na czele grupy zadaniowej stoi Alon Halevy, były wykładowca informatyki Uniwersytetu Stanu Waszyngton. Celem jest stworzenie nowej generacji robota indeksującego, który będzie sprawdzał zawartość każdej bazy danych, wysyłając słowa kluczowe powiązane z jej ogólną tematyką.

Podobny projekt realizuje profesor Juliana Freire z Uniwersytetu Stanu Utah. Inicjatywa DeepPeep również bazuje na „zgadywaniu” zawartości baz danych. Trudno mówić w tym wypadku o pełnym rozpoznaniu treści. Profesor Freire twierdzi jednak, że jej mechanizm może zindeksować 90% dowolnego zbioru informacji.

Zapraszamy do zapoznania się z jedną z najskuteczniejszych wyszukiwarek do przeszukiwania Głębokiej Sieci, o której pisaliśmy w listopadzie ubiegłego roku w tekście DeepDyve zanurkuje w Głęboką Sieć.

Źródło: NYTimes.com

publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
skomentuj »

Komentarze

Uwaga! Możesz zarejestrować się w serwisie i w ten sposób zarezerwować swój nick oraz ominąć konieczność ciągłego odczytywania wyrazów.

Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka (słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.

Polecane książki

Czytaj Webhosting

Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.

Zarejestruj domenę

Sprawdź dostępność swojej domeny:

.pl: 0 zł   .com: 19.90 zł
.com.pl: 0 zł   .eu: 19.90 zł