System reCAPTCHA wykorzystuje zeskanowane obrazy słów, które okazały się zbyt trudne dla OCR-u. Gdy użytkownik identyfikuje się na stronie internetowej, jego odpowiedź – tekst uzyskany przez człowieka z obrazka – zostaje wysłany do uniwersyteckiego serwera. By zapewnić poprawność odczytu, obrazek pokazany użytkownikowi składa się faktycznie z dwóch słów, z których jedno jest już rozpoznane.
- Teraz uczeni przedstawili efekty działania swojego programu, wdrożonego na przynajmniej kilkudziesięciu tysiącach witryn w Internecie (w tym i naszej, Webhosting.pl). Okazuje się, że dzięki reCAPTCHA użytkownicy dokonują transkrypcji 160 książek dziennie, z ponad 99% dokładnością, mimo że większość z nich nie ma pojęcia, że uczestniczy tym samym w jakiejkolwiek użytecznej pracy.
Każdego dnia na stronach serwisów korzystających z tego systemu rozwiązuje się ponad 100 milionów testów CAPTCHA i choć każdemu z użytkowników zajmuje to zaledwie kilka sekund, przekłada się to setki tysięcy godzin ludzkiej pracy. Przez pierwszy rok działania systemu rozwiązano łącznie ponad 1,2 miliarda testów, co przełożyło się na odcyfrowanie 440 milionów słów i w konsekwencji ocalenie ponad 17 600 książek.
- Von Ahn stwierdził, że coraz więcej witryn internetowych przechodzi na reCAPTCHA, wzrasta w związku z tym tempo odcyfrowań. By dorównać efektom tygodnia działania systemu, potrzeba by ponad 1500 osób pracujących 40 godzin w tygodniu z szybkością 60 słów na minutę. Książki w ten sposób ocalone trafiają z powrotem do Internet Archive, gdzie mogą być z łatwością indeksowane, przeszukiwane i udostępniane w postaci równie wygodnej jak wspólczesne teksty spotykane w Sieci.
Profesor von Ahn dodał też, że projekt cyfryzacji starych książek i gazet jest oczywiście czymś samym w sobie wartym uwagi, ale stanowi jedynie część większego projektu. Jego zespołowi chodzi bowiem o pokazanie, że można wykorzystać ludzki wysiłek – który w przeciwnym wypadku byłby marnowany – do realizowania celów będących niemożliwymi do wykonania dla komputerów. Przykładem takich projektów mają być gry sieciowe, dostępne na stronie www.gwap.com, które wykorzystują wysiłek graczy do analizowania zawartości fotografii i nagrań dźwiękowych. Podobny projekt uruchomili też biolodzy z Uniwersytetu Waszyngtońskiego – gra fold.it pozwala grupom ludzi rywalizować w stworzeniu idealnej struktury danego białka.
- Osoby zainteresowane wykorzystaniem projektu reCAPTCHA w swoim serwisie mogą zapoznać się z jego dokumentacją na reCAPTCHA Wiki oraz pobrać pliki instalacyjne pod adresem recaptcha.net/resources.html.
- źródło: ScienceDaily.com
Ładowanie





Można by coś takiego zrobić i dla polskich stron :)
I też zacznę korzystać z reCaptchy przy swoich projektach :)
Browser:
dAREuS
Browser:
Browser:
Browser:
Browser:
Browser:
Browser:
Browser:
Browser:
Browser:
Browser: Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.9.0.9) Gecko/2009040821 Firefox/3.0.9
Browser: Mozilla/5.0 (X11; U; Linux i686; pl-PL; rv:1.9.1.3) Gecko/20091020 Ubuntu/9.10 (karmic) Firefox/3.5.3