publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
1 skomentuj »

TAGI: recaptcha , ocr , google , captcha , google books , google news

2009-09-17 08:58  |  Adam Golański

Google przejęło projekt reCAPTCHA

Google przejęło projekt reCAPTCHA

Testy CAPTCHA stosowane przez Google nie są złe, ale wielu twórców spambotów zdołało już je obejść. W poszukiwaniu mocniejszych rozwiązań Mountain View zwróciło swoją uwagę na projekt reCAPTCHA – stworzony w Carnegie Mellon University system, który wykorzystuje zeskanowane starodruki jako źródło napisów do testu.

Celem projektu profesora Luisa von Ahna, twórcy testu reCAPTCHA, było nie tylko stworzenie metody skutecznego odróżniania ludzi od maszyn, ale też ratowanie treści starodruków. Wykorzystywane próbki napisów były niezwykle trudne do odtworzenia przez systemy OCR, jednak dla ludzi zwykle nie stanowiło to problemu, a ich poprawne odpowiedzi służyły systemom automatycznego dekodowania tekstów.

reCAPTCHA zawsze przedstawia bowiem użytkownikowi dwa słowa. Pierwsze z nich jest słowem kontrolnym, znanym systemowi, a drugie jest nieznane – i je właśnie musi rozpoznać człowiek, poprawiając błędy OCR. Jeśli dany napis regularnie jest rozpoznawany w określony sposób, wówczas system wprowadza je do swojej listy słów kontrolnych.

Cały system – za nielicznymi wyjątkami – był też dość odporny na próby fałszerstw i znalazł zastosowanie w ponad stu tysiącach liczących się serwisów internetowych.

Tymczasem Google dokonało w ostatnich latach wielkiego dzieła zeskanowania milionów książek w ramach swojego projektu cyfrowej biblioteki – jednak w procesie tym napotkało na wiele przeszkód, których algorytmiczne rozwiązanie nie było łatwe.

Aby wspomóc zatem zarówno Google Books, jak i Google News Archive Search, a także zwiększyć poziom zabezpieczeń swoich usług przed spamerami i oszustami, gigant z Mountain View zdecydował się przejąć cały zespół profesora von Ahna i zaimplementować w całym Google technologię reCAPTCHA.

Źródło: googleblog.blogspot.com

publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
1 skomentuj »

Komentarze

  • Andrzej P. Woźniak

    #1 Andrzej P. Woźniak 2009-09-17 09:17:16 0

    Wyjątki w przełamywaniu reCAPTCHA już się rozpowszechniły, a dowody macie pod nosem we własnym serwisie:

    http://webhosting.pl/Relacja.z.MeetDomainers..spotkania.wlascicieli.domen.internetowych

    Przy okazji - czy tu w ogóle działa jakiś filtr antyspamowy, czy bezmyślnie polegacie tylko na jednym zabezpieczeniu?

    IP: 80.50.127.[...] Mozilla/5.0 (Windows; U; Windows NT 5.0; pl; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3

Uwaga! Możesz zarejestrować się w serwisie i w ten sposób zarezerwować swój nick oraz ominąć konieczność ciągłego odczytywania wyrazów.

Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka (słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.

Polecane książki

Czytaj Webhosting

Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.

Zarejestruj domenę

Sprawdź dostępność swojej domeny:

.pl: 0 zł   .com: 19.90 zł
.com.pl: 0 zł   .eu: 19.90 zł