Ratunek dla starodruków poprzez CAPTCHA
CAPTCHA (Completely Automated Public Turing Test to Tell Computers and Humans Apart), powszechnie stosowany przez miliony witryn test do odróżniania ludzi od spambotów podczas czynności rejestracyjnych, może wkrótce pomóc w przenoszeniu zawartości starych książek i pism do postaci elektronicznej.
Amerykańscy badacze z Carnegie Mellon University stworzyli system, który pozwala wykorzystać do tego celu czas spędzany przez miliony internautów codziennie logujących się z użyciem CAPTCHA.
Współczesne systemy OCR, z jakich korzysta się przy automatycznym przenoszeniu tekstu, nie dają sobie rady z rozpoznawaniem starych druków, popełniając kolosalne błędy. Jedyną pewną metodą pozostaje ręczna weryfikacja przez człowieka. Jest to jednak niemal niewykonalne zadanie, w sytuacji gdy do przetworzenia pozostaje jeszcze ponad sto milionów książek.
System znany jako reCAPTCHA wykorzystuje zeskanowane obrazy słów, które okazały się zbyt trudne dla OCR. Gdy użytkownik identyfikuje się na stronie internetowej, jego odpowiedź – tekst uzyskany przez człowieka z obrazka – zostaje wysłany do uniwersyteckiego serwera. By zapewnić poprawność odczytu, obrazek pokazany użytkownikowi składa się faktycznie z dwóch słów, z których jedno jest już rozpoznane. Luis von Ahn, profesor CMU stojący na czele tego projektu, jest przekonany, że pozwoli to uzyskać pewność poprawnej identyfikacji. Jeśli użytkownik poprawnie rozpozna napis znany, istnieje duże prawdopodobieństwo poprawnego rozpoznania przez niego napisu nieznanego. Żeby to zweryfikować, obrazy niezidentyfikowanych słów są używane w więcej niż jednym logowaniu. Jeśli przynajmniej dwa razy uzyskany zostanie identyczny wynik, słowo zostaje zaakceptowane. Jeżeli wyniki będą odmienne, słowo jest dalej wysyłane jako nieznane, aż zostanie uzyskany odpowiednio wysoki odsetek identycznych odpowiedzi.
W chwili obecnej system reCAPTCHA został już wdrożony przez takie witryny, jak Facebook, StumbleUpon i Twitter, a jego wprowadzenie rozważa też Google. Oczekuje się dzięki temu, że system będzie rozpoznawał ponad milion słów dziennie. Odpowiada to ponad trzem tysiącom godzin pracy pojedynczego badacza.
źródło: BBC
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
Nazwa padła ofiarą szantażystów, inni polscy hosterzy też zagrożeni?
22
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Premiera Diablo 3 wzbudziła dyskusję na temat gier, które zawsze chcą być online
19
Nowy problem z Windows 8: bootuje się za szybko
10
Amerykańscy rodzice straszeni „e-narkotykami” dostępnymi w Sieci
21
Anonymous upubliczniają 1,7 GB danych wykradzionych Departamentowi Sprawiedliwości USA
12
Blueseed: libertariańska sztuczna wyspa przyciągnęła już ponad sto startupów z całego świata
8
Rewolucja w Firefoksie, nowa łatka czterokrotnie ograniczyła zużycie pamięci
20
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
CVDazzle: makijaż jest w stanie pokonać automatyczne systemy ulicznego monitoringu
3
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Ubuntu 12.04 LTS już dostępny: stabilna dystrybucja na następne pięć lat?
28
Zostań webmasterem polskiego rządu, zarobisz na komfortowe życie dla siebie i swojej rodziny
33
Społeczność
Daresh A ja na pulpicie nie mam żadnych ikon i nie potrzebuję takich narzędzi :)
buahahaha @xyz: jak będzie wybór między MS ograniczającym wybór a Apple...
xyz @bartez® : Uważasz, że Apple nie ogranicza programistów? buahahaha
anga star za droga ludzie wy myślicie!?Jestem 4 klasistką rodzice się nigdy nie...
Jan Zwyczajnych filmów tak kręcić się nie da co najwyżej krótkie scenki jak w...
piotrek____ @asdfgh - yup, też tak sądzę.
Tak jak wtedy ten przeciek o żołnierzu...
gonzales Javowcy pozdrawiają dotnetowców xD
- Najdmen.pl: Konta www z wyłączonym licznikiem transferu od IONIC.pl (1)
- 2BE.PL: [Oferta] Promocja jak złoto w 2BE.PL (1)
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
Polecane książki
Praca
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |








