Google kupuje reCaptcha, cílem je digitalizace knih

17. 9. 2009

Sdílet

Google kupuje společnost reCaptcha, jež nabízí technologie pro ochranu diskusních fór i přihlašování ke službám před spamovacími roboty. Nejpoužívanější technologií firmy je klasické opisování textu z obrázku. Její řešení dnes používá asi 100 000 webových serverů.

Cílem Googlu je v tomto případě především získat technologii použitelnou pro digitalizaci knih (projekt Internet Archive a Google Books) a dalších textů (chystaný Google News Archive). Uživateli se zadá text, který měl automaticky pracující OCR software problém rozpoznat při skenování (např.) knihy. Kromě toho dostane uživatel za úkol rozpoznat ještě text, který je známý. Pokud druhý úkol vyřeší správně, systém mu uvěří i v prvním případě a jeho řešení se doplní do digitalizované knihy.

Postup podrobněji popisuje článek CAPTCHA žije a navíc pomůže při digitalizaci knih.