Data z on-line her mají pomoci zdokonalit ochranu CAPTCHA

20. 5. 2008

Sdílet

Jak naučit internetové vyhledávače rozpoznávat a odpovídajícím způsobem rozpoznávat, respektive indexovat obrázky nebo zvuk? Jednou z možností je vyjít z toho, jak grafickou nebo zvukovou informaci spojují s jazykem lidé.

Jak naučit internetové vyhledávače rozpoznávat a odpovídajícím způsobem rozpoznávat, respektive indexovat obrázky nebo zvuk? Jednou z možností je vyjít z toho, jak grafickou nebo zvukovou informaci spojují s jazykem lidé.

Data, která by se dala použít k učení softwaru, lze získat z lidských reakcí. Luis von Ahn z Carnegie Mellon University v Pittsburghu vymyslel za tímto účelem několik her. V jedné z nich hráči napíší, jaká slova podle nich nejlépe vystihují zobrazený obrázek (a pak se snaží svá slova navzájem uhodnout; jako data, „tagy“ pro obrázek, se pak použijí i neúspěšné pokusy). V jiné variantě se zase několika slovy charakterizují audiosoubory. Hráči pak mají svůj popis a popis protihráče a jejich porovnáním mají uhodnout, zda oba poslouchali stejný soubor.
Ahnovým cílem ale není jen to, aby počítače zdokonalil, ale jde mu i o rozpoznání jejich omezení, respektive odlišností od lidských reakcí. Na základě jeho výzkumu by měly být vyvinuty dokonalejší varianty ochrany CAPTCHA. Tato metoda je v současné podobě prostřednictvím útoků robotů značně zranitelná, přesto se však k ochraně internetových formulářů používá a podle všeho bude používat i nadále. Mohlo by být např. zajímavé nepožadovat přepsání textu z obrázku, ale chtát napsat, co na obrázku je.
Příslušné hry se hrají na stránce www.gwap.com a úspěch projektu samozřejmě závisí na tom, kolik lidí bude ochotno se bavit hraním hry, která má ještě další smysl.

Zdroj: New Scientist

Viz také:
Ochranu CAPTCHA Hotmailu lze prolomit za 6 sekund

CAPTCHA je v jistém ohledu variantou Turingova testu. Zkratka znamená Completely Automated Public Turing Test to Tell Computers and Humans Apart.

Autor článku