Zhruba miliarda veřejně dostupných instagramových fotografií. S takovým množstvím fotek pracují vývojáři Facebooku s cílem vyvinout algoritmus, který by se naučil sám automaticky rozeznávat jejich obsah. V čem je tento přístup unikátní?
Algoritmy umělé inteligence jsou běžně „cvičeny“ na datových setech předem kategorizovaných lidmi a mají tak na výběr z předem definovaných množin. V tomto případě však byly fotografie z Instagramu předloženy algoritmu bez takového předchozího zaškatulkování. Přesnost, s jakou byl jejich obsah správně identifikovat, dosáhla 84,5 %, tvrdí Facebook, který nový systém nazval Seer – Jasnovidec.
Podle odborníka na umělou inteligenci Caluma Chase může takový systém představovat „významný krok k nalezení svatého grálu počítačů se selským rozumem,“ pakliže se ukáže efektivní i v dlouhodobém časovém horizontu. Facebook přitom není jedinou firmou, která na podobném algoritmu pracuje.
Podobně soběstačná technologie už v minulosti prokázala výsledky při zpracování jazyka, fotografie a obrázky však představují větší výzvu. Jednotlivá slova je totiž snazší rozpoznat než rozdílné části obrázku, který se může skládat z více takovýchto částí (slov), navíc uspořádaných nepravidelně.
„Algoritmus musí umět určit, jaký pixel patří které části. Navíc, tento přístup se zákonitě mezi rozdílnými fotografiemi liší, jelikož i když budete hodnotit fotky kočky, na každé bude zachycená v jiné poloze a z jiného úhlu,“ uvádí Facebook na firemním blogu.
Trénování algoritmů na datových setech, které nebyly nejdřív kategorizovány lidmi, navíc může dle Facebooku přispět k jejich přesnosti a neutralitě. Jak totiž ukázala loňská studie vedená Leibnizovým institutem sociálních věd na univerzitě v německém Kolíně nad Rýnem, dokonce i počítačový program má předsudky – rozpoznávací software Googlu, Microsoftu i Amazonu hodnotil odlišným stylem fotografie mužů a fotografie žen, u nichž si více všímal fyzických rysů.
„Této předpojatosti vycházející z lidského vlivu se sice možná půjde zbavit, ale nic jako nezaujatá neutrální data neexistuje. Proto bude důležité pochopit, na základě čeho algoritmus činí svá rozhodnutí a kategorizace,“ komentovala pro BBC výzkum Facebooku profesorka Sandra Wachterová z Oxfordského internetového institutu.