Lepší strojové učení: Méně zkratek, více dat

3. 11. 2021

Sdílet

 Autor: Depositphotos
Nová metoda nutí modely strojového učení brát více v úvahu čistá data a omezuje nežádoucí zjednodušující charakteristiky datasetu, které výsledný algoritmus ovlivňují.

Nová studie vědců z MIT se zaměřuje na samotný proces trénování modelů strojového učení. Podívejme se třeba na jednoduchý dataset, ze kterého se model učí rozpoznávat krávy. Ty by v celé řadě případů mohl určovat nikoli podle tvaru, barvy apod. krávy samotné, ale třeba pomocí přítomnosti zelené trávy; což je něco, co v budoucnu může vést k mylným identifikacím a nesprávným výsledkům.

Studie se problémem těchto zkratek v trénování AI modelů zabývá, a omezuje je tím, že model nutí důsledněji využívat dostupná data. Konkrétně se vědci zabývali formou učení bez učitele, kde je model trénovat z velkých datasetů bez připravených informací a popisků od lidí.

Jde o dvojí postup: Vědci model nutí vyřešit problém, kupříkladu právě rozpoznání krávy, dvěma způsoby – nejprve pomocí identifikace jednodušších prvků, jako je zelená tráva nebo modrá obloha, a poté těch komplexnějších, jako je vzhled krávy samotné. V praxi tím chtějí výzkumníci omezit zmíněnou zkratkovitost některých AI modelů.

bitcoin_skoleni

Výrazný potenciál přináší studie do oblasti zdravotnické informatiky. Modely strojového učení jsou velice perspektivní v oblasti identifikace onemocnění a anomálii na rentgenových a jiných snímcích, nicméně nesprávná diagnóza může pacienty přímo ohrozit na životě. Podobná metodika, jakou navrhli vědci z MIT, by mohla potenciální falešně pozitivní (či negativní) výsledky omezit na minimum.

Teoreticky také studie přinese hlubší poznatky o tom, proč se algoritmy hlubokého učení rozhodují tak, jak se rozhodují, což není vždy snadné určit.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.