DeepMind vyvinul AI agenty, kteří napodobují sociální učení

8. 12. 2023

Sdílet

 Autor: PCWorld s využitím DALL-E
Výzkumníkům z DeepMind, dceřiné společnosti Googlu, se podařilo napodobit sociální učení vyskytující se u lidí a zvířat, které umožnilo jejich evoluční vývoj – v případě lidí například akvizici znalostí a zdokonalování nástrojů nutných pro přežití.

Studie Learning few-shot imitation as cultural transmission byla přímo inspirována poznatky evoluční psychologie a antropologie o principech kulturní evoluce a o předávání poznatků a dovedností napříč generacemi, s motivací naučit to také AI agenty. DeepMind integraci kulturního přenosu a sociálního učení do AI agentů chápe jako dílčí cíl pro dosažení umělé obecné inteligence (AGI).

Využití AI ve veřejném sektoru

Výsledky výzkumu přispějí k řešení problémů, které doprovázejí nyní běžnou metodu učení agentů RLHF (Reinforcement Learning from Human Feedback), která je náročná na čas a zdroje. Výzkumníci DeepMind hledali inspiraci v sociálním učení u lidí a snažili se ukázat, že AI agenti se mohou analogicky učit i od jiných entit, ať už to jsou lidé nebo další AI agenti. To bude podstatné pro aplikace umělé inteligence v reálném světě, například v robotech pro domácnosti, sociální péči nebo stavebnictví.

Výzkumníci prováděli experimenty v počítačově simulovaném prostoru nazvaném GoalCycle3D, což je fyzické prostředí s chodníky a překážkami, které sloužilo jako „zkušení hřiště“ pro AI agenty. Ti se učili jen na základě pozorování dalších AI agentů, kteří se v tomto prostředí pohybovali a byli vybavení expertními znalostmi pro řešení daných úloh. 

Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

Výsledky ukázaly, že AI agenti jsou schopni úspěšně napodobit chování dalších agentů a v reálném čase aplikovat tyto poznatky v nových prostředích a kontextech, což demonstruje účinnost navrhovaného přístupu. Klíč k úspěchu spočíval v tom, že tým vycvičil AI agenty tak, aby byli schopni identifikovat v prostředí „experty“ a napodobit jejich chování a uchovat si získané znalosti. Tento proces probíhal, aniž by se spoléhali na lidská data, což šetří zdroje a umožňuje tyto postupy škálovat.

bitcoin školení listopad 24

Kulturní přenos mezi AI agenty jako cesta k AGI

Výzkum, který navazuje na předchozí studie sociálního učení, identifikoval jednoduchý soubor komponent, které usnadňují přenos informací mezi AI agenty. V této minimální „startovací sadě“ pro vznik kulturního přenosu se nachází 1. paměť, 2. expert (např. další AI agent disponující expertními znalostmi pro vyřešení úlohy), 3. mechanismus (bias) zaměřující pozornost na další expertní agenty, 4. automatické a náhodné vstupy těchto agentů-expertů do daného prostředí, 5. automatická randomizace domén (zajišťující heterogenitu výukového prostředí). Výzkumníkům se mimo jiné podařilo také identifikovat umělé neurony, které jsou zodpovědné za procesy sociálního učení.

Přes relativní jednoduchost simulovaného prostředí i úloh, které AI agenti prováděli, se jedná první kroky ke kulturní evoluci umělé inteligence, která bude hrát klíčovou roli při vývoji obecné AI, neboť AI agenti budou schopni hromadit znalosti a dovednosti napříč generacemi stejně jako lidé a učit se ve smíšených prostředích, v nichž jsou přítomni další účastníci – jak lidé, tak další AI agenti. Právě interdisciplinární přístup, kombinující AI a evoluční psychologii, slibuje odhalení nových poznatků při hledání AGI.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.