Nový nástroj Microsoftu zatočí s halucinacemi genAI

2. 10. 2024

Novinka podle výrobce halucinaci nejdřív rozpozná a pak iniciuje její opravu v reálném čase. Lze ji použít s jakýmkoli textovým modelem genAI, včetně modelů Llama společnosti Meta či GPT-4o společnosti OpenAI.

Generativní umělá inteligence (genAI) a „halucinace“ jdou ruku v ruce bez ohledu na to, jak dobře jsou vycvičeny velké jazykové modely, které za nástroji genAI stojí.

Důvěřujete firmám, které s vámi komunikují pomocí AI?

Microsoft proto představil Correction, novou funkci v rámci Azure AI Content Safety, která podle ní dokáže odhalit a následně opravit odpovědi genAI, které nejsou přímo spojeny se zdroji dat použitými k trénování LLM – jinými slovy halucinace.

„Umožnit našim zákazníkům porozumět nepodloženému obsahu a halucinacím a přijmout opatření v případě jejich výskytu je klíčové, zejména proto, že požadavky na spolehlivost a přesnost obsahu generovaného umělou inteligencí stále rostou,“ uvedla společnost v příspěvku na blogu.

Zatímco „přídavné nástroje“ mohou pomoci překontrolovat přesnost výstupů LLM, společnost Gartner zjistila, že prvním krokem ke zmírnění halucinací by mělo být použití lepších vyhledávacích technik pro Retrieval Augmented Generation (RAG) neboli tzv. grounding („uzemnění“), chcete-li se dostat k lepším kontextuálním výsledkům.

RAG je metoda utváření přizpůsobenějšího modelu genAI prostřednictvím série otázek a odpovědí poskytovaných LLM, která umožňuje přesnější a specifičtější odpovědi na dotazy.

Kromě Googlu nabízí nástroje pro monitorování, vyhodnocování a opravu problematických výsledků genAI řada startupů a dalších poskytovatelů cloudových služeb v naději, že se tyto systémové problémy podaří odstranit.

Correction od Microsoftu patří mezi několik novinek, které pracují s Azure AI Evaluation SDK, nástrojem pro hodnocení rizik, a s Hybrid Azure AI Content Safety, SDK pro zpracování AI přímo v zařízení.

Correction je k dispozici jako součást API Microsoft Azure AI Content Safety, které je v současné době k dispozici v preview podobě; lze jej použít s jakýmkoli textovým modelem genAI, včetně modelů Llama společnosti Meta i GPT-4o společnosti OpenAI.

Co se však týče jeho účinnosti, jsou analytici skeptičtí. „Halucinace jsou nadále součástí generativní AI,“ říká analytik společnosti Gartner Jason Wong. „Na trh jsou uváděny produkty, které mají halucinace mírnit, ale žádní z jejich tvůrců neslibují, že je odstraní úplně ani že se díky nim stanou genAI modely přesnými.“

Microsoft poprvé představil svou vlastní funkci pro grounding v březnu. Aby ji mohla nějaká genAI aplikace používat, musí se připojit k dedikovaným dokumentům a RAG Q&A scénářům. Zákazníci se prý od té doby dotazují, co mohou po zjištění chybných informací dělat, mimo jejich zablokování.

Video ke kávě

Máte čas na rychlé a informativní video?

„Ukazuje se, že jde o zásadní výzvu v rychle se vyvíjejícím prostředí generativní umělé inteligence, kde tradiční obsahové filtry často nedokážou řešit specifická rizika spojená s halucinováním umělé inteligence,“ uvádí Katelyn Rothneyová, senior manažerka produktového marketingu společnosti Microsoft.

Nástroj Correction vycházející ze stávajících řešení pro grounding umožňuje Azure AI Content Safety identifikovat i opravovat halucinace v reálném čase – dříve, než se s nimi uživatelé aplikací generativní AI setkají.

Funguje tak, že nejprve označí „neuzemněný“ obsah. Poté systém Azure Safety zahájí proces přepisování v reálném čase, aby opravil nepřesné části a zajistil soulad s připojenými zdroji dat.

„K této opravě dochází ještě předtím, než uživatel může vidět původní nepodložený obsah,“ říká Rothneyová. K uživateli se tak dostane už opravený obsah.

Halucinogenní povaha genAI technologií je dána tím, že jejich základní modely jsou založeny na masivních, amorfních, nekonkrétních parametrech nebo možnostech, ze kterých může algoritmus vybírat odpovědi.

A ačkoli genAI většinou poskytuje velmi přesné odpovědi, je také náchylná k tomu, aby sbírala informace z míst, ve kterých je sbírat nemá, jen aby mohla poskytnout odpověď. Jakoukoli odpověď.

Pravda je, že LLM už byly označeny i jako „stochastičtí papoušci“ – čím jsou větší, tím jsou jejich odpovědi více domnělé nebo náhodnější. V podstatě jen předpovídají slova a pokračují v papouškování toho, co se naučily, avšak bez logického rámce.

Studie Stanfordovy univerzity z letošního roku zjistila, že genAI dělá chyby při zodpovídání právních otázek v 75 % případů. „Například,“ uvádí studie, „v úloze měřící precedenční vztah mezi dvěma různými soudními případy si většina LLM nevede lépe než při náhodném hádání.“

Optimalizace vyhledávací infrastruktury začleněním lexikálního i sémantického vyhledávání zvyšuje pravděpodobnost, že LLM budou předány pouze relevantní informace, uvedl Wong.

„I když to však může výrazně snížit pravděpodobnost halucinací, stále je to nemůže vyloučit,“ řekl. „Kvalita informací vyhledaných pro RAG do značné míry určuje kvalitu výstupu, a tak je výchozím předpokladem pro minimalizaci halucinací kvalitní obsahový management a řízení.“

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Našli jste v článku chybu?

Sdílet

Důvěřujete firmám, které s vámi komunikují pomocí AI?

Nejkritičtější zranitelnosti velkých jazykových modelů

Video ke kávě

Generativní umělou inteligenci si v příštích dvou letech osvojí 85 % vývojářů softwaru

Autor článku

Lucas Mearian

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Raspberry Pi: jaké příslušenství zvolit pro začátek?

NIS 2: Posílení kybernetické bezpečnosti se firmy nevyhnou

Eset: Češi riskují s daty, podceňují zálohy i bezpečnost

Datová inteligence: Klíč nejen ke konkurenční výhodě

Jak mohou zasáhnout agenti AI, když důvěra spotřebitelů klesá

eD system bodoval u HPE, je distributorem roku v oblasti SBP

Pokuty za spam dramaticky (možná) vzrostou. Můžou být likvidační

Jakou představu mají Češi o ideálním čistém měsíčním platu?

T-Mobilu mírně klesly tržby, spotřeba dat dál stoupá dvouciferně

Nový nástroj Microsoftu zatočí s halucinacemi genAI

Sdílet

Důvěřujete firmám, které s vámi komunikují pomocí AI?

Nejkritičtější zranitelnosti velkých jazykových modelů

Video ke kávě

Generativní umělou inteligenci si v příštích dvou letech osvojí 85 % vývojářů softwaru

Autor článku

Lucas Mearian

Témata:

Mohlo by vás zajímat

Co se dočtete v novém Computerworldu 11/2024?

Facebook a Instagram vrací do hry rozpoznávání obličeje, aby nás „chránily“

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Raspberry Pi: jaké příslušenství zvolit pro začátek?

NIS 2: Posílení kybernetické bezpečnosti se firmy nevyhnou

Eset: Češi riskují s daty, podceňují zálohy i bezpečnost

Datová inteligence: Klíč nejen ke konkurenční výhodě

Jak mohou zasáhnout agenti AI, když důvěra spotřebitelů klesá

eD system bodoval u HPE, je distributorem roku v oblasti SBP

Pokuty za spam dramaticky (možná) vzrostou. Můžou být likvidační

Jakou představu mají Češi o ideálním čistém měsíčním platu?

T-Mobilu mírně klesly tržby, spotřeba dat dál stoupá dvouciferně

Dále u nás najdete

Osvědčené způsoby, jak snížit vysoký krevní tlak

Starlink pronikl do zóny rádiového klidu, kde nesmí být ani Wi-Fi

Roční poplatky: Endokrinologie chce pětistovku, praktici tisíc korun

Pirátský web Hellspy je zpět. Plný filmů a seriálů ke stažení

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Jak Mikýř vyděsil Novu, ale nakonec vydělaly obě strany

Jak českým firmám pomáhá digitální transformace?

Policie zatkla provozovatele tržiště pro DDoS útoky

Padá vám Outlook? Zkuste tyto jednoduché kroky!

Nejen Coca-Cola, ale i Lidl má červený vánoční kamion

Balík od DPD si nově můžete vyzvednout i na České poště

Nová centrální evidence srážek ze mzdy

Na svátek 17. listopadu to s nákupy nebude moc složité

Jak ovlivní průměrná a minimální mzda zdanění zaměstnanců?

Českou husu musíte objednávat i rok dopředu. V obchodech teď koupíte jen ty zahraniční

Blíží se uplatnění slevy na manžela za rok 2024

Krevní skupiny a nemoci: „nulám“ hrozí vředy, „áčka“ chytí malárii

Změny v dárcovství: za spermie 2 tisíce, za vajíčka 28 tisíc

Nemocenské pojištění 2025: Co se změní?

Člověk může bez souhlasu skončit v nemocnici nejen na psychiatrii