GenAI je možná nejméně důvěryhodný software, který existuje. Přesto se očekává, že mu budeme důvěřovat

12. 6. 2024

Pokud nemůžete věřit výrobku, můžete věřit jeho výrobci?

Důvěra. Klíčové slovo, bavíme-li se o umělé inteligenci. Věří koncoví uživatelé nebo vedoucí pracovníci tomu, co říká generativní umělá inteligence (genAI)? Pravděpodobně ano, jinak by se ji nikdy neobtěžovali používat. Ale je umělá inteligence skutečně důvěryhodná? (Stručně řečeno: Ne, není.)

Pokud využíváte AI pro rozhodování, zkreslila už nějakou odpověď?

Ale ještě, než se budeme zabývat tím, jak důvěryhodné jsou výsledky genAI, začněme tím, jak důvěryhodní jsou vedoucí pracovníci společností, které algoritmy AI vytvářejí. Jde o zásadní otázku. Protože pokud vedoucí IT pracovníci firem nemohou věřit lidem, kteří vytvářejí AI produkty, jak mohou věřit produktům? Jak můžete věřit tomu, co AI říká vašim lidem, věřit tomu, co udělá s jejich dotazy, nebo být v pohodě s tím, co chce AI dělat se všemi vašimi citlivými daty.

Ať se vám to líbí, nebo ne, když používáte jejich software, říkáte, že jste srozuměni s vložením veškeré této důvěry.

Začněme s OpenAI. Dnes by proklamovaná otevřenost měla být uváděna nejspíš raději v uvozovkách. Aby se společnost, která nesdílí zdroje, jež používá k trénování svého modelu, nazývala Open – Otevřenou, je zpochybněním definice tohoto slova. Ale to odbočuji.

Video ke kávě

Máte čas na rychlé a informativní video?

Časopis Artificial Intelligence and Law LiveScience nabídl podrobný pohled na tvrzení společnosti OpenAI, že GPT-4 si vedl skvěle při advokátní zkoušce (UBE, Uniform Bar Exam). Ve skutečnosti to byla lež. Statistická, ale přesto lež.

„Snad nejrozšířenějším úspěchem GPT-4 při spuštění byl jeho údajný 90. percentil při jednotné advokátní zkoušce,“ uvádí publikace a upozorňuje na to, že odhad byl silně zkreslený výsledky opětovných účastníků zkoušek, kteří dosáhli výrazně nižšího skóre než je běžné. „Při zkoumání pouze těch, kteří zkoušku složili – tj. advokátů s licencí nebo advokátů, kteří na licenci čekají – se odhaduje, že výsledky GPT-4 klesnou na 48. percentil celkově a 15. percentil v oblasti esejů.“

Komise rovněž uvedla, že GPT-4 ze své podstaty podvádí. „Ačkoliv zkoušení při UBE nemohou používat jiné zdroje, obrovský tréninkový korpus GPT-4, který je do značné míry jeho podstatou, znamená, že může efektivně absolvovat UBE s přístupem k dalším zdrojům, což naznačuje, že UBE může být nejen přesným ukazatelem právnických schopností, ale také ve výsledcích pravděpodobně zvýhodňuje tyto schopnosti ve prospěch GPT-4 ve srovnání s lidmi.“

Komise došla také k závěru, že GPT-4 si v písemných esejových částech zkoušky vedl poměrně špatně, což by nemělo překvapit toho, kdo už si s GPT-4 nějakou tu větu vyměnil.

„Polovina jednotné advokátní zkoušky se skládá z psaní esejí a zdá se, že GPT-4 dosáhl mnohem nižších výsledků i v jiných zkouškách zahrnujících psaní, jako je AP English Language and Composition (14.-44. percentil), AP English Literature and Composition (8.-22. percentil) a GRE Writing (54. percentil). V každé z těchto tří zkoušek nedosáhl GPT-4 vyššího percentilového výkonu než GPT-3.5 a nedosáhl skóre blízkého 90. percentilu,“ uvádí publikace.

Dále je tu problém s pověstí generálního ředitele společnosti OpenAI Sama Altmana, který byl v loňském roce krátce bývalým generálním ředitelem společnosti. Jedna z členek správní rady, která Altmana vyhodila, nakonec zveřejnila a vysvětlila své důvody: Altman představenstvu lhal – a to hodně.

„Správní rada je nezisková rada, která byla zřízena výslovně za účelem zajištění toho, aby veřejně prospěšné poslání společnosti bylo na prvním místě – nad zisky, zájmy investorů a dalšími věcmi,“ řekla bývalá členka správní rady OpenAI Helen Tonerová v podcastu The TED AI Show. „Ale Sam po léta představenstvu skutečně ztěžoval plnění této úlohy tím, že zatajoval informace, zkresloval věci, které se ve společnosti děly, a v některých případech představenstvu přímo lhal.“

Tonerová uvedla, že Altman několikrát poskytl správní radě „nepřesné informace o malém počtu formálních bezpečnostních procesů, které společnost zavedla“. „U každého jednotlivého případu dokázal Sam vždy přijít s nějakým nevinně znějícím vysvětlením, proč o nic nejde, proč je to špatně interpretováno nebo cokoli jiného. Ale konečný efekt byl takový, že po letech podobných věcí jsme všichni čtyři, kteří jsme ho vyhodili, došli k závěru, že věcem, které nám Sam říkal, prostě nemůžeme věřit, a tak jako představenstvo nemůžeme fungovat – zejména jako představenstvo, které má zajišťovat nezávislý dohled nad společností, a ne jen pomáhat generálnímu řediteli získat další peníze.“

Podívejme se na to v souvislostech. Od chvíle, kdy první firma zřídila a najala do funkce CIO, se vedoucí pracovníci a IT manažeři snažili důvěřovat dodavatelům. Je to v jejich povaze. Nedostatek důvěry v souvislosti s technologiemi tedy není nic nového. Ale umělá inteligence – a konkrétně genAI a všechny její podoby – dostává možnosti a přístup k datům řádově rozsáhlejší než jakýkoli software před ní…

Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

A žádá se po nás, abychom tomuto zcela neomezenému softwaru, který byl vyškolen na rozsáhlém a tajném seznamu zdrojů, poskytli přístup – a to, co se získanými daty dělá, je rovněž nejasné a/nebo tajné.

Co před tím vším chrání firmy? Ochranné bariéry poskytnuté dodavatelem nebo někdy ochranné bariéry vytvořené v rámci IT oddělení dané firmy. Co je ale nejméně překvapivé, společnosti nyní vytvářejí aplikace, které jsou výslovně navrženy tak, aby tyto bariéry obcházely. (A daří se jim to docela efektivně.)

Vezměme si přístup „abliterace“, který je nyní k dispozici na Google Colab a v kurzu LLM na GitHubu. Abliterace je technika, „která dokáže odclonit jakýkoli LLM bez přeškolování. Tato technika účinně odstraňuje vestavěný odmítací mechanismus modelu, což mu umožňuje reagovat na všechny typy podnětů. Toto odmítavé chování je zprostředkováno specifickým směrem v reziduálním proudu modelu.

Pokud modelu znemožníme reprezentovat tento směr, ztratí schopnost odmítat požadavky. Naopak umělé přidání tohoto směru může způsobit, že model bude odmítat i neškodné požadavky.“ To znamená, že bariéry coby ochranné mechanismy lze poměrně snadno zrušit nebo obejít. A to nás přivádí zpět k otázce důvěry v tyto společnosti a jejich vedoucí pracovníky.

S dalšími a dalšími novinkami je stále těžší tuto důvěru zajistit.

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Seriál: Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích

Přečtěte si všechny díly seriálu Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích nebo sledujte jeho RSS

Našli jste v článku chybu?

Sdílet

Pokud využíváte AI pro rozhodování, zkreslila už nějakou odpověď?

Video ke kávě

Rozeznáte fotografii od obrázku vytvořeného umělou inteligencí?

Zakažte Facebooku, aby si na vašich příspěvcích vytrénoval svou AI

Umělá inteligence vládne světu, ale žádá si stále více energie. Můžou pomoct kvantové počítače?

Umělá inteligence ohlídá i třeba kvalitu výroby, říká v coffee breaku Josef Mikuška ze společnosti Konica Minolta

Prudký rozvoj AI nevyhnutelně vede i k rozkvětu jaderné energie. Máme totiž málo proudu

Autor článku

Evan Schuman

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Arrow Electronics v EMEA spouští Cloud Amplification Program

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

GenAI je možná nejméně důvěryhodný software, který existuje. Přesto se očekává, že mu budeme důvěřovat

Sdílet

Pokud využíváte AI pro rozhodování, zkreslila už nějakou odpověď?

Video ke kávě

Rozeznáte fotografii od obrázku vytvořeného umělou inteligencí?

Zakažte Facebooku, aby si na vašich příspěvcích vytrénoval svou AI

Umělá inteligence vládne světu, ale žádá si stále více energie. Můžou pomoct kvantové počítače?

Umělá inteligence ohlídá i třeba kvalitu výroby, říká v coffee breaku Josef Mikuška ze společnosti Konica Minolta

Prudký rozvoj AI nevyhnutelně vede i k rozkvětu jaderné energie. Máme totiž málo proudu

Autor článku

Evan Schuman

Témata:

Mohlo by vás zajímat

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?

Co se dočtete v novém Computerworldu 11/2024?

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Arrow Electronics v EMEA spouští Cloud Amplification Program

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Dále u nás najdete

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Šestka nad čtyřkou? Zastaralé. Čtyřka nad šestkou!

Osvědčené způsoby, jak snížit vysoký krevní tlak

Policie zatkla provozovatele tržiště pro DDoS útoky

Opatrně s kofeinovým práškem, už jedna lžička je životu nebezpečná

Edge zkouší nový trik na uživatele Chromu

Oznámení o osvobozených příjmech: shrnutí povinností

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

V aplikaci Záchranka je rozcestník péče pro nevyléčitelně nemocné

Správná péče o bércové vředy může zabránit zanícení

Chrome OS se zřejmě promění v Android

Balík od DPD si nově můžete vyzvednout i na České poště

Horké nápoje: Zkuste recepty na šest nejznámějších

USA zastavují dodávky pokročilých AI čipů TSMC do Číny

Lumbální punkce sice vypadá děsivě, ale nebolí

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Bezplatný Microsoft PC Manager vylepšen

Kdy začít péct cukroví? Vhodná doba nastává o adventu

Nejlepší dobou, kdy začít péct perníčky, je měsíc před Vánoci