Meta představila nástroje, které zvýší bezpečnost generativní AI

15. 12. 2023

Projekt Purple Llama, jehož cílem je vytvořit pro vývojáře open source nástroje, které umožní vyhodnotit důvěryhodnost a bezpečnost generativních modelů umělé inteligence ještě před jejich veřejným nasazením, představila Meta.

Firma tak podle svých slov chce vytvořit společný základ pro vývoj bezpečnější generativní AI, protože obavy z velkých jazykových modelů a dalších technologií AI narůstají a svět se začíná stále více přesouvat k regulaci, která obvykle představuje zbrzdění vývoje v dané oblasti.

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Projekt zahrnuje partnerství s vývojáři umělé inteligence, cloudovými službami, jako jsou AWS nebo Google Cloud, dále s výrobci polovodičových součástek, jako jsou Intel, AMD a Nvidia, či se softwarovými firmami včetně Microsoftu. Vzniklé nástroje budou schopné testovat schopnosti modelů AI a identifikovat případná bezpečnostní rizika.

Mezi první sadu nástrojů v rámci projektu Purple Llama patří produkt CyberSecEval. Ten vyhodnocuje rizika kybernetické bezpečnosti v softwaru vytvářeném umělou inteligencí. Obsahuje jazykový model, který identifikuje nevhodný nebo škodlivý text, včetně diskusí o násilí nebo nezákonných činnostech.

Vývojáři mohou pomocí řešení CyberSecEval otestovat, zda jimi vytvářené modely umělé inteligence nejsou náchylné k vytváření nezabezpečeného kódu nebo k napomáhání kybernetickým útokům.

Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

Podle výzkumníků Mety totiž modely LLM často navrhují zranitelný kód, což zdůrazňuje důležitost neustálého testování a zlepšování bezpečnosti AI.

Dalším nástrojem v této sadě je pak Llama Guard, velký jazykový model vyškolený k identifikaci potenciálně škodlivé nebo útočné mluvy.

Vývojáři tak mohou otestovat, zda jejich modely dokážou vytvářet nebo přijímat nebezpečný obsah, což omezí možnosti toho, že jejich LLM povedou k nevhodným výstupům AI.

Security World si můžete koupit i jako klasický časopis, buď v klasické tištěné formě nebo v elektronické verzi. Věnujeme se bezpečnosti počítačových systémů, ochraně dat, informací a soukromí. Jsme jediný titul na českém a slovenském trhu, který oslovuje širokou čtenářskou obec – od ředitelů firem, přes odborníky na bezpečnost po koncové uživatele. Naším cílem je poskytnout ucelený přehled o bezpečnostních hrozbách a zejména o tom, proč a jak se jim bránit, případně proč respektovat a dodržovat nařízení IT manažerů ve firmách.

Našli jste v článku chybu?

Sdílet

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Autor článku

Pavel Louda

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Arrow Electronics v EMEA spouští Cloud Amplification Program

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Meta představila nástroje, které zvýší bezpečnost generativní AI

Sdílet

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Autor článku

Pavel Louda

Témata:

Mohlo by vás zajímat

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?

Co se dočtete v novém Computerworldu 11/2024?

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Canalys: Příprava na AI je v plném proudu, investice do cloudové infrastruktury vystřelily o 21 %

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

Arrow Electronics v EMEA spouští Cloud Amplification Program

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Dále u nás najdete

Bezplatný Microsoft PC Manager vylepšen

Policie zatkla provozovatele tržiště pro DDoS útoky

Oznámení o osvobozených příjmech: shrnutí povinností

Prémiové AI funkce: Stojí za příplatek?

Cukroví bez tuku je stejně chutné, jako jeho kaloričtější alternativy

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Je možné vyhrát nad Temu? Prodejci her se to podařilo

ÚOOÚ šetří české vydavatele kvůli „pay or ok“

Youtubeři a influenceři se musí registrovat

Obsah vytvořený pomocí AI vidíte každý den. Jen to nevíte

Čeští středoškoláci očekávají vypuštění své družice

Edge zkouší nový trik na uživatele Chromu

Českou husu musíte objednávat i rok dopředu. V obchodech teď koupíte jen ty zahraniční

Vánoční slevy operátorů? Daleko za očekáváním

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Jihlava a Havlíčkův Brod mění daň z nemovitostí. Co další města?

Chrome OS se zřejmě promění v Android

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Někteří lidé kvůli vzácnému syndromu necítí bolest

Balík od DPD si nově můžete vyzvednout i na České poště