Meta představila nástroje, které zvýší bezpečnost generativní AI

15. 12. 2023

Projekt Purple Llama, jehož cílem je vytvořit pro vývojáře open source nástroje, které umožní vyhodnotit důvěryhodnost a bezpečnost generativních modelů umělé inteligence ještě před jejich veřejným nasazením, představila Meta.

Firma tak podle svých slov chce vytvořit společný základ pro vývoj bezpečnější generativní AI, protože obavy z velkých jazykových modelů a dalších technologií AI narůstají a svět se začíná stále více přesouvat k regulaci, která obvykle představuje zbrzdění vývoje v dané oblasti.

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Projekt zahrnuje partnerství s vývojáři umělé inteligence, cloudovými službami, jako jsou AWS nebo Google Cloud, dále s výrobci polovodičových součástek, jako jsou Intel, AMD a Nvidia, či se softwarovými firmami včetně Microsoftu. Vzniklé nástroje budou schopné testovat schopnosti modelů AI a identifikovat případná bezpečnostní rizika.

Mezi první sadu nástrojů v rámci projektu Purple Llama patří produkt CyberSecEval. Ten vyhodnocuje rizika kybernetické bezpečnosti v softwaru vytvářeném umělou inteligencí. Obsahuje jazykový model, který identifikuje nevhodný nebo škodlivý text, včetně diskusí o násilí nebo nezákonných činnostech.

Vývojáři mohou pomocí řešení CyberSecEval otestovat, zda jimi vytvářené modely umělé inteligence nejsou náchylné k vytváření nezabezpečeného kódu nebo k napomáhání kybernetickým útokům.

Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

Podle výzkumníků Mety totiž modely LLM často navrhují zranitelný kód, což zdůrazňuje důležitost neustálého testování a zlepšování bezpečnosti AI.

Dalším nástrojem v této sadě je pak Llama Guard, velký jazykový model vyškolený k identifikaci potenciálně škodlivé nebo útočné mluvy.

Vývojáři tak mohou otestovat, zda jejich modely dokážou vytvářet nebo přijímat nebezpečný obsah, což omezí možnosti toho, že jejich LLM povedou k nevhodným výstupům AI.

Security World si můžete koupit i jako klasický časopis, buď v klasické tištěné formě nebo v elektronické verzi. Věnujeme se bezpečnosti počítačových systémů, ochraně dat, informací a soukromí. Jsme jediný titul na českém a slovenském trhu, který oslovuje širokou čtenářskou obec – od ředitelů firem, přes odborníky na bezpečnost po koncové uživatele. Naším cílem je poskytnout ucelený přehled o bezpečnostních hrozbách a zejména o tom, proč a jak se jim bránit, případně proč respektovat a dodržovat nařízení IT manažerů ve firmách.

Našli jste v článku chybu?

Sdílet

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Autor článku

Pavel Louda

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Meta představila nástroje, které zvýší bezpečnost generativní AI

Sdílet

Je podle vás regulace AI vhodnou metodou, jak zabezpečit AI?

Autor článku

Pavel Louda

Témata:

Mohlo by vás zajímat

Co se dočtete v novém Computerworldu 11/2024?

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Dále u nás najdete

Bezplatný Microsoft PC Manager vylepšen

SSD už také mají obrovskou kapacitu – až 122 TB

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Domácí mazlíčci jí téměř ožívají pod rukama. Figurky vyrábí z vlny

Podnikatelé s nižšími příjmy si za celý rok připlatí skoro o 13 tisíc víc

Prémiové AI funkce: Stojí za příplatek?

Je možné vyhrát nad Temu? Prodejci her se to podařilo

V aplikaci Záchranka je rozcestník péče pro nevyléčitelně nemocné

Vánoční slevy operátorů? Daleko za očekáváním

Jak uplatní pracující důchodci u zaměstnavatele slevu na pojistném?

Edge zkouší nový trik na uživatele Chromu

Oznámení o osvobozených příjmech: shrnutí povinností

Papírové letáky budou zpoplatněny, může jít o desetník za kus

Správná péče o bércové vředy může zabránit zanícení

Youtubeři a influenceři se musí registrovat

Balík od DPD si nově můžete vyzvednout i na České poště

Kdy se vyhneme platbě daně z příjmů při prodeji nemovitosti?

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

DVTV začala vysílat v DVB-T2 multiplexu 23

Jihlava a Havlíčkův Brod mění daň z nemovitostí. Co další města?