Amazon chrlí novinky. Opřel se do AI, začal s novou generaci

Sdílet

Amazon Nova Autor: Internet Info DG – Radan Dolejš

Amazon.com na výroční konferenci AWS re:Invent představil Amazon Nova, novou generaci modelů Foundation. Modely budou k dispozici v systému Amazon Bedrock a zahrnují: Amazon Nova Micro (model pro převod textu na text) a Amazon Nova Lite, Amazon Nova Pro a Amazon Nova Premier (multimodální modely, které dokáží zpracovávat text, obrázky a videa a vytvářet z nich text). Amazon také uvedl na trh také dva další modely – Amazon Nova Canvas (který generuje obrázky ve studiové kvalitě) a Amazon Nova Reel (který generuje videa ve studiové kvalitě).

První z modelů, Amazon Nova Micro , je pouze textový model, který poskytuje odpovědi s nejnižší latencí a velmi nízkými náklady. Dalšími třemi jsou např: Amazon Nova Lite, velmi levný multimodální model, který je bleskově rychlý při zpracování obrazových, video a textových vstupů; Amazon Nova Pro, vysoce schopný multimodální model s nejlepší kombinací přesnosti, rychlosti a ceny pro širokou škálu úloh; a Amazon Nova Premier, nejschopnější z multimodálních modelů společnosti Amazon pro složité úlohy uvažování a pro použití jako nejlepší učitel pro produkci vlastních modelů. Modely Amazon Nova Micro, Amazon Nova Lite a Amazon Nova Pro jsou běžně dostupné již dnes; Amazon Nova Premier bude k dispozici v prvním čtvrtletí roku 2025.

Využíváte už některé z inovativních metod šifrování?

Amazon tvrdí, že Amazon Nova Lite je vysoce konkurenceschopný s ostatními modely ve stejné inteligenční třídě; ve srovnání s GPT-4o mini společnosti OpenAI dosáhl stejných nebo lepších výsledků v 17 z 19 benchmarků, ve srovnání s Gemini 1.5 Flash-8B společnosti Google v 17 z 21 benchmarků a ve srovnání s Claude Haiku 3.5 společnosti Anthropic v 10 z 12 benchmarků. Kromě přesnosti v textových srovnávacích testech vyniká Amazon Nova Lite také v porozumění videím, grafům a dokumentům, měřeno srovnávacími testy, jako jsou Vatex, ChartQA a DocVQA.

Amazon Nova Pro dosáhl stejných nebo lepších výsledků v 17 z 20 benchmarků ve srovnání s GPT-4o od OpenAI, stejných nebo lepších výsledků v 16 z 21 benchmarků ve srovnání s Gemini 1.5 Pro od Googlu a stejných nebo lepších výsledků v 9 z 20 benchmarků ve srovnání s Anthropic Claude Sonnet 3.5v2. Kromě přesnosti v textových a vizuálních inteligenčních benchmarcích vyniká Amazon Nova Pro v oblasti sledování instrukcí a multimodálních agenturních pracovních postupů měřených pomocí Comprehensive RAG Benchmark (CRAG), Berkeley Function Calling Leaderboard a Mind2Web.

Vícejazyčná a multimodální podpora s dlouhým kontextem

Aplikace Amazon Nova Micro, Lite a Pro podporují více než 200 jazyků. Amazon Nova Micro podporuje kontext o délce 128 tisíc vstupních tokenů, zatímco Amazon Nova Lite a Amazon Nova Pro podporují kontext o délce 300 tisíc tokenů nebo 30 minut zpracování videa. Na začátku roku 2025 bude společnost Amazon podporovat kontext o délce více než 2M vstupních tokenů.

Rychlé a nákladově efektivní

Všechny modely Amazon Nova jsou rychlé, nákladově efektivní a byly navrženy tak, aby je bylo možné snadno používat se systémy a daty zákazníka. Modely Amazon Nova Micro, Amazon Nova Lite a Amazon Nova Pro jsou nejméně o 75 % levnější než nejvýkonnější modely v příslušných inteligenčních třídách v systému Amazon Bedrock. Jsou také nejrychlejšími modely ve svých I

Integrace s Amazon Bedrock

Všechny modely Amazon Nova jsou integrovány s Amazon Bedrock, plně spravovanou službou, která zpřístupňuje vysoce výkonné FM od předních společností zabývajících se umělou inteligencí a společnosti Amazon k použití prostřednictvím jediného rozhraní API. Pomocí služby Amazon Bedrock mohou zákazníci snadno experimentovat a vyhodnocovat modely Amazon Nova i jiné FM a určit tak nejlepší model pro danou aplikaci.

Podpora jemného doladění pro zvýšení přesnosti

Modely také podporují vlastní jemné doladění, které zákazníkům umožňuje nasměrovat modely na příklady ve vlastních datech, které byly označeny pro zvýšení přesnosti. Model Amazon Nova se z vlastních dat (včetně textu, obrázků a videí) naučí, co je pro zákazníka nejdůležitější, a poté Amazon Bedrock vycvičí soukromý vyladěný model, který poskytne odpovědi na míru.

Kybernetická bezpečnost: Podcast o tajemstvích bezpečnostních operačních centrech s Pavlem Hrabcem
Kybernetická bezpečnost: Podcast o tajemstvích bezpečnostních operačních centrech s Pavlem Hrabcem
0:00/

Destilace pro trénování menších a efektivnějších modelů

Kromě podpory jemného ladění modely podporují také destilaci, která umožňuje přenést specifické znalosti z většího, vysoce schopného „učitelského modelu“ na menší, efektivnější model, který je vysoce přesný, ale také rychlejší a levnější na provoz.

Modely Amazon Nova byly optimalizovány tak, aby se snadno používaly a byly efektivní v agentních aplikacích, které vyžadují interakci s vlastními systémy a daty organizace prostřednictvím několika rozhraní API k provedení vícekrokových úloh.

Přístup k vizuálnímu obsahu

Amazon Nova Canvas je nejmodernější model generování obrázků, který vytváří obrázky z textu nebo obrázků zadaných v podnětech. Amazon Nova Canvas také poskytuje funkce, které usnadňují úpravy obrázků pomocí textových vstupů, a poskytuje ovládací prvky pro úpravu barevného schématu a rozvržení. Model je vybaven vestavěnými kontrolními prvky, které podporují bezpečné a zodpovědné používání umělé inteligence.

Podcast magazínu Computerworld

V podcastu se bavíme s lidmi, kteří znají svět ITC a mají o něm co říct. Podcast najdete na všech obvyklých podcastových aplikacích: Spotify, Apple Podcasts, Seznam Podcasty nebo Podbean.

Patří mezi ně funkce, jako je vodoznak, který umožňuje vždy dohledat zdroj obrázku, a moderování obsahu, které omezuje generování potenciálně škodlivého obsahu. Amazon Nova Canvas dosahuje lepších výsledků než generátory obrázků, jako jsou OpenAI DALL-E 3 a Stable Diffusion, v hodnoceních vedle sebe prováděných třetí stranou a v klíčových automatizovaných metrikách.

Amazon Nova Reel je pro generování videa, který zákazníkům umožňuje snadno vytvářet vysoce kvalitní video z textu a obrázků. Je ideální pro tvorbu obsahu v reklamě, marketingu nebo školení. Zákazníci mohou pomocí pokynů v přirozeném jazyce ovládat vizuální styl a tempo, včetně pohybu, otáčení a přibližování kamery. Amazon Nova Reel v současné době generuje šestisekundová videa a v následujících měsících bude podporovat generování videí o délce až dvou minut.

Co bude následovat: Modely Speech-to-Speech a Multimodal-to-Multimodal

V prvním čtvrtletí roku 2025 představí společnost Amazon model Amazon Nova pro převod řeči na řeč. Tento model je navržen tak, aby změnil konverzační aplikace umělé inteligence tím, že bude rozumět proudovému řečovému vstupu v přirozeném jazyce, interpretovat verbální a neverbální signály (jako je tón a kadence) a poskytovat přirozené interakce podobné lidským, zpětné interakce s nízkou latencí.

Společnost Amazon také vyvíjí nový model, který dokáže jako vstup přijímat text, obrázky, zvuk a video a generovat výstupy v jakékoli z těchto modalit. Tento model Amazon Nova s nativní funkcí multimodal-to-multimodal – neboli „any-to-any“ modality – bude představen v polovině roku 2025. Zjednoduší vývoj aplikací, v nichž lze stejný model použít k provádění nejrůznějších úloh, jako je překlad obsahu z jedné modality do druhé, úprava obsahu a napájení agentů umělé inteligence, kteří rozumí všem modalitám a dokáží je generovat.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Našli jste v článku chybu?