Meta AI představila nové modely Seamless pro překlad v reálném čase

5. 12. 2023

Sdílet

 Autor: Depositphotos
Společnost Meta AI oznámila uvolnění dvou nových modelů pro jazykový překlad a tlumočení v reálném čase – Seamless Streaming a SeamlessExpressive. Tyto modely umožňují přirozenější a jemnější mezijazykovou komunikaci díky zachování expresivních prvků řeči, jako je tón hlasu, pauzy a důrazy, které jsou pro komunikaci podobnou té lidské nezbytné.

Seamless Streaming je model pro tlumočení v reálném čase s latencí kolem pouhých dvou sekund, to znamená, že lidé spolu mohou vést přirozeně znějící konverzaci, i když mluví různými jazyky. Seamless Streaming podporuje téměř 100 vstupních a výstupních jazyků, což z něj činí vhodný nástroj pro globální komunikaci. 

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

SeamlessExpressive je model, který zachovává expresivitu původní řeči, to znamená, že přeložená řeč zní přirozeně a vyjadřuje stejné emoce a záměry jako řeč původní. SeamlessExpressive v současné době podporuje šest jazyků: angličtinu, španělštinu, němčinu, francouzštinu, italštinu a čínštinu.

Oba nové modely jsou postaveny na modelu SeamlessM4T v2, nejnovější verzi základního vícejazyčného modelu Meta AI pro převod řeči na řeč, řeči na text a textu na řeč. SeamlessM4T v2 výrazně vylepšuje předchozí verze a dosahuje nejlepších výsledků v různých srovnávacích testech.

Dopad na reálné aplikace

Systémy Seamless Streaming a SeamlessExpressive mají mimořádný potenciál pro vývoj široké škály aplikací pro reálný svět jako například: tlumočení v reálném čase pro videokonference a nástroje pro vzdálenou spolupráci, služby jazykového tlumočení pro podniky a organizace, nástroje pro výuku jazyků, které mohou poskytovat zpětnou vazbu a podporu v reálném čase i asistenční technologie pro osoby s řečovým postižením.

Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

Meta AI v současnosti uvolnila pro výzkumnou komunitu následující čtyři modely – foundational model SeamlessM4T v2, Seamless Streaming, SeamlessExpressive a SeamlessAlignExpressive, které jsou dostupné na serverech Hugging Face a Github, a to spolu se sadou hodnotících nástrojů pro zachycení a zachování expresivity.

bitcoin_skoleni

Meta AI se rovněž v souladu se svojí strategií o bezpečnou AI snaží o zmírnění halucinační toxicity v překladových systémech. Halucinační toxicita je jev, při kterém překladový systém generuje text, který je toxický, ačkoli vstupní text toxický nebyl. 

Technologie Meta AI automaticky detekuje a opravuje toxická slova během procesu generování překladu. Meta AI také vyvíjí novou metodu pro watermarking, kterou lze dohledat původ zvukových nahrávek, což by mělo zabránit zneužití zvuku generovaného AI, například pro vytváření deepfakes.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.