Seamless Streaming je model pro tlumočení v reálném čase s latencí kolem pouhých dvou sekund, to znamená, že lidé spolu mohou vést přirozeně znějící konverzaci, i když mluví různými jazyky. Seamless Streaming podporuje téměř 100 vstupních a výstupních jazyků, což z něj činí vhodný nástroj pro globální komunikaci.
Využíváte už některé z inovativních metod šifrování?
SeamlessExpressive je model, který zachovává expresivitu původní řeči, to znamená, že přeložená řeč zní přirozeně a vyjadřuje stejné emoce a záměry jako řeč původní. SeamlessExpressive v současné době podporuje šest jazyků: angličtinu, španělštinu, němčinu, francouzštinu, italštinu a čínštinu.
Oba nové modely jsou postaveny na modelu SeamlessM4T v2, nejnovější verzi základního vícejazyčného modelu Meta AI pro převod řeči na řeč, řeči na text a textu na řeč. SeamlessM4T v2 výrazně vylepšuje předchozí verze a dosahuje nejlepších výsledků v různých srovnávacích testech.
Dopad na reálné aplikace
Systémy Seamless Streaming a SeamlessExpressive mají mimořádný potenciál pro vývoj široké škály aplikací pro reálný svět jako například: tlumočení v reálném čase pro videokonference a nástroje pro vzdálenou spolupráci, služby jazykového tlumočení pro podniky a organizace, nástroje pro výuku jazyků, které mohou poskytovat zpětnou vazbu a podporu v reálném čase i asistenční technologie pro osoby s řečovým postižením.
Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.
Meta AI v současnosti uvolnila pro výzkumnou komunitu následující čtyři modely – foundational model SeamlessM4T v2, Seamless Streaming, SeamlessExpressive a SeamlessAlignExpressive, které jsou dostupné na serverech Hugging Face a Github, a to spolu se sadou hodnotících nástrojů pro zachycení a zachování expresivity.
Meta AI se rovněž v souladu se svojí strategií o bezpečnou AI snaží o zmírnění halucinační toxicity v překladových systémech. Halucinační toxicita je jev, při kterém překladový systém generuje text, který je toxický, ačkoli vstupní text toxický nebyl.
Technologie Meta AI automaticky detekuje a opravuje toxická slova během procesu generování překladu. Meta AI také vyvíjí novou metodu pro watermarking, kterou lze dohledat původ zvukových nahrávek, což by mělo zabránit zneužití zvuku generovaného AI, například pro vytváření deepfakes.
Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.