Nvidia se pochlubila genAI modelem schopným tvořit hudbu

6. 12. 2024

Sdílet

Ilustrační snímek Autor: PCWorld s využitím DALL-E
Ilustrační snímek
Model nazvaný Fugatto dokáže na základě textového příkazu vytvořit prakticky jakýkoliv zvuk včetně hudebního díla.

Společnost Nvidia představila nový model generativní umělé inteligence (genAI), který lze použít k vytváření nejrůznějších zvuků a hudby

Zatajujete před šéfy, že vám v práci pomáhá umělá inteligence?

Jmenuje se Fugatto, což je zkratka pro Foundational Generative Audio Transformer Opus 1. 

Zadáním textového promptu může uživatel přimět Fugatto vytvořit v podstatě jakýkoli zvuk, například trubku štěkající jako pes.

Video ke kávě

Máte čas na rychlé a informativní video?

Model lze podle agentury Reuters použít také ke změně dialektu zpěváka nebo k proměně klavírní skladby ve zcela jinou píseň.

„Zamyslíme-li se nad uměle vytvářeným zvukem během posledních padesáti let, hudba dnes zní díky počítačům a syntetizátorům jinak,“ říká Bryna Catanzaro, viceprezident pro aplikovaný výzkum hlubokého učení ve společnosti Nvidia.

bitcoin školení listopad 24

„Myslím, že generativní umělá inteligence otevře nové možnosti hudbě, videohrám i obyčejným lidem, kteří chtějí něco tvořit.“

Fugatto byl vycvičen na datech s otevřeným zdrojovým kódem a dle vyjádření zástupců Nvidie společnost stále ještě zvažuje, zda a jakým způsobem model zpřístupnit veřejnosti.

 

Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.