Společnost Runway se rozhodla překonat aplikace Midjourney a Stable Diffusion a představila první klipy vytvořené umělou inteligencí, kompletně generované na základě textového příkazu. Zároveň zpřístupnila „čekací listinu“ pro tzv. Gen 2 text-to-video AI, nástroje navazujícího na jednoduššího předchůdce sloužícího pro převod textu na video, vycházejícího z modelů reálného světa.
Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?
Když se loni objevila umělá inteligence, používala model převodu textu na obraz. Uživatel zadal textový příkaz popisující scénu a nástroj se pokusil vytvořit obraz s využitím zdrojů z reálného světa. Služby jako Midjourney provádějí tyto úlohy na cloudovém serveru, zatímco Stable Diffusion a Stable Horde využívají podobné modely umělé inteligence běžící na domácích počítačích.
Převod textu na video je však dalším krokem. Existují různé způsoby, jak toho dosáhnout: Pollinations.ai nashromáždila několik modelů, které si můžete vyzkoušet, přičemž jeden z nich jednoduše vezme několik souvisejících scén a vytvoří animaci, která je spojí dohromady. Jiný vytvoří 3D model obrázku a umožní vám jej přiblížit.
Runway má jiný přístup. Společnost již nabízí nástroje pro práci s videem s umělou inteligencí: inpainting pro odstranění objektů z videa, bokeh s umělou inteligencí, přepisy a titulky a další. První generace jejích nástrojů pro převod textu na video umožňovala vytvořit scénu z reálného světa a poté ji použít jako model, na který se překryje video vytvořené textem. Obvykle se to provádí jako obrázek, kdy můžete vyfotit zlatého retrívra a pomocí umělé inteligence tuto fotografii přeměnit například na fotografii dobrmana.
To byla generace 1. Generace 2, jak společnost uvedla na Twitteru, může sice jako základ použít existující obrázky nebo videa, ale dokáže už i zcela automaticky vygenerovat krátký videoklip z textového příkazu bez čehokoliv dalšího.
Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.
Jak naznačuje tweet společnosti Runway, klipy jsou krátké (maximálně několik sekund), zrnité a trpí nízkou snímkovou frekvencí. Není také jasné, kdy Runway uvolní model pro předběžný nebo všeobecný přístup. Ukázky na stránce Runway Gen 2 však ukazují širokou škálu videopohledů: čistě textově-obrazové UI, text+obrázek na video atd. Zdá se přitom, že čím více vstupů modelu zadáte, tím větší štěstí budete mít. Nejplynulejší video s vysokým rozlišením přitom dle všeho generuje „překrytí“ videa přes existující objekt či scénu.
Runway již nabízí tarif „Standard“ za 12 dolarů/měsíc, který umožňuje neomezený počet videoprojektů. Některé nástroje, jako je například skutečné trénování vlastního portrétu nebo generátoru zvířat, však vyžadují další poplatek 10 dolarů. Není jasné, kolik si Runway bude účtovat za svůj nejnovější model. Runway však dokazuje, že jsme se během několika krátkých měsíců posunuli od uměleckého zpracování textu do obrázku k uměleckému zpracování textu do videa… a můžeme jen udiveně kroutit hlavou.
Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.