Jak pracovat s AI generátorem obrázků, který Microsoft přidal do prohlížeče Edge

24. 4. 2023

Sdílet

Je tomu jen několik dnů, co generátor obrázků Microsoft Bing dorazil také přímo do internetového prohlížeče Edge. Vyzkoušeli jsme, jaké výsledky nabízí. Výhodou je rychlejší přístup k obrázkům, třeba u konkurenčního Midjourney je ovládání složitější.

Využívání implementovaného generátoru nazvaného Bing Image Creator, který využívá technologii DALL-E, není nic složitého. K tomu, abyste si ho vyzkoušeli, vám stačí pouze účet od Microsoftu. Přesto jsou tam určitá úskalí, proto vám přinášíme přehledný návod.

Novou funkci v Edge si třeba třeba nejdříve aktivovat, a to kliknutím na plusko v pravém panelu, načež v rozbalené nabídce vybereme „Image Creator“. Tím do lišty přidáme ikonu odkazující na novou funkci, na kterou již stačí jednoduše kliknout.

Image Creator otevřený v panelu prohlížeče Edge má nicméně k dispozici poměrně omezený prostor, a pro lepší uživatelský zážitek tak doporučujeme využít spíše oficiální stránkuNa té jsme ostatně generátor obrázků testovali i my, a vy se nyní můžete podívat, jak dobře si tahle novinka Bingu vlastně vedla.

Do pole pro klíčová slova můžeme zadat podstatná nebo přídavná jména, slovesa i specifický umělecký styl (geometric art, retro, digital art, pop art…). Bing následně vytvoří čtyři obrázky, přičemž na zpracování mu postačí jen několik vteřin. Za rychlé zhotovení nicméně platíme virtuální měnou, oficiálně nazvanou „vylepšení“. Jakmile nám vylepšení dojdou, doba generování obrázků se mírně prodlouží, a to zhruba na 30 vteřin.

Konečná kvalita obrázků závisí na konkrétním tématu. V některých oblastech pro nás Bing připravil dechberoucí díla, ať už šlo o válečné scény, bojovníky, živočichy, města, strašidelné postavy, sci-fi záležitosti, loga nebo ikony nejrůznějšího charakteru. Veškeré tyto snímky bychom mohli použít i v profesionálních pracích (ale nemůžeme, protože je to omezené licenčně, viz další text).

V jiných okruzích nicméně generování obrázků značně pokulhávalo. Šlo zejména o tvorbu fotorealistických lidských obličejů, prstů na rukou a v některých případech byly problémy také s chrupem. Výsledné deformace přitom nebyly jen nepřirozené, ale vysloveně odpuzující a ve výsledku tak zcela nepoužitelné. Při tvorbě herních a filmových postav byla celková atmosféra sice správná, vyprodukované postavy ale nikoho z daného díla nepřipomínaly.

Zcela znemožněno je generování obrázků s násilnou nebo lechtivou tématikou, stejně jako nelze vytvářet snímky s celosvětově známými osobnostmi (politiky, celebritami…). Toto omezení se netýká některých českých celebrit, které vývojáři zřejmě neznají, a proto je do zakázaných klíčových slov (zatím) nezařadili. Ani v jejich případě nicméně podoba vytvořené postavy neodpovídala reálné předloze.

Jeden z nepříliš povedených obrázků z Image Creatoru.

Pro úplnost dodejme, že vytvořená díla zpravidla mají čtvercový tvar, formát JPG, rozlišení 1024 × 1024 px a vodoznak v levém dolním rohu. Tyto parametry v současné době nelze měnit. Klíčová slova zároveň musí být v angličtině a výsledky je možné využít jen v rámci nekomerčního využití. Obrázky si nicméně velmi rychle a jednoduše můžete stáhnout.

bitcoin_skoleni

Generátor v některých věcech působí jako chudý příbuzný populárního Midjourney. Ten umožňuje měnit třeba výstupní formát u vytvořeného obrázku. Jeho nová verze zároveň přináší výrazně přirozenější výstupy. Na druhou stranu se ale zase hůře ovládá.

Printscreeny v textu vytvořila redakce PCWorld.