Není náhoda, že řada programů využívajících umělé inteligence má otevřený zdrojový kód, a je tedy zcela zdarma. Je to proto, že první přístupy vznikly na akademické půdě, kde jsou bezplatné licence na software běžnou praxí, aby se podpořila spolupráce a další vývoj.
Pokud využíváte AI pro rozhodování, zkreslila už nějakou odpověď?
Zde však nejde o rámce a knihovny pro formy AI, ale o hmatatelné a užitečné aplikace umělé inteligence pro váš vlastní počítač. Pojem umělá inteligence zahrnuje různé metody, jako jsou neuronové sítě, strojové učení, hluboké učení nebo zpracování přirozeného jazyka. V následujícím výběru jsou zastoupeny všechny tyto přístupy.
Na modelech záleží
Různé přístupy k rozpoznávání vzorů, strojově zpracovávaným rozhodovacím stromům a automatizaci úloh jsou postaveny na již hotových trénovacích datech a modelech. Dostupnost těchto dat je jedním z důvodů, proč jsou dnes užitečné techniky umělé inteligence vůbec k dispozici ve volně dostupném softwaru.
Vývoj modelů obvykle trvá roky a k dispozici jsou často terabajty nezpracovaných dat, která je třeba vyhodnotit. S rostoucím výpočetním výkonem běžného PC hardwaru se však vývoj AI modelů a analýza trénovacích dat v posledních letech zrychlila, což umožnilo zapojení i menších výzkumných týmů.
Následující sborník se zabývá praktickými přínosy, tj. implementací metod především ve volně dostupném softwaru pro Windows, které dobře ukazují, jak daleko technologie nyní pokročila bez vysokých nákladů na instalaci, což umožnil i vývoj open source.
Final 2× – Zvětšení fotek
Škálování bitmapové grafiky pouhým zvětšením pixelů vede vždy k výrazné ztrátě kvality. V aplikaci Final 2× tomu tak však být nemusí. Final 2× úspěšně zvětšuje grafiku a vyhlazuje ji do posledního detailu pomocí neuronových sítí a dodaných modelů.
Pomocí algoritmů Real Cugan, Real Esrgan, Waifu 2× a SRMD poskytuje Final 2× čtyři způsoby škálování obrázků pro dosažení nejlepších výsledků. Program také dokáže výrazně vylepšit pixelované fotografie ve formátu JPG se šumem a silnými artefakty.
Meshroom – 3D scanner
3D skener skenuje objekty pomocí laseru a z dat vytváří soubor pro další použití v programech CAD a animačních programech. To, co zní velmi složitě, je ve skutečnosti možné v malém měřítku pomocí běžných chytrých telefonů nebo digitálních fotoaparátů a bezplatného softwaru Meshroom.
Je založen na fotogrammetrických knihovnách vývojáře Alicevision, je k dispozici pod licencí open source a pro Windows (64 bitů). Z analýzy sérií snímků vypočítá tvar fotografovaného objektu a vytvoří grid soubor.
Kdenlive – Sledování objektu ve videu
Tento bezplatný editor videa už dva roky dokáže přicházet s pomůckami umělé inteligence. Sledování pohybu, tj. automatické sledování objektů ve videích, dokáže rozpoznané motivy opatřit maskou a následně na ně aplikovat cílené efekty. To je užitečné například pro pixelizaci určitých objektů ve videu.
Spleeter – Rozdělení skladby na stopy
Spleeter si získal velkou pozornost už před dvěma lety po svém prvním představení. Dokáže rozdělit hudbu ve formátu MP3 na dvě, čtyři nebo pět jednotlivých stop pomocí předem vyškolených modelů. Spleeter rozpoznává kategorie jako jsou vokály, basy, bicí a rytmická sekce.
Nástroj příkazového řádku využívá knihovnu umělé inteligence Tensorflow k analýze datového toku v hudebních skladbách a kodér Ffmpeg k rozdělení izolovaných stop do jednotlivých souborů MP3. Nástroj pochází od francouzské streamovací služby Deezer, které bylo umožněno využít obrovský licencovaný katalog popové hudby jako analytický materiál. Tato tréninková data jsou k dispozici i pro soukromé použití zdarma, je však nutné je nainstalovat samostatně.
Microsoft Edge – Vylepšení fotek
Microsoft s využitím vlastních datových center pracuje na vybavení každodenních programů co největším počtem AI nástrojů. Které z nich budou užitečné v dlouhodobém horizontu, se teprve ukáže. Nepochybně velmi pěkné výsledky na obrazovkách s vysokým rozlišením přinášejí nové schopnosti webového prohlížeče Edge automaticky zvětšovat obrázky, a dokonce i videa. Nástroje jsou však zatím dostupné jen ve vývojářské verzi Edge.
Vosk – Rozpoznání řeči
Od mluveného, zaznamenaného slova k čistému přepisu dnes není daleko. Rámec umělé inteligence Vosk, který je založen na enginu pro rozpoznávání řeči Kaldi, je open source projektem Univerzity Johnse Hopkinse.
Digikam – Rozpoznání tváří
Digikam, program pro databázově podporovanou organizaci rozsáhlých sbírek fotografií, který se neustále vyvíjí již více než patnáct let, byl původně vyvinut pro Linux a je pravidelně portován na Windows. Důvodem jsou jeho značné možnosti:
Kromě třídění a kategorizace fotografií podle alb, značek a klíčových slov jsou k dispozici i pokročilé možnosti. Rozpoznávání obličejů a automatické třídění kvality snímků jsou dvě novější funkce založené právě na umělé inteligenci.
Hugin – Tvorba panoramat
Hugin je další nástroj pro fotografie, který ušetří mnoho hodin zdlouhavého zpracování snímků a umožní vytvářet zcela nové scenérie při fotografování krajiny. Program vytváří panoramatické fotografie z překrývajících se sérií jednotlivých snímků.
Panoramata jsou v krajinářské fotografii obzvláště atraktivní pro zachycení dramatických nálad. To již několik let umožňují také aplikace pro chytré telefony. Hugin však umožňuje přesnou kontrolu nad výsledkem a umí také spojovat jednotlivé snímky do svislých řad.
Subsync – Synchronizace titulků
Cinefilové dávají přednost filmům a seriálům v původním znění bez dabovaných dialogů. Titulková stopa je v nich nicméně užitečná – a pro cizí jazyky nezbytná. Webové stránky jako opensubtitles.org poskytují titulky k seriálům a filmům ve formátech, které zvládnou multimediální přehrávače jako VLC.
Potíž často spočívá v nalezení vhodného souboru s titulky, který běží synchronně s daným videosouborem. Pokud titulky neodpovídají mluvenému slovu ve filmu, požitek z filmu upadá. Bezplatný nástroj Subsync to může napravit: Pomocí rozpoznávání řeči a umělé inteligence synchronizuje soubor s titulky se souborem videa.
Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.
Chcete si článek přečíst celý?
Tento článek je součástí exkluzivního obsahu pouze pro odběratele našeho newsletteru.
Přihlaste se k odběru newsletteru a my vám do mailu pošleme odkaz na celý článek.