Strojové učení se stává dostupným díky open source

11. 9. 2020

Sdílet

 Autor: © agsandrew - Fotolia.com
Se zrychlující se digitalizací shromažďují firmy stále větší množství dat. Podívat se na ně očima stroje pak může přinést větší vhled do vlastního byznysu i objevování nečekaných příležitostí. Stejně tak se ale zvyšuje i komplexita využívaných systémů. Šéfové firem či management proto musí sledovat stále více ukazatelů, tabulek, grafů a statistik, aby se mohli efektivně rozhodovat.

Do hry vstupuje množství z tradičního pohledu externích datových zdrojů, které dokážou výrazně rozšířit možnosti rozhodování. Kombinace externích a interních dat přináší novou příležitost, zejména pokud firma naplno využívá možností strojového učení.

Paradoxně skutečná příležitost netkví v technologiích, ty jsou pouze podmínkou pro automatizaci a urychlení celého procesu. Příležitost je primárně v hlubším pochopení vlastního pracovního prostoru a možnost rozhodování se na základě mnohem větší množiny informací. Firmy, které projdou evoluční transformací a digitalizaci procesů rozšíří o data-driven rozhodování, získají klíčovou výhodu oproti konkurenci.

Nejprve je třeba data propojit a vybudovat ekosystém informací

Informace vznikají a mění svoje parametry v reálném čase, pokoušet se udržet všechny procesy a evidence v jednom monolitickém systému je proto ambice patřící do minulosti. Základ pro poznání vlastního datového prostoru umožňuje přístup Master data management, kde každý typ informace by měl mít přesně určený zdroj.

Může se jednat o účetní systém, výrobní systém, bankovní systém, CRM, uživatelská data, open data nebo také dokumenty, tabulky a volné texty či znalostní báze. Zajímavé obohacení může přijít do systému ve formě komerčně dostupných datasetů. Pro ekosystém informací je podstatné pochopit a zavést takové procesy, které tato data dokážou propojit a umožní jejich efektivní vytěžení bez zásahu člověka.

Algoritmy strojového učení pomohou se složitějšími otázkami

V dalších krocích zpracování dat vznikají odvozená data v procesu zavedení automatizovaných matematických operací. Často tak dochází k dopočítání různých statistických ukazatelů, sumářů či porovnání v čase. V tomto bodě většinou končí první fáze budování datového ekosystému.

Jakmile si jeho využívání firma osvojí, přichází na řadu sofistikovanější otázky: Jak zvýšit prodej? Jak vyladit proces výroby? Jak předpovídat kritické situace? Zde je prostor pro zavedení algoritmů strojového učení a v některých případech zpracování big data, jejichž výstupem je další skupina dat potřebných pro efektivní rozhodování.

Kdo se na data bude dívat?

Uvedení ekosystému do života má několik forem. Unifikovaný a propojený pohled na data se vrací do zdrojových systémů, které využívají rozšířené informace z jiných systémů nebo výpočtů. Automatizované procesy sledují důležité ukazatele v širších kontextech a spouští procesy upozornění nebo zásahů.

Data se většinou transformují rovněž do datových kostek, které využívají datoví analytici. Ti připravují pro sebe nebo management různé pohledy, často ve formě automatických reportů v e-mailech, znalostních bázích nebo v produktech business intelligence. Většinou jde o živý proces, při kterém se datový ekosystém průběžně rozšiřuje, zvyšuje se kvalita dat a aplikují se další algoritmy.

Jak open source platformy a implementace algoritmů strojového učení využívají světové korporace

Jeden z klientů podnikající v agrochemii, který prodává své produkty po celém světě, evidoval potřebu sdílení informací mezi obchodníky z různých domén. Problém byl v nízkém cross-selling prodeji – každý segment si prodával pouze svoje produkty, přitom potenciál pro cross-selling byl obrovský. Firma stimulovala komunikaci mezi obchodníky různými programy a eventy, ale výsledky se dostavovaly jen ojediněle.

Naše řešení využilo konsolidovaná data z téměř všech zemí světa. Pro ověření hypotéz jsme zvolili open source platformu Apache Spark s knihovnou strojového učení MLlib, která měla potenciál pro nasazení v rámci superpočítače. V takto distribuovaném výpočtovém prostředí jsme dosáhli nečekaných výsledků – řešení dokáže identifikovat zajímavé cross-selling prodeje na různých trzích a doporučit obchodníkům sofistikované nabídky až na úroveň konkrétního zákazníka. Řešení se následně stalo součástí rozvojové strategie společnosti a poukázalo na obrovský potenciál zvoleného open source řešení v daném segmentu.

Digitální transformace neznamená nahradit člověka, ale ulehčit rozhodování

Nejen v digitálním světě existuje řada oblastí, které lze snadno automatizovat. Určitě to ale neznamená nahrazení člověka strojem, který bude na základě získaných dat činit kvalifikovaná rozhodnutí. Strojové učení přináší nové dimenze do ekosystému informací, na základě kterého se rozhodujeme. Pochopení a vhodné interpretování informací v organizaci je však složitá úloha, kterou nevyřeší technologie, ale je záležitostí dobře postaveného týmu a procesů.

Tento fakt se projevuje u většiny úspěšných projektů zapojením expertů a externích konzultantů přímo do procesů managementu. Úlohou managementu je pak potřebné transformační projekty řídit a definovat zadání pro IT oddělení.

Úkolem konzultačního partnera je především poznat klientův byznys – využít své zkušenosti z dané domény a vybrat IT řešení na základě skutečných potřeb klienta. Z toho důvodu je třeba mít pro všechny důležité komponenty několik alternativ včetně open source řešení.

bitcoin školení listopad 24

Z dosavadních zkušeností tedy open source často vychází jako optimální cesta pro klienta. Jeho velkou výhodou je totiž nejen široká vývojářská komunita, a tedy i sdílené know-how, ale i nezávislost na dodavateli řešení. S vendor lockem se totiž neustále potýkají nejen státní instituce, ale i řada firem.

Autor je CEO BOOTIQ EEA