Tři největší poskytovatelé cloudových služeb, AWS (Amazon Web Services), Microsoft Azure a GCP (Google Cloud Platform), chtějí, aby vývojáři a datoví vědci vyvíjeli, testovali a nasazovali modely strojového učení (ML, Machine Learning) právě v jejich cloudu.
Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?
Je to pro ně lukrativní oblast, protože testování modelů často vyžaduje rozsáhlou podporu výkonné infrastruktury a modely nasazené v produkčním prostředí často vyžadují vysokou dostupnost, což jim přináší vysoké příjmy.
Poskytovatelé těchto služeb ale nechtějí v nabídce pro vaši firmu soupeřit jen v oblasti infrastruktury, úrovně služeb a cen. Zaměřují se i na všestrannou podporu umělé inteligence (AI, Artificial Intelligence), aby bylo pro zákazníky snadnější začít využívat nabízené schopnosti strojového učení.
Každý veřejný cloud poskytuje více možností ukládání dat včetně databází serverless, datových skladů, datových jezer a datových úložišť typu NoSQL, aby se tak zvýšila pravděpodobnost, že budete vyvíjet modely v blízkosti svých dat.
Zmínění provideři poskytují populární frameworky pro strojové učení včetně TensorFlow a PyTorch, aby jejich cloud nabízel na jednom místě vše potřebné pro týmy datové vědy, které vyžadují flexibilitu.
Všichni tři klíčoví poskytovatelé nabízejí ModelOps, MLOps či stále rostoucí počet schopností pro podporu celého životního cyklu strojového učení.
Nedávná studie společnosti Red Hat ukázala, že 78 % podnikových projektů umělé inteligence a strojového učení se nasazuje za využití hybridní cloudové infrastruktury, takže veřejný cloud má spoustu prostoru pro růst.
To znamená, že budou muset poskytovatelé pokračovat v inovacích a v nabídkách nových a odlišujících schopností.
Chcete dostávat do mailu týdenní přehled článků z Computerworldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.
Tato vylepšení se objevují v několika kategoriích, které pomáhají podnikům provozovat strojové učení i ve velkém měřítku, s více službami a se snáze použitelnými platformami. Zde jsou některé podrobnosti.
Bitva čipů pro AI
Experimentování se strojovým učením pokračuje v růstu a používají se větší a komplexnější modely, které vyžadují trénink na obrovském množství dat. Microsoft a Nvidia nedávno oznámily masivní jazykový procesor se vstupem 530 miliard parametrů, a Google dokonce tvrdí, že už dokázal vytrénovat model s 1,6 bilionu parametrů.
Trénování modelů této velikosti a složitosti ale může trvat dlouho a může být drahé, takže veřejné cloudy přicházejí s inovacemi v podobě čipů a infrastruktury pro AI. AWS již má čipy Inferentia a Trainium. Nedávno navíc oznámilo také nové instance EC2 využívající čip Gaudi společnosti Habana, který nabízí o 40 % lepší poměr cena/výkon ve srovnání s nabídkou EC2 založenou na GPU.
Google zase vloni ohlásil TPU v4 (Tensor Processing Unit). Jeho čtvrtá generace této jednotky pro zpracování tenzorů vykazuje průměrně 2,7násobné zlepšení vůči výkonu předchozí generace TPU. V oblasti čipů pro AI lze očekávat další hardwarové inovace od společností Cerebras, Graphcore, Nvidia nebo SambaNova.
Čipy však nejsou jedinou zajímavou vlastností infrastruktury podporující AI – všichni tři klíčoví poskytovatelé veřejného cloudu nabízejí platformy pro edge computing, které pomáhají nasazovat modely strojového učení pro nasazení řešení internetu věcí (IoT) a další streamingové aplikace.
Bitva služeb pro AI
Většina týmů datové vědy zřejmě nikdy nebude vyvíjet AI v obrovském měřítku, ale chtějí vytvářet a konfigurovat modely pokročilého strojového učení. Všichni tři poskytovatelé cloudu vyvíjejí služby pro strojové učení a lze čekat, že právě tato oblast v příštích několika letech výrazně poroste.
Níže je stručný přehled služeb strojového učení platforem Azure, GCP a AWS:
- Microsoft Cognitive Services zahrnují služby pro zpracování řeči, jazykové služby pro analýzu nálady a také služby pro otázky a odpovědi často používané v chatbotech. Jejich řešení pro vizuální oblast zahrnují rozpoznávání obličeje a mají služby pro podporu rozhodování pro personalizaci a detekci anomálií.
- Microsoft nedávno oznámil řešení OpenAI, které se připojuje k modelu přirozeného jazyka GPT-3 podporujícího vyhledávání, konverzaci, dokončování textu a další služby.
- Google Cloud má několik služeb AI pro zpracování dokumentů AI včetně DocAI pro obecné zpracování dokumentů a vertikální řešení pro oblast půjček, nákupů, pro kontaktní centra nebo pro řízení kontraktů.
- Služby strojového učení AWS zahrnují Rekognition v oblasti počítačového vidění, Textract pro zpracování dokumentů, Lex pro chatboty, CodeGuru pro kontroly kódu a Personalize pro přizpůsobení webových aplikací.
- AWS také nabízí řešení AI specifická pro některé obory, jako je například Amazon HealthLake umožňující predikci na základě zdravotních údajů, Amazon Lookout pro identifikaci neobvyklého chování vybavení nebo Amazon Fraud Detector pro finanční služby a další obory.
Uvidíme více modelů strojového učení nabízených jako služba (MLaaS) od poskytovatelů veřejných cloudů a dalších konkurentů? Kirk Borne, ředitel pro vědu ve společnosti DataPrime, je o tom přesvědčen.
„Uvidíme více nabídek služeb MLaaS jak z důvodu rostoucí propracovanosti těchto modelů a rostoucích nákladů na jejich trénování, tak i kvůli tomu, že bude klesat počet organizací, které by chtěly svůj čas a talent investovat do vytváření vlastní podoby těchto předtrénovaných modelů.“
Podle Bornea obrovské množství malých až středně velkých firem začínajících se strojovým učením a umělou inteligencí zjistí, že tyto nabídky X-aaS perfektně odpovídají jejich potřebám z hlediska času, rozpočtu a strategie.
MLaaS také pomáhá řešit všudypřítomný nedostatek talentů využitím výhody předtrénovaných modelů nabízených jako služba s důmyslnými a výkonnými algoritmy, dodává Borne.
Bitva za větší dostupnost AI
Další metou pro veřejný cloud je nabídnout schopnosti strojového učení a umělé inteligence organizacím, které týmy pro datovou vědu a pokročilý vývoj softwaru nemají. Snaží se o to prostřednictvím technologií typu low-code, které buď mají vestavěné schopnosti strojového učení, nebo pomáhají vývojářům komunikovat s dalšími službami AI.
Například AWS SageMaker IDE zjednodušuje vývoj, testování a nasazování modelů ML. Toto integrované vývojové prostředí nabízí několik pokročilých schopností včetně datového wrangleru, který pomáhá datovým vědcům připravit data, úložiště funkcí pro podporu spolupráce a opětovného využití mezi týmy datové vědy a schopnosti DevOps pro nasazení jedním kliknutím.
AWS Sagemaker tak soupeří s platformami pro datovou vědu, jako jsou třeba řešení od firem Alteryx, Dataiku, Knime nebo SAS.
Microsoft zase nabízí Azure Machine Learning Studio, což je portál kombinující no-code a code-first přístupy pro datové vědce. Jejich pokročilejší nabídkou low-code pro AI je pak řešení AI Builder pro platformu Power Apps – umožňuje low-code vývojářům vykonávat klasifikaci textu, detekci objektů a zpracování formulářů.
Google používá podobný přístup s AutoML pro trénování modelů. Vestavěná inteligence AppSheet zahrnuje predikci trendů, klasifikaci obsahu, analýzu nálady a další funkce.
Tyto veřejné cloudy soupeří s dalšími nabídkami platforem low-code se schopnostmi strojového učení, jako jsou řešení od firem Creatio, Outsystems, Thinkwise, Vantiq a dalších.
Bude určitě velmi zajímavé vidět, jak v blízké době veřejné cloudy, start-upy, dodavatelé podnikového softwaru, výrobci čipů, poskytovatelé infrastruktury a platformy open source budou soupeřit v oblasti inovací AI a ML s cílem podporovat větší modely, více služeb a snadnější zahájení práce na integrovaných aplikacích.
Tento článek vyšel v Computerworldu 2/2022.
Computerworld si můžete objednat i jako klasický časopis. Je jediným odborným měsíčníkem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computerworldu je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.