„Máme zde moderní trend pro vývoj – DevOps, ale stále více lidí vkládá do vývoje a do systémů nějaký druh schopností datové vědy, takže v týmu DevOps potřebujete někoho, kdo se o datové aspekty stará,“ říká Ted Dunning, hlavní architekt aplikací společnosti MapR Technologies.
Stejně jako v případě známějšího DevOps také přístup DataOps vychází z agilní metodiky. Tento přístup využívá nepřetržité poskytování analytických pohledů s primárním cílem uspokojit potřeby zákazníka.
Týmy DataOps oceňují fungující analytiku a měří výkon datových analýz podle získaných poznatků. Chápou změny jako přirozené a usilují o nepřetržité vnímání a chápání vyvíjejících se potřeb zákazníků.
Týmy DataOps jsou skutečnými týmy. Organizují se samostatně kolem cílů a usilují o redukci „hrdinství“ ve prospěch dlouhodobě udržitelných a škálovatelných procesů.
Týmy DataOps se snaží od začátku až do konce organizovat data, nástroje, kód a prostředí. Nezbytným základem jsou reprodukovatelné výsledky. Týmy DataOps mají tendenci pohlížet na analytické toky analogicky k výrobním linkám továren.
Kde se hodí?
„Dnešní podniky stále častěji zavádějí strojové učení do široké škály produktů a služeb,“ říká Dunning, „a DataOps je přístup zaměřený na podporu komplexních potřeb strojového učení.“
„Tento styl datovým vědcům například usnadňuje využívání podpory softwarového inženýrství, aby poskytli to, co je potřeba při předávání modelů do provozu během nasazení,“ tvrdí Dunning a Ellen Friedman, hlavní technoložka společnosti MapR.
„Přístup DataOps ale není omezen na strojové učení,“ dodávají. „Tento styl organizace je užitečný pro veškeré práce zaměřené na data, což usnadňuje využití výhod plynoucích z vytváření globální datové struktury.“
Poznamenávají také, že se DataOps dobře hodí pro architektury mikroslužeb.
DataOps v praxi
Je nezbytné, aby podniky při zavádění nově vznikajících datových technologií, jako jsou tyto, rozvíjely svůj přístup ke zlepšování své schopnosti pracovat s daty v různém měřítku a reagovat na události reálného světa, když nastávají, upozorňují Dunning a Friedman.
„Tradičně rozdělené role se mohou ukázat jako příliš zkostnatělé a pomalé, aby se dobře hodily pro organizace pracující s big daty při probíhající digitální transformaci,“ popisují. „Zde může pomoci právě pracovní styl spojený s DataOps.“
Přístup DevOps sdružuje specialisty na vývoj softwaru a provoz se záměrem více harmonizovat vývoj s firemními cíli, zkrátit vývojové cykly a zvýšit frekvenci nasazení. Zdůrazňuje multifunkční týmy, které zahrnují „cechy dovedností“, jako jsou provoz, softwarové inženýrství, architektura, plánování a produktový management.
DataOps k tomuto mixu přidává oblast datové vědy a datového inženýrství s cílem zlepšit a rozšířit spolupráci a komunikaci mezi profesionály z vývoje, provozu a s datovými experty. Dunning zdůrazňuje, že dosažení sjednocení slibovaného stylem DataOps vyžaduje začlenění datových vědců do týmu DataOps.
„Myslím si, že je zde nejdůležitější nedržet se nerealistického uspořádání, ve kterém datoví vědci pracují odděleně od týmů vývoje,“ upozorňuje Dunning. „Nejdůležitějším krokem, který můžete udělat, je skutečně začlenit datové vědce do týmu DevOps. Když žijí ve stejné místnosti, příslovečně jedí stejné jídlo a slyší stejné stížnosti, dojde k přirozenému sjednocení.“
„Nedovolte, aby pracovali odděleně,“ dodává Dunning. „Potřebují slyšet komentáře z frontové linie, doporučení stejných řešení a účastnit se rozhodování o prioritách. Toto začlenění je potřebný klíčový krok.“
Dunning však také poznamenává, že datoví vědci nutně nemusejí být součástí týmu DataOps trvale. „Obvykle je součástí týmu datový vědec jen po nějakou dobu,“ prohlašuje Dunning.
Podle něj se jejich schopnosti a cit začnou přenášet. Někdo z týmu pak převezme roli datového inženýra a jakéhosi nízkorozpočtového datového vědce. Skutečný datový vědec, který je součástí týmu, potom přejde jinam. Je to tedy proměnlivá situace.
Jak vytvořit DataOps
Vytvoření týmu DataOps nutně neznamená, že si ve firmě musíte najmout nové specialisty. Friedman poznamenává, že mnoho podniků již má jádro týmu DataOps ve svých existujících týmech DevOps.
Dalším krokem je identifikace projektů, které potřebují vývoj zaměřený na data, a nalezení někoho vyškoleného v oblasti dat. Takovou osobou může dokonce být spíše datový inženýr než plnohodnotný datový vědec.
„Když pokrýváte tyto různé dovednosti a spojujete je s tímto společným cílem, nemusí to nutně znamenat, že budete muset najmout mnoho lidí, abyste tyto role obsadili,“ vysvětluje Friedman. „Často totiž už u sebe máte personál s takovými klíčovými dovednostmi. Vyžaduje to jen restrukturalizaci, v rámci které se budou definovat klíčové role.“
Důležitou součástí je podle ní zlepšení spolupráce mezi jednotlivými dovednostmi pro zajištění efektivity a lepšího využití času a odbornosti členů týmu.
„Ve velkých projektech může být určitá role DataOps obsazena více než jednou osobou, ale je také běžné, že někteří lidé pokrývají více než jednu roli,“ tvrdí Dunning a Friedman.
„Dovednosti z oblastí provozu a softwarového inženýrství se mohou překrývat a členové týmu se zkušenostmi softwarového inženýrství mohou být také kvalifikováni jako datoví inženýři.“
Často se také stává, že datoví vědci mají dovednosti z oblasti datového inženýrství. Je však vzácné vidět překryv mezi datovou vědou a provozem.
Dunning a Friedman také upozorňují, že je důležité, aby měly týmy DataOps společný cíl: daty určované potřeby služeb, které podporují.
„S inženýrskými týmy a dobrými inženýry potřebujete jen dobře definovat cíle,“ prohlašuje Dunning. „Jakmile existuje společný cíl, vyřešení problému, pak se tým velmi často sám zorganizuje, tak aby směřoval k vyřešení tohoto problému.“
Obtíže podle něj vznikají, když různí lidé vidí různé aspekty problému. Lidé z provozu budou mít obavy o spolehlivost, a zda dostanou odpověď v určitém čase. Datoví vědci zase mají tendenci zaměřovat se na přesnost odpovědi – už zde máte určitý rozpor.
Pokud se však pokoušejí vyřešit stejný problém a jsou ochotni ke kompromisům ve způsobu řešení, je poměrně snadné vytvořit sociální strukturu.