Vytváříte plány pro big data? Tady jsou tipy, jak na to

Při zavádění big dat mohou společnosti vytěžit co nejvíce, pokud si předem stanoví jasný akční plán. Přinášíme podrobné rady, jak zvládnout strategii pro big data. Tento návod objasňuje koncepty a terminologii a může pomoci zlepšit připravenost realizačního týmu.

Vytváříte plány pro big data? Tady jsou tipy, jak na to


Krok 1: Vyhněte se žargonu

Nehledě na žargon, koncepty kolem big dat se neustále vyvíjejí. Začněte vyjasněním si rozdílů mezi správou big dat a administrací konvenčních údajů. Vysvětlete koncepty klíčovým zainteresovaným stranám a vypilujte spravovatelné komponenty.

Nebezpečí spočívá v tom, že by se koncepty mohly ztratit v překladu. Tradiční data jsou čistá – mezery jsou zaplněné a extrémy odstraněné. Hypotézu lze testovat společně s důkazy. Tyto důkazy i údaje se shromažďují a ukládají v tradičnějších podnikových datových skladech.

Big data jsou naopak méně čistá a obsahují strukturované, částečně strukturované i nestrukturované údaje. Pocházejí z mnoha různých zdrojů včetně mobilních zařízení, internetového provozu, streamování, komunikace mezi počítači, senzorů a sledovacích systémů GPS.

V tomto dynamickém a nepředvídatelném prostoru se dnešní big data mohou lehce stát zítřejšími zastaralými údaji. V oblasti lidské komunikace a interakce nic nezůstává neměnné.

Jako cestovatelé začínejte na cestě s názvem big data v malém. Složitosti ponechte vědcům specializovaným na big data. Ptejte se sami sebe, jaká by měla být právě vaše strategie.

Odpovídá tato strategie vašemu podnikání, dodávkám služeb a provozním potřebám? Jaké technologie, standardy a postupy doplní to, co chcete?

 

Krok 2: Vyhněte se více podobám téhož

Nebezpečí spočívá v přejmenování vašeho dosavadního plánu pro správu podnikových informací na strategii pro big data. Abyste mohli se ziskem analyzovat, sdílet a využívat méně strukturované informace, vyjasněte si nejprve své datové množiny s vysokou hodnotou.

Tyto soubory dat jsou otevřené, snadno dostupné a mohou být svobodně použité, opětovně využité či komukoli distribuované. Kromě sémantiky posuďte, jak analýza big dat alokuje služby tam, kde je to třeba, zprůhledňuje zásady či vylepšuje podnikové procesy a řízení.

Vyhněte se vytváření databázových dotazů pro big data. To za vás může udělat nepřeberné množství komerčně dostupných analytických nástrojů. Tento výlet se spíše týká průzkumu, objížděk, méně stabilních vztahů a přizpůsobení se měnící se krajině.

 

Krok 3: Podívejte se zpět

Přezkoumejte své dostupné informační zdroje – kdo vlastní kterou část skládačky? Do hry vstoupí strategické plánování, které je už poněkud nadužívaným pojmem. Podrobněji se přezkoumávají dostupné zdroje dat, potenciál těchto dat, náklady a překážky přístupu.

Tato strategie také zahrnuje vědecký, ekonomický a sociální výzkum. Na provozní úrovni je analytika užitečná pro segmentaci zákazníků či klientů, průzkum trhu, řízení kampaní či sledování domácích nebo globálních ekonomických trendů. Odhalování podvodů a řízení rizik nabízí zatím nevyužitý potenciál.

Pokud jste v přední linii a děláte rychlá, velkoobjemová či časově citlivá rozhodnutí, budou se vám big data velmi hodit. Širší sada zdrojů nabízí hlubší vhled do podnikových či obchodních problémů.

To je důležité, když je údajů reaktivně málo nebo nejsou snadno dostupné. Konkrétněji řečeno: Potřebujete předvídat události s vyšší přesností nebo najít spojnice mezi občasnými, ale těsně provázanými vztahy.

 

Krok 4: Odkud to pochází?

Při kvapné implementaci strategie big dat nebezpečí spočívá ve ztrátě ohledu na přesnost a důvěryhodnost. Ve vládním sektoru, ve zdravotnictví či ve vzdělávacím sektoru se dostává do popředí potřeba odpovědnosti. Problém leží v detailu – například schopnost identifikovat a ověřit různé zdroje dat.

Cílem je zajistit inteligentní a informované využití dat. Přestože kontrola vašich datových aktiv může být nereálná, pomůže identifikovat vysoce cenné datové zdroje a „korunovační klenoty“. Pravidelná aktualizace seznamu těchto zdrojů je určitě pozitivem.

Big data podléhají stejně jako ostatní data vládním přepisům, regulacím a zákonům. Platí to o to více, když dochází k výměně dat o zákaznících nebo k jejich sdílení v komerčním prostředí. Udělejte si čas na uvážení způsobů správy těchto dat a případného využití jasně definovaných auditů.

Ke svým datům můžete přistupovat jako ke strategickému prostředku. Bude také dobré věnovat čas přezkoumání dopadů na soukromí a zabezpečení. Problém spočívá ve vyvážení přístupu k otevřeným datům a odpovědné výměny informací.

 

Krok 5: Proč záleží na soukromí

Regulační předpisy jsou v oblasti ochrany osobních údajů a zabezpečení velmi přísné, zejména pokud se výměna těchto údajů stává všudypřítomnou, komerčně atraktivní a má globální dosah.

Dříve než vytvoříte obrovské jezero dat nebo velké objektové úložiště, uvědomte si, že je nezbytné vytvořit funkce pro odstranění identifikovatelnosti. Osobní identifikátory lze například eliminovat smazáním základních údajů podle pravidel, která stanoví tzv. bezpečný přístav (safe harbour). Nebo můžete zkusit maskování, agregaci apod. Další možností je využít oddělení personálu, který s těmito daty pracuje, a povinností, jež má.

Bezpečnostní opatření pro osobní údaje je nutné podrobněji přezkoumat v místě sběru dat. To zahrnuje on-line, mobilní a další senzory. Zatímco prohlášení o dopadech na soukromí lahodí oku, následky nastávají v oblasti nákladů, a to včetně případných nečekaných pokut.

Mezi nápravná opatření si zařaďte sledování toku informací v rámci celého svého projektu. Analyzujte a posuzujte dopad na lidi, služby a provoz. V ideálním případě začíná toto hodnocení již ve fázi plánování a nedomýšlí se až později.

Buďte spíše aktivní, než abyste jen reagovali na vzniklé problémy. Používejte ochranu soukromí a osobních údajů jako výchozí vlastnost a zajistěte, aby tato magická slova byla součástí designu. A možná ještě důležitější je investovat do komplexního zabezpečení namísto záplatování děr současných řešení.

Úvodní foto: © Ben Chams - Fotolia.com



Vyšlo v Computerworldu 6/2015
Tento text vyšel v Computerworldu 6/2015 jako součast většího celku k problematice big dat.








Komentáře