Deset velkých mýtů o big datech

19. 4. 2015

Sdílet

 Autor: © Ben Chams - Fotolia.com
V poslední době se technologii big data věnuje velká pozornost. Nabízela se jako možné řešení pro všechno -- od detekce narušení přes předcházení podvodům až po léčbu rakoviny či stanovení optimálních cen produktů. Big data však nejsou všelékem na každý problém.

Pokud firmy věří v některé mýty, které big data obklopují, mohly by se kvůli tomu vydat špatným směrem, ztratit mnoho času a peněz a mohlo by je to stát jejich konkurenční postavení na trhu nebo poškodit jejich pověst.

Zde jsou některé z největších mýtů, které se okolo big dat stále točí.

 

MÝTUS 1: Big data zvládnou jen datoví vědci

Ve skutečnosti samotní datoví vědci nestačí.  

„Samotní tito lidé nedokážou z big dat informace získávat, pokud v první řadě nevědí, co hledají,“ upozorňuje Pat Farrell, šéf pro analýzy dat ve zdravotnickém ekosystému Penn Medicine. „Potřebujete specializované pracovníky, kteří oboru rozumějí, mají znalosti z dotyčné oblasti, chápou možné otázky a pohledy, které by pro váš konkrétní obor byly cenné.“

Zmíněný Penn Medicine zahrnuje jak samotný systém zdravotní péče, tak lékařskou univerzitu. Prvně jmenovaná divize po dlouhou dobu shromažďuje klinická data ve svém datovém skladu,  na její univerzitě zase nová technologie umožňuje dekódování lidského genomu, které s sebou nese obrovské množství dat.

„Víme, že tam někde uvnitř se skrývá poklad, a konečně máme výpočetní výkon, abychom se k němu dostali,“ říká Farrell a dodává, že kombinace analýzy dat s odbornými lékařskými znalostmi otevírá zcela novou oblast prediktivního zdravotnictví.

 

MÝTUS 2: Čím více dat, tím větší hodnota

Shromažďování dat, jejich ukládání a katalogizace vyžadují čas a zdroje, připomíná Farrell. Bezhlavý sběr velkého množství údajů může vytížit zdroje, které byste jinak použili na důležitější projekty.

Farrell proto doporučuje, aby společnosti měly dříve, než začnou data sbírat, jasnou představu konkrétní metriky nebo klíčového ukazatele výkonu, které požadují.

„Chcete se dostat do bodu, kdy máte hrst plnou zlatých valounů – moudrosti, která je pro vás cenná,“ vysvětluje Farrell. „Samotná uložená data nestačí.“

 

MÝTUS 3: Big data jsou jen pro velké společnosti

Velké firmy mohou mít více vnitřních zdrojů dat, ale i malé organizace mohou efektivně využít data pocházející ze sociálních sítí, od vládních úřadů a dodavatelů dat.

„Nehledě na velikost vaší organizace je lepší, abyste se rozhodovali na základě dat a nespoléhali se jen na intuici či pocity,“ radí Darin Bartik, výkonný ředitel produktového managementu divize Information Management Solutions ve společnosti Dell.

Menší podniky mohou dělat rozhodnutí na základě dat méně často než ty velké, ale zase mohou svůj směr korigovat rychleji.

„Menší společnosti mohou využívat osvědčené postupy, aby lépe využily data k rozhodování a překonaly či takticky porazily větší a pomalejší konkurenci,“ vysvětluje Bartik.

 

MÝTUS 4: Nasbírejte teď a přeberte později

Úložiště jsou stále levnější, ale nejsou úplně zadarmo. Mnoha firmám však roste chuť na data rychleji, než jak klesají ceny úložišť, prohlašuje Brad Peters, výkonný ředitel společnosti Birst, která je dodavatelem cloudového produktu business intelligence.

Firmy si myslí, že budou sbírat data a teprve později přijdou na to, co s nimi budou moci dělat, popisuje Peters a dodává: „Vidím řadu velkých korporací shromažďujících kvanta údajů, jejichž náklady pro tuto činnost stále rostou, a přitom jim to nepřináší žádnou hodnotu.“

Ve skutečnosti podle Peterse u některých množin dat začíná platit zákon klesajících výnosů. Řekněme například, že děláte průzkum, abyste dokázali odhadnout výsledek voleb. Potřebujete pro reprezentativní vzorek získat určitý počet lidí. Po dosažení tohoto bodu ale už přidávání dalších lidí statistickou odchylku významně neovlivní.

„Ukládáte spoustu dat s nadějí, že vám poskytnou o něco vyšší přesnost?“ ptá se Peters. „Nebo pořizujete více personálu? Zabezpečujete lépe své sítě? Nepostupujete moc rychle z důvodu nedostatečného růstu ekonomiky a rozpočtů.“

Nejsou to ale jen náklady na úložiště, jak upozorňuje Dean Gonsowski, ředitel pro správu informací a big data z firmy Recommind, která se specializuje na analýzy nestrukturovaných dat. Například únik dat může podle něj firmu značně poškodit.

Data uložená v datových skladech mohou být navíc předmětem různých důkazů na základě rozličných soudních sporů.

A konečně – čím více dat máte, tím déle trvá jejich přebrání. „Když jsou v archivu miliardy záznamů, trvá vyhledávání odpovídajících informací hodiny nebo i týdny,“ popisuje Gonsowski a dodává: „Velké množství informací skutečně začíná blokovat činnost systémů, které se nikdy nevytvářely pro zvládání takových objemů.“

 

MÝTUS 5: Všechna data se vytvořila stejně

 

bitcoin_skoleni

Kompletní článek zahrnující spoustu dalších poznatků, trendů a zajímavostí jste si mohli přečíst v Computerworldu 12/2014.