Sledujte v současné době propagované přístupy v podnikové sféře a nabudete dojmu, že big data jsou odpovědí na všechny otázky, které vaše společnost má. Problémem však je, že často jde o nesplněný příslib.
Ukazuje se, že to, co se obvykle označuje jako big data – všechna ta obrovská „jezera“ údajů zaznamenaných systémy ERP (plánování podnikových zdrojů), CRM (správa vztahů se zákazníky) a dalšími podnikovými systémy nadšeně zkoumanými současnými analytickými nástroji – ve skutečnosti tvoří jen deset procent dat, která průměrná společnost zpracovává, uvádějí analytici IDC.
Zbytek jsou nestrukturovaná či kvalitativní data, která mohou být chaotická. Součástí tohoto typu dat jsou například výsledky průzkumů zaměřených na zákazníky, formuláře odezvy, on-line fóra, sociální média, dokumenty, videa, zprávy, telefonní hovory na centra volání.
A také neoficiální informace získané prodejním týmem. Data jsou častěji textová než číselná a nelze je snadno kvantifikovat, ani převést na číselné hodnoty.
Problém současných analýz
V tom spočívá problém. Zatímco většina analytických nástrojů je nastavená na kvantifikované informace, jinými slovy na zpracování čísel, jsou to často nestrukturovaná data, která poskytují kontext a smysl, jeež společnost potřebuje, aby jí tyto informace byly užitečné.
„Data často vyvolávají více otázek, než poskytují odpovědí, a u kvantitativních datových trendů lze vždy klást otázku ‚proč‘,“ vysvětluje Anjali Laiová, analytička společnosti Forrester Research. „Data analyzovaná ve vakuu přinášejí riziko neúplnosti a kvalitativní data mohou pohled doplnit o kontext.“
Představte si, že jste ve společnosti, která se snaží pochopit, proč on-line prodeje nejsou takové, jaké byste si přáli.
Můžete významně investovat do nástrojů marketingové analýzy, které vám poskytnou údaje na základě aktivit, například jak dlouho průměrně setrvají uživatelé na které webové stránce nebo jaká je míra nedokončení nákupu pomocí nákupního košíku e-shopu.
Takové informace však i přes své množství nemusejí nutně poskytnout odpověď na otázku pátrající po příčině takového konání.
„Možná víte, že máte deset tisíc unikátních návštěvníků na svému webu – to jsou kvantitativní data,“ uvádí Sebastian Collin, produktový ředitel společnosti YouEye, která nabízí software a služby navržené speciálně s ohledem na kvalitativní data.
„Kvalitativní data vám řeknou, že čtyři tisíce z nich se nadchly pro nějakou konkrétní položku, že se něco určitého chtěli dozvědět, očekávání kolika návštěvníků se nenaplnilo a co nakonec udělali.“
Kvalitativní data mohou poskytnout více než jen zjištění souvislostí mezi daty, což vám může například ukázat, že lidé, kteří se na vašem webu zdrží déle, mají tendenci také nakupovat.
Namísto toho mohou kvalitativní data začít zjišťovat kauzální vztahy a snažit se odpovědět na otázku ‚proč‘. Například nakupují lidé, protože již strávili na vašich stránkách více času, nebo jednoduše jsou na stránkách déle, protože je váš e-shop těžkopádný?
„Současný průměrný marketingový ředitel využívá 14 informačních panelů,“ uvádí Sebastian. „Je to případ paralýzy analýzou: Mám 10 milionů datových bodů, které se vztahují k mé otázce 17 různými způsoby, ale nemám žádný kontext významu.“
Historicky má analýza kvalitativních dat tendenci k nárokům na manuální zpracování a zátěž lidské pracovní síly. „Nemůžete jednoduše zadávat databázové dotazy vůči dokumentu a dostávat zpět čísla, která byste mohli posílat do vizualizace,“ vysvětluje Kirk Borne, datový vědec ve společnosti Booz Allen Hamilton.
Kvalitativní analýzy dat byly ve svém důsledku zpravidla omezené co do rozsahu, ale začíná se to měnit. Nejenže existuje více nástrojů a balíků navržených speciálně pro kvalitativní data, ale existují také „stále chytřejší způsoby, jak kvalitativní data transformovat na kvantitativní data, a tím zpřístupnit plný výkon kvantitativních analýz i pro kvalitativní data“, vysvětluje Borne.
Audiovizuální a dotazníková analytika
Společnost YouEye vykonává on-line studie pomocí audio- a videozáznamů, které zachycují uživatele při interakci s klientskými weby, reklamou a dalšími materiály.
Pro každou studii se vybere obvykle mezi 50 až 300 uživateli v závislosti na tom, co chce klient zjistit. Video se potom dále převádí a zakóduje pomocí kombinace lidských programátorů, zpracování přirozeného jazyka a strojového učení. Na konci tohoto procesu pak klienti firmy YouEye dostanou ukázkové video ilustrující výsledky.
Například v případě prodejce kávy „jsme nechali účastníky projít interakcemi s produktem a dodali jsme ukázkové video ve všech případech, kdy nakonec padla volba na konkurenci“, uvedl Sebastian. „Okamžitě získáte analýzu příčin, proč ztrácíte zákazníky – a to vám kvantitativní data neřeknou.“
QSR International je další společnost, která vyvíjí software na míru speciálně pro kvalitativní data a její produkt NVivo se používá ve společnosti Gallup.
Ačkoli je tato firma nejlépe známá díky svým průzkumům veřejného mínění, nabízí také konzultace pro organizace, aby jim pomohla pochopit emocionální aspekty jejich vztahů se zákazníky, což představuje velké množství kvalitativních dat.
„Existují určité klíčové otázky výzkumu, které nelze postihnout samotnými kvantitativními metodami, například proč se zákazník rozhodl odejít, proč je vůči dodavateli lhostejný, a také pocity, motivace a myšlenkové procesy klienta při využívání služby,“ uvádí Ilana Ron-Leveyová, poradkyně pro strategie ve společnosti Gallup.
„Když spolupracujeme s nějakou organizací, umožní nám kvantitativní údaje posoudit rozšířenost konkrétních názorů, ale kvalitativní údaje jsou nezbytné pro pochopení významů určitých četností a rozložení,“ popisuje Leveyová.
Gallup používá různé metody pro posouzení vnímání zákazníků. V nedávném projektu B2B například v osobních rozhovorech vyzpovídal více než 100 zákazníků vyšší manažerské úrovně a shromáždil kvalitativní i kvantitativní údaje o tématech zaměřených na zájem zákazníků, popisuje Ron-Leveyová.
Tým induktivně analyzoval kvalitativní data pomocí nástroje NVivo stejně jako manuálně naprogramovanými metodami v aplikaci Microsoft Excel.
Vyzbrojen těmito výsledky použil Gallup kvantitativní odpovědi ke statistickému vysvětlení budičů zájmu zákazníků. Kvalitativní data se tak využila k popisu toho, jak se tyto budiče jevily zákazníkům a jak je vnímali.
„Odtud jsme zjistili, jak mohou strategie zlepšit zájem podle různých typů klientů,“ popisuje Leveyová.
Práce s kvalitativními daty v softwaru je často záležitostí jejich převodu do číselné podoby jako například přiřazení číselného hodnocení či skóre ke specifickým odpovědím či komentářům.
Při analýze pocitů například výzkumník obvykle přiřazuje kladné či záporné hodnoty k pocitům vyjadřovaným kvalitativními údaji a poté přiřadí číselné hodnoty k síle tohoto dojmu, poznamenává Borne.
Analýza textu pak zahrnuje shrnutí obsahu psaných informací kvantitativními způsoby, například prostřednictvím tematických modelů a tzv. tepelných map, zatímco metody zpracování přirozeného jazyka a sémantiky extrahují z jazyka smysl, ať už jde o psanou či mluvenou formu.
Kvalitativní vs. kvantitativní data
Transformace kvalitativních dat do kvantitativní formy může vyžadovat určitá subjektivní rozhodnutí...
Tento příspěvek vyšel v Computerworldu 10/2015.Oproti této on-line verzi je výrazně obsáhlejší a přináší další poznatky a tipy, které lze využít při praktické implementaci u vás ve firmě.
Časopis (starší čísla i předplatné těch nadcházejících) si můžete objednat na adrese našeho vydavatelství.