Jak využít BIG Data pro analýzy a reporty

26. 5. 2014

Každá organizace generuje svou činností velké množství dat. Business uživatelé ale potřebují pro smysluplné analýzy a reporty přístup nejen k těmto velkým datům.

(PR článek)

Každá organizace generuje svou činností velké množství dat. Společnosti pracující se zákazníky shromažďují data o jejich nákupním chování; organizace veřejné správy a vládní instituce pracují s daty o obyvatelstvu, jeho demografickém, pracovním, ekonomickém nebo zdravotním stavu; průmyslové podniky monitorují průběžně stavy různých zařízení a systémů a samo IT produkuje další data o tom, jak správně či chybně pracuje. Takovýchto dat přibývá stále rychleji, údajně 80 % jich vzniklo za poslední 2 roky, jejich velikost se celosvětově odhaduje na biliony terabytů, a tak hovoříme o fenoménu velkých dat, tedy Big Data.

(Ne)možnosti práce s Big Data

Pro uchování velkých dat existuje řada systémů, jako např. hadoop clustery, což jsou nákladově výhodné, distribuované, souborové systémy pracující na běžně dostupných platformách či celopodnikové datové sklady založené na technologiích různých výrobců. Většina dnešních řešení Big Data je tedy orientována na zpracování masivních objemů dat. Business uživatelé ale potřebují pro smysluplné analýzy a reporty přístup nejen k těmto velkým datům ale i k dalším zdrojům dat z provozních systémů, spreadsheetů, pomocných systémů či internetu.

Stávající systémy pracující s Big Data nejsou obvykle navrženy pro analýzy řízené uživateli (user-driven analytics), ale jsou převážně orientovány na škálovatelnost, a nikoli výkon – vyřizování analytických dotazů je proto velmi pomalé. Navíc jednotlivé dotazy vyžadují napsání příslušných programů a není tedy podporován koncept ad-hoc dotazů.

Podobně je to s tradičními nástroji Business Intelligence (BI) závislými na součinnosti IT. V nich jsou pro předem očekávané dotazy připravena příslušná datová schémata, jednotlivé dotazy jsou řešeny lineárním vnořováním po předdefinovaných cestách. Uživatel tak nemá možnost svobodné volby a jím požadované změny pak trvají dlouho a jsou nákladné.

Práce s Big Data lépe a snadněji

Potřeby analytického uživatele proto mnohem lépe splňují systémy podporující tzv. in-memory asociativní analýzu, jejichž představitelem je nástroj QlikView od společnosti Qlik. V tomto prostředí uživatel samostatně rozhoduje, kde své dotazování započne a jak jej bude dále rozvíjet, má k dispozici veškerá data, která jsou uložena v operační paměti, a požadované dotazy a změny jsou proto extrémně rychlé a efektivní. Možnosti tohoto nástroje tak překračují běžně chápaný obsah pojmu Business Intelligence a definují novou oblast, tzv. Business Discovery. Nástroj této kategorie musí umožňovat uživateli, aby mohl samostatně pokládat následující dotazy na základě výsledků dotazů předchozích.

In-memory prostředí a Big Data

Data v prostředí in-memory architektury jsou v průměru komprimovány v poměru 1:10, takže např. při kapacitě 256 GB serverové paměti to představuje možnost pracovat s více než 2 TB vstupních dat, což umožňuje analýzy milionů řádek dat s vteřinovými odezvami. 2 TB dat nejsou málo, ale stále se nejedná o Big Data, jak jsou definována výše.

V prostředí QlikView je pro práci s externí Big Data infrastrukturou využita funkčnost, tzv. Direct Discovery. Jedná se o hybridní přístup, který umožňuje propojit in-memory data s daty získanými dynamickými dotazy z externích zdrojů. Agregované výsledky dotazů jsou zaslány do objektů QlikView, aniž by byly nataženy do jeho datového modelu. Tento výsledek tak umožňuje asociativní operace se všemi daty.

Business uživatel pracuje s Big Data bez znalosti programování a v kontextu s ostatními daty, v případě potřeby je zachována možnost drilovat až na příslušný detail. To, kdy je využita funkce Direct Discovery, může uživatel poznat pouze tak, že vyřízení příslušného dotazu není tak okamžité, jak je při práci s daty in-memory zvyklý. Toto „zpomalení“ je možné ale ovlivnit jak návrhem architektury řešení, tak možností „kešovat“ (rovněž v in-memory) výsledky externích dotazů pro rychlejší znovupoužití. V in-memory jsou proto obvykle alokována data, která jsou uživatelem z hlediska četnosti používána často (detailní data za aktuální období, relevantní a kontextová data, agregované, sumární či průměrné údaje za definovaná období), zatímco data, která jsou uložena v rozsáhlých faktových tabulkách, které nelze do in-memory uložit nebo přístup k nim je předpokládán s minimální četností, jsou ponechána v externích zdrojích.

Tato nová funkcionalita nástroje QlikView tak umožňuje využít nástroj kategorie Business Discovery i pro oblast Big Data. Není náhradou in-memory technologií ale jejich doplněním pro přístup k externím datům.

Autor: Tomáš Třmínek, Key Account Manager, trminek@komix.cz, KOMIX s.r.o.

Více informací o řešení: www.analyzyareporting.cz

Našli jste v článku chybu?

Sdílet

Autor článku

PR článek

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už některé z inovativních metod šifrování?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Jak využít BIG Data pro analýzy a reporty

Sdílet

Autor článku

PR článek

Témata:

Mohlo by vás zajímat

Co je nejoblíbenější způsob použití umělé inteligence v práci?

Kybernetická bezpečnost: Podcast o tajemstvích bezpečnostních operačních center s Pavlem Hrabcem

Europol zatnul tipec hackerům, chystali hromadný útok během Vánoc

Předpověď kybernetických hrozeb pro rok 2025: Připravte se na větší a odvážnější útoky

Anketa

Využíváte už některé z inovativních metod šifrování?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Dále u nás najdete

Online nákupy pohodlně. Známe trendy v e-commerce pro rok 2025

Autor zasněžených Vánoc přišel jako malý o oko

Vyšetření krvácení do stolice jako prevence rakoviny nestačí

Jak okresní města mění koeficienty k dani z nemovitostí

Zkuste vánoční cukroví bez cukru. 5 vyladěných receptů

Neplaťte si IT kurzy sami, využijte dotace od EU

Simona Kijonková: Dívala jsem se na investice za 1,4 miliardy

Operátoři testují nástroj proti podvrženým mobilním číslům

Udělejte si french toast ze zbylé vánočky

Kvíz: Ukažte, kolik druhů vánočního cukroví poznáte

Zahraniční cestovní náhrady 2025: Téměř 40 změn

Při balení dárků nemusíte vůbec používat izolepu, dokonce ani papír

Dění v Rumunsku testuje vztah Evropy k online platformám

Díky aplikaci placené pojišťovnou se povedlo objevit devět melanomů

Smyčka se utahuje – americké restrikce omezí další firmy

Ona pracuje s jehlou a nití, on se štětci a barvami

Google Agentspace zpřístupní AI agenty pro zaměstnance

Nejistota pro podnikatele, zásadní změny DPH ještě nejsou schváleny

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Nové HDMI 2.2 už je za rohem