Datawarehousing

1. 12. 1997

Sdílet

Zahoďte křišťálové koule, datové sklady přicházejí! Když jsem nedávno odmítl jít se svým znám


Zahoďte křišťálové koule, datové sklady přicházejí!


Když jsem nedávno odmítl jít se svým známým na kulečník s tím,
že mě ještě čeká ten datawarehousing, řekl mi: "Vídíš, kdybys
měl pořádnej antivirák, tak bys žádnýho verhauze v datech
neměl". A tak jsem mu začal vysvětlovat, že.

Datawarehousing, nebo chcete-li česky datový sklad, není nic
tajemného nebo převratného. Název sám trefně charakterizuje, že
se jedná o schraňování dat. Složitá není ani odpověď na dotaz, k
čemu je takové hromadění dat dobré. Mám-li totiž k dispozici
dostatek kvalitních informací, může mi být jejich analýza
nápomocná při mých budoucích rozhodnutích. Takže např. pokud
jsem v restauraci U Tří boulí již dvakrát inkasoval pár facek,
rozhodnu se pravděpodobně po zhodnocení těchto skutečností pro
jiný podnik nebo zůstanu raději doma.

Ale teď vážně. Pokud se na problematiku datových skladů podíváme
hlouběji, zjistíme, že se v určitých ohledech liší od běžně
používaných databázových systémů. Je to dané především
specifickými požadavky, které jsou na oblast datawarehousingu
kladeny. Jedná se o následující rysy:

Silná schopnost přístupu k datům. Datové zdroje podniku
(může se samozřejmě jednat i o externí data) mohou být často
uloženy v řadě rozdílných formátů na více místech, lišících se
síťovým protokolem či operačním systémem.

Vysoký výkon. Ve většině případů jsou zpracovávány velké
objemy dat, protože čím více je vstupních údajů , tím jsou
samozřejmě získané výsledky přesnější a objektivnější.
Složitější je také vyladění systému, neboť používané dotazy
bývají komplikované, nahodilé a zřídka se opakují. V praxi je
také třeba výsledky získat v rozumném časovém horizontu.

Naproti tomu některé funkce podnikových systémů, sloužící
především ke zvýšení produktivity a efektivnosti zpracovávání
běžné agendy, nejsou pro datawarehousing bezpodmínečně nutné:

Pořizování dat. Standardně se datový sklad naplňuje po
velkých celcích, není určen k zadávání jednotlivých záznamů.
Proto je volena optimalizace pro čtení, a nikoliv zápis.

Počet uživatelů. Datawarehousing není určen pro široký
okruh uživatelů. U většiny firem je zpracovávání informací na
této úrovni doménou úzkého okruhu specialistů, mnohdy dokonce
jednotlivce.

Dalším termínem spojeným s datawarehousingem je datamart. I přes
vzrůstající výkon hardwaru je totiž stále třeba zamýšlet se nad
návratností investic vložených do budování datového skladu.
Nashromáždíme-li např. 200 GB "čistých" dat, můžeme spolu s
vytvářenými indexy a sumacemi (ty podle statistik tvoří 65 -- 75
procent z celkového objemu dat) dostat až 800 GB velkou
databázi. To již vyžaduje opravdu výkonné stroje, nasazení
systémů na bázi symetrického procesingu nebo použití jiných
speciálních a nikterak levných řešení. Díky technologii založené
na datamartech to však není bezpodmínečně nutné.

Datamart je vlastně podmnožina datového skladu, tvořená daty
určitého zaměření. Oddělit tak lze například data, jejichž
analýza má význam pro ekonomický úsek, data týkající se
personalistiky, marketingu nebo profilace výrobní náplně.
Získáme tak menší, lépe zpracovatelné datové zdroje, aniž by
utrpěla relevantnost výsledných údajů.

Význam datawarehousingu a datamartů. Při dnešním rozmachu
výpočetní techniky vzniká v rámci různých podnikových aplikací
obrovské množství dat s většinou dočasným významem. Datové
sklady a datamarty umožňují využití potenciálu těchto zdánlivě
"mrtvých" dat pro lepší řízení, plánování a strategická
rozhodnutí v rámci podniku. A to jak jistě uznáte stojí v tržním
prostředí nejen za úvahu, ale i za tu partičku kulečníku.

7 0.../OK




Autor článku