Datové sklady v podání Microsoftu

Microsoft nemá na databázovém poli příliš velkou tradici a v oblasti datových skladů je naprostým nováčkem. Přes...


Microsoft nemá na databázovém poli příliš velkou tradici a v oblasti datových
skladů je naprostým nováčkem. Přesto je jeho vstup do této oblasti odborníky
brán velmi vážně, neboť dovede být velmi nepříjemným konkurentem.
Microsoft vstoupil do oblasti nástrojů pro datové sklady teprve na přelomu
tohoto roku, kdy uvedl na trh novou verzi svého databázového stroje SQL Server
7.0, který obsahuje technologie pro práci s datovými sklady a OLAP. Nutno
podotknout, že nástroje pro datové sklady a OLAP jsou standardní součástí SQL
Serveru.
Komponenty
Jednou z klíčových komponent pro tvorbu datových skladů jsou zde služby
transformace dat (Data Transformation Services). Tyto služby zajišťují import
a export dat mezi SQL Serverem a datovými zdroji s rozhraním ODBC nebo OLE DB
(případně textovými soubory). Tato transformace může být provedena
jednorázově, anebo pravidelně v nastavených časových intervalech. Při
transformaci je možné specifikovat, jaké položky zdrojové databáze budou
mapovány na jaké položky cílové databáze. Pro složitější transformace je
možné vytvořit skript v jazyce Visual Basic Script, který může data při
přenášení prakticky neomezeně modifikovat. Pro skriptování je možné použít i
jiný jazyk, kompatibilní s Windows Scripting Host například JavaScript. Tyto
transformační služby nejsou vázány přímo na SQL Server mohou být používány i
jako flexibilní datová pumpa mezi úplně jinými systémy.
Hlavním nástrojem pro datové sklady v MS SQL Serveru jsou OLAP Services. Ty
zajišťují výpočet analytických dat a jejich dodávání cílovým aplikacím.
Analytická data je možné udržovat ve formě multidimenzionální databáze
(MOLAP), relačních tabulek (ROLAP), nebo v hybridní formě (HOLAP). Každá z
těchto technologií má jak známo své výhody i nevýhody. Tvůrce datového skladu
si také může definovat, jaký rozsah agregovaných dat (tj. pro kolik
agregačních funkcí) má SQL Server udržovat. Větší počet užitých agregačních
funkcí znamená delší dobu pro generování agregovaných dat a také jejich větší
objem, avšak i kratší dobu odezvy. Tyto agregace je možné generovat nejen nad
daty na SQL Serveru, ale i nad daty uloženými na konkurenčních serverech
(Oracle, Informix apod.). Za účelem zlepšení škálovatelnosti je možné data
rozdělit podle vybraného atributu (např. geografického regionu) na několik
částí (partitioning), a tyto části umístit na různé servery. Jednotlivé dotazy
na agregovaná data pak budou řešeny distribuovaně.
Jednou z technologií, která má velký potenciál, je Microsoft Repository. Jedná
se obecně o jakýsi sdílený zásobník objektů, který může být využíván různými
uživateli a aplikacemi. Do Repository jsou ukládána metadata, připravené
transformační služby a některé další věci. Jelikož je rozhraní k Microsoft
Repository otevřené, je tyto informace možné využívat z dalších nástrojů.
Pro správu datového skladu je možné využít MS Management Console, která se
stala univerzálním administrátorským nástrojem Microsoftu. Ta nabízí také řadu
průvodců pro jednoduché i obtížnější administrátorské úkony. Pro optimalizaci
datových skladů je nabízen nástroj SQL Server Query Analyzer, který graficky
znázorní postup při vykonávání dotazu. SQL Server také nabízí nástroje, které
zajistí optimální nastavení různých voleb databáze a databázového serveru jako
takového. Jsou to např. Index Tuning Wizard nebo SQL Server Profiler. Užitečné
mohou být funkce pro práci s ER (Entity Relation) diagramy.
Klientské nástroje
Co se nástrojů pro datové sklady týče, Microsoft zatím lehce pokulhává na
straně klientských nástrojů, které mají vyvíjet partnerské firmy uživatelům
na míru. Hlavní klientský nástroj je PivotTable Service, který slouží k
vytváření a zobrazování kontingenčních tabulek. To jsou klasické
multidimenzionální kostky, které zachycují závislosti daného ukazatele na
různých dimenzích. Klientská část této služby umožňuje také cachování
analytických dat na klientovi, což může zrychlit odezvu a také umožňuje
prohlížení analytických dat i po odpojení od sítě. Tato technologie je opět
přístupná pomocí rozhraní COM, takže ji lze využít z aplikací vytvořených v
běžných vývojových prostředcích. Jelikož je kontingenční tabulka k dispozici
též jako ActiveX prvek, je dostupná i z Internet Exploreru.
Podobně jako jiní výrobci i Microsoft vyvinul nástroj pro dotazování v běžné
angličtině English Query, který je díky rozhraní COM dostupný také např. z
aplikací ve Visual Basicu nebo z webových stránek. Před použitím tohoto
nástroje je ale nutné definovat vztahy mezi tabulkami a význam jednotlivých
hodnot. Tyto informace jsou ukládány také do Microsoft Repository.
Posledním z možných klientů je Microsoft Office (verze 2000), zejména pak
součásti Excel a Access. Excel umožňuje získávat analytická data přímo z
databází a prezentovat je ve formě tabulky nebo v grafické podobě. Excel je v
tomto směru dobrý "front-end", neboť je mezi uživateli oblíben a umožňuje
získaná data velmi jednoduše dále zpracovávat. Program Access je nyní také
možné použít jako obecného klienta ke SQL Serveru a tedy i k OLAP službám.
Jelikož získávání dat ze SQL Serveru do aplikací Office je přeci jen trochu
obtížnější, je vhodné tyto operace automatizovat pomocí maker.

9 1912 / ramn









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.