Datové sklady v podání Oraclu

V loňském 30. čísle Business Worldu jste mohli najít první 2 díly volné série článků o datových skladech, které ...


V loňském 30. čísle Business Worldu jste mohli najít první 2 díly volné série
článků o datových skladech, které byly věnovány Microsoftu a Sybase. Díky
změnám, kterými koncem roku příloha BW prošla, máte nyní možnost přečíst si
třetí volné pokračování zmíněné série na stránkách Technology Worldu. Tentokrát
se věnujeme společnosti Oracle.
Firma Oracle je považována za vedoucí technologickou firmu v oblasti databází.
Není proto divu, že v jejím portfoliu nalezneme mnoho produktů pro datové
sklady a související oblasti. Některé z těchto produktů firma Oracle vyvinula
sama, jiné získala akvizicí od cizích firem.
Přístup společnosti Oracle k datovým skladům charakterizuje heslo "Think Big,
Start Small". To znamená, že implementace datových skladů je postupná. V době,
kdy se poměrně často mění požadavky na informační systém (včetně analyticky
orientovaných částí), je nebezpečné věnovat mnoho prostředků a času na tvorbu
celopodnikového datového skladu naráz. Oproti tomu, "jednoúčelová" řešení,
založená pouze na datových tržištích (data martech), obvykle vedou k vytvoření
velmi neefektivního a těžce spravovatelného systému.
Doporučením Oraclu je postupná (paralelní) tvorba datového skladu, datových
tržišť a implementace koncových analytických aplikací tak, jak vyvstává jejich
potřeba v organizaci. Oracle8i
Hlavním produktem Oraclu v oblasti datových skladů je databázový server
Oracle8i. Jelikož je tento server "srdcem" všech řešení datových skladů od
Oraclu, budu se vlastnostem této databáze věnovat trochu podrobněji. Jde o
stejný server, který Oracle používá pro transakční systémy. Jde o velmi
flexibilní databázový systém, který si poradí s uložením velkého objemu dat,
indexováním a s propojením s transakčními systémy.
Tato databáze umožňuje vytváření "souhrnných tabulek" (summary tables), které
obsahují agregovaná data (součty, počty apod.). Tím se databáze přizpůsobuje
tomu, že většina dotazů na datový sklad vyžaduje právě agregované informace. Na
rozdíl od jiných produktů využije Oracle8i těchto souhrnů, kdykoliv je to možné
tedy i když se uživatelský dotaz odkazuje na původní tabulky, optimalizér
dotazů přepíše dotaz tak, aby byla použita předpočítaná data. Tím se doba
zpracování dotazů značně urychlí.
Oracle8i zvládá také partitioning rozdělování rozsáhlých tabulek do
samostatných částí za účelem zvýšení výkonu. Kromě rozdělení podle hodnoty ve
vybraném sloupci lze použít rozdělení tabulky podle hashovací funkce.
Oracle8i se vyznačuje velmi dobrou správou zdrojů zejména procesorového času. U
víceprocesorových strojů je možné velmi podrobně specifikovat způsob využívání
jednotlivých procesorů i v závislosti na uživateli. Server také umožňuje
průběžně informovat klientskou stranu o průběhu dlouhých procesů (dlouhé
dotazy, vytváření indexů anebo zálohování).
Také jazyk SQL přináší několik rozšíření. Klíčová slova ROLLUP a CUBE (které se
používají s příkazem SELECT) slouží k výpočtu multidimenzionální kostky podle
zadaných parametrů. Zejména pro aplikace dolování dat je určena funkce SAMPLE,
která umožňuje vybrat z tabulky jen "vzorek" dat (pro rychlejší následné
zpracování).
Warehouse Builder
a Data Mart suite
Warehouse Builder je nástroj pro návrh, implementaci a správu datového skladu.
Společně s vlastním databázovým serverem je tento nástroj vhodným základem pro
řešení datových skladů technologiemi Oraclu.
Warehouse Builder umožňuje načítat do datového skladu data z různých datových
zdrojů z jiných databází Oracle, z ODBC datových zdrojů a z dalších zdrojů přes
Gateway Oraclu (např. DB2, Informix, Sybase). Warehouse Builder zajišťuje také
vícestupňové transformace dat a dokumentaci procesu transformace. Při načítání
je také možné ověřovat integritu dat podle definovaných obchodních pravidel.
Jednou z důležitých komponent Warehouse Builderu je sdílená Repository, která
obsahuje veškerá metadata. K dispozici je také dokumentace, jak jsou tato
metadata do Repository ukládána, takže další aplikace mohou tyto informace
využívat. Tuto Repository také používají některé z koncových nástrojů
(Discoverer, Express), které jsou popsány dále.
Uživatelský interface Warehouse Builderu je vytvořen kompletně v Javě a proto
může být používán na libovolné platformě. Pro velmi rozsáhlé modelování
datových objektů je možné použít specializovaný CASE nástroj Oracle Designer.
Oracle nabízí kompletní balík pro vybudování účelově zaměřeného datového skladu
neboli Data Martu, který se jmenuje Data Mart Suite a obsahuje veškeré
softwarové komponenty potřebné pro vybudování a provoz datového skladu včetně
školení a kuchařky.
Klientské nástroje
Klientským nástrojem pro nejjednodušší analýzu a prohlížení dat je "Oracle
Reports". Jedná se o poměrně propracovaný nástroj pro tvorbu různých sestav,
které jsou dynamicky generované z aktuálních dat. Oproti konkurenci tento
nástroj vyniká velkými možnostmi formátování a grafické úpravy. Jednou ze
speciálních vlastností Reports je možnost vkládání grafů z živých dat.
Tento nástroj je vhodný pro běžné (relativně nekvalifikované) uživatele, kterým
stačí si pravidelně prohlížet různé standardní sestavy. Sestavy je možné
prohlížet buď ve speciálním prohlížeči, nebo pomocí běžného webového
prohlížeče. Dále je možné generovat dokumenty ve formátu Acrobat Readeru (PDF),
Rich Text Format a dalších.
Nástrojem pro náročnější uživatele je "Oracle Discoverer". Ten umožňuje ad-hoc
dotazování tedy dotazování "na cokoliv" bez jakýchkoli omezení. Tento nástroj
pracuje s konceptem ukazatelů (toho, co sledujeme) a dimenzí (podle čeho
sledujeme). Uživatel je při tvorbě dotazů odstíněn od fyzické databáze a
pracuje s uživatelsky pochopitelnými "aliasy" (náklady, zisk, čas), které
definuje administrátor. U dimenzí je také možné definovat jejich hierarchii
(země region město). Tento nástroj je určen pro analýzu dat z relačních
databází (tedy ROLAP).
Klasickým "OLAP" nástrojem pro pokročilé typy analýzy je "Oracle Express". To
není jen klientský nástroj, ale současně multidimenzionální databázový server.
Kromě Ad-hoc dotazů zvládá Express také dotazy what-if, vyhledávání vzorů,
analýzu časových řad, rozdělování do skupin ("klastrování"), tvorbu
"analytických modelů" (např. sestavování rozpočtu).
Nástroje Report, Discoverer a Express si mohou vyměňovat sestavy a tabulky mezi
sebou. Jejich klientská část je lokalizovaná do češtiny.
Závěr
Oracle nabízí ucelenou sadu nástrojů, které pokrývají tvorbu datového skladu,
import dat, správu i analýzu. Pokud uvažujete o tvorbě datového skladu, Oracle
patří mezi firmy, které byste rozhodně neměli přehlédnout.
9 3651 / pen









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.