Zlaté poklady v hlubokém moři informací

Datová skladiště a jejich využití Data warehouse je databáze, která sbírá obchodní informace z mnoha zdrojů v rám...


Datová skladiště a jejich využití
Data warehouse je databáze, která sbírá obchodní informace z mnoha zdrojů v
rámci podniku. Ty zahrnují všechna hlediska podnikových procesů, produktů a
zákazníků. Warehouse poskytuje uživatelům mnoharozměrný pohled na data, která
potřebují k analýze situace podniku. Tak nějak by mohla znít suchá definice. A
praxe?
Data warehouse transformuje surové informace na užitečný analytický nástroj pro
obchodní rozhodování. "Základní otázka, která je pokládána v tisíci a jedné
formě, zní: Kteří zákazníci kupují nebo používají které produkty a služby, kdy
a kde?" říká Lou Agosta, analytik Giga Information Group v Chicagu. "Znáte-li
odpověď na tuto otázku, jste schopen řídit váš podnik."
Společnosti často uchovávají základní informace v OLTP, které zachycují
každodenní operace každý prodej, nákup, změnu zásob apod. Ale OLTP systémy
nejsou vhodné pro zodpovídání otázek týkajících se minulých, současných a
budoucích směrů vývoje obchodu otázek typu: Jaké jsou historické trendy
jednotkových nákladů v poměru k růstu prodeje zákazníkům v Alabamě?
Pro zodpovězení otázek tohoto typu společnost potřebuje analytický systém se
schopností provádět ad hoc dotazy a vytvářet speciální výkazy. Základním
materiálem pro analýzu je kombinovaný pohled na všechna významná data, která má
společnost k dispozici data warehouse. Warehouse uchovává informace z OLTP
systémů a dalších zdrojů základních dat například vnějších z jednotlivých míst,
vytříděné a zpracované do správného formátu pro analýzu. Protože informace
přicházejí z mnoha různých zdrojů, z nichž každý má vlastní úhel pohledu, musí
společnost vytvořit podnikový model dat, aby na své informace získala
konzistentní pohled. Tak vznikají metadata, která tvoří prvotní zdroj pro
jednotlivé součásti architektury datového skladiště.
Proces přeměny základních dat na warehouse zahrnuje několik kroků: sběr,
konsolidaci, filtraci, čištění, konverzi a agregaci. Tento proces se celkově
označuje jako vytváření warehouse (warehouse generation).
Krok za krokem
Jednotlivé kroky tvorby datového skladu zahrnují následující postupy:
Sběr: Tento krok zahrnuje vytažení dat z jejich původních databází a jejich
přenesení do infrastruktury warehouse.
Konsolidace: Jedná se o proces kombinování dat z různých zdrojů do jedné
databáze. Aby společnost získala kompletní obraz zákazníka, může konsolidovat
data např. ze systému příjmu objednávek, databáze kontaktů a databáze technické
podpory.
Filtrace: Filtrace vybírá významná data a odstraňuje duplicitní záznamy.
Čištění: Kvalita odpovědi odpovídá kvalitě dat použitých k jejímu získání,
proto je důležité čištěním dat zvyšovat přesnost informací ve warehouse.
Klasickým příkladem špatné kvality dat je vícenásobný záznam pro jednoho
zákazníka například jako John Jones, Jack Jones a J. Jones.
Konverze: Konverze znamená přiřazení (mapování) původních dat do datových polí
datového modelu warehouse a převedení dat do formátu používaného ve warehouse.
Agregace: Přínos data warehouse je v tom, že poskytuje souhrnné údaje a
odvozená data, na rozdíl od původních, základních dat v OLTP zdrojích. V tomto
kroku jsou data tříděna a kombinována v měřítku užitečném pro provádění analýz.
0 0195 / pen









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.