Jaké informace musíte vyžadovat od dodavatele data warehousu

V minulém článku o datových skladech (BW číslo 31/99) jsme se věnovali úvodním krokům vedoucím k vybudování datov...


V minulém článku o datových skladech (BW číslo 31/99) jsme se věnovali úvodním
krokům vedoucím k vybudování datového skladu a zmínili si základní body, které
je nutné udělat, než si vybereme dodavatelskou či konzultační firmu. Dnes se
podíváme trochu blíže na prověření kvalit potencionálního dodavatele.
Výběr firmy, která se stane dodavatelem data warehousu, představuje, podobně
jako výběr konzultanta či poradenské firmy, složitý úkol. Jak dodavatelská, tak
i konzultační firma totiž představují jedno z kritérií úspěšnosti implementace
datového skladu.
Dříve, než se pustíme do výběru dodavatelské firmy, musíme mít k dispozici
ucelené informace o hlavních dodavatelích těchto řešení na našem trhu.
Zmapování trhu je možné provést buď vlastními silami nebo využít služeb
konzultačních firem. Na základě těchto materiálů se musíme rozhodnout, kterou z
firem pozveme, resp. nepozveme do užšího výběrového řízení.
Jak se nejlépe zorientovat a udělat dobrý výběr? Na co je potřeba se
dodavatelských firem ptát? Většina z nich se prezentuje tím, že nabízí ucelené
řešení data warehousu, příp. data martu, které je úhledně zabaleno do
marketingového produktu typu "Mart in the Box". Případně je nabízen balíček
řešení představující jakousi data warehousovou šablonu.
Technologie a nástroje pro budování datových skladů jsou bezpochyby důležité,
existují však i další kritéria, jež by neměla být při výběru vhodného
dodavatele opomenuta. Patří sem hlavně TCP testy, škálovatelnost architektury
DW, použitá metodika, generický datový model, reference a další.
Testy
Patrně nejznámějšími výkonnostními testy systémů sloužících pro podporu
rozhodování jsou TPC-D testy poskytující výsledky vhodné pro porovnání
kvalitativních ukazatelů, ale i škálovatelnosti hardwarových platforem. V rámci
testů jsou spouštěny předem definované SQL dotazy nad příslušnými relačními
databázemi o různém objemu dat, a to v objemech dat až 3 TB. SQL představují
množinu obchodních dotazů navržených tak, aby co nejkomplexněji otestovaly
funkčnost systému pro data warehouse. Tyto dotazy mají vysoký stupeň
komplexnosti a je jimi testováno významné procento použitelných dat. Všechny
testy (dotazy) jsou odlišné a obsahují parametry měnící se v rámci provádění
jednotlivých dotazů.
Výsledky testů by měly být pro organizaci jedním z kritérií pro výběr
hardwarové platformy i databáze použitelné pro uložení dat v data warehousu.
Samozřejmě je nutné mít na zřeteli také požadavek informačního oddělení
podniku, které dbá na to, aby nová platforma byla integrovatelná do stávající
infrastruktury.
V současnosti nejpoužívanějšími databázemi pro DW jsou NCR Teradata, Red Brick
(nyní v produktovém portfoliu firmy Informix), DB/2, Oracle, Sybase. Testy
TPC-D jsou prováděny nezávislou organizací TPC (Transaction Processing
Performance Council), jejímiž členy jsou převážně dodavatelé informačních
technologií, ale i konzultační firmy, systémoví integrátoři a zákazníci
(www.tpc.org). Mezi signatáři dohody o provádění TPC testů lze najít např.
Compaq, Data General, Dell, EMC, HP, IBM,Informix, Microsoft, NCR, Oracle,
Sequent, SGI, Sun, Sybase nebo Unisys, přičemž ne všichni tyto testy provádějí.
Pokud se bavíme o hardwarové platformě, nelze zapomenout na vlastnost nazývanou
škálovatelnost systému. Ta vyjadřuje možnost jeho rozšiřování z hlediska
výkonnosti serverů a databází v případě růstu objemu dat v data warehousu.
Metodika
Metodiky budování datových skladů jsou odlišné od metodik vývoje OLTP aplikací
a jsou v převážné míře vlastněny dodavatelskými nebo konzultačními firmami.
Tyto metodiky nejsou většinou samostatně prodejné a podnik se s nimi seznamuje
během procesu budování data warehousu. Externí dodavatel připravuje projektový
plán implementace založený na
interní metodice, ze které jsou vždy vybrány fáze, etapy a jednotlivé dílčí
kroky nejvhodnější pro daného klienta. Přesto se doporučuje zjistit, jakou
metodiku dodavatel používá a který z přístupů budování data warehousu podporuje.
Ve světě lze najít i komerční metodiky budování data warehouse, které však
nejsou zatím na našem trhu dostupné. Hodnoty těchto metodik se pohybují v
cenách nad 100 tis. dolarů, což představuje významnou položku v rozpočtu
projektu data warehousu. Proto je nutno případný nákup komerční metodiky
pečlivě zvážit.
Reference
Jednou z velmi důležitých informací o dodavateli jsou dostupné reference. Ty
poskytují údaje o tom, kde a jaký datový sklad firma budovala. Vzhledem k tomu,
že v naší zemi jsme dnes teprve ve fázi zavádění datových skladů, bude se
jednat především o zahraniční reference. Pro potenciálního klienta mají význam
hlavně ty reference, které může na vlastní oči vidět a získat tak možnost
promluvit si s uživateli daných technologií či s lidmi, jenž se podíleli na
implementaci. Tyto reference současně umožňují získat přehled o tom, v jakých
odvětvích se dodavatel pohybuje.
Firmy dodávající datové sklady se snaží urychlit implementaci datového skladu.
Jedna z možností zrychlení implementace datového skladu je dána použitím tzv.
generického datového modelu představujícího jakousi datovou šablonu. Tato
šablona je zaměřena na určitou oblast podnikání, např. telekomunikace,
bankovnictví, pojišťovnictví apod. a vznikla na základě zkušeností s
nasazováním DW v příslušném odvětví. Z toho důvodu lze očekávat, že generický
datový model budou mít k disposici firmy, které se v oblasti data warehousingu
pohybují již dlouho dobu.
Generické datové modely obsahují duševní bohatství dodavatelské firmy, takže je
není možné koupit jako samostatný produkt. Zároveň lze předpokládat, že tyto
modely jsou navrženy tak, aby optimálně vyhovovaly konkrétní hardwarové
platformě.
Avšak podobně, jako existují možnosti koupit si metodologii, je možné získat i
univerzální datový model, který je jakousi šablonou pro budoucí návrh modelu
data warehousu. Ale opět, jako v případě metodik pro budování datových skladů,
zatím nejsou na našem trhu k dispozici.
Budoucí vývoj
Mezi množinu dotazů kladených potencionálnímu dodavateli je vhodné zařadit
otázky např. na téma příští verze databáze, zda se u ní počítá s podporou
starších verzí, zda nová verze operačního systému bude vyhovovat této databázi
apod. Velmi důležité je také vědět, jaké aplikace má dodavatel k dispozici a
jakou funkčnost nabízejí.
Firma, která zvažuje implementaci datového skladu, by si měla dopředu připravit
seznam otázek podobných našemu, případně rozšířený o další okruhy (bezpečnost,
kvalita dat), neboť jenom tak je schopna objektivně posoudit a zhodnotit
schopnosti dodavatelské firmy.
Co závěrem?
Trh s technologiemi datových skladů se postupně rozrůstá a dodavatelské
společnosti přicházejí s řešeními, která nesou marketingová označení jako "Data
mart v krabici", "Snadný návrh data warehousu" apod. Tyto balíčky však nic
neříkají o dodavateli a jeho schopnostech realizovat dodávku datového skladu.
Proto je potřeba prohlédnout si tyto firmy z blízka a na základě získaných
informací provádět co nejlepší rozhodnutí na cestě k datovému skladu.
9 2149 / ramn
Některé otázky pro výběr dodavatele
řešení datových skladů:
Jaké produkty a služby nabízí vaše firma v oblasti data warehousingu?
Jakým způsobem je zabezpečena škálovatelnost architektury DW?
Jakou metodiku vlastníte a preferovaný přístup k budování data warehousu?
Jaké jsou výsledky TPC-D testů v porovnání s konkurencí?
Vlastní dodavatel generické datové modely a pokud ano: jaké?
Jaké jsou reference související s aktivitami našeho podniku a je možné
některého zákazníka navštívit?

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.