Informace, které skutečně nesou peníze

DEFINICE: Datový sklad je databází, která obsahuje obchodní informace z řady zdrojů. Ty typicky pokrývají všechny ...


DEFINICE: Datový sklad je databází, která obsahuje obchodní informace z řady
zdrojů. Ty typicky pokrývají všechny aspekty obchodních procesů firmy, jejích
produktů a zákazníků. Dolování dat je pak procesem, který umožňuje v takové
rozsáhlé databázi najít jinak obtížně zjistitelné vztahy. Jejich zjištění může
přinést nemalé zisky a finanční úspory.
Datový sklad mění surové informace v užitečný analytický nástroj usnadňující
rozhodování. "Základní otázka byznysu, která existuje v tisíci a jedné formě,
zní: Kteří zákazníci, kdy a kde kupují a používají které produkty a služby?"
vysvětluje Lou Agosta, analytik z Giga Information Group. "Pokud znáte
správnou odpověď, pak jste schopni vést svůj byznys."
Aby byla firma schopna zodpovědět tuto otázku, potřebuje analytický systém
schopný provádět ad-hoc dotazy nad databází a na základě odpovědí vytvářet
specializované reporty. Surovým materiálem pro takové analýzy je kompletní
soubor firemních dat, ke kterým je zajištěn on-line přístup datový sklad.
Právě datový sklad uchovává na jednom místě informace z OLTP (on-line
transaction processing) systémů a z dalších zdrojů (vč. externích). Tato data
jsou přitom odpovídajícím způsobem přefiltrována, vyčištěna a uložena ve
formátu vhodném pro další podrobnou analýzu. Převod dat z původních zdrojů do
datového skladu se provádí v několika krocích:

extrakce z původních zdrojů z historických dat ji stačí provést jednou, z
aktuálních dat je třeba ji provádět pravidelně, např. každý den

konsolidace data z různých zdrojů jsou důsledně převedena do jednotného
formátu výsledné databáze

filtrace nepotřebných a duplicitních údajů

čištění a konverze v jejich rámci je kontrolována konzistence dat

agregace při ní jsou vytvářena různá odvozená data, např. součty prodejů za
určité regiony.

Datový trh
Datové tržiště, data mart, představuje specializovanou sadu obchodních
informací, které souvisejí s určitou částí obchodních procesů firmy. Může jít
např. o data pro oddělení lidských zdrojů apod. Řada společností přitom plní
jednotlivé data marty z datového skladu, protože zde již příslušná data jsou k
dispozici přefiltrovaná a ve vhodném formátu.

Dolování dat
S datovými sklady úzce souvisí také pojem dolování dat. Datové sklady
shromažďují data do formátu vhodného pro analýzu, proces dolování dat pak mezi
nimi vyhledává zajímavé a užitečné souvislosti.
Odlišnost procesu analýzy dat v běžném datovém skladu a procesu dolování dat
lze nejlépe vysvětlit na příkladu: V prvním případě uživatel vytvoří nějakou
hypotézu a poté si nechá vyhledat data pro její podporu. Např. je možné
požádat datový sklad o zobrazení zákazníků, kteří si pravděpodobně koupí nový
drahý produkt na základě předpokladu, že to budou ti, kteří již v minulosti
podobný produkt koupili. V případě dolování dat je proces opačný hypotéza
vzniká až na základě procesu dolování. Příslušný nástroj se probírá daty a
hledá podklady pro zjištění, kdo nakupuje drahé výrobky možná to jsou
nejčastěji lidé, kteří tak již učinili dříve, ale možná, že ne.
Škála tímto způsobem řešitelných problémů je skutečně široká: lze hledat typ
zákazníků, který s největší pravděpodobností využije nabídky na získání
půjčky, na koupi určitého typu domácí elektroniky, ale třeba i klienty
pojišťovny, kteří s největší pravděpodobností spáchali pojišťovací podvod.
Aby bylo možné takové informace získat, je třeba vlastnit dostatečný objem
odpovídajících dat (např. historické případy poskytnutých úvěrů) a nástroj,
který data prochází a hledá v nich souvislosti odpovídající určitým vzorcům.
Dolovací nástroje mohou pracovat několika různými způsoby. Řada z nich
vyžaduje zdrojová data ve formátu běžných textových souborů, některé jsou
desktopové, jiné pracují na principu klient//server. Nástroje od Right Point
Software mají jeden algoritmus pro všechny typy hledání, produkty společnosti
SAS zase obsahují sadu nástrojů s různými algoritmy.
Důležitým imperativem je použití vhodných dat. Příliš velké množství dat
nemusí dát uspokojivé výsledky, vždy je vhodné provést dopředu rozumný výběr
parametrů, které mohou mít vliv na požadovanou vlastnost. Věk zákazníka
kupříkladu nemusí být v souvislosti s jeho chováním zdaleka tak užitečným
parametrem jako podíl jeho věku a příjmu.

Data České pojišťovny
Letos v červnu jsme v Computerworldu psali o pravidelné uživatelské konferenci
společnosti SAS, která se pod názvem SeUGI konala v italské Florencii. SAS se
zaměřuje především na řešení datových skladů, business intelligence a CRM
(customer relationship management) a ve Florencii mj. představil řešení
IntelliVisor, které umožňuje použití CRM prostřednictvím modelu ASP. CRM
řešení od SASu již řadu měsíců využívá také Česká pojišťovna.
V tomto pojišťovacím ústavu bylo v roce 1998 rozhodnuto vybudovat v rámci
restrukturalizace společnosti datový sklad, který by shromažďoval data z
provozních systémů a umožňoval jejich další zpracování a analýzy pro podporu
rozhodování. Problémem, který si s sebou Česká pojišťovna historicky nesla, je
skutečnost, že její provozní systémy byly orientovány výhradně na jednotlivé
smlouvy (uzavřené pojistky). Klient v těchto systémech nebyl veden jako
samostatná entita, a tudíž bylo těžké zjistit, kolik má pojišťovna vlastně
zákazníků a nebylo téměř možné k nim efektivně individuálně přistupovat.
Z tohoto důvodu je v současnosti vytvářena jednotná klientská databáze, na
kterou jsou napojeny všechny provozní systémy. Tato databáze je součástí
konceptu datového skladu a postupně dochází k čištění a úpravám dat tak, aby
se mohla stát středem firemního CRM systému. Srdcem celého CRM systému bude
tedy datový sklad integrující údaje o všech klientech, smlouvách a pojistných
událostech, ale také o dalších smluvních partnerech pojišťovny. Nad tímto
datovým skladem jsou potom budovány data marty, které plní specifické úlohy
pro jednotlivá oddělení pojišťovny, jako je např. hodnocení efektivity
produktů, hodnocení práce obchodníků nebo analýza segmentů s nestandardním
chováním pro odhalování pojistných podvodů. V rámci výběrového řízení byla
jako hlavní dodavatel vybrána společnost SAS.
"Nejrychlejším přínosem nového řešení je schopnost segmentace klientů a
trhu," vysvětluje Jaroslav Kafka, náměstek výkonného ředitele České
pojišťovny. "Pokud jste schopni v pojišťovnictví oslovit přesně cílenou
skupinu, je vaše činnost daleko efektivnější." Protože je databáze klientů
České pojišťovny velmi rozsáhlá, je možné datový sklad využít také např. pro
sledování vzorů spotřebitelského chování. "Finálním cílem veškerého našeho
snažení, který se dnes v oblasti pojišťovnictví podobá spíše snu, je masová
výroba individualizovaných produktů," vysvětluje Kafka.

Odhalování podvodů
Pravděpodobně největším problémem, se kterým se musí potýkat každá pojišťovna
na světě, jsou pojistné podvody. Aplikace dodaná společností SAS, která byla
vyvinuta za účelem sledování nestandardních vzorů chování, už od začátku
přinášela dobré výsledky.
Útvaru bezpečnosti se podařilo díky systematickému sledování vzorů
nestandardního chování prováděnému pomocí tohoto řešení odhalit řadu
pojistných podvodů. Jen v prvním roce jejího využívání ušetřila pojišťovna na
nevyplaceném pojistném v případě odhalených podvodů řádově stovky milionů
korun. "Vzhledem k tomu, s jakými objemy peněz Česká pojišťovna pracuje, lze
prokázat návratnost investic vložených do tohoto projektu maximálně v týdnech.
A to jsme zatím prověřili pouze pojištění automobilů," říká Jaroslav Kafka,
náměstek výkonného ředitele České pojišťovny.
1 1982 / pen









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.