Kxen naplňuje potřebu rychlé BA

Přestože BI (business intelligence) dává odborníkům na dolování dat příležitost zodpovědět strategické otázky, ...


Přestože BI (business intelligence) dává odborníkům na dolování dat příležitost
zodpovědět strategické otázky, nejde o příliš interaktivní či iterativní
proces. Tyto výhody jsou doménou BA (business analytics). Ale také nástroje pro
BA vyžadují, abyste předem znali ty správné otázky a byli schopni vidět modely
v předkládaných informacích tak, abyste následně mohli klást další dotazy.
Jedním z faktorů limitujících analytický software je skutečnost, že tento
software má buď tendenci zaměřit se na široké spektrum odborníků v dané
oblasti, nebo naopak na omezenou skupinu expertů na statistiku. Proto zde
vzniká mezera, kterou se snaží dodavatelé BA nástrojů překlenout produkty, jež
disponují sofistikovanými analytickými schopnostmi zabalenými do takového
uživatelského rozhraní, které budou schopni obratně využívat lidé bez
profesionálních znalostí statistiky.
Analytic Framework 3.0.2 od společnosti Kxen představuje kvalitní úsilí o
zaplnění výše zmíněné mezery na trhu. Podporuje iterativní a interaktivní
zkoumání dat a spojuje v sobě dolování dat a BA spolu s vysoce výkonným
enginem, který se velkými soubory prokousává překvapivě rychle.
Analytic Framework představuje velký pokrok při analýze cílových aplikací a
velkých datových skladů, ale na jeho uživatelském rozhraní pro analytické úlohy
střední úrovně by se dalo ještě ledacos vylepšit. Přesto tento nástroj
disponuje významnými schopnostmi v oblasti zpracování dat a lehce zvládá úlohy,
které by zahltily většinu jiného analytického softwaru.

Vážná matematika
Kouzlo nástroje Analytic Framework spočívá v jeho samotných základech:
statistická teorie učení (statistical learning theory), matematika Vladimira
Vapnika a zkušení matematici stojící v čele firmy Kxen. Architektura produktu
sestává z osmi analytických modulů od pročišťování dat až po analýzu časových
řad které jsou přístupné prostřednictvím API (Application Programming
Interface) nebo pomocí průvodce Modeling Assistant.
Průvodce vede uživatele specifikací problému včetně provádění statistického
výběru, načítání dat ze standardních datových formátů a specifikace jedné nebo
více cílových proměnných (jako např. "profitabilní zákazník" či "poškozená
obvodová deska") až po stanovení proměnných, které nebudou při zpracování brány
v potaz. Software tato nastavení následně využívá pro zkoušení a tvorbu modelů
a zpracování výsledků analýzy.
Ačkoliv se průvodce jen těžko vymkne kontrole, systém má řadu předepsaných
omezení, jak mají importovaná data vypadat. Rozhraní není snad až tak zmatené,
ale uživatelé musejí přesně pochopit, jak s tímto mocným nástrojem zacházet, a
proto je třeba jejich důkladného zaškolení.

Klady a zápory
Mezi dva hlavní analytické moduly patří K2R (robustní regrese Robust
Regression) a K2S (inteligentní segmentace Smart Segmenter). K2R vytváří
prediktivní modely, přičemž využívá historická data ke stanovení budoucí míry
pravděpodobnosti.
K2S tvoří shlukové analýzy (Cluster Analysis) pro účely stanovení segmentace
trhu ty jsou nezbytné pro klasickou analýzu trhu a rozdělení celkové škály
zákazníků do skupin podle jejich povahových vlastností. Mnohé nástroje
očekávají od analytiků definování clusteru, ale K2S toto realizuje za
analytiky, čímž jim šetří práci a čas. Namísto odhadu primárních skupin
software mapuje řady dat do jednotlivých shluků a dovoluje je přesně a rychle
analyzovat.
Produkt má k dispozici dvě pozoruhodné funkce. Vypustí některá data z dané
skupiny a zahrne některé výskyty do vícero skupin, což odráží realitu
mimopočítačového světa lépe než čistý přístup "buď, anebo", který používá
většina ostatních BA nástrojů. To přispívá k tomu, že tento nástroj má silné
segmentační schopnosti a je vybaven špičkovou sadou metod pro seskupování podle
určitého znaku.
Zlepšení bychom však rádi viděli v možnostech zobrazení definic každé skupiny.
Za současného stavu je třeba uložit model jako SQL a číst jednotlivé sestavy,
což je sice plně funkční, ale vývoj směrem k přirozenému jazyku by dovolil
široké řadě vedoucích pracovníků a expertů na danou oblast snadno pochopit
informace prezentované K2S.
Analytic Framework rovněž zjednodušuje hodnotu navrženého modelu tím, že se
soustředí na dvojice čísel ze statistické teorie učení. První veličinou je KI,
jež naznačuje, jak dobře daný model popisuje podíl informací o cílových
proměnných "vysvětlený" ostatními proměnnými jinými slovy do jaké míry model
odpovídá skutečnosti.
Druhou veličinou je KR, která měří schopnost stávajícího modelu dosáhnout
stejné výkonnosti při použití s jinou sadou údajů, tj. do jaké míry je model
opětovně využitelný. Jelikož jsou zde pouze dvě veličiny, s ohledem na něž lze
optimalizovat, nástroj Analytic Framework velmi zjednodušuje uživatelům práci,
a tím otevírá přístup k informacím širší a méně odborně zaměřené základně
uživatelů.
K dalšímu vylepšení analytického modelu poskytuje Analytic Framework sestavy o
podílu jednotlivých proměnných, což dává uživatelům možnost vážit tyto proměnné
a vyloučit či kombinovat je, čímž dochází k vytváření různých scénářů. Výstupní
sestavy jsou jak grafické, tak numerické, ale přestože jsou prezentovány v
jednoduché formě, jejich úplné pochopení a využití bude snadnější pro uživatele
pokročilejší v oblasti BA.

Export a konsolidace
Po vytvoření modelu odpovídajícího vámi zvoleným kritériím lze využít nástroj
Modeling Assistant a modul KMX (Model Export) pro uložení k opětovnému využití
nebo k exportu modelu v několika programovacích jazycích včetně C, ANSI SQL,
SQL pro SQL Server, v XML či ve formátech pro produkty firem SAS a SPSS.
Zmíněné exportní funkce oddělují analytickou práci a programátorské úlohy,
přičemž slouží v zásadě k oběma účelům.
Analytic Framework má také modul pro konsolidaci dat, nazvaný KEL (Event Log).
KEL podporuje úlohy, které vyžadují předběžné zpracování, jako je například
sumarizace nebo průměrování. Pro jeho využití je třeba si zvyknout na přesně
předepsané datové formáty, ale jinak funguje přesně tak, jak to o něm výrobce
tvrdí.
Celkově lze Kxen Analytic Framework 3.0.2 označit za mocný balík nástrojů s
vyspělými a silnými matematickými schopnostmi, kterým většina ostatních BA
nástrojů nemůže konkurovat. Nejvíce jej pravděpodobně oceníte při zpracování
databází s velkým množstvím polí, které nejsou jiné nástroje schopny zvládnout,
ale skutečným přínosem bude jeho využití jakožto součásti celkového řešení: při
integraci se stávajícími BI produkty či jinými systémy pro dolování dat může
tento produkt podstatně posílit strategický pohled na danou problematiku.

Kxen Analytic Framework 3.0.2
+silné segmentační schopnosti, sada metod pro seskupování podle určitého znaku
-výstupní sestavy by mohly být detailnější
Prodejce: Urbana Technologies, www.urbanatech.cz
Cena (bez DPH): od 42 500 eur v koncové konfiguraci pro 2 CPU
Platformy: Windows, Solaris, AIX, HP-UX, Linux

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.