Clementine 10 posiluje obrannou analýzu

Upgrady BA aplikace SPSS přinášejí detekci anomálií a rychlejší odpovědi při grafickém modelování. Když jsme ...


Upgrady BA aplikace SPSS přinášejí detekci anomálií a rychlejší odpovědi při
grafickém modelování.

Když jsme v roce 2004 naposled testovali aplikaci pro obchodní analýzy (BA,
business analytics) Clementine firmy SPSS, objevili jsme velké možnosti zejména
v jejím efektivním grafickém rozhraní a ve schopnosti systematizovat
sestavování a ukládání analytických postupů (sestav) pro případné pozdější
použití.
Od té doby se mimo jiné výrazně zvýšila poptávka po síle BA ve dvou sektorech:
ve zdravotnictví a v národní bezpečnosti. Clementine 10 se zaměřuje přímo na
to, aby vyhověla právě potřebám těchto dvou sektorů, ale dělá to tak, aby
současně nabídla spoustu aplikací také firmám na ostatních trzích.
Zdravotní péče a národní bezpečnost potřebují BA k tomu, aby si posvítily na
výjimky. Ve zdravotnictví se příslušné instituce snaží vykořenit podvody nebo
odhalit lékaře, kteří tráví se svými pacienty delší dobu, než odpovídá průměru,
stejně jako předejít šíření epidemií nebo biologickým útokům. Zákazníci na poli
národní bezpečnosti potřebují být mimo jiné schopni přesně identifikovat hrozby
pocházející ze strany různých hackerských skupin.
Clementine 10 používá novou analýzu anomálií, aby vyřešila právě tyto typy
problémů. SPSS vytvořila sestavy tak, aby měl analytik k dispozici nějaký
základ, s nímž může pracovat, což mu výrazně zjednodušuje úlohu, která by dříve
vyžadovala víceuzlovou konstrukci. Tato funkcionalita šetří čas analytika,
protože tak nemusí věnovat příliš velké úsilí designu a má volné ruce pro
samotnou analýzu.

Detekce anomálií
Přidání analytických metod pro detekci anomálií rovněž zvyšuje produktivitu.
Analytici se nyní například mohou při snaze detekovat podvody soustředit na
odchylky. Tento proces může ovšem také sloužit k odfiltrování neobvyklých
případů, což je užitečné pro takové úlohy, jako je segmentace trhu, kde mají
anomálie tendence zamlžit a zpomalit identifikaci segmentů.
Nová verze zlepšuje produktivitu analytiků také pomocí dalšího modelovacího
uzlu, označovaného jako Feature Selection (výběr funkce). Tento uzel rychle
podává seznam nejužitečnějších polí, která by měla být zahrnuta v prediktivních
modelech, a těch, jež by měla být odfiltrována jako přebytečná. Funguje tedy
jako analytik v malém a klasifikuje a hodnotí každé pole, jež jste
identifikovali jako vstup. (Feature Selection také můžete uložit pro opakované
použití v budoucnu.)
Díky těmto předběžným hodnocením se analytik rychleji dostává k podmnožině
kritických polí a SPSS tvrdí, že při práci s menším počtem polí vyždímá
Clementine z hardwaru rychlejší časy zpracování právě v okamžiku, kdy bude
odpovídat na dotazy. Zjistili jsme, že díky Feature Selection jsme se k
odpovědím skutečně dostali mnohem rychleji, ale bylo to především kvůli úspoře
času při uživatelské interakci než kvůli rychlejšímu zpracování v systému.

Množství vylepšení
U Clementine 10 jsme ocenili obzvláště upgrady týkající se analýzy časových
řad, jejíž plynulý běh se u předchozích verzí neobešel bez externích nástrojů.
Nové funkce budou vyžadovat určitou investici do školení, avšak analýza dat se
bude v průběhu doby ve stále větší míře stávat těžištěm prediktivní analýzy,
která tyto výdaje ospravedlňuje. Některé z doplňků verze 10 patří mezi ty,
které je příjemné, ale nikoli nutné mít. Ačkoliv předchozí verze byly schopné
importovat širokou škálu datových zdrojů, mnohé z nich musely být přivedeny
prostřednictvím ODBC připojení, což pro IT znamená nutnost vytvářet extra
zabezpečení či oprávnění a zajišťovat podporu koncových uživatelů. Clementine
10 nicméně podporuje přímá připojení excelovských souborů (oblasti buněk a
pracovní listy), čímž šetří čas IT oddělení i koncových uživatelů.
Drobná závada se objevila ve dvou z excelovských souborů, jež jsme tímto
způsobem připojovali: Po prázdných sloupcích na konci pracovních tabulek, které
byly vyčištěny od dat, zůstaly nadbytečné oddělovače. To, že Excel neví, kde
tabulka končí, je jeho běžným nedostatkem a nejde o žádný obrovský problém,
byli bychom nicméně raději, kdyby SPSS toto chybné chování v rámci vstupní
rutiny odstranila.

Uživatelské rozhraní
Clementine od doby, kdy jsme naposled procházeli její možnosti, povyrostla o
dvě verze a SPSS se povedlo udržet její rozhraní použitelné. Základem tohoto
rozhraní je sada nástrojových palet. Vrchní tabulka obsahuje nejpotřebnější
nástroje, a ty jsou potom uspořádány do tabulek souvisejících kroků ve
workflow. Analytik uzly z palet přetahuje do pracovní oblasti a propojuje je do
strukturované grafické sekvence, aby vytvářel různá workflow, která SPSS
označuje jako "streams" (proudy).
Můžete vytvořit platný proud a odpovídat v Clementine na dotazy jen s použitím
uzlu datového zdroje, jediného procesního uzlu a výsledku (modelu nebo
grafického výstupu). Někteří uživatelé budou možná tuto cestu příležitostně
volit pro provádění ad hoc úkolů, větší část seriózní práce však budou dělat
prostřednictvím vytváření modelů uvnitř tohoto klienta a exportování modelů a
procedur do jednoho z podporovaných výstupních formátů včetně SPSS, SAS a SQL.
Práci s přípravou dat a modely si můžete také uložit zpět do databáze, takže je
při budoucím úsilí o realizaci úloh data miningu nebude třeba vytvářet znovu.
SPSS provedla také některá vylepšení týkající se architektury a platformy.
Clementine 10 dohání SAS Enterprise Miner v jeho schopnosti využít výhod
multiprocesorových systémů: Software přináší vícevláknové procesy pro komplexní
modelování a pro paralelní zpracování dalších rutin. Firma SPSS také
upgradovala schopnosti Clementine pro provádění data miningu v databázi,
přičemž přidala specifické funkce a rozšířila podporu pro databáze IBM DB2 a
Oracle nyní běží na 32bitovém Red Hat Linuxu. Reporting byl celkově výborný,
ale nenabízí mnoho, pokud jde o tištěné reporty namísto toho spoléhá na ostatní
modely SPSS.
Při tom všem Clementine 10 neztratila své silné stránky týkající se
použitelnosti pro klíčové publikum z řad profesionálních analytiků, zatímco
nové funkce včetně detekce anomálií a uzlu Feature Selection poskytují další
služby současným zákazníkům z oblasti BA a zvyšují přitažlivost pro nové
uživatele.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.