Řiďte si životní cyklus informací

V životě nové technologie se vždy vyskytne etapa, ve které je polovina světa přesvědčena, že se jedná o zcela nové...


V životě nové technologie se vždy vyskytne etapa, ve které je polovina světa
přesvědčena, že se jedná o zcela nové paradigma, zatímco ta druhá polovina si
myslí, že je to všechno jen mediální horečka. Polovina říká, že se novou
myšlenku nikdy nepodaří realizovat, zatímco druhá prohlašuje: "My už ji
využíváme." A dokonce i výrobce, u nějž je to nejméně pravděpodobné, tvrdí, že
už má strategie a produkty připraveny tak, aby ji mohl podporovat. Tak je tomu
i v případě řešení ILM (Information Lifecycle Management), tedy správy
životního cyklu informací.


ILM, současná naděje celého odvětví pro ukládání dat, je založeno na dvou
jednoduchých konceptech. Zaprvé, ne každá informace má pro organizaci stejnou
hodnotu. Zadruhé, ať už má informace jakoukoliv hodnotu, tento parametr má
tendenci v čase se měnit.
Jestliže jsou tyto předpoklady pravdivé, proč potom aplikovat stejnou úroveň
drahých úložných zdrojů, jejich správy a ochrany na všechny informace v
podniku? Přesunutím méně cenných informací do levnějších úložných systémů a
aplikací náležitých úrovní ochrany na každou vrstvu uchovaných dat mohou firmy
ušetřit peníze a rezervovat high-endové zdroje pro ty informace, které je
skutečně vyžadují.
Výsledek: Kriticky důležité systémy jsou méně rozsáhlé, jsou stabilnější a lépe
pracují. Zálohovací okna se zmenšují, méně často dochází k zaplnění ukládacích
kapacit, upgrady jsou méně frekventované a celkové náklady na úložné zdroje a
jejich správu klesnou.
To je ovšem jenom idea. Za předpokladu takovýchto vysokých nároků je docela
rozumné být poněkud skeptický ohledně toho, co pokud vůbec něco pro vás může
ILM udělat v podnikovém prostředí. Avšak jakmile jsme přestali přemýšlet o
"velké vizi" ILM a soustředili se na realitu, shledali jsme, že několik
rodících se, dílčích řešení založených na principu politik je již schopno
poskytnout skutečné výhody těm organizacím, které se musejí vyrovnat s rychle
rostoucím objemem uchovávaných dat a s komplexními požadavky na dodržování
předpisů.

Co to je a co to není
Při povrchním pohledu připomíná koncept ILM už známé předchozí technologie pro
ukládání dat včetně HSM (Hierarchical Storage Management) nebo DLM (Data
Lifecycle Management). Zatímco DLM se soustřeďovalo na data jakožto na úložnou
jednotku, HSM se orientovalo na asociaci dat s aplikacemi a přesouvalo tato
data na základě jediného kritéria času, ILM nastavuje politiky na základě
hodnoty informace, již data nesou, bez ohledu na aplikaci nebo čas. "Pokud jde
o informace, je technologie HSM již překonaná," říká Jeremy Burton, výkonný
viceprezident skupiny Data Management Group ve společnosti Veritas. Například
určitý e-mail může vyžadovat aplikaci jiné politiky než ten další, a to v
závislosti na předmětu, odesílateli nebo vztahu k určitému procesu. Podobně i
medicínské záznamy ne vždy ztrácejí na hodnotě; často je nezbytné se k nim
rychle dostat, pokud má pacient opakované problémy. V těchto případech je
důležitá informace obsažená v každém kousku dat, nikoliv data sama o sobě.
Dalším rozdílem je ochrana. "V některých směrech je ILM podobné HSM, ale každou
vrstvu chráníte odlišným způsobem," vysvětluje Nancy Hurleyová, senior
analytička společnosti Enterprise Strategy Group. "Můžete každých několik hodin
vytvářet snímky první vrstvy dat a každý den provádět inkrementální zálohy.
Vrstva číslo dvě může být zálohována jednou za týden. Třetí vrstva není
zálohována nikdy replikujete ji, a tím vzniká vaše úložiště."
A konečně, ve většině případů se u ILM předpokládá, že navzdory migraci či
archivaci budou data po dlouhou dobu nadále přístupná, buď jako instance
identického archivu, nebo v úložišti, jež se dá prohledávat.

Chytřejší storage
Dvěma hlavními hnacími silami pro ILM jsou rychle rostoucí náklady na správu
úložných zdrojů a na dodržování právních předpisů. Která z nich je důležitější,
závisí na tom, s kým právě mluvíte.
"Mnoho lidí předpokládá, že to, co pohání ILM, je nutnost vyhovět předpisům,"
říká Hurleyová, "avšak pouze dva z deseti uživatelů, s nimiž jsem hovořila,
uvádějí dodržování předpisů jako hlavní důvod, proč o něj mají zájem. Většina
ostatních uvádí úspory nákladů."
Vezměme si příklad organizace North Bronx Healthcare Network, která dohlíží na
několik veřejných zdravotnických zařízení v New Yorku. "Provedli jsme analýzu a
zjistili jsme, že 84 % našich dat je prakticky neměnných," říká její CIO Daniel
Morreale. "S využitím softwaru DiskXtender od společnosti EMC jsme tedy
aplikovali několik pravidel, abychom automaticky přesunuli z našeho úložného
systému Symmetrix DMX (Direct Matrix Architecture) do levnějšího NAS ta data,
která nejsou využívána po dobu šesti měsíců. Po dalších šesti měsících jsou pak
přemístěna do úložného systému pro neměnný obsah typu EMC Centera CAS (Content
Addressed Storage)."
Veškeré soubory jsou nicméně uživatelům snadno dostupné. "Rozdíl mezi přístupem
k souborům v SAN a v NAS je těžko postřehnutelný," tvrdí Morreale, "získání
souborů z CAS si vyžádá možná jednu a půl sekundy navíc." Morreale dodává, že
tento model úložného systému rozčleněného do vrstev významně snížil jejich
náklady na zdroje a personál a zlepšil obchodní kontinuitu. Vedle toho také
pomohl vyhovět HIPAA.
Michael Howard, výkonný ředitel ILM výrobce OuterBay, říká, že problémy s
dodržováním norem tvoří velkou část jejich byznysu. Například když firma
Tektronix konsolidovala své oraclovské systémy z 27 zemí do dvou lokalit v
Beavertonu, jejich požadavky se výrazně zvýšily a komplexnost problémů s
dodržováním předpisů vzrostla.
"Ve Spojených státech musejí být účty zákazníků uchovávány po dobu pěti let,"
říká Lois Hughes, senior manažer obchodních aplikačních systémů v Tektronixu.
"Avšak v Itálii je to 12 let a v Číně dokonce 15 roků."
Tektronix využil produkt Live Archive od OuterBay k tomu, aby přesunul
transakce ze svého produkčního prostředí do méně nákladné úložné vrstvy archivu
určeného pouze pro čtení po dvou letech. Na každou vrstvu jsou aplikovány různé
úrovně ochrany, neboť stabilní data nemusejí být replikována nebo zálohována
tak často jako ta živá, stále se měnící. A data ve vrstvě archivu jsou pohotově
k dispozici uživatelům. "Vypadá to stejně jako produkční prostředí, není třeba
žádného školení uživatelů," popisuje Hughes.
Dalším krokem bude přesunutí dat po šesti letech do třetí vrstvy: Tu tvoří
produkt Encapsulated Archive od OuterBay, což je úložiště XML archivu s
automatickým vytvářením popisu. "To nás posouvá od rozsáhlého, náročného
aplikačního prostředí Oracle do kompaktního XML úložiště nezávislého na
systémech Oracle. Stále se můžeme dotazovat a vytvářet reporty. SQL kód
identifikuje původce transakce, takže systém bude vědět, že pokud je
právoplatným zadavatelem Tektronix Germany, mělo by být vyčištění provedeno po
deseti letech a jednom dni."
Frank Harbist, viceprezident a hlavní manažer pro úložný software a ILM ve
společnosti Hewlett-Packard, vidí i třetí motivační faktor pro nasazení ILM:
využití informací. "Setkáváme se se stále větším počtem firem, které chtějí
využívat informace jako způsob, jenž jim pomůže dále zefektivnit provozování
jejich obchodních aktivit," říká. "Chtějí, aby bylo více informací přístupných
tak, aby firma mohla využít možností dataminingu, podpory obchodního
rozhodování či analytických nástrojů pro získání konkurenčních výhod."

Vize vs. realita
Jak dlouho bude trvat, než dospějeme k naplnění vize ILM? Experti se shodují
pouze na tom, že od tohoto momentu nás dělí přinejmenším ještě pár let. Dnešní
nabídky ILM řešení postrádají především ideál spočívající v jediné konzoli pro
celý podnik tedy nástroj, které by organizacím umožnil klasifikovat veškeré
informace podle jejich hodnoty, vytvořit jednotný systém úložných vrstev a
aplikovat politiky pro migraci a ochranu napříč nimi s využitím jediného
správního nástroje. Mnohem běžnější jsou dnes dílčí řešení, z nichž každé klade
důraz na jinou oblast a nabízí jiné schopnosti.
Například společnosti jako OuterBay nebo Princeton Softech se soustřeďují na
strukturovaná data nacházející se v databázích Oracle nebo v CRM, ERP a SCM
(Supply Chain Management) systémech. Jiná řešení mimo jiné od výrobců
EMC/Documentum, Hewlett-Packard či Ixos se zase zaměřují na nestrukturovaná
data, jako jsou třeba soubory a obrázky. Systémy pro archivaci e-mailů od firem
iLumin, Ixos, Veritas a Zantaz se soustřeďují takřka výhradně pouze na výměnu
zpráv. StorageTek má dílčí řešení pro strukturovaná data a elektronickou poštu.
Různá další řešení jsou k dispozici od takových výrobců, jako jsou například
Hitachi Data Systems, IBM, Network Appliance nebo Sun Microsystems.
Druhým nedostatkem ILM je to, že nejběžnější řešení označovaná jako ILM pouze
přesouvají a archivují data. Ochrana na každé vrstvě ve formě zrcadlení,
replikace či zálohování je obecně ponechána na starost správci úložného řešení,
který ji musí implementovat s použitím jiných produktů. Dlouhodobá vize ILM
předpokládá, že architektura správy prováže obě funkce dohromady a že budou
spravovány společně, možná dokonce jako jedna z mnoha funkcí celkové správní
platformy.
Aby se povědomí o informacích skutečně stalo realitou, budou muset být do
celého řešení nutně zahrnuty rovněž aplikace, které zachycují a využívají
informace. V současné době fungují produkty, jako je řada EMC Tender nebo sada
OuterBay Application Data Management, jako určitý druh aplikačně orientovaného
middlewaru umístěného mezi jednotlivými aplikacemi a úložnými systémy, jenž
poskytuje informační inteligenci a možnosti na politikách založeného přesouvání
a odstraňování dat. Také Oracle Database 10g nabízí některé vlastní možnosti
data partitioningu, rozvrstvení ukládání dat a správy.
"Především musí dojít ke propojení mezi úložnými systémy a aplikacemi," říká
Hurleyová. "Jakmile jednou přiřadím hodnotu k dané informaci, všechny aplikace,
které ji budou využívat, přesouvat, migrovat, chránit a uchovávat, by měly
tomuto ohodnocení rozumět od momentu, kdy je vytvořeno. Tyto možnosti přijdou
ze strany výrobců, kteří poskytnou otevřená API, aby mohly systémy vzájemně
spolupracovat, a takovou úroveň integrace, že si enginy pro správu politik
budou vzájemně rozumět."
Starší aplikace jsou pro celopodniková ILM často kritickými překážkami.
"Mysleli jsme si, že můžeme naše ILM řešení použít pro přesun informací z
našeho 12 let starého medicínského informačního systému do řešení EMC Centera
CAS," popisuje Morreale, "ve skutečnosti to ale nejde, neboť aplikace
neposkytuje svobodu dynamického přesouvání dat."
Také metadata budou klíčovým zdrojem informačního povědomí. "Lidé budou chtít
zachytit všechno možné," říká Ken Steinhardt, ředitel technologické analýzy ve
firmě EMC. "Budou chtít využívat mnoho pohledů založených na metadatech nejen
jak často se k nějakým informacím přistupovalo, ale také například značení
objektů asociovaných s důležitým projektem, u nějž existuje požadavek na
uchování informací po dobu 20 let."
A konečně, naplnění vize ILM bude také možná vyžadovat standardy. Data
Management Forum organizace SNIA (jejím členem jsou například společnosti Cisco
Systems, EMC, Hewlett-Packard, IBM nebo Sun Microsystems) je právě v
počátečních fázích tvorby ILM modelu, avšak většina expertů se shoduje, že od
ILM standardů jsme vzdáleni ještě spoustu let.Zapomeňte na vizi
Realita bude možná taková, že pro mnohé firmy bude podnikové ILM příliš
rozsáhlým projektem, než aby se do něj pustily. "ILM už expandovalo tak, že se
týká všeho v oblasti úložného hardwaru, softwaru i služeb," říká Jeremy Burton
z Veritasu. Zákazníci nevědí, kde začít, neboť ILM se jim jeví podobně jako
nějaký druh ERP projektu, jenž přeroste mimo jejich kontrolu a zabere 10 let."
Jednou z cest, jíž se firmy mohou vydat, je přestat se zabývat vizemi. Namísto
toho mohou začít v oblastech, které jim působí nejvíce problémů. Pro mnohé
organizace je hlavním zdrojem nepříjemností e-mail, a je tedy dobrým startovním
bodem, zvláště pokud jde o výzvy týkající se dodržování předpisů. Jiné firmy
mohou zjistit, že nejproblematičtější jsou pro ně data z ERP či CRM.
Ať už je zdroj problémů kdekoliv, prvním krokem je pečlivý proces identifikace,
analýzy a klasifikace informací. Hurleyová z Enterprise Strategy Group
doporučuje využít výhod SRM (Storage Resource Management) aplikací. "Ty vám
rychle řeknou, čeho se můžete zbavit a co zabírá většinu dat, takže budete
schopni jasně sledovat přístupové vzory," říká. "Pravděpodobně budete
překvapeni tím, co zjistíte."
Výsledkem této analýzy by měl být systém, které vaše informace rozčlení do
kategorií na základě požadavků na výkon, ochranu a dobu jejich uchování v
průběhu jejich životního cyklu. Poté, na základě potřeb úložných zdrojů
identifikovaných každou klasifikací, se rozhodnete pro strukturu ukládacích
vrstev, kde každá má patřičnou úroveň služeb týkajících se výkonu, dostupnosti
a ochrany. A konečně, prozkoumejte dostupná řešení pro automatizované
přesouvání dat založené na politikách, jež splňují vaše požadavky, od takových
výrobců, jako jsou EMC, Hewlett-Packard, Veritas a další.
Mnohé firmy začínají s ILM u jedné aplikace nebo jednoho oddělení nebo při
řešení určitého problému, jako je například dodržování předpisů. Klíčem je
seznámit se blíže s celým procesem a zjistit, v čem může být ILM pro vaši
organizaci užitečné. Potom se můžete třeba při obědě bavit o vizi ILM.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.