Databázová dieta založená na archivaci

Osvědčené praktiky pro archivaci databází pomáhají udržovat kapacitu diskového prostoru na zdravé úrovni, a zabrán...


Osvědčené praktiky pro archivaci databází pomáhají udržovat kapacitu diskového
prostoru na zdravé úrovni, a zabránit tak problémům s výkonem.
Nebývá výjimkou, že databáze se rozrostou do mnohem větších objemů, než si
jejich vlastníci vůbec kdy dokázali představit. Vlastně k tomu dojde téměř
vždy. Pravidelný a neustálý přísun nepotřebných a nadbytečných transakčních
informací může vést k přílišné "obezitě" databáze. Takové problémy, jako je
rychle mizející diskový prostor, mohou způsobit pokles výkonu, doprovázený
nespokojeností uživatelů, které bude zneklidňovat pomalá rychlost přístupu nebo
občasné vypršení platnosti dotazu.
"Naše poněkud přerostlá databáze už byla několik měsíců na pokraji zhroucení
kvůli překročení kapacity produkčního diskového prostoru," popisuje Larry Cuda,
vedoucí projektů pro globální archivaci dat ve společnosti Kennametal.
"Management rozhodl, že problém nelze ,řešit neustálým přidáváním dalších a
dalších disků."
Jejich databáze SAP se rozrůstala rychlostí 27 GB za měsíc, dokud ji firma
Kennametal nezredukovala pomocí produktu eCONtext od společnosti Ixos Software.
Transakce, které zabraly 6 sekund, nyní trvají sekundu a firma ušetří ročně
téměř 700 tisíc dolarů jenom na nákladech za nákupy storage hardwaru. Databáze
uchovává objem 2 TB dobře udržovaných dat s tím, že další terabajt je uložen v
rychle přístupných archivech. Firma přitom své ERP aplikace SAP, stejně jako
databázi Oracle8i provozuje v prostředí 64bitového operačního systému HP-UX.

Promarněné čekání
Podle společnosti Meta Group roste objem dat o 125 % ročně, nicméně až 80 % z
nich je jen nečinně uloženo v produkčních systémech, kde pouze ochromují jejich
výkon. "A co víc, v mnohých podnicích právě probíhají různé iniciativy, které
mají vést ke sladění archivace dat se zákony, což vyžaduje uchovávání více dat
po delší časové období. V současnosti také mnohde probíhají konsolidační
projekty, které se rovněž odrážejí ve výrazném růstu objemu dat," podotýká
Charlie Garry, programový ředitel společnosti Meta Group.
Rozsáhlý seznam předpisů činí ze snahy o archivaci poměrně složitou záležitost:
Zákony, jako je známý Sarbandes-Oxley Act, ale i mnohé další, proměňují správu
informací v minové pole plné potenciálních problémů.
Následky absence vhodné metody archivace informací z databází přitom mohou být
dosti pochmurné. Existuje bezpočet důvodů, které mluví pro formulaci
odpovídající archivační strategie a její rychlé uvedení do chodu. Vedle zmíněné
spotřeby diskového prostoru firmy často uvádějí problémy, jako jsou úplné
výpadky systému, pokud databáze vyžaduje příliš velké množství zpracování dat,
možná selhání při zálohování, jestliže je nutné zálohovat velké objemy dat, či
riziko přerušení transakcí, je-li třeba prohledávat miliony záznamů.
Například ve společnosti Southwest Gas obsahovaly tabulky skladu 5 milionů
záznamů a tabulka pro lidské zdroje zahrnovala 60 milionů záznamů. Luca
Cotrone, systémový analytik Southwest Gas, říká: "Uživatelé si často stěžovali,
že dotazy zabírají příliš mnoho času."
Cotrone proto implementoval Applimation Archiver pro databázi Oracle8i, jež se
rozrůstala přibližně rychlostí 1 GB měsíčně. Objem databáze se nyní
stabilizoval na hodnotě okolo 100 GB. Kupříkladu archivace tabulky jedné hlavní
knihy se projevila uspořením 18 GB prostoru. Doba vyhledávání pak klesla z
několika minut na pár sekund.
Oproti Kennametalu, kde nastavují politiky pro automatizovanou archivaci, sází
Southwest Gas na manuální archivaci. Každý měsíc tak stráví administrátor 30
minut výběrem souborů určených pro archivaci. Toto rozhodování je založeno na
stáří souborů v databázi aplikace pro řízení skladu. Tak třeba ty, které jsou
starší než 30 měsíců, mohou být přesunuty z produkčního systému do méně
nákladného datového skladu Applimation. K těmto souborům pak může uživatel
transparentně přistupovat z původní aplikace.

Páska není odpověď
Provozování objemné databáze bývá zřídka žádoucí či vhodnou alternativou a ve
většině případů jí není ani pročištění přemístěním dat na pásková média ačkoliv
je to poměrně běžná praxe. Při pročištění databáze totiž musí být obnova dat
prováděna manuálně, a je tedy extrémně časově náročná i zdlouhavá. "Jakmile
jednou vyčistíte databázi Oracle, uživatelé už nemají k datům přístup,"
popisuje Lois Hughes, analytik obchodních systémů ve společnosti Tektronix.
"Také mezinárodní finanční předpisy vyžadují, aby bylo odstranění dat z
databáze spojeno s jejich současnou archivací."
Protože firma podniká ve 27 zemích, bylo rozhodování o tom, co je třeba
archivovat, dosti složité. Například účtování pohledávek představuje jen jednu
z desítek aplikací přitom třeba Čína vyžaduje retenci dat po dobu 15 let,
Brazílie 10, Itálie 7 a Spojené státy 3 roky.
Tektronix archivuje transakční data každé 3 měsíce pomocí nástroje LiveArchive
firmy OuterBay Technologies, přičemž informace jsou rekategorizovány (v rámci
existující instance databáze Oracle jsou redukovány podle priority) a poté jsou
přemístěny do méně nákladné infrastruktury. Uživatelé jsou nicméně schopni
přistupovat ke všem datům z jediné obrazovky bez jakýchkoliv problémů.
OuterBay je jedním ze čtyř předních uchazečů, který chce ukousnout z koláče
archivačního trhu, jehož hodnota je odhadována na 1 miliardu dolarů. Podle
společnosti Gartner zde zaujímá vedoucí postavení s 50 % firma Princeton
Softech. Stejně jako OuterBay (která je se svým podílem na trhu druhá) pokrývá
oblast databází IBM, Informix, Sybase, Microsoft i Oracle. Applimation se
soustřeďuje na Oracle, zatímco Ixos Software se orientuje výhradně na řešení
SAP a Siebel Systems.

Mějte se na pozoru
IT manažeři, kteří obracejí pozornost k archivačním projektům, jsou vystaveni
značnému množství problémů či komplikací. Hughes například zmiňuje, že bylo
třeba vyřešit několik bugů ve funkcích pro vyčištění databáze Oracle, zatímco
Cotrone se setkal s potížemi způsobenými rozdíly mezi verzemi Oracle8i a 9i.
Cuda z firmy Kennametal popisuje, že dostal svůj projekt pod kontrolu teprve
tehdy, když přešel od pohledu soustředěného na technologii archivace k přístupu
založenému na obchodních procesech a legálních předpisech. Následně zmapoval
všech 223 datových objektů v jejich SAP databázi, což mu umožnilo objasnit
závislosti, které existovaly mezi těmito datovými typy, a přesně ukázalo, jak
data přemístit a zároveň minimalizovat riziko jakýchkoliv problémů. Například
faktury by neměly být archivovány, dokud odpovídající dokumentace o přepravě a
dodání nepotvrdí uzavření transakce. SAP má podle Cudy vestavěné mechanismy,
které zamezují vyřazení otevřených transakcí.
Jeho rada pro realizaci jakéhokoliv archivačního projektu zní: soustředit
pozornost na jednoduchý přístup k datům a současně na finanční úspory spojené s
archivací. Cuda vysvětluje "Správné uchopení problému neumožňuje pouze obnovu
významných dat, ale může posloužit i jako důkaz pro management či uživatele,
nakolik je archivace pro firemní infrastrukturu prospěšná."

Revoluce pod zkratkou ILM
Nikoho zřejmě příliš nepřekvapí, že se on-line archivace stala hlavním prvkem
strategií prodejců v rámci jejich orientace na správu životního cyklu informací
(Information Life-cycle Management, ILM). Společnost EMC uzavřela partnerství s
firmou OuterBay, jejímž cílem je integrace systému LiveArchive se sadou
nástrojů EMC pro správu storage Control Center jakožto součásti jeho ILM sady.
Další dodavatelé je následují a rozruch kolem tématu ILM se blíží ke svému
vrcholu.
Steve Duplessie, analytik z firmy Enterprise Storage Group, však odhaduje, že
bude trvat ještě nejméně 18 měsíců, než se o ILM přestane jenom mluvit a
poskytne nějaký přínos v reálném světě. Do té doby bude zřejmě lepší hodnotit
nástroje pro archivaci podle jejich vlastních předností.
Podobně jako například správa hierarchické storage i ILM používá přístup
založený na několika vrstvách. Zatímco v prvním případě jsou data přesouvána do
nižších vrstev podle svého věku, ILM určuje jejich umístění v příslušné vrstvě
na základě jejich hodnoty pro obchodní procesy. Běžně využívaná data jsou
uložena v high-endovém storage systému, zatímco data, k nimž je přistupováno
zřídka, lze archivovat v levnějším diskovém poli, popřípadě v páskové knihovně
(nejsou-li využívána téměř vůbec).

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.