Zaostřeno na zálohování

Protože množství digitálních dat se zdvojnásobuje každým rokem, usilují IT manageři o udržení informací pod kontr...


Protože množství digitálních dat se zdvojnásobuje každým rokem, usilují IT
manageři o udržení informací pod kontrolou. Internet, intranet, proudy
multimediálních informací a aplikace, jakými jsou datové sklady (data
warehouse) a následné dolování dat (data mining), to vše má za následek (nebo
je výsledkem), že ve většině společností roste potřeba ukládání velkého
množství dat rychleji než kdykoliv předtím.
Někteří manažeři IT ve většině oborů, jež jsou náročné na potřebu získávání a
skladování dat, se obávají, že by mohla přijít doba, kdy technologie již nebude
schopna udržet krok se vzdouvajícím se přílivem informací a oni ho nebudou
schopni uřídit.
"Je to podobný princip, jaký naleznete v knize Hlava 22," tvrdí Dave Bowlan,
manažer řízení informací v Kaiser Foundation Health Plan v Kalifornii. "Zdraví,
někdy dokonce i život stále většího počtu lidí závisí na lékařských
informacích. A čím dál více lidí přibývá, tím je těžší udělat informace
dostupnými, protože je musíte neustále přeorganizovávat a odstraňovat všechny
problémy s dostupností údajů z velmi velké databáze."
Neustálý růst
Z nedávného průzkumu, uskutečněného mezi 250 středně velkými společnostmi
vyplynulo, že kapacita zálohovacích disků v serverech se ročně zvětšuje v
průměru o 50 % a kapacita všech pevných zálohovacích médií ve firemních sítích,
tj. včetně disků v desktopech, serverech a mainframech, je ročně zdvojnásobena.
Výzkum potvrdil i známou zkušenost, že se stejnou vervou, s jakou jsou
společnostmi najímány desítky lidí pro řízení podnikových procesů, jsou
databázovým administrátorům nabízeny stále lepší podmínky finanční, pracovní i
sociální, jen aby v podniku zůstali. Průměrné množství zálohovaných dat
řízených administrátory vyskočilo totiž za poslední dva roky o téměř 70 procent
a během příštích tří let je očekáváno další ztrojnásobení (viz tabulka).
Množství dat a v návaznosti i zálohovací kapacita podniků vzrůstá rychleji, než
jejich schopnost najít síťového administrátora, který se v problému orientuje.
Síťový administrátor s klasickými prostředky v podstatě nemá šanci zefektivnit
řízení obrovského množství dat, které pomalu začíná překračovat míru umožňující
jejich kontrolu. Proto nutně vyvstává potřeba používání lepších,
operativnějších řídicích nástrojů.
Peníze opět rozhodující
Cena magnetických zálohovacích disků se v minulých letech výrazně posunula
směrem dolů, a to mnoha společnostem umožnilo uhasit vzrůstající žízeň
uživatelů po digitálních informacích pomocí většího množství (samozřejmě
větších) disků. Jenže řešení problémů, spočívající v pouhém přidávání disků,
vyvolává nové problémy v oblasti technické a řídící.
Pro mnoho společností se však prozatím tento způsob jeví jako nejsnadnější
cesta. Kaiser musí udržet detailní lékařské záznamy pro své uživatele on-line
tak dlouho, dokud jsou jejich pacienty. To ale v některých případech znamená
celá desetiletí. Jen v regionu severní Kalifornie, kde Bowlan působí, proto
společnost přidává 3 až 9GB (v závislosti na modelu serveru) disk každý týden.
Vše musí fungovat se vším
Podle IT manažerů jsou produkty, jež jsou na trhu k dispozici pro řízení
zálohování, sice neustále vylepšovány, ale stále spolu vzájemně nespolupracují
tak, jak by měly. Na lepší časy se zřejmě začíná blýskat u nástrojů určených
pro operační systémy UNIX. V prosinci představil Sun Microsystems produkt
StoreX vývojářský kit, založený na otevřeném standardu. Ten by měl výrobcům
umožnit přidávat k jejich hardwarovým produktům, určeným pro ukládání dat, též
podporu datových služeb, jakými jsou např. automatická hlášení, diagnostika,
zálohování a zrcadlení, které již známe. Nově však budou tyto služby schopny
vzájemně spolupracovat v prostředí několika sítí, obsahujících heterogenní
zařízení. Několik rozhodujích výrobců již vzalo myšlenku za svou a vyvíjí
produkty pro řízení ukládání dat založené na StoreX.
Společnost Capital One Financial v současné době manipuluje s 26 TB dat. 18 TB
dat obsahují datová média v mainframech a podnikových serverech, dalších 8 TB
je rozloženo na discích jednotlivých stolních počítačů.
Společnost sesbírá podle vedoucího technologického oddělení, Johna Pastora, jen
v samotném call-centru okolo 10 GB dat týden co týden.
Capital One plánuje využít IT pro vzrůst hodnoty společnosti z 1 miliardy
dolarů v současnosti na 17 miliard dolarů v příštích deseti letech. Společnost
nabízí svým zákazníkům kreditní karty v 3 000 různých kombinacích vlastností a
cen, přizpůsobené pro jednotlivé konkrétní aplikace. Princip fungování karet je
přitom odvozen od algoritmů obvyklých u aplikací postavených na data miningu a
data modellingu.
Udržet všechna uživatelská data pro on-line analýzu není nic snadného.
"Uživatelé by chtěli být on-line minimálně deset let, jenže to za současného
stavu, kdy poškozenou databázi nahrazujeme týdny, není možné," říká Pastore.
Snad toto tvrzení vypadá nelogicky, ale nesmíme zapomínat, že v průběhu deseti
let by přicházeli stále noví a noví zákazníci, a databáze by tak narostla do
nekontrolovatelných rozměrů.
Výsledkem je, že společnost udržuje transakce on-line jen po dobu tří let a
poté je přesune na zálohovací pásky. Jednou z možných cest, jak se vyhnout
časovým ztrátám způsobeným obnovováním dat z pásek, je zálohování obsahu disku
na jiný disk. Tento způsob se dnes začíná pro společnosti stávat přístupnějším
díky poklesu ceny disků i růstu jejich kapacity. Capital One proto začal
zálohovat data použitím aplikace Symmetrix Remote Data Facility od EMC, která
umožňuje zrcadlení dat mezi dvěma fyzicky rozdílnými systémy.
Nové (staré) cesty
IT manažeři se ale poohlížejí i po ostatních technologických alternativách pro
zálohování dat, mezi jinými je soustředěna pozornost na technologii laserového
disku. J. Pastore dokonce zorganizoval tým, jenž pokračuje ve výzkumných
projektech týkajících se zálohování ve formě třírozměrné holografie. Tyto
studie byly před lety započaty IBM a univerzitou ve Stanfordu.
Vývoj v technologiích pro ukládání dat probíhá velice rychle a navíc mnoha
různými směry. Hustota zápisu, s jakou mohou být data zálohována na běžných
magnetických discích, roste o 50 % ročně již mnoho let, v posledních letech se
však tato hodnota posunula až na 60 % ročně. Stejně tak se spolu s klesající
cenou prudce zdokonalují mnohé další parametry, jako např. rychlost otáčení
disku, rychlost zápisu a čtení dat, řídicí algoritmy.
Přestože vylepšování parametrů v technologiích pro ukládání dat na pevné disky
bylo postupné, může mít velký a náhlý důsledek pro uživatele. Cena za bit
uložený na pevném disku je nyní skoro nižší než u pásek. Až se cenové křivky
protnou, bude to pádný důvod pro odstavení páskových systémů.
Eliminace kritických míst
Výzkumná střediska dnes pracují na Network Attached Secu-re Discs (discích, jež
mají vestavěnou schopnost inteligentního dálkového řízení) a na technologii
nouzového a náhradního zálohování síťové oblasti určené pro ukládání dat SAN
(storage-area network).
Eliminace hostitelského počítače jako článku omezujícího výkon dovoluje
klientskému stroji přistupovat k datům přímo, pomocí výkonných síťových
protokolů typu Fibre Channel určených pro přenos dat. To uvolňuje servery pro
plnění jiných úkolů, dovoluje ukládacím zařízením komunikovat přímo s ostatními
a přijímat a vysílat informace týkající se např. zálohování a obnovování
ucpaných podnikových sítí IP. Výkon a dostupnost ukládacích zařízení se
zvyšuje, spolu se snadností ovládání systému, protože celý systém pro ukládání
dat je v podstatě centralizován.
Podle Arno Penziase, dřívějšího vědeckého vedoucího Bellových laboratoří, může
v některých případech vykazovat spojení v rámci SAN více provozu než běžný
síťový provoz mezi počítači.
Změna plánování
Protože zálohovací systém Kaiser Foundation Health Plan by se v nejbližší
budoucnosti mohl stát nebezpečným problémem, uvažují jeho představitelé o
několika alternativních technologiích pro ukládání dat včetně SANu. Geograficky
decentralizovaný Kaiser je dnes postaven na informačním systému obsahujícím
klinická data pacientů a jeho 8,5 mil. členů má přístup do databáze z
kteréhokoliv místa ve Spojených státech. V rámci centrálního ukládání
obrovského množství dat jsou využívány i kapacity jednotlivých klinik, které
poskytují rychlejší přístup k vybraným, často požadovaným údajům. Data v
centrálním skladišti budou postupně také diferencována třeba pomocí rozdílných
systémů nebo disků. Ukládání dat tam, kde je to nejvýhodnější z hlediska jejich
potřeby, a rozdělení centrální datové zálohy na segmenty, umožní efektivnější
chod, větší dostupnost a snadnější ovladatelnost. Celý proces přechodu na nový
typ ukládání dat však musí vycházet z ideje, že je tvořen pro skutečně obrovské
množství dat. Do budoucna již nebude možné rozšiřovat postupně donekonečna
kapacitu. Podle Johna McArthura, analytika společnosti International Data
Corporation, jsou dávno pryč časy, kdy se plánování podnikového systému pro
ukládání dat dalo řídit zkušenostmi a citem. "Společnosti musejí vytvářet
zálohovací infrastrukturu a pomůcky s ohledem na nutnost obsloužení širokého
spektra různých aplikací i operačních systémů," říká. "Právě tak, jako
nenecháte každé oddělení, aby si koupilo vlastní telefonní systém, nesmíte je
nechat vytvořit vlastní zálohovací řešení."

9 1340 / ijan

Co nás v zálohování čeká?
Jestliže jste ohromeni změnou ukládání digitálních dat za posledních pět let,
měli byste zkusit navštívit Carnegie Mellon. Univerzity, National Science
Foundation a 25 společností investovalo v tomto roce 11 milionů dolarů do 78
výzkumných projektů týkajících se zálohování.
Cílem tohoto centra je vývoj magnetických diskových systémů, schopných uložit
data o hustotě 100 Gb na čtvereční palec tj. přibližně 20krát více, než je dnes
obvyklé. Bob White, ředitel centra, je přesvědčen, že funkční pracovní prototyp
bude dostupný v roce 2001 a komerční produkt rok později. Zároveň doufá ve
vývoj kompletního systému, ukrytého v jednom čipu. Jedna strana bude obsahovat
procesor, paměť, I/O okruh a ostatní elektroniku. Druhá bude obsahovat 10GB
křemíkový zálohovací nástroj s mikroskopickou "sondou" čtecí/zapisovací hlavy.
Další projekty, kterými se centrum zabývá, jsou následující:
Vývoj algoritmů "přemýšlivých výpočtů", přes které aplikace dynamicky generuje
"rady", která data z kterého datového disku mohou být vzápětí pro chod aplikace
potřeba. Aplikace tato data předem čte a chvilkově skladuje, čímž se urychluje
její chod.
Výzkum magnetických pásek je zaměřený na zvýšení hustoty ze 100 Mb na 6 Gb na
čtvereční palec a dosažení čtyřnásobku zapisovací rychlosti na 20 m/s.
Technologie s vysokou rozlišovací schopností, zahrnující modrý laser, jsou
používány na zvýšení hustoty optických disků z 5 Gb na čtvereční palec na 40 Gb
na čtvereční palec během příštích dvou nebo tří let.
Výzkum třídimenzionálních holografických zálohovacích pomůcek pro dosažení
zálohovací hustoty 1 Tb na krychlový palec a přenosové rychlosti až 1 Gb/s.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.