Připravte se také na katastrofy při přenosu dat

1. 12. 2002

Sdílet

Manažeři společnosti Eastman Chemical z Kingsportu ve státě Tennesee si uvědomili, že při obnově v případě katastr...
Manažeři společnosti Eastman Chemical z Kingsportu ve státě Tennesee si
uvědomili, že při obnově v případě katastrofy je třeba vzít v potaz též
vzdálenost a problémy s transportem.
Společnost má dvě zálohovací centra, jedno v IBM v Gaithersburgu ve státě
Maryland, druhé v Sungard Data Systems v Atlantě. "Dvakrát do roka nahrajeme
data na pásky a ty odešleme do těchto center," říká Charlie Oliver, ředitel
globálních infrastrukturních služeb Eastman Chemical. Nicméně ještě před tím,
než tragédie z 11. září 2001 uzavřela většinu transportních tepen, bylo
Oliverovi jasné, že toto řešení není adekvátní.

Nová vize
Počátkem roku 2001 získal svolení managementu k vybudování dalšího střediska,
vzdáleného 30 km od ústředí v Johnson City. Nové centrum bylo spuštěno v březnu
2002. Chemická společnost si zvolila hardware Symmetrix od EMC a software EMC
Symmetrix Remote Data Facility, který je propojen telekomunikačním vedením
Dense Wave Division Multiplexing.
Oliver říká, že architektura znamená víc než jen zajištění kontinuity firemního
provozu. "Replikujeme všechny své ERP a další kritické systémy, nicméně zároveň
se snažíme dosáhnout mezi oběma centry vyváženosti tak, aby jedno nebylo pouhou
zálohou druhého."

Zlepšení služeb
Provoz dvou aktivních, vyvážených center přináší lepší zákaznické služby.
"Většinu rutinních selhání teď naši klienti vůbec nepostřehnou, jelikož
transakce mohou být automaticky přepnuty na druhé centrum. Díky tomu můžeme
nabízet neobyčejnou dostupnost," říká Oliver. Vysoká dostupnost je zajímavým
vedlejším přínosem, nicméně podle Olivera je nejdůležitější brát při výstavbě
nového systému pro zajištění kontinuity provozu firmy v úvahu charakter reálné
katastrofy.

Zadní vrátka
"Často slyším, jak někdo říká: Dokážeme obnovit naše prostředí během 24 až 48
hodin, nicméně vůbec nemyslí na to, že by mohly selhat i jiné jejich služby.
Spousta mých kolegů spoléhá na to, že by mohli v případě katastrofy odlétnout
do nějakého vzdáleného místa, nicméně tento čas je třeba též přičíst k času na
obnovu, proto je nutné brát v potaz, kde je zařízení umístěno," varuje Oliver.

Klonování dat pro obnovu po havárii
Firmy usilují o skloubení svých úložných a obnovovacích strategií
prostřednictvím replikace dat. Dokonce ještě před teroristickými útoky z 11.
září 2001 a krizí amerických leteckých společností začali IT manažeři používat
výrazů jako "disaster recovery" (obnova po katastrofě) a "storage" (ukládání) v
jedné větě, zejména pak v oblasti finančních služeb.
Po útocích nicméně požadavek na skloubení obou disciplín působil ještě
naléhavěji. Možnost katastrofy byla najednou mnohem reálnější a dřívější plány
ochrany dat (jako odesílání fyzických pásek leteckou poštou na vzdálené místo)
najednou působily značně naivním dojmem. Výsledkem je to, že slova "disaster
recovery" neboli obnova po katastrofě či havárii dnes určují směr mnoha
projektů v oblasti úložných technologií, neboť IT manažeři hledají způsoby, jak
data replikovat a kopie odesílat do zařízení, jež budou vzdálená deset, dvacet
nebo dokonce stovky kilometrů od ústředí společnosti. Zde jsou tři
technologické strategie, kterých používají:

1. Přístup na základě subsystému pro ukládání dat
Když Lajuana Earwoodová začala hledat nový systém pro obnovu v případě havárie,
zjistila, že je ve svém úsilí vlastně osamocena. "O něco podobného jako my se
nikdo nepokoušel chtěli jsme dokázat zrcadlení velkých datových objemů na velmi
dlouhou vzdálenost, na více než 1 000 kilometrů," říká. L. Earwoodová,
ředitelka pro mainframové systémy ve společnosti Norfolk Southern Railway v
Norfolku ve státě Virginia, si v lednu 2001 uvědomila, že počítačové systémy
velkých firem jsou značně zranitelné. "V té době jsme měli k dispozici
replikaci malého objemu dat v reálném čase, nicméně to by v případě větší
katastrofy stejně nebylo dostačující," říká Earwoodová. Data dosahovala objemu
6 TB kritických informací o železnici, výplatních listinách a objednávkách,
přičemž byla uložena na dvou mainframových počítačích IBM v zásadě tvořily IT
rozbočovač železniční společnosti. A tak Earwoodová oslovila všechny velké
poskytovatele zařízení pro ukládání dat: vítězem výběrového řízení se v únoru
2001 stala společnost Hitachi Data Systems z kalifornské Santa Clary. "Návrh
IBM by vyžadoval příliš dodatečného hardwaru, stejně neuspokojivé se nám jevilo
řešení EMC HDS nám předložila řešení, jež se asi nejvíc blíží zrcadlení v
reálném čase a navíc vyžaduje méně hardwarového vybavení." A také cena byla
příznivá. Nový systém byl spuštěn v lednu 2002. V průběhu instalace nicméně
došlo k jedné výrazné změně plánu. Původně se měla data replikovat do zařízení
umístěného v North Bergenu, stát New Jersey, zhruba 1 100 kilometrů od ústředí
firmy. "Ale po teroristických útocích 11. září nám došlo, že to není zas tak
dobrý nápad. Problémy spojené s přepravou personálu by mohly v podstatě zničit
všechny naše snahy," říká Earwoodová. A tak se firma Norfolk Southern rozhodla
pro mnohem bližší zálohovací centrum pro zrcadlení mainframových dat v
Buckheadu. Další překážku představoval čirý objem dat. "Chtěli jsme všechna svá
data shromáždit do jedné konzistentní skupiny," říká Earwoodová. Konzistentní
skupina je sada dat sdílených několika kritickými aplikacemi, ovšem v případě
společnosti Norfolk Southern jsou všechna data sdílena všemi aplikacemi. Na
papíře to smysl dávalo, nicméně při samotné realizaci se ukázaly hranice
technologie."
"Pro ukládání dat používáme hardware HDS 9960, replikační software HDS TrueCopy
a dvě síťová vedení OC3," vysvětluje Earwoodová. "Všechno to fungovalo, nicméně
u zápisu vysokých objemů transakcí jsme dosahovali stropu." Řešením bylo data
rozdělit do třech konzistentních skupin, nicméně Earwoodová přesto nevzdává
svůj originální plán: "Zkoušíme nový hardware od HDS, který bude s to zvládat
větší objemy. To by nám mohlo umožnit zkonsolidovat všechna naše data zpět do
jedné konzistentní skupiny," říká. Earwoodová testuje systém pomocí simulované
katastrofy téměř každý týden. "Dobu obnovy se nám podařilo snížit na téměř
čtyři hodiny, takže mám pocit, že teď už klidně můžeme předstoupit před vedení
společnosti a zodpovědně prohlásit, že máme k dispozici dobrý systém pro obnovu
dat v případě katastrofy.

2. Hostované softwarové řešení
Když Chadd Warwick, provozní ředitel společnosti Comprehensive Software
Systems, což je firma zabývající se vývojem finančního softwaru sídlící v
coloradském Goldenu, vybíral nový systém pro zajištění firemní kontinuity,
chtěl něco flexibilnějšího než hardwarově založené systémy nabízené dodavateli
jako Hitachi či EMC. Požadované řešení našel v softwaru Veritas Volume
Replicator (VVR) od kalifornské společnosti Veritas Software. "VVR se nám
zamlouvalo, jelikož jde o hostované softwarové řešení," říká Warwick. Protože
software běží na serveru místo na jednom z disků, je nezávislý na systému pro
ukládání dat. "Díky tomu jsme nemuseli budovat novou hardwarovou
infrastrukturu, a tak jsme výrazně ušetřili," pochvaluje si Warwick. Warwick
začal VVR používat v listopadu roku 2001 jako betatester a rozhodl se u něj
zůstat. "Jde o replikaci po celých blocích, takže software nemusí vědět vůbec
nic o aplikacích ani o datech. A hardwarová nezávislost je skutečně velice
příjemná věc. Dokonce je možná obnova dat na jakýkoli hardware, takže v případě
nějaké závažné katastrofy by klidně bylo možné zaběhnout do obyčejného obchodu,
nakoupit jakékoli počítače a systém opět spustit." Další výhoda podle Warwicka
spočívá v absenci složitých specifických síťových protokolů. "VVR používá
standardní IP protokol," zdůrazňuje. V současné době společnost replikuje
zhruba 400 MB až 1 GB dat denně po linkách T1 a T3 z datového centra v Goldenu
do zařízení umístěného v Denveru. Softwarový přístup je obvykle levnější než
subsystémové produkty, zvláště v případě replikace na delší vzdálenost,
popisuje Bob Guilbert, viceprezident společnosti NSI Software z Hobokenu ve
státě New Jersey, která je konkurentem firmy Veritas. "Subsystémové produkty
obyčejně vyžadují pro přenos specializovaná vlákna, takže výsledná cena může
být velmi vysoká."

3. Hybrid: SAN po IP
Jako mnoho jeho kolegů i Shimon Wiener začal hledat lepší způsoby ochrany dat
své firmy po teroristických útocích 11. září. Wiener je manažerem internetového
a síťového oddělení izraelské společnosti Miytachim, jednoho z nejvýznamnějších
poskytovatelů důchodového pojištění. A zrovna Izrael je místem světa, kde
katastrofy bohužel nejsou ničím vzácným. Firma má dvě datová centra: jedno se
600 MB v Ramat-Ganu, kde sídlí její ústředí, druhé o kapacitě 400 MB vzdálené
zhruba 10 km odtud v Tel Avivu. "Chtěli jsme dvojitou replikaci," říká Wiener,
"a to proto, že kdyby nám centrum v Tel Avivu selhalo, může jeho úlohu přejmout
centrum v Ramat-Ganu, a opačně." Nicméně když se Wiener vydal hledat
nejvhodnější řešení, zklamaly jej vysoké ceny. "Nejprve jsme se dívali na
Compaq (nyní HP), IBM a EMC. Žádná z těchto firem však nebyla s to nabídnout
řešení bez připojení optickým kanálem, což je v případě jeho použití velmi
nákladné."
Wiener konečně našel to, co hledal, v produktu společnosti Dot Hill Systems z
kalifornského Carlsbadu. Společnost Miytachim chtěla mít na každém pracovišti
síť se systémem pro ukládání dat SAN se softwarem Axis Storage Manager od Dot
Hill, který podporuje IP replikaci pro systémy postavené právě na standardu
SAN. V lednu 2001 si penzijní společnost nainstalovala Dot Hill SANnet 7100 v
Ram-Gatu a druhý SANnet 7100 v Tel Avivu. Hned poté začala vzájemná replikace
mezi oběma centry. Testování trvalo zhruba čtyři týdny. "Původně jsme měli
jisté problémy se synchronizací obou systémů," říká Wiener, "nicméně dostalo se
nám dobré podpory a nyní jsme zcela spokojeni. Replikaci provádíme zhruba
jednou denně."
Ačkoli hlavním cílem Wienera bylo získat systém pro obnovu dat v případě
katastrofy, říká, že zavedením nového řešení získali i další vedlejší výhodu.
"Použitím SAN se rovněž podařilo centralizovat data, takže se zálohami se
podstatně snadněji pracuje."