Všichni zaměstnanci v jakékoliv společnosti potřebují mít přístup k firemním datům a na druhou stranu je také sami generují, čímž vytvářejí celkový vnitřní svět informačních technologií. Mezi taková data může patřit poštovní komunikace se zákazníky, personální a účetní zdroje, auditní či bezpečnostní záznamy nebo prezentace obchodních řešení.
V dnešní době však tyto firemní zdroje, které mají pro tu kterou společnost nevyčíslitelnou hodnotu, rostou exponenciální řadou. Čím je tržní podíl organizace větší, tím větší je i množství vnitřních dat.
Tato data je nutné dobře chránit, jelikož mohou být velice jednoduše a rychle zneužita či znehodnocena. Ať už se připravujete na útoky zvenčí či zevnitř, nebo na problémy způsobené hardwarovou či lidskou chybou, vždy existuje varianta úplné nebo částečné ztráty dat.
V případě běžných metod ochrany firemních dat pravidelnou zálohou existují čtyři základní části, na které se společnosti zaměřují:
-
Ochrana souborového systému na zálohovaných strojích
-
Ochrana kritických firemních aplikací jako celku bez nutnosti vypnutí
-
Ochrana operačního systému a obnova na odlišný hardware
-
Duplikace zálohovaných dat a možnost obnovy z jiné lokace
Zálohování souborového systému je klasickou metodou ochrany firemních dat. Vezmete soubory v konzistentním stavu, co nejrychleji kopie přesunete do úložiště (tím může být buď disk, páska, nebo optické médium) a tam je necháte po požadovanou dobu (dny a týdny při záloze, případně roky a desetiletí při archivaci).
Dnešní zálohovací řešení umožňuje automaticky rozpoznat, co je zálohováno a jaké soubory se oproti poslední záloze změnily, a kopírovat pouze změněná data. Současným trendem je vybrat si řešení, ve kterém není nutné vracet se k první záloze (první plná záloha – jedna ku jedné), ale používat stálé rozdílové zálohování.
Vše probíhá na základě dvou jednoduchých pravidel: kolik verzí maximálně je nutné od jednoho souboru uchovávat a po jakou dobu budou zálohy v úložišti drženy. Tato pravidla by měla být snadno nastavitelná a měla by se automaticky hlídat dopředu zvoleným řešením. Výhodou je velmi rychlá záloha, menší zátěž zálohovaného stroje a přenosové linky a nižší požadovaná kapacita úložného prostoru, což dohromady přináší i nižší náklady.
U přenosových linek je patrný trend opouštění zálohování přes klasickou firemní síť. V současnosti již není náročné postavit vedle ní ještě klasickou 1Gb síť sloužící pouze pro denní zálohy a měsíční archivace. K nejlepším řešením, hlavně pro větší objemy dat souborového systému, patří využití datové vysokorychlostní sítě SAN (Storage Area Network) nebo NAS (Network Attached Storage). Zde mohou být data zasílána přímo ze zálohovaného stroje na cílové úložiště (diskový nebo páskový prostor) bez jakéhokoliv prostředníka (centrálního zálohovacího serveru).
Minimalizace objemů
Dalším trendem při zálohování souborového systému je snaha o co nejmenší přenášený objem dat mezi klientem a úložištěm. Pokud změníte jeden soubor (například 50 MB) tím, že v něm přepíšete pouze jeden záznam, znamená to automaticky celou zálohu souboru. Mezi progresivní metody zálohování patří záloha pouze datových částí souborů nebo celého systému při zachování možnosti konzistentní obnovy celku. Taková metoda by v předešlém případě vygenerovala zálohu pouze 5 KB ze změněného souboru. To při předpokladu velkého počtu souborů znamená velmi výrazné snížení zálohovacího okna!
Zálohovací řešení by mělo při procesu zálohování a obnovy automaticky rozpoznat, o jaké soubory se jedná. Zatím byla zmíněna vlastnost zjištění změny takového souboru (název, velikost, datum vytvoření, přístupu či změny...) oproti poslední záloze. Také je dobré mít v zásobě vlastnost rozpoznání duplicitních souborů na zálohovaných strojích. Proč duplikovat soubory, které jsou již jednou zálohované, i když z jiného stroje? Vše by mělo být velmi rychlé v kompetentnosti centrální zálohující složky spravující klienty a úložiště.
Také deduplikace již zazálohovaných souborů se prosazuje jako důležitá a vyhledávaná vnitřní vlastnost zálohovacích řešení. Jedná se o deduplikace datových bloků na centrálním úložišti, kdy jsou jednotlivé části (zašifrované datové bloky) porovnávány s dalšími a při nalezení shody se uchovává pouze první originální, ostatní shodné jsou smazány a nahrazeny pouze odkazy. Tato metoda snižuje potřebu investovat do široké kapacity úložiště a snižuje náklady.
V případě firemních aplikací je zde odlišná situace v trendech a možnostech zálohování. Taková aplikace je složená z více částí (většinou produkční a databázové) a ty je potřeba zálohovat v konzistentním stavu jako jeden celek. Nelze na ni použít metody jako u souborového zálohování, jelikož aplikace je určena pro nepřerušený chod a není možné ji vypínat, zálohovat a znovu zapnout. Mezi takové aplikace patří například databázové systémy, poštovní aplikace, portálové nebo ERP řešení a další.
Většina těchto aplikací disponuje otevřeným komunikačním rozhraním (API, Application Programming Interface), které umožňuje zálohovacímu řešení před začátkem zálohovacího okamžiku provést procesy k zajištění konzistentnosti (zapsání otevřených informací z operační paměti do databáze, zmrazení či duplikace částí aplikace a jiné).
Samotné aplikace tvoří největší oříšek v procesu zálohování. Jejich počet a vnitřní objem dat roste. Zvláště aplikace na firemních pobočkách znamenají problém, jelikož přesun dat z pomalých pobočkových sítí (WAN, Wide Area Network) na centrálu znamená velkou zátěž aplikace a snížení průchodu dat přes pomalou a drahou přenosovou síť.
Trendem firemního zálohování pro rychlou ochranu a obnovu aplikací je znovu možnost zasílání pouze datových oblastí kritické aplikace a ne souborového systému jako celku (1 databáze = 1 soubor). Pokud je zachována konzistentnost, je možné zálohovat a obnovit aplikaci za zlomek času v porovnání s předešlými souborovými případy.
Taková obnova „na pozadí“, kdy je celý disk obnoven okamžitě (ale datové bloky jsou obnovovány postupně na pozadí) a obnovená aplikace spuštěna do minuty, je nenahraditelnou vlastností pro kritické případy.
Omezené zásahy
Firemní aplikace jsou klíčové pro běh mnoha komponentů a funkčních celků ve společnosti. Bez nich nepošlete elektronickou poštu, nevytvoříte výplaty zaměstnanců nebo nezorganizujete zákaznické setkání. Jako takové potřebují klid na svou práci a jakékoli zálohování je zatěžuje a omezuje jejich funkci. Pro obzvlášť kritické aplikace (například ERP) existuje způsob zálohování s tzv. nulovým dopadem.
V tomto případě se vytvářejí duplikace databázové části aplikace na diskových polích v konzistentním stavu (funkcionalita FlashCopy, Peer to Peer Remote Copy...). Tyto duplikace jsou poté automaticky připojeny k jinému zálohujícímu stroji, který provede zálohu do centrálního úložiště. To vše se děje automaticky bez jakéhokoli zásahu do fungující aplikace.
Dalším důležitým hlediskem pro zálohu a obnovu je možnost vrátit do původního stavu celý operační systém po pádu. Je sice dobré mít možnost obnovy souborového systému a aplikací (popsáno výše), bez operačního systému se však neobejdete. Instalace, nastavení, ovladače, bezpečnostní politika, instalace aplikace – to vše může trvat nepřiměřeně a hlavně zbytečně dlouho.
Zálohovací řešení by mělo mít ve své politice nástroje pro zálohu celého operačního systému (jako celku či jeho jednotlivých částí) používaného ve společnosti. Nemělo by záležet na tom, zda se jedná o serverovou edici či uživatelskou verzi pro pracovní stanice. Záloha by měla být rozdílová, v konzistentním stavu a hlavně s možností obnovy i na odlišný hardware. Postup při takovém pádu a následné obnově operačního systému by mohl poté vypadat takto:
-
Vytvoření boot média pro komunikační rozhraní mezi zálohovacím úložištěm a strojem, na který obnovujeme, následné načtení takového média.
-
Obnova zálohovaného operačního systému i na odlišný hardware.
-
Úprava obnoveného operačního systému (dodání či změna ovladačů, úprava nastavení), vše přes rozhraní a nástroje boot média.
Pokud využíváte všech nejnovějších schopností řešení pro ochranu dat formou zálohování, nesmíte zapomínat na možnosti duplikace již zálohovaných dat na odlišné lokace. Důvodem je, že ve většině případů jsou jak zálohované firemní informace, tak i jejich duplikáty uskladněny ve stejných prostorách (centrální serverovna). Výhodou je, že všechny zálohy jsou rychle dostupné jak pro samotné zálohovací řešení, tak pro jejich obsluhu. Nevýhodou je, že pokud vznikne plošná katastrofa ve společnosti (požár, povodeň, zemětřesení), postihne jak produkční chráněnou část, tak i tu zálohující.
V této chvíli je potřeba si ujasnit, o jaký zálohovaný objem dat se jedná, jak často a jaká data chcete takto vícenásobně duplikovat nebo přes jaké komunikační linky budete data zasílat a které technologie duplikace využijete. Jako pomůcku lze použít dva základní požadavky na celé zálohovací řešení:
Jakou aktuální časovou potřebu obnovy máte na daný soubor, aplikaci nebo operační systém? (parametr RPO, Recovery Point Objective)
-
Jak dlouho se společnost obejde (bez kritických finančních ztrát) bez souborů, aplikace nebo operačního systému? (RTO, Recovery Time Objective)
Jako odpověď na otázky týkající se možností duplikace zálohovaných dat do jiných lokací vznikla v roce 1992 v USA mezinárodní uživatelská skupina SHhare, která definovala sady vrstev řešení, které se staly mezinárodním standardem pro disaster recovery. Těchto vrstev je sedm a definovaný standard v každé vrstvě vysvětluje aktuální stav, jeho výhody a rizika. První vrstva definuje základní zálohovací řešení mezi klientem a centrálním úložištěm. Poslední, sedmá vrstva definuje řešení automatické duplikace mezi jednotlivými prostředími (hardwarový a softwarový cluster). Více informací naleznete na webových stránkách www.share.org.
Závěrem
Téma disaster recovery, řešení pro zálohování a obnovu dat, je důležitou součástí každé fungující firemní kultury, ve které si všichni uvědomují, jak důležité je nejenom se k datům společnosti dostat, ale také je při jakékoli ztrátě co nejrychleji obnovit.
Zvláště velký důraz se klade na dobu, za kterou je možné obnovu dat provést. Sami se zeptejte, kdy se společnost skutečně začne zajímat o to, zda využívá moderní zálohovací řešení kopírující nejnovější trendy.
Bohužel je to často až tehdy, když přijde o to nejdůležitější – o svá data. V tom okamžiku je nezbytné vědět, z jakého úložiště bude obnova data probíhat, jak rychle bude možné obnovit operační systém, soubory a aplikace a hlavně jak aktuální data dokážete obnovit.
Autor je pracovníkem společnosti IBM.
***tento článek vyšel v tištěném SecurityWorldu 2/2009