Co dělat, aby zálohování a obnova dat skutečně fungovaly

  • Podniky musejí sbírat klíčová data, aby ověřily, zda jejich řešení zálohování a obnovení vyhovují realitě.

Sdílet

Zjistit, jestli systémy zálohování a obnovy fungují dobře, je mnohem složitější než zjištění doby, jakou zálohování či obnovení trvá. Správný výběr základní sady metrik je klíčem k řádnému posouzení systému, zda je reálně použitelný, nebo potřebuje přepracování.

Tady je pět metrik, jaké by měl každý podnik sledovat, aby bylo možné posoudit, zda jeho systémy vyhovují skutečným potřebám.

1. Kapacita a využití úložiště

Začněme nejzákladnější metrikou: má váš zálohovací systém dostatek úložné kapacity, aby mohl uspokojit vaše současné a budoucí požadavky na zálohování a obnovení?

Ať už jde o páskovou knihovnu nebo úložné pole, má váš úložný systém konečnou úložnou kapacitu? Potřebujete sledovat, jak velký objem to je a jaké procento z něj v průběhu času využíváte.

Absence tohoto monitoringu by vás v důsledku mohla časem nutit k rozhodnutím, která by nebyla v souladu s firemními zásadami. Například jediným způsobem vytvoření další kapacity bez nákupu  je vymazání starších záloh.

Byla by skutečně ostuda, kdyby absence monitoringu kapacity úložného systému vyústila v neschopnost plnit požadavky na uchovávání dat, které vaše společnost stanovila.

Cloudově založené objektové úložiště ale může tento problém elegantně vyřešit, protože některé služby nabízejí v podstatě neomezenou kapacitu.

2. Kapacita a využití propustnosti

Každý úložný systém má schopnost přijmout za den jen určitý objem záloh. Obvykle se to měří v megabajtech za sekundu nebo terabajtech za hodinu.

Toto číslo byste měli znát a měli byste monitorovat jeho využití vaším systémem zálohování. Pokud to neuděláte, může to vyústit v situaci, kdy se bude doba zálohování prodlužovat až do stavu, kdy začne zasahovat do pracovní doby.

Zvláště významné je monitorování propustnosti a využití u páskových technologií. Je velmi důležité, aby propustnost vašeho zálohovacího systému odpovídala propustnosti páskové jednotky – tedy její schopnosti přenášet data.

Konkrétně by propustnost, prostřednictvím které dodáváte data pro páskovou jednotku, měla být větší než propustnost páskové jednotky pracující s minimální rychlostí.

Podívejte se do dokumentace k páskové jednotce a do dokumentace dodavatele podpůrného systému – potřebujete zjistit minimální akceptovatelnou rychlost, které se musíte co nejvíce přiblížit.

Je nepravděpodobné, že by se vám podařilo dosáhnout maximální rychlosti páskové jednotky, ale přesto byste měli monitorovat i horní hranici.

3. Výpočetní kapacita a její využití

Kapacita vašeho zálohovacího systému se také určuje výkonem nosného výpočetního systému. Pokud objem zpracování zálohovacích serverů nebo databáze zálohovacího systému nedokáže udržet krok, může to také zpomalit zálohování a v důsledku to může způsobit, že zálohování začne zasahovat do pracovní doby.

Měli byste tedy také monitorovat výkon zálohovacího systému, abyste viděli míru, s jakou se to případně děje.

4. Zálohovací okno

Předchozí dvě metriky jsou velmi důležité, protože ovlivňují to, co nazýváme zálohovací okno: je to časový úsek, během kterého smí probíhat zálohování.

Pokud používáte tradiční zálohovací systém, kde existuje významný dopad na výkon primárních systémů při zálohování, měli byste předem stanovit své zálohovací okno.

Jestliže se začnete blížit zaplnění celého okna, nastává čas buďto přehodnotit velikost okna, nebo přepracovat zálohovací systém.

Společnosti, které používají zálohovací metody patřící do kategorie neustálých přírůstků (např. CDP, kontinuální ochrana dat, přírůstkové zálohy na blokové úrovni), se obvykle nemusejí o zálohovací okno obávat.

Je to kvůli tomu, že zálohování běží jen velmi krátce a přenáší malá množství dat, takže tento proces má jen velmi nepatrný vliv na výkon primárních systémů.

Proto zákazníci používající takové systémy obvykle zálohují celý den, například každou hodinu či každých pět minut.  Pravý systém CDP ve skutečnosti pracuje nepřetržitě a přenáší každý nový bajt při jeho zápisu.

5. Skutečné body obnovy a doby obnovy

Ve skutečnosti nebývá zásadní, jak dlouho trvá zálohování, ale podstatné je, jak dlouho trvá obnova. Cíl doby obnovy (RTO, Recovery Time Objective) je maximální čas dohodnutý všemi stranami, že obnovení musí nastat do této doby po nějakém incidentu.

Délka přijatelného RTO pro danou společnost je obvykle určená velikostí finanční ztráty vznikající při odstavených systémech. Pokud například firma ztrácí při výpadku miliony dolarů každou hodinu, vyžaduje obvykle velmi krátkou dobu RTO.

Třeba organizace obchodující s cennými komoditami (zejména s akciemi), kde probíhají rychlé změny hodnoty, se snaží dosáhnout RTO blížící se dokonce nule.

Zato jiné podniky, které mohou tolerovat delší dobu odstavení svých výpočetních prostředků, mohou mít RTO i v řádu týdnů. Důležité je, aby parametr RTO odpovídal podnikatelským potřebám společnosti.

Navíc není potřeba mít stanovený jeden parametr RTO pro celou firmu. Je naprosto normální a rozumné používat kratší RTO pro kritičtější aplikace a naopak delší RTO pro zbytek datového centra.

Cíl bodu obnovení (RPO, Recovery Point Objective) vyplývá z velikosti přijatelné ztráty dat po incidentu a měří se pomocí času. Pokud se například domluvíte, že můžete ztratit hodinu, v rámci které vznikají a mění se data, domluvili jste se na jednohodinovém RPO.

Většina společností však používá hodnoty, které jsou mnohem vyšší, například 24 hodin a více. Je to primárně proto, že čím kratší je vaše RPO, tím častěji musíte spouštět zálohovací systém.

Mnoho podniků si možná přeje kratší RPO, ale uvědomují si, že to není možné s jejich aktuálním zálohovacím systémem. Stejně jako u RTO je naprosto normální mít ve svém prostředí více RPO podle důležitosti jednotlivých datových sad.

Metriky pro bod obnovy a dobu obnovy se měří jen při probíhajícím procesu obnovování – ať už je reálné, či testovací. RTO a RPO jsou cíle. Jim odpovídají metriky RTR a RPR, které měří míru, do jaké se podařilo tyto cíle splnit.

Je důležité je měřit a porovnávat s RTO a RPO, aby bylo možné rozhodnout, zda je nutné přepracovat používaný systém zálohování a obnovy, či nikoliv.

Ve skutečnosti je běžné, že většina firem má  RTR a RPR, které se ani zdaleka nepřibližují dohodnutým hodnotám RTO a RPO. Důležité však je vynést tuto realitu na světlo a tuto nepříjemnou skutečnost si přiznat.

Následně je potřeba RTO či RPO přizpůsobit, nebo přepracovat zálohovací systém. Nemá vůbec žádný smysl mít definované krátké časy RTO a RPO, a přitom akceptovat naprosto odlišné RTR a RPR.

Co dělat s metrikami?

Jedním ze způsobů, jak můžete zvýšit důvěru ve svůj zálohovací systém, je dokumentovat a publikovat všechny výše uvedené metriky. Seznamujte management s tím, jak funguje váš zálohovací systém, zda splňuje na něj kladené požadavky.

Dejte jim také vědět – na základě aktuálního tempa růstu – za jak dlouho bude potřeba koupit další kapacitu. A především zajistěte, aby věděli, zda a v jaké míře je váš systém zálohování a obnovy schopný splnit stanovené parametry RTO a RPO.

Neznámost této skutečnosti totiž nic dobrého nepřinese vůbec nikomu, zejména pak v případě neplánovaného výpadku.

Autor: Preston W. Curtis

 

Security World si můžete koupit i jako klasický časopis, buď v klasické tištěné formě nebo v elektronické verzi. Věnujeme se bezpečnosti počítačových systémů, ochraně dat, informací a soukromí.  Jsme jediný titul na českém a slovenském trhu, který oslovuje širokou čtenářskou obec – od ředitelů firem, přes odborníky na bezpečnost po koncové uživatele. Naším cílem je poskytnout ucelený přehled o bezpečnostních hrozbách a zejména o tom, proč a jak se jim bránit, případně proč respektovat a dodržovat nařízení IT manažerů ve firmách.