Nejlepší kombinace zálohovacích metod

Zálohování dat zůstává nadále hlavním důvodem pro vznik plánovaných odstávek IT systémů. Soubory dat, které je ...


Zálohování dat zůstává nadále hlavním důvodem pro vznik plánovaných odstávek IT
systémů. Soubory dat, které je třeba zálohovat, jsou často velmi obsáhlé a
časový prostor příliš malý pro tradiční metody zálohování. Pomoci může
kombinace různých postupů.
K problémům s rostoucími datovými soubory se přidávají požadavky na více než
99% nepřetržitou dostupnost (lišící se jen počtem devítek za desetinnou čárkou
v údaji o počtu procent). Moderní metody zabezpečení dat se musejí těmto
vysokým požadavkům na dostupnost přizpůsobit.
Koncept zálohování v Storage Area Networks (SAN) se v mnohých firmách dočasně
postaral o zlepšení situace. Serverové systémy se připojují na mechaniky pásek
přímo technologií Fibre Channel, která umožňuje dosáhnout tří až pětinásobně
lepších hodnot propustnosti dat oproti klasickým řešením. Potíže však vznikají
u velkých databázových aplikací s extrémně vysokými požadavky na dostupnost.
Pro všechna zálohování databází platí toto základní pravidlo: Čím častěji
zálohujete, tím kratší je doba znovuspuštění v případě krize. Problémem ale
může být objem zálohovaných dat. Rychlého zálohování databází bylo možno
doposud dosáhnout pouze pomocí tzv. raw partition backupů, u nichž databáze
najede do režimu off-line a pak se provede zálohování. Kvůli tomu však není po
dobu zálohování dostupná. Pomoc by mohly přinést následující tři koncepty
zálohování.

Mimo hostitele
Off-host zálohování znamená vytvořením kompletního datového obrazu a
zabezpečení přes druhý server. U tohoto typu zálohování se může nedostupnost
aplikace obejít vytvořením úplně identického datového souboru (zrcadlový
obraz). Obecně rozlišujeme hardwarové a softwarové zrcadlové obrazy. Základní
technika se nazývá snapshot (snímkování) nebo kopie point-in-time a umožňuje
zobrazení identického datového souboru v definovaném okamžiku. Zatímco
hardwarové zrcadlení je speciální a drahé řešení, které funguje často jen s
určitými diskovými systémy, nabízí softwarové zrcadlení (mirroring) možnost
flexibilního využití libovolné platformy. Funkce je dostupná například ve
Volume Manageru od Veritasu (pro systémy Unix a Windows 2000).
Zabezpečení dat probíhá v následujících krocích:
Databázový server se krátkodobě nastaví do zálohovacího režimu, aby se na disk
zapsaly všechny informace z aplikačního bufferu, a tak vznikne konzistentní
datový soubor.
Zrcadlový obraz se pak odpojí od serveru. Tyto dva první procesy trvají jen
několik vteřin.
Databázový server je pak ihned vyvolán ze záložního módu a je zase k dispozici
v režimu on-line. Druhý hostitelský počítač (off-host) zálohuje odpojený
databázový obraz. Nevýhoda této koncepce spočívá především v nutnosti dodatečné
kapacity disků. Protože mnozí uživatelé již kopírují pro případ nutnosti
zotavení po katastrofě primární datový soubor (synchronně nebo asynchronně) na
sekundární zrcadlo nepřetržitě, představuje backup mirror často třetí kompletní
datový obraz. Dodatečné požadavky na kapacitu však umí obejít tzv. softwarový
snapshot.

BLIB
V případě Block Level Incremental Backupu (BLIB) může zálohování probíhat v
on-line režimu. Místo celého souboru se zálohují jen změněné bloky dat.
Velikost bloků přitom závisí na příslušné instalaci a například u databází
Oracle činí v ideálním případě osm kilobajtů což je velikost bloku, kterou také
Oracle sám používá. U BLIB je během zálohování neustále zaručena integrita dat.
Zahájí se proces tvorby softwarového snapshotu a aktivuje se tzv. copy-on-write
driver. Ten registruje všechny změny v databázi, ke kterým dochází během
procesu zálohování. Pokud se vyskytne nějaký změněný datový blok, uloží se
původní data do vyrovnávací paměti a nová data se zapíší přímo do databáze.
Žádný měnící se blok se tedy nemusí zapisovat do paměti cache více než jednou.
Při zálohování dat se kopírují bloky, které se změnily oproti poslednímu
inkrementálnímu zálohování a řídicí programy se postarají o to, že se z
vyrovnávací paměti vyberou správné bloky tak, aby došlo ke skutečnému zachycení
stavu databáze v jednom časovém okamžiku. Metoda vystačí s pouze o něco vyšší
dodatečnou kapacitou disků a umožňuje rychlé zálohování. Časová náročnost
samozřejmě závisí na tom, kolik dat se v průběhu zabezpečování právě mění,
zpravidla však jde pouze o několik málo procent. Databáze zůstává během celého
procesu zálohování on-line. Při metodě BLIB, kterou používá např. společnost
Veritas, se už nemusí celá databáze prohledávat po změněných blocích. Na
základě tabulky se všemi změnami bloků lze identifikovat všechny bloky, které
se mají zazálohovat.
Kontrolní body
Na technice kontrolních bodů (checkpoints) je založen takzvaný roll-back. Pokud
administrátor vytvoří několik časově posunutých kontrolních bodů a uchová je po
delší dobu, může se metodou roll-back opět dostat na určitý kontrolní bod.
Časově náročné načítání dat z pásky, jak je tomu u běžného obnovování, tady
odpadá. Tato technika však nenahrazuje nutnost zálohování dat na pásce.

Bez serveru
Jedním z nejdiskutovanějších témat při zálohování dat je metoda bez použití
serveru nebo hostitelského počítače. Pokud se u zálohování bez LAN přes SAN
musejí provádět veškeré I/O příkazy ještě z technologického serveru, je cílem
zálohování bez serveru to, abychom server těchto úkolů zbavili. Off-host
zálohování za použití kompletních hardwarových a softwarových zrcadlových
obrazů už to umí, avšak jen na úkor kapacity a za použití druhého, často
identicky vybaveného hostitelského systému. Zálohování bez serveru kombinuje
off-host zálohování se snapshotovými technikami a technologií BLIB, a nabízí
tím rychlé zálohování dat i jejich regenaraci, maximální výkon technologického
serveru a vysokou dostupnost dat. Zcela bez serveru to však také nejde, protože
ten sice nemusí provádět obtížné přístupy čtení a zápisu, ale musí spravovat
důležité mapovací tabulky s přiřazováním logických bloků k fyzickým a předávat
je dále na tzv. data mover. Tím je buď jiný off-host systém, nebo komponenta v
síti SAN, například most (bridge) či router. Ten je zodpovědný za transport
zálohovaných dat. Zálohování bez použití serveru v sítích SAN probíhá v
několika krocích. Uživatel uvede aplikaci na několik vteřin do zálohovacího
režimu, aby se obsah aplikačního bufferu mohl zapsat na disky. Pak se vytvoří
"zamrzlý obraz" datového souboru. Použijí se přitom již zmíněné softwarové
snapshoty nebo hardwarové a softwarové prostředky pro mirroring. Přepočet
logických blokových adres na adresy fyzické provádí agent v aplikačním systému.
Důležité je to, že seznam pro mapování zůstává stále konzistentní, dokonce i
při reorganizaci systému souborů nebo při defragmentaci. Jen tak je zaručena
integrita dat potřebná pro úspěšné zálohování. Nakonec pošle program informace
o mapování dat na data mover v SAN. Data mover nyní uleví vlastnímu
hostitelskému počítači za použití příkazu SCSI Extended Copy na základě
zaslaného seznamu samostatně zazálohuje příslušné datové bloky z disku na
páskové jednotky. Žádná ze tří popsaných metod však nenabízí uživateli všechny
výhody současně. Uživatelé se musejí rozhodnout, která varianta je pro ně
nejzajímavější, případně zvolit nějakou kombinaci dostupných metod.

Snapshoty
Metoda snapshotů vytváří v definovaném časovém okamžiku obraz systému souborů a
zaprotokoluje všechny následující změny. Tím je zajištěno, že zrcadlový obraz
obsahuje konzistentní data. Po počáteční synchronizaci se ještě zrcadlově
zapíší změněná data na vzdálený systém. Nevýhodou asynchronního způsobu
zrcadlení je to, že vypadne-li primární systém, ztratí se všechna data, která
byla změněna od poslední aktualizace zrcadla.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.