Riziko ztráty dat zálohovaných na určitém médiu hrozí v nějakém časovém horizontu bez rozdílu každému z nás. Týká se každého, kdo vlastní rozsáhlé archivy skladeb, amatérských fotografů, osob samostatně výdělečně činných... zkrátka všech, kdo uchovávají svá díla, vzpomínky nebo třeba různé dokumenty v elektronické podobě. Ve srovnání s kresbami na papyrus, pergamen nebo voskové válečky je ukládání dat v elektronické podobě velmi náchylné k výskytu chyb a záznam nevydrží zdaleka tak dlouho jako u klasických materiálů. Na rozdíl od starobylých nápisů, které leckde přetrvaly tisíciletí, se můžeme v případě digitálního záznamu bohužel takřka stoprocentně „spolehnout“ na to, že data příliš dlouho nevydrží – a to platí zejména tehdy, když se o data nebudete nijak starat a otázku jejich čitelnosti po pár letech ponecháte náhodě.
Jen vědět jak: Důležitá data můžete chránit před jejich ztrátou či poškozením pouze aktivním přístupem k jejich zálohování. V tomto článku vám prozradíme, kterým datům hrozí riziko ztráty či poškození, řekneme vám, kde přesně toto riziko hrozí, kdy může nastat a jaké jsou příčiny. Samozřejmě se nespokojíme jen s konstatováním stavu a poradíme vám, jak svá data ochráníte nejúčinněji.
Na rozdíl od knihy nebo poznámkového bloku závisí čitelnost elektronicky uložených dat na několika faktorech: prvním je integrita nosiče dat (média), dalším je funkčnost čtecího zařízení (hardware), pak musí být k dispozici softwarový interpreter (aplikace) a konečně systémový software (operační systém).
Výrobci hardwaru a v menší míře i softwarové firmy vzhledem k velmi razantnímu zkrácení životnosti jedné verze programu a velkému tlaku na cenu kladou jen malý důraz na stálost a zpětnou kompatibilitu digitálních dat. Víceméně ponechávají na uživateli, aby včas rozpoznal nebezpečí hrozící jeho datům a v pravý čas je převedl, zkopíroval nebo obecně řečeno přesunul jinam. Z hlediska uživatele se v podstatě se jedná o následující rizika, která je nutné hlídat:
1. Chyby uživatelů a viry: Tyto problémy jsou sice triviální, ale jejich význam není radno podceňovat. K tomu, abyste smazali důležitá data v prakticky libovolném množství, stačí jen stisknutí špatné klávesy v nesprávnou chvíli. Co se týče moderních virů, pak naštěstí na rozdíl od svých starších předchůdců je jen zřídka jejich cílem hromadné ničení dat.
2. Poškození hardwaru, softwaru nebo samotných médií: S nebezpečím poškození pevného disku se sice dá počítat, horší je ale fakt, že k němu může dříve či později dojít naprosto neočekávaně. To samé platí i pro operační systémy. U operačních systémů se zvyšuje riziko jeho poškození a tedy i ztráty dat v důsledku chyb uživatelů nebo nerozvážně provedených nových instalací všemožného softwaru. Pro optická média (CD, DVD) představují riziko nejen škrábance na povrchu, ale také potisky disků či jejich vystavování přímému slunečnímu záření.
3. Omezená výdrž médií: Ukládání dat pomocí strameru na magnetické pásky je obvyklé pouze ve větších firmách. Bohužel asi nenajdete jiné médium, které by bylo pro uchovávání dat na delší dobu vhodnější než právě magnetické pásky (jejich životnost se pohybuje od 10 let výše). Z již zmíněných magnetických pásků mají nejdelší životnost ty od firmy Iomega s označením REV – garantují životnost 30 let. Ostatní média zachovají data po dobu maximálně 10 let.
Diskety teoreticky uchovají data po dobu 5 až 10 let. Chyby na nich se však začínají objevovat už daleko dříve – už po dvou až třech letech. Není vyloučeno, že u některých médií se náhodně nebo díky optimálnímu zacházení dá dosáhnout skutečně solidní životnosti. U starých disket se však křivka vyjadřující poškození dat pohybuje u hranice sta procent.
Vámi vypálená CD/DVD by mohla při optimálním skladování (stálá teplota, vlhkost vzduchu a tma) dosáhnout životnosti až 50 let. V praxi se však této hranici ani zdaleka neblíží. Podle výsledků umělých testů (viz www.uni-muenster.de/Forum-Bestandserhaltung/downloads/iraci.pdf) a empirických hodnot můžeme za nespolehlivá označit optická média již po třech až pěti letech – a to i při optimálním skladování, kdy nejsou média vystavena přímému slunečnímu záření.
Iomega ZIP a JAZ mají podle firmy Iomega životnost 10 let – jedná se o údaj výrobce, kterému se výjimečně dá i věřit.
Vyměnitelné disky USB (a obecně všechny paměti typu Flash) mají tu obrovskou výhodu, že jsou velmi odolné proti nejrůznějším fyzikálním vlivům (nárazy, transport). Hlavním problémem je zde však frekvence, s jakou se k datům přistupuje. Při intenzívním využívání pamětí jejich životnost klesá a v závislosti na tomto faktoru tyto typy médií vydrží od dvou do deseti let.
Pokud se podíváme na křivku vyjadřující statistiku chybovosti u pevných disků, zjistíme, že má tvar písmene U. U nového disku je výskyt chyb skutečně poměrně značný. Ve střední fázi chybovost disku na dobu asi 5 let klesá, poté se opět postupně zvyšuje.
Originální hudební CD a DVD s filmy sice média, jež si vypálíte sami, ve své životnosti značně překonávají, nicméně jsou kvůli vzdušné vlhkosti a ultrafialovému záření po 20 až 30 letech stejně nepoužitelná. Například archiv hudby v Berlíně, který obsahuje 400 000 hudebních nosičů, již zaznamenal první nečitelná hudební CD, jež se tam shromažďují od roku 1983.
4. Zastaralá média: Ani média, která jsou v pořádku, vám nejsou k ničemu, když nemáte odpovídající hardware. To, co po letech potkává staré gramofonové desky a magnetofonové kazety, platí ve zrychlené míře i pro digitální záznamová média. Disketa 5,25 palce je skutečnou historií, data na disketách 3,5 palce pomalu již také nepřečtete, protože na dnešních počítačích už disketová mechanika není takovou samozřejmostí jako ještě před několika lety. To samé můžeme říci i o disketách o kapacitě 100 MB a 250 MB vyráběné firmou Iomega – starší mechaniky ZIP, které se připojovaly k počítači přes paralelní port, jsou dnes značně úzkoprofilovým zbožím. V současnosti se čas krátí i pevným diskům s rozhraním IDE.
5. Zastaralé datové formáty: Proprietární datové formáty jako jsou dBase, Ami Pro nebo Word se dají použít pouze tehdy, pokud jsou k dispozici příslušné programy, jež dokáží s těmito formáty pracovat. Problémy s nimi jsou ještě závažnější, když nastane potřeba pro takový software navíc použít některý z již nepoužívaných operačních systémů – třeba virtuální stroj s operačním systémem MS-DOS. Výrobcům softwaru a operačních systémů (jako například Microsoftu) se v tomto směru nedá mnoho vytknout, protože zastaralejší subsystémy vždy nějakým způsobem integrují do nových produktů a prostřednictvím různých převaděčů se skutečně na solidní úrovni starají o zpětnou kompatibilitu svých aplikací. Nicméně i přesto občas nějaká ta hodina uběhne, než se podaří nějaký zastaralý proprietární formát včetně používaného systému souborů přivést alespoň trochu k životu.
6. Digitální práva: Hudební soubory či filmy, které jsou zakódované pomocí technologie DRM (Digital Rights Management) problém životnosti dat ještě více komplikují. Jde o to, že v první řadě musí daný koncept DRM podporovat jak hardware pro přehrávání, tak i software. K tomu se ještě přidává fakt, že kopírování takto chráněných dat bez zadání informace o licenci je k ničemu, nehledě k tomu, že je potřeba při přehrání kontaktovat server pro ověření licence. Zda bude tento server existovat i za 20 let, to je pochopitelně ve hvězdách.
Všechna důležitá data ochráníte před zničením pouze aktivním přístupem k jejich zálohování.
Pro profesionální archivaci dat na dlouhou dobu je nutno splnit následující požadavky: bezztrátová čitelnost dat (ta se zajistí opakovanou migrací na nové platformy a média), ochrana proti falšování dat (ta se zajistí kontrolou přístupu k datům a vedením protokolů o změnách) a dostupnost daného formátu dokumentu (lze zajistit přes muzea hardwaru či softwaru, emulací, uchováním dat a interpreteru do archivu).
Pro obyčejného uživatele je nutné zajištění bezztrátové čitelnosti dat, ochrana proti falšování je samozřejmě v nějaké rozumné míře rovněž vítána. Data by tedy měla zůstat úplná a v plné kvalitě, případné změny by měly být důsledně sledovány a zaznamenány. Naproti tomu uchovávání původních formátů není většinou pro uživatele nezbytné. Všechny v článku uvedené příčiny možné ztráty dat tedy ve smyslu jejich ochrany vedou ve svém důsledku k následujícím více či méně triviálním pravidlům, která by měl každý uživatel dodržovat:
1. Od všech důležitých souborů potřebujete minimálně jednu kopii, nebo ještě lépe dvě kopie, které umístíte na dvě na sobě nezávislá média. Jedna záloha by dále měla být umístěna na jiném místě než původní soubory, a to buď u příbuzných, kteří žijí v jiném domě nebo bytě, popřípadě u některého z poskytovatelů prostoru na webu (viz bod 13).
2. Pro archivaci vašich souborů dávejte přednost pevným diskům, a to zejména v externím provedení. Je k tomu několik důvodů. Obecně jsou z dlouhodobého hlediska spolehlivější než CD a DVD, cenově vyjdou levněji než streamer a na rozdíl od sekvenčních pásků nabízejí přímý přístup k jednotlivým souborům (do zálohy tedy můžete velmi snadno přidávat nové soubory nebo vyměňovat verze jednotlivých souborů za jiné). V neposlední řadě vám při použití pevných disků odpadne díky jejich velké kapacitě spousta práce s organizací záloh (jejich číslování nebo výměna). Právě dva stejně velké pevné disky, jež navíc mají stejný systém souborů, dramaticky minimalizují práci a riziko výskytu chyb při archivaci. Jinak rovněž platí, že 3,5palcové pevné disky jsou spolehlivější než jejich 2,5palcové varianty.
3. Pokud provádíte archivaci na externí pevný disk, který poté uložíte na bezpečné místo a dále nepoužíváte, pak doporučujeme tento pevný disk minimálně jednou za půl roku připojit k počítači. Pokud se pevné disky dlouho nepoužívají, mohou jim zatvrdnout kapalinová ložiska.
4. Pokud používáte pevné disky v zapojení diskového pole RAID 1 nebo RAID 5, kdy se zapojují dva, popřípadě čtyři pevné disky, pak se sice provádí zrcadlení dat, ale má rovněž své nevýhody. Záloha není uložena na pevném disku, který by byl na jiném místě než samotný počítač, a kromě toho se při zrcadlení zrcadlí i chyby. V tomto případě je potom nutné vytvořit ještě další, v pořadí třetí kopii dat.
5. Jednoznačně si určete, které úložiště (soubor, složka, disk) bude obsahovat původní data, a na toto úložiště umisťujte data ze zálohy pouze tehdy, pokud se toto úložiště poškodí. Bezplánovitá synchronizace dat mezi dvěma nebo více úložišti dříve nebo později způsobí to, že se vám některá data buď ztratí, nebo budete mít na několika úložištích zbytečně mnoho stejných záloh.
6. Informace v elektronické podobě se mohou snadno ztratit, aniž byste si toho vůbec všimli. Vzhledem k tomu, že při obrovském množství dat není v lidských silách provádět důkladnou kontrolu dat, měli byste před každým porovnáním dat použít funkci zobrazení dat, jež by byly při synchronizaci zkopírovány. Touto funkcí disponuje prakticky každý program pro synchronizaci dat a dokonce již i nástroje, které jsou standardní součástí operačního systému (Xcopy a Robocopy – parametr /L), nebo zdarma dostupné nástroje jako například Microsoft Synctoy (funkce Preview).
7. Nastavte pro svá data taková přístupová práva, abyste k nim měli přístup a mohli je měnit pouze vy a nikdo jiný. Tato práva můžete podle své volby nastavit buď pouze u originálních souborů, nebo u souborů zálohovaných, popřípadě u obou typů.
8. Před přechodem na novou verzi aplikace nebo operačního systému si pečlivě zjistěte, zda tímto přechodem neztratíte přístup k souborům zálohy. Pokud po přechodu nebudete moci archivované soubory přečíst nebo nebudete moci spustit některý dříve používaný software, pak je nutné soubory před přechodem převést do nového formátu. Pokud zmíněné opatření neprovedete, budete později odkázáni na firmy, které sice tuto konverzi provedou, ale ani zdaleka to nebude zadarmo.
9. Speciální problém při přechodu z jednoho operačního systému na jiný představují systémy souborů. Pevné disky se systémem souborů HFS+ operačního systému Apple jen tak pod Windows nebo Linuxem nepřipojíte. Souborový systém ext2 z operačního systému Linux zase nepřipojíte ani pod Windows, ani pod MacOS. I v tomto případě se tedy vyplatí včasné zkopírování dat na disk s kompatibilním systémem souborů – bude-li třeba, použijte systém souborů FAT(32), s nímž si rozumí všechny operační systémy.
10. Při přechodu na nový hardware se rovněž můžete dostat do potíží v okamžiku, kdy budete potřebovat přístup k archivovaným souborům. Nebudete-li mít vhodný hardware pro přečtení archivovaných souborů, pak je to stejné, jako kdybyste žádnou zálohu dat neměli. Můžete se třeba dostat do situace, kdy nebudete mít na počítači disketovou mechaniku, a než připojíte k počítači externí pevný disk, uplyne doba životnosti těchto disket. Na počítači Mac nebo na novém počítači PC zase nenajdete paralelní port, takže data uložená na disketách ZIP jsou vám také k ničemu. Na novějších počítačích začíná být problém i s pevnými disky s rozhraním IDE. Ty v tomto případě často připojíte pouze přes externí adaptér a rozhraní USB. I zde vám včasné překopírování dat na hardware kompatibilní s nejnovějšími počítači ušetří spoustu námahy, rozčilování, dodatečných nákladů a v nejhorším případě i ztracená data.
Pro archivaci důležitých dat používejte pokud možno co nejméně odlišné formáty.
11. Pro ukládání důležitých dat používejte co možná nejméně odlišné formáty. Ideální jsou otevřené a standardizované formáty, jako je kupříkladu ODF (Open Document Format), PDF, TIFF nebo OGG. Bezproblémové jsou i velmi rozšířené proprietární formáty jako DOC, XLS nebo MP3. Platí ovšem, že čím více stejných nebo podobných formátů používáte, tím jednodušší bude v případě potřeby později hromadná konverze do jiného formátu v případě, že by některý z formátů zanikl.
12. Vyhněte se datům chráněným technologií DRM. Například u hudebních formátů chráněných DRM lze vždy bez problémů vypálit data na hudební CD a poté převést kupříkladu do otevřeného formátu OGG nebo alespoň do formátu MP3, který žádnou ochranu typu DRM neobsahuje.
13. Uložením zálohy svých dat na on-line úložiště splníte podmínku z bodu 1 (umístění zálohy na jiné místo). Na internetu najdete řadu poskytovatelů, kteří na svých serverech nabízí diskový prostor. Navíc tím péči o svá data svěříte do rukou profesionálů. Na druhou stranu umístěním dat na servery poskytovatelů, kteří poskytují prostor zdarma, jako například Google, se musíte smířit s tím, že záruka na dostupnost dat a jejich ochranu není téměř žádná. Rovněž kapacita, kterou poskytovatelé nabízejí, není nijak závratná, ani rychlost uploadu nepovažujeme právě za dokonalou. Nesmíte zapomenout ani na ochranu proti neoprávněnému přístupu dat (šifrování). V opačném případě vám nezbývá nic jiného, než správcům serveru poskytovatele (poněkud slepě) důvěřovat.