Podniky děsí ztráty archivovaných dat

Víme, co řekl Alexander Graham Bell v prvním telefonickém hovoru: "Pane Watsone, pojďte sem, chci s vámi mluvit." Nevím...


Víme, co řekl Alexander Graham Bell v prvním telefonickém hovoru: "Pane
Watsone, pojďte sem, chci s vámi mluvit." Nevíme, co napsal Ray Tomlinson v
prvním síťovém e-
-mailu v roce 1972. On si to přesně nepamatuje a neuložil si to. "Hlavní důvod
této historické ztráty je, že mi to tehdy nepřipadlo důležité," říká Tomlinson,
hlavní inženýr jednotky BBN Technologies společnosti GTE v Cambridge v
Massachusetts.

Zpětně by bylo hezké ten kousek historie někde mít, uvažuje Tomlinson, ale
člověk nemůže ukládat všechno - a ani to pak hledat. "I kdyby existovaly
zálohovací pásky, zřejmě by už nešly přečíst. Tehdy to byly magnetické pásky a
po sedmi, osmi letech se oxidy začínají rozpadat, zejména u pásků z té doby,"
říká.
A v tom je ten háček: digitálním informacím - od historicky zajímavých po
ekonomicky důležité - hrozí zmizení nebo nedostupnost způsobená nosiči, na
které jsou ukládány, jako jsou právě magnetické pásky. K dalším viníkům patří
stále se měnící formáty dat a skutečnost, že software a hardware rychle stárnou.
Velká část údajů ze sčítání lidí z roku 1960 ve Spojených státech je nyní
přístupná jedině prostřednictvím páskového zařízení Univac type II-A, což byl
muzeální kousek už 16 let po sčítání, uvádí zpráva americké Rady o
knihovnických a informačních zdrojích (CLIR). Bylo zapotřebí vyvinout značné
úsilí na záchranu těchto dat a jejich nakopírování na standardní pásky.
Ne nadarmo se mluví o "strojově čitelných" datech. Data ze satelitů Landsat
pocházející z období před rokem 1979 jsou například nedostupná, protože byla
nahrávána na staré počítače Xerox, které už podle časopisu Science nelze uvést
do provozu. A zkuste najít PC, který dokáže přečíst soubor WordPerfect 4.0 na
disketě 5,25 - a neztratit ani poznámky pod čarou, ani formátování.
Historikové, knihovníci a archiváři - tedy ti, kteří mají přirozený sklon
vyhledávat skutečně staré věci - už teď bijí na poplach kvůli ztrátám
kulturních a státních záznamů. Digitální uchovávání se však také stává
předmětem byznysu, neboť některé průmyslové obory přicházejí na to, že z
firemních nebo regulačních důvodů potřebují data uchovávat déle a déle.
Typickým příkladem jsou farmaceutické společnosti. Ty potřebují uchovávat
záznamy o nových medikamentech tak dlouho, dokud je příslušný lék na trhu, a
záznamy o klinických pokusech po dobu života pacienta, říká Jeff Rothenberg,
počítačový vědec, který pracuje pro společnost Rand v kalifornské Santa Monice.
A tak nyní firmy utrácejí miliony na budování datových skladů, které mají
uchovávat záznamy o nákupech klientů a zdravotní péči o pacienty od kolébky až
po hrob. "Máme opravdu obavy, že se může stát, že ode dneška za deset, dvacet
let ta data bude možno vyhledat jen s obtížemi," říká Joe Bruscato, hlavní
architekt datových skladů společnosti Anthem Blue Cross and Blue Shield.
"Společnosti se dost nestarají o to, aby data, která byla zaarchivována před
několika lety, byla zpětně vyhledatelná. Ty obavy mají své opodstatnění," říká
Bruscato. "Stejně jako ve firmách obvykle existuje záchranný plán pro případ
živelné katastrofy, je dnes zapotřebí mít připravený i plán pro záchranu dat."
Analytici tvrdí, že kvalita firemních archivů dat je naprosto různorodá,
počínaje ideálním prostředím optických jukeboxů a pásek uložených v
klimatizovaných prostorách po náhodné a nezdokumentované skladování kotoučů ve
sklepích. Některé firmy nearchivují vůbec a počítají s tím, že zaměstnanci
všechno, co je skutečně důležité, vytisknou.
Krátkodobé uvažování a nedbalé zacházení se záznamy by však pro firmy mohlo
vyústit až v datové katastrofy, pokud by přišly o cenné informace například z
toho důvodu, že se jim rozložily magnetické pásky nebo že už nemají software či
hardware potřebný k jejich nalezení.
Kromě skutečné péče o datové nosiče firmy potřebují tým, který má na starosti
správu dat a udržuje ústřední sklad metadat - něco jako katalog firemních dat a
formátů - a plánuje konverzi na nová média, říká Wendy Anne Ailorová, správkyně
záznamů v jedné velké farmaceutické společnosti. Podstatné je naplánovat
konverze na určitý čas před tím, než konkrétní skladovací médium zastará.
Správci by měli také zaznamenávat verze softwaru a hardwaru potřebné ke čtení
nebo manipulaci s daty a ohlídat si ty typy, které končí.
Ailorová říká, že její firma měla 1,5 milionu obrazových souborů na jukeboxech
Sony, ale firma Sony přede dvěma lety oznámila, že za rok přestane 12palcové
optické disky podporovat. Takže její společnost kopíruje obrázky na 5,25palcové
disky od Hewlett-Packard.
"Může se se ukázat, že je vhodné, aby firma udržovala archiv aplikací," říká
Kris Newtonová, analytička společnosti Strategic Research. A vysvětluje:
"Uživatelé, kteří přešli z mainframů na UNIX nebo Windows NT - třeba kvůli roku
2000 - potřebují kopii starých aplikací, aby mohli číst data. A možná budou
potřebovat emulátor hardwaru, protože si zřejmě nebudou chtít jen pro tento
účel ponechávat starý mainframe."
Klasickým řešením problému stárnutí nosičů je kopírování veškerých dat na
novější média. Migrace ale není dokonalá.
"Když přesouváte materiál ze systému na systém, může dojít k nejrůznějším
chybám - náhodným nebo záměrným," říká Anne Gilliland-Swetlandová, lektorka
informačních studií na Kalifornské univerzitě. Gilliland-Swetlandová je zároveň
ředitelkou nového výzkumného projektu, který se pokouší formulovat vzorovou
politiku, standardy a strategie pro zajištění toho, aby elektronické záznamy
byly zachovány v autentické podobě po delší období.
Vyhlídky do budoucnosti
Klíčem k vytvoření systému archivování je "pohled do budoucnosti", a to s
dlouhodobou perspektivou, říká Kermit Patton, výzkumník SRI Consulting.
"Většina firem se kloní spíše ke krátkodobým perspektivám, takže uvažují jen o
tom, jak dostat data na nejbližší novou generaci nosičů," říká Patton. "Pokud
navrhujete systém a standardy dat a uvažujete přitom v perspektivě několika
generací, jste v lepší pozici."
Nemůžeme spolehlivě zjistit, jak dlouho dnešní nosiče data spolehlivě udrží,
dokud je nenecháme deset, dvacet let zestárnout. A nezjistíme, zda data jsou
zkreslená nebo ztracená, dokud se nepokusíme je přečíst.
Přesně to se stalo, když technici kontrolovali magnetické pásky s údaji z cesty
sondy Viking na Mars z roku 1979: zjistili, že 10 až 20 procent pásků obsahuje
značné chyby, jak uvádí zpráva CLIR. Technici označili magnetické pásky za
"katastrofální" médium, pokud jde o archivování informací.
"Na knihách vidíte, že se rozpadají, ale na magnetický pásek se nemůžete
podívat a vidět chyby, ten si musíte přehrát. Je to velmi pracné," říká Abby
Smithová, odbornice na archivaci dat, která pracuje pro CLIR. "Takže se
nedozvíme, jak velký daný problém je, dokud se poprvé nevrátíme a nepokusíme se
uloženou informaci použít."

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.