Neprůstřelná datová úložiště

Dvoumotorovým letadlem se dá létat i na jeden motor, ale kolik cestujících by si přálo s ním letět? To je filozofie ...


Dvoumotorovým letadlem se dá létat i na jeden motor, ale kolik cestujících by
si přálo s ním letět?
To je filozofie tzv. neprůstřelných datových úložišť (bulletproof storage)
konceptu, který společnost IBM rozvíjí už dva roky a plánuje ho během
následujících tří let postupně představit. "Chceme, aby se o systémy datových
úložišť uživatel nemusel starat," říká Jai Menon, vedoucí technologií úložných
systémů společnosti IBM. Technologická iniciativa IBM počítá s tolerancí vůči
poruchám v libovolném místě úložného systému: na disku, řadiči, na síťových
kartách, na zdrojích energie i v softwaru. IBM je přesvědčeno, že s pomocí
robustnějších úložných systémů pracujících s redundantními prvky, které dokáží
pozdržet náhradu poškozených částí až po dobu tří let, bude moci eliminovat
také řadu chyb lidského faktoru. K nim dochází především při náhradě
poškozených komponent.

Otázka času
Podle Stanleye Zaffose, analytika společnosti Gartner, čeká myšlenku
bulletproof storage ještě asi 5 až 10 let, než bude obecně přijata uživateli.
Ale jakmile k tomu dojde, budou úložiště potřebovat méně údržby, a tedy i nižší
náklady na ni. "Umíme vytvořit velmi spolehlivé programy. Denně používáme
přístroje, které mají napevno zabudovaný software: automobily, kalkulačky,
řadiče disku v PC, telefon," vysvětluje Zaffos.
Společnost IBM se ovšem chystá na daleko složitější systémy, než jsou telefony
a kalkulačky.
V rámci iniciativy bulletproof se IBM zabývá poruchami diskových sektorů,
kterých s rostoucí kapacitou pevných disků přibývá. Zatímco velikost disků se
každých 12-18 měsíců zdvojnásobuje, s neopravitelnými chybami čtení/zápisu se
to nezlepšuje a ani se nesnižuje pravděpodobnost, že se taková chyba na disku
objeví. Současné disky disponují velkým počtem sektorů, a proto je u nich i
vyšší možnost výskytu neopravitelné chyby.
Podle Menona spočívá řešení ve vytvoření softwaru pro správu úložiště se
samoopravnými schopnostmi a v robustnější konfiguraci polí RAID.
IBM slibuje, že během roku předvede úložné systémy, které si díky paritním
diskům v konfiguracích RAID poradí až se třemi současnými poruchami řadiče
disku v jediném poli. Dále hodlá nabídnout mnohonásobně pružnější konfiguraci
RAID se dvěma paritními disky. Dnešní standardní systémy připouštějí pouze dvě
poruchy disku. Zaffos tvrdí, že 80 % prostojů vlivem výpadků je dnes způsobeno
chybami uživatelů a poruchami softwaru, nikoliv hardwaru. Je přesvědčen, že
poruchy softwaru vznikají kvůli složitosti a že v komplikovaném systému se může
vyskytnout prakticky nekonečně mnoho poruch.
IBM se věnuje těmto poruchám programů v softwarovém projektu nazvaném N-Version
Programming, kde data ukládají dva programy téže aplikace a poté je
porovnávají, aby se zjistilo, zda nedošlo k chybě. Při aplikaci N-Version
Programming jsou chráněny dvě kopie dat různými prostředky. Jedna by mohla být
zabezpečena standardním programováním RAID-5, které naprogramuje programátor A.
Druhá kopie je chráněna jiným algoritmem, který naprogramuje programátor B.
Takže pokud dojde k poškození první kopie vlivem určité chyby v programu, který
napsal programátor A, je možné druhou kopii dál používat.
"Ve druhé kopii mohou být také nějaké chyby, ale ty se budou projevovat jinak a
v jinou chvíli, a pokud se objeví, bude nasazena první kopie," vysvětluje
Menon. "Je to, jako byste měli dalšího člověka, který kontroluje práci prvního
a bude ji jistit, kdykoliv se najdou chyby."
Jedním ze způsobů, jak chce IBM odhalovat a opravovat porušená data, je
vytvoření robustnějšího softwaru pro úložiště s opravitelnými datovými
strukturami. Takový program zkontroluje, zda jsou splněny podmínky definované v
pravidlech. Například v systému s mnoha soubory se musí objem, který soubory v
souhrnu zabírají, plus volný prostor v systému rovnat celkovému objemu, jenž je
k dispozici. Program to musí automaticky a opakovaně zkontrolovat, a pokud toto
pravidlo není splněno, musí použít postup k opravě a vyřešení problémů.
V tomto případě software nekontroluje program, aby zjistil, zda správně
funguje, a nekontroluje ani datový obsah. Pokud není některé pravidlo splněno,
software ví, jak datové struktury opravit.
"Ale netěšte se, že výsledky přístupu N-Version Pragramming nebo
kontrolovatelných datových struktur uvidíte už v příštích dvou či třech
letech," varuje Menon.
"Jednou se budete muset smířit s tím, že tyto systémy jsou vytvářeny tak, že se
v nich prostě mohou vyskytovat chyby," říká Menon. "Budete muset být schopni
tyto chyby izolovat do malé oblasti systému. A budete je muset umět velmi
rychle opravit."


ČEMU IBM ŘÍKÁ BULLETPROOF
aÚložná pole, která si dokáží poradit až se třemi současnými poruchami disků.
Podpora při několika současných poruchách řadiče.
Software, který dokáže rozeznat chyby v programu a opravit je.
Vytváření systémů, které umějí odložit náhradu poškozených částí až o tři roky.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.