Zoptimalizujete si infrastrukturu pro ukládání dat (1.)

30. 12. 2009

Sdílet

S rostoucím objemem ukládaných dat stoupají i požadavky na storage. Do hry se tak dostávají deduplikace informací, pokročilé metody zálohování či migrace dat bez zatížení podnikových systémů.

Vzhledem k sílícímu tlaku ze strany státní administrativy a dalším důvodům vycházejícím z vlastního podnikání je stále více nutné uchovávat a archivovat určité typy dokumentů. Bohužel mnoho organizací používá klasické postupy zálohování v domnění, že tato metoda se vyrovná specializovaným postupům, které zajišťují uchování informací klíčových pro daný typ podnikání. Specializovaná archivační a úložná řešení jsou přitom podstatně efektivnější – uživatelům umožňují uchovávat pouze ty dokumenty, soubory a další informace, jež odpovídají zákonům a jiným požadavkům, které je třeba v rámci provozu firmy dodržovat. Není tedy třeba archivovat úplně vše, ale vybírat a uchovat jen to, co je nutné.

Specializované metody nejenže zajišťují soulad firmy se zákonnými požadavky a s vlastními procesy pro podporu podnikání, ale také dokáží výrazně vylepšit poměr cena/výkon systémů tím, že maximálně využívají kombinaci různých typů médií pro archivaci (hierarchická správa úložného prostoru). Pokročilejší techniky zajišťují správu informací napříč celým jejich životním cyklem (Information Lifecycle Management, ILM) a umožňují definovat velmi různorodá pravidla pro správu informací, šitá na míru danému typu podnikání. Podle údajů IDC vzroste prodej úložné kapacity v letech 2008 až 2012 o plných 54 procent (zdroj: IDC, „Worldwide Disk Storage Systems 2008–2012 Forecast“, květen 2008), přičemž objem tradičních strukturovaných dat roste o 32 %, nestrukturovaných o 64 % a – což je zřejmě nejdůležitější – objem replikovaných dat o 44 % (viz zpráva IDC, „Storage Infrastructure Innovations for the Future Data Center“, březen 2008).

Tento nárůst má samozřejmě dopad i na různé aspekty každodenního provozu. Informace, které by měly být archivovány, často zůstávají na provozních serverech, zaplňují paměťové prostory, zpomalují aplikace, prodlužují dobu zálohování, a v důsledku můžou vést ke zhoršení úrovně poskytovaných služeb (SLA).

Jak na zálohování

I proto je třeba, aby firmy začaly rozlišovat mezi pravidelnými zálohami, které jsou používány za účelem udržení kontinuity, a archivací jako takovou. V prvním případě jsou veškerá data kopírována většinou na pásku, takže společnosti pak mohou dokumenty, které byly omylem smazány, anebo se ztratily v důsledku nějaké katastrofy, jednoduše obnovit. V případě archivace jsou na disk nebo pásku (anebo je možná rovněž kombinace obou těchto médií) přesunovány pouze některé dokumenty. Pravidelné zálohy by měly probíhat i nadále, nicméně některé informace uložené na zálohovaných serverech lze trvale nebo dočasně odložit na jiná média, než jsou servery sloužící k běžnému provozu, a tak částečně řešit potíže spojené s prudkým nárůstem datových objemů, o nichž se ve zprávě zmiňuje IDC.

Při zvažování archivace a uchovávání dokumentů je třeba vzít v potaz náklady na technologii. Namísto uchovávání dat na drahém produkčním diskovém poli lze archivovaný obsah přesunout na podstatně levnější úložná média, jako jsou například takzvané nearline diskové systémy (SATA) nebo pásky.

Jak disky, tak i pásky jsou použitelnými alternativami pro archivaci a uchovávání dokumentů, nicméně jako ideální se ukazuje kombinace těchto dvou médií, a to z několika důvodů. Dokumenty uložené na disk jsou totiž podstatně přístupnější než dokumenty uložené na pásce; na druhé straně je však páska mnohem levnější a má rovněž delší životnost než magnetický disk. Ten lze tedy použít pro dokumenty, s nimiž se pracuje častěji, úložná páska naopak pro ty dokumenty, k nimž častý přístup není nutný.

Vhodná deduplikace
Ve většině výše zmíněných případů je třeba uchovávat pouze jednu kopii určitého dokumentu. Pokud firma nepřistupuje k archivování systematicky a namísto toho se spoléhá na obyčejné zálohování, pak dochází k tomu, že jsou uchovávány nadbytečné kopie dokumentu, který může být uložen jen jednou. Právě tento postup přispívá k výše zmíněnému 44procentnímu nárůstu replikovaných dat.

V uplynulých letech se často používal pojem „Single Instance Store“ (SIS ) označující tento přístup k redukci dat. SIS znamená, že je uchována pouze jedna kopie určitého souboru, a to i tehdy, pokud je tento soubor v systému uložen na více místech. Při používání SIS se tak archivuje pouze jedna kopie duplikovaného souboru; všechny ostatní výskyty fungují jako zástupci a odkazují na tuto jedinou kopii, čímž se výrazně redukují požadavky na kapacitu.

Technologie deduplikace dat posouvá koncept redukce dat typu SIS ještě mnohem dál. Pomocí identifikace dat a porovnání algoritmů totiž výrazně snižuje prostorové požadavky jednotlivých objektů, a to tak, že ukládá pouze jedinečné „kusy“ dat, díky čemuž se eliminují nadbytečně uložená data.

Zatímco SIS dokáže zjistit a eliminovat duplikáty na úrovni souboru, deduplikace se zaměřuje na duplikáty i na objektech menších než soubor, přičemž jsou porovnávána všechna již dříve uložená data.

Investujte do služeb
Pokud však organizace chce skutečně vylepšit IT podporu tak, aby odpovídala dynamickým potřebám jejího podnikání, musí mít možnost přesouvat data snadno – a to jak při migraci, tak i při replikaci, zrcadlení či kopírování. Firmy mohou maximalizovat přínosy a naopak snižovat rizika informační exploze tím, že budou rozvíjet a implementovat strategii informační infrastruktury, která je v souladu s jejich obchodními cíli.

Dokončení článku vám přineseme zítra...