Automatizovaný tiering: Jak snížit objem uchovávaných dat (2.)

4. 1. 2011

Sdílet

Inteligentní software dokáže automaticky umístit data do cenově nejefektivnější formy storage. To firmám dovolí ušetřit výdaje za drahé úložiště i optimalizovat přístup k datům.

Dokončení včerejšího článku…

2. Komprese
Jde o pravděpodobně nejznámější technologii pro zmenšování objemu dat. Komprese je procesem hledání a eliminace opakujících se vzorů bajtů. Pracuje dobře s databázemi, e-mailem a soubory, ale u obrázků je méně efektivní. Je obsažena v některých systémech pro ukládání dat, ale můžete také najít samostatné kompresní aplikace či appliance.

Někteří dodavatelé nabízejí nebo budou nabízet oboje – deduplikaci i kompresi. Jiné, jako Ocarina, dekódují již komprimované soubory před jejich optimalizací. Randy Chalfant tvrdí, že data by měla být komprimována na souborové úrovni nebo na úrovni operačního systému  a deduplikována v místě cílového úložiště. Firma Asigra, která dodává cloudovou službu deduplikace a komprese, nejprve provádí kompresi a poté data deduplikuje a ukládá pouze provedené změny.

Výběr, zda, kdy a v jakém pořadí použít kompresi a deduplikaci, záleží na tom, zda komprese usnadní, nebo naopak ztíží deduplikačnímu softwaru hledání více kopií dat, jaká vrstva (primární nebo sekundární) má být takto optimalizována a jak rychle dokáže produkt vracet data v použitelné podobě v případě, že jsou vyžadována.

„Komprese v reálném čase, která nezpozdí přístup k datům ani nesníží výkon požadavkem dekomprese dat před modifikací nebo čtením, je vhodná pro on-line aplikace, jako jsou databáze a bezprostřední zpracování transakcí,“ uvádí Schulz. Výpočetní výkon moderních vícejádrových procesorů také podle něho umožňuje v některých prostředích použít serverově založenou kompresi.

Allen ze společnosti i365 zase tvrdí, že přínos komprese je různý. Dokáže zmenšit objem dat u databází SQL až v poměru 6 : 1 nebo i více, ale u souborových serverů je ukazatel spíše okolo 2 : 1. Podle Fadi Albatala, viceprezidenta marketingu společnosti FalconStor, je komprese nejefektivnější při zálohování u sekundárního či terciárního úložiště, kde dokáže zmenšit velikost ukládaných informací v poměru 2 : 1 až 4 : 1 u vysoce aktivních databází či e-mailových aplikací. „Společnost Iron Mountain, která poskytuje služby správy informací, dosahuje při archivaci aplikací s využitím komprese a deduplikace zmenšení objemu ukládaných dat o 80 procent,“ uvádí T. M. Ravi, ředitel marketingu.

Společnost IBM zaměřila svou pozornost na kompresi primárních úložišť prostřednictvím řešení firmy Storwize, kterou nedávno převzala. Její appliance zapisují komprimované soubory zpět do zařízení NAS, ze kterého pocházejí, nebo do jiné vrstvy úložiště. „Storwize provádí betatestování zařízení pracujícího na úrovni bloků,“ prohlašuje Doug Balog, viceprezident divize úložišť společnosti IBM. Soubory komprimované aplikacemi Microsoft Office nebo populární formáty obrázků, jako je JPEG, nelze většinou běžných kompresních algoritmů nijak zvlášť zmenšit a v některých případech dokonce může dojít k jejich zvětšení. Firma Neuxpower Solutions ale prohlašuje, že její software dokáže komprimovat soubory Office a JPEG až o 95 % bez ztráty kvality obrazu tak, že odstraní zbytečné informace jako metadata a podrobnosti, které nelze vidět bez zvětšení obrazu.

Společnost Ocarina, kterou koupila firma Dell, o svých produktech uvádí, že nabízejí podobné výsledky, protože používají algoritmy vícenásobné optimalizace, vyladěné pro různé typy obsahu, a dokážou otestovat a vybrat si z několika různých kompresních metod za účelem zajistit nejlepší efektivitu.

Deduplikace a komprese se tedy vzájemně doplňují. „Kompresi použijte, pokud záleží hlavně na rychlosti, výkonu a přenosových rychlostech. Pokud existuje vysoký stupeň redundance dat a chcete dosáhnout větších úspor místa, použijte deduplikaci,“ radí Schulz.

3. Tiering založený na zásadách
Tiering založený na zásadách je procesem přesouvání dat na různé druhy úložišť podle jejich kritérií, jako jsou stáří dat, četnost jejich využívání a rychlost, s jakou musí být dostupné. Dokud pravidla přímo nepožadují smazání nepotřebných dat, tato metoda sice nesníží celkový objem ukládaných dat, ale dokáže zmenšit náklady přesunutím určitých dat na méně drahá, i když pomalejší média. Mezi dodavatele z tohoto segmentu trhu patří firma Hewlett-Packard, která nabízí vestavěnou správu zásad a automatickou migraci souborů ve svém produktu StorageWorks X9000, a také firma DataGlobal, která prohlašuje, že její software pro jednotnou správu informací a úložišť umožňuje zákazníkům analyzovat a spravovat nestrukturované soubory i další informace, a tak zredukovat objem ukládaných dat o 60 až 70 % (u e-mailu) a cca o 20 % u souborových serverů.

Další produkty s funkcemi tieringu zahrnují Storage Center 5 od firmy Compellent Technologies, HotZone and SafeCache od společnosti FalconStor, dále Policy Advisor od firmy 3Par, FAST od EMC a také řadu appliancí ARX od firmy F5 Networks pro virtualizaci souborů.

4. Virtualizace úložišť
Podobně jako u virtualizace serverů dochází i u virtualizace úložišť k abstrakci více ukládacích zařízení do jednoho poolu, takže správci mohou přesouvat data mezi vrstvami podle potřeby. Mnoho expertů tuto technologii považuje spíše za nástroj pro rozšíření funkcí než pro samotné snižování objemu dat, ale někteří vidí se zmenšováním objemu dat zřetelnější spojitost.

Systémy správy dat od společnosti Actifio využívají virtualizaci k eliminaci potřeby mít více aplikací pro takové funkce, jako jsou zálohování a obnovení po havárii. Její appliance umožňují zákazníkům vybírat si ze sady šablon smlouvy o úrovni poskytovaných služeb (SLA), pokrývající správu různých množin dat.

Pomocí této metody jsou na jednu kopii dat poté použity odpovídající zásady správy, které například definují, kde je uložena a jak probíhá deduplikace při zálohování a replikaci. Ash Ashutosh, spoluzakladatel a výkonný ředitel firmy, prohlašuje, že Actifio tak dokáže snížit ukládaný objem dat o 75 až 90 procent.

5. Thin provisioning
Thin  provisioning znamená nakonfigurování aplikačního serveru tak, aby rezervoval určité množství místa na disku, ale nevyužíval ho do té doby, než je skutečně potřeba. Stejně jako u ukládání dat založeného na zásadách tato technika nesníží celkový objem dat, ale odloží nutnost nákupu více disků až na dobu, kdy je to nezbytně nutné.

Pokud se potřeba úložného místa rychle zvyšuje, musíte „reagovat opravdu velmi rychle, abyste zajistili, že budete mít dostatek fyzického místa,“ varuje Allen. Čím méně předvídatelné jsou vaše potřeby, tím lepší nástroje pro měření a správu potřebujete – pokud tedy chcete thin provisioning skutečně nasadit. Schulz radí hledat produkty, které sledují potřeby uživatelů dat a aplikací a monitorují nejen využití místa, ale také operace čtení a zápisu, aby se předešlo zpomalení.

Jedním z poskytovatelů na tomto trhu je firma IBM, která rozšířila thin provisioning „do všech našich řadičů pro ukládání dat,“ tvrdí Balog. Společnost HP, která tuto funkcionalitu poskytuje ve svých produktech P4000 SAN, nedávno koupila firmu 3Par, která tvrdí, že její produkty Utility Storage sníží zákaznickou potřebu ukládání dat až o 50 procent. Společnost Nexsan nabízí thin provisioning prostřednictvím svých polí SATABeast.

Před výběrem konkrétní strategie pro redukci dat si vytvořte zásady, které vám pomohou provést těžkou volbu mezi tím, kdy platit za výkon a kdy šetřit peníze omezením objemu ukládaných dat. „Nezaměřujte se ale jen na redukční poměry,“ radí Schulz, ale pamatujte, že byste mohli dosáhnout větších úspor pomocí nižšího redukčního poměru použitého pro větší množství dat.

Nenechte se také zmást terminologií dodavatele. Komprese, deduplikace dat, zálohování „pouze změn“ a využívání jediné instance jsou všechno různé způsoby snižování objemu redundantních dat. V případě pochyb si vyberte nástroje pro snížení objemu dat podle přínosů pro vaše podnikání s využitím podrobné analýzy svých dat.