Disková pole přinášejí vysoké kapacity i vyspělé možnosti (1.)

28. 7. 2010

Sdílet

Při výběru diskového pole pro ukládání rostoucích objemů dat je třeba zvážit požadavky na výkon, náklady i další aspekty, jako je správa úložišť s dat.

Investování stovek tisíc až milionů korun do ukládání dat není procesem, který bude brán na lehkou váhu. Je to však také příležitost vytvořit v organizaci důkladnou a škálovatelnou strategii ukládání dat, která poskytne úspory i nadále do budoucna.

Podívejme se tedy obecně, jak postupovat při volbě vhodného diskového pole, které uspokojí požadavky vaší společnosti.

Krok 1 – Data
Proveďte audit a udělejte si obrázek o datech do budoucna. Zejména pokud se chystáte učinit významnější investici do rozsáhlejší infrastruktury pro ukládání dat, vyplatí se podle Kevina McIsaaca, analytika Intelligent Business Research Services (IBRS), provést důkladný audit. „Auditem není myšleno to, že jen přijdete a podíváte se, jaký hardware stojí ve vaší serverovně či datovém centru na podlaze,“ říká McIsaac. „Potřebujete samozřejmě vědět, jaký máte hardware a servery, ale musíte jít více do hloubky a u současného hardwaru zjistit, kolik kapacity je serverům přiřazeno. A dále: kolik kapacity přidělené serverům se vlastně reálně využívá?“ Druhá věc je podívat se na samotná data nebo využitou kapacitu na těchto serverech. Následující krok je přitom ten, který už paradoxně téměř nikdo nedělá – zeptat se, jaký druh dat to je. Můžeme o tom mluvit jako o úrovních služeb ukládání.

To v principu znamená podrobněji rozebrat a rozdělit data do různých kategorií na základě úrovně služeb, jakou organizace očekává, že by měla být v daném případě dosažena nebo obdržena.

O jakou úroveň služeb by vám přitom mělo jít? Nejde ani tak o množství I/O operací za sekundu a podobné technické termíny, jež do celého problému vnášejí zbytečné složitosti a vyzná se v nich pouze úzký okruh techniků. Mělo by jít spíše o to, co zajímá obchodní oddělení – hodiny dostupnosti, doba či bod obnovení, a kromě toho musíte pochopit, zda jde o archiv, transakční data, data pouze ke čtení nebo specializované formáty, jako ty pro video streaming.

Projděte si své aplikace a zjistěte, jaké ve firmě skutečně využíváte. Potom je třeba porozumět pož-adavkům na kapacitu každé z nich a předpovědím růstu příslušných dat na další tři až čtyři roky. To může samo o sobě trvat nějakou dobu, ale je to účelně strávený čas, neboť tyto informace vám budou k užitku pro pozdější jednání.

Poté si můžete vytvořit tabulku s obrazem dat a přiřadit jim značky na základě důležitosti: Například platinovou pro data s nejvyšší hodnotou, která musejí být k dispozici 24 hodin 7 dní v týdnu bez ztráty dat a s rychlostí jejich obnovení kupříkladu během čtyř hodin, dále zlatou, stříbrnou (pro oblasti, jako je archiv) a v případě potřeby třeba i bronzovou. Seskupte data do malého počtu tříd – jde přitom o třídy dat, nikoliv třídy disků.

A to je klíčový bod. Třídy jsou založeny na datech, nikoliv na technologii. Nyní můžete sečíst všechny kapacity a předpovědět rychlost růstu. Výsledkem je, že máte obrázek, který říká, že budete potřebovat množství kapacity X TB pro data kategorie Platinum, Y TB pro Gold a Z TB pro Silver, a to i rok od roku. Tyto údaje shrňte do dokumentu jako strategii pro ukládání dat.

Zvláště pokud se jedná o velké objemy dat, můžete tyto údaje využít pro vytvoření konceptu storage rozdělené do vrstev. Pak můžete požadované úložné zdroje rozdělit na několik tříd, které umožní na jedné straně vyhovět požadavkům na výkon úložiště a na druhé straně dosáhnout výhodnějších nákladů. V praxi to může vypadat třeba tak, že tam, kde požadujete skutečně vysoký výkon (například u provozních či transakčních dat), můžete využít výkonné SSD disky, popřípadě SCSI či SAS disky s vyšší rychlostí otáček a nižšími kapacitami, zatímco u méně kritických aplikací nebo zálohování si vystačíte s obyčejnými SATA disky, jež nabídnou vyšší kapacitu, ale nižší výkon. Archivovaná data, k nimž se přistupuje zřídka nebo dokonce vůbec, postačuje uchovávat na páskách. Konkrétně zmíněné SSD disky si získávají stále větší popularitu, ale jejich efektivní nasazení má určité specifické aspekty, jimž se podrobněji věnujeme níže.

Aspekty nasazování SSD
I když disky SSD nabízejí zvýšení výkonu, klíčem k nalezení jejich vhodné role v datovém centru je poměr výkonu vůči jejich ceně.

Technologie SSD je tu již desítky let a stala se populární v noteboocích a stolních počítačích zejména mezi náročnými uživateli volajícími po nejvyšším možném výkonu, jaký lze získat. Zpráva o nich se postupně šířila dál a podniky si tak dnes uvědomují výhody používání SSD v datovém centru pro stěžejní aplikace vyžadující maximální výkon. Firmy mohou obvykle použít méně disků SSD ve srovnání s počtem tradičních rotačních disků, které by musely nasadit, aby dosáhly stejného výkonu.

Přesto však existují v technologiích SSD rozdíly. Rychlost SSD není levná – průměrná cena za gigabajt je přibližně desetkrát vyšší než u tradičních disků. Před použitím disků SSD je tak nutné porozumět skutečným příčinám potřeby výkonu a zvolit pro své aplikace nejvhodnější konfiguraci SSD.

Uvádíme zde čtyři hardwarové a softwarové aspekty týkající se SSD:

1. Potřeba rychlosti – Jsou disky SSD řešením? IDC předpovídá ve studii „Předpověď a analýza celosvětového používání disků SSD v letech 2007–2012: Vstup do nerotační zóny“, že trh SSD mezi roky 2007 a 2012 vzroste o 70 procent, ale že k osvojení této nové úložné infrastruktury nedojde ze dne na den.

SSD poskytují výkon potřebný pro významné zvýšení počtu I/O operací za sekundu (IOPS) u nejnáročnějších aplikací. Uvolní také přetížené tradiční disky v prostředích s do vrstev členěnou strukturou úložišť, takže zároveň dojde také k maximalizaci jejich možností. Úložiště členěné do vrstev přesouvá data mezi vysokovýkonnostními, nízkokapacitními disky a pomalejšími disky s vysokou kapacitou.

Účinnost disků SSD je založena na schopnosti zvýšit počet I/O operací a využití, takže ačkoli náklady za GB mohou být vyšší než u pevných disků, cena za I/O operaci je u flash storage mnohem nižší. Toto snížení je zjevné při pohledu na příklady použití. Někteří dodavatelé SSD uvádějí, že jeden disk SSD dokáže poskytnout výkon odpovídající 30 Fibre Channel diskům. Nicméně integrace SSD do prostředí, které není pro tuto technologii optimalizováno, může velmi připomínat strkání čtvercové kostičky do kruhové dírky.

Chcete-li vyvážit rychlost a náklady, měli byste začít s málem bez nutnosti nakupovat předem velké množství disků SSD. Zajistěte, abyste mohli maximalizovat využití SSD kombinací těchto disků s klíčovými virtualizačními aplikacemi. Prozkoumejte, zda můžete tuto technologii integrovat do zvoleného pole nebo zda potřebujete nainstalovat další zařízení nebo pole, abyste mohli disky SSD používat. Bez adekvátní infrastruktury se mohou stát tyto disky velmi rychle příliš drahými, obtížně spravovatelnými a neefektivními ve srovnání s tradičními rotačními médii. Budete-li zkoušet SSD, ověřte si u vámi vytipovaných dodavatelů, zda a jak lze disky SSD integrovat do jejich původního systému a jak lze maximalizovat funkčnost.

2. Disk vs. cache – dva způsoby konfigurace SSD: Jakmile se rozhodnete implementovat SSD, musíte zvážit konfiguraci. Základní (a nejdiskutovanější) volbou pro maximalizaci účinnosti je, zda tyto disky nasadit jako vyrovnávací paměť cache nebo jako trvalé úložiště.

Konfigurace založené na cache mohou zlepšit výkon serveru nebo řadiče tím, že pracují jako přídavná paměť DRAM. Mnohé kontroléry jsou v zásadě uzavřené systémy a neumožňují přidání karet cache, takže jedinou možností je přidat dedikovanou SSD cache, ale tento přístup bývá nákladný. Řadiče, které akceptují karty cache, to umožňují za cenu obětování cenného slotu PCI Express, který by jinak mohl být použit k maximalizaci počtu portů. Avšak největší nevýhodou implementace disků SSD jako cache je to, že brání uživatelům použít do vrstev rozdělenou strukturu storage, která je podle mnohých názorů z oboru nejefektivnějším způsobem využití disků SSD a dosažení maximálního výkonu.

Narozdíl od konfigurací s cache umožňují perzistentní, diskové implementace začlenit SSD jako další vrstvu k tradičním rotačním diskům. V automatizovaném prostředí vrstvené storage lze disky SSD vyhradit pro aplikace vyžadující nejvyšší výkon, což znamená, že je vyžadován menší počet disků SSD. Méně důležitá data, k nimž je potřeba rychlý přístup, lze ukládat na relativně levnějších discích Fibre Channel nebo SATA s vyššími kapacitami, jež nabídnou pohotovější přístup než archivace na pásky nebo mimo lokalitu. Automatický přesun dat tam a zpět mezi vrstvami SSD a běžných disků založený na politikách, jako je například frekvence přístupu, může významně snížit náklady na ukládání a správu dat.

Rozhodnutí implementovat SSD disky jako cache nebo trvalé úložiště vede zpět k základní otázce: čeho tím chcete dosáhnout? Cache poskytuje významné zvýšení výkonu pro celou infrastrukturu úložišť a nevyžaduje další software ani školení. Cachování však znemožňuje snadné vrstvení. Je-li technologie SSD integrovaná jako nejvyšší vrstva v prostředí trvalého úložiště, můžete nakoupit pouze takový počet disků SSD, jaký je vyžadován k ukládání aktivních bloků pro vaše aplikace. Nemusíte pořizovat SSD pro celé svazky.

3. SLC vs. MLC – rozhoduje technologie použitá v disku: Existují dva základní druhy SSD, a to disky založené na pamětech Flash a na DRAM. Od vzniku disků SSD však technologie flash změnila trh a předstihla DRAM coby volba pro datová centra. Ačkoli DRAM nabízí výkonnostní výhody, flash je výrazně rychlejší než na klasických discích postavená pole a při implementaci cenově dostupnější než DRAM. Proto se stala široce nabízeným formátem, který dnes podporuje většina dodavatelů úložných polí.

Flash používaná v SSD se dále dělí do dvou kategorií: SLC (Single Level Cell) a MLC (Multi Level Cell). SLC flash lze najít převážně v discích podnikové třídy, a jak plyne z názvu, každý bit dat je zde uložen v jedné buňce. Tento formát je spojován s lepší spolehlivostí, delší životností a lepšími cykly zápisu a čtení. Disky MLC, které jsou levnější na výrobu, mají pomalejší přenosové rychlosti, vyšší spotřebu energie a nižší trvanlivost buněk. Typicky se používají v paměťových kartách ve spotřebitelském segmentu. Podstatné přitom je, že v jedné buňce je uloženo více dat, takže dojde-li k jejímu poškození, bude spolu s ní ztraceno také více dat.

Dokončení článku vám přineseme zítra...