Virtualizace ukládání dat: Úložná kapacita ze zásuvky

S nástupem prvních sítí SAN založených na technologii Fibre Channel v letech 1997-1998 začali dodavatelé systémů pro...


S nástupem prvních sítí SAN založených na technologii Fibre Channel v letech
1997-1998 začali dodavatelé systémů pro ukládání dat razit heslo "Storage as
Utility". Nicméně v té době byla existující řešení od naplnění tohoto označení
ještě na míle daleko. Teprve dnes, o šest či sedm let později, jsou skutečně k
dispozici nezbytné metody a technologie.
Zdroje pro ukládání dat a související služby budou pro interní i externí
uživatele či zákazníky výpočetních center brzy automaticky vyvolatelné,
měřitelné a také zúčtovatelné stejně jako třeba voda z kohoutku nebo proud ze
zásuvky. Ačkoliv to zní docela jednoduše, realita je poměrně složitá. Mnohé z
dosud izolovaných funkcí systémů pro správu storage musejí umět automaticky
sahat po jiných a ve vzájemné souhře pracovat jako jeden celek.
Základními pilíři pro nasazení či realizaci takového řešení jsou
interoperabilita mezi různými stavebními prvky, transparentnost na dlouhých
datových sběrnicích mezi aplikací a fyzickými úložnými zařízeními, stejně jako
implementace systémů správy zdrojů pro ukládání dat (Storage Resource
Management, SRM). Velký význam připadá také virtualizaci storage, neboť jenom
díky ní mohou být odběratelům ukládacích kapacit bez přerušení přidělovány nové
storage zdroje na základě stanovených smluv o úrovni služeb (SLA, Service Level
Agreement).
Správu SAN a zdrojů pro ukládání dat v heterogenních prostředích je dnes možné
provádět především díky dohodám o výměně API (Application Programming
Interface) mezi výrobci (API swapping). To je ovšem způsob náročný z hlediska
času, testování i nákladů.

Politika alokace
Vzhledem k neustálému růstu objemu dat musejí mít administrátoři při ruce
účinné pomůcky pro správu úložných kapacit. Právě virtualizace storage
představuje takový nástroj, jehož prostřednictvím mohou zákazníkům a jejich
obchodním aplikacím poskytnout odpovídající kapacitu, výkon i dostupnost.
Zmíněné úlohy však dnes správci stále ještě ve velké míře provádějí manuálně.
Kromě toho je virtualizace pouze jednou ze součástí rozsáhlé problematiky
správy systémů pro ukládání dat. Vedle ní je třeba zvládnout množství dalších
úkolů storage například může být nejprve virtualizována pro server, a jakmile
ji detekuje, bude fyzicky zpřístupněna počítačům. V rozsáhlé a komplexní síti
pro ukládání dat jsou proto nezbytné další funkce a mechanismy, obzvláště pokud
se požadovaný storage prostor nachází v jiné zóně (než servery) a je zabezpečen
mechanismy ochrany přístupu. Správce řešení pro ukládání dat dnes navíc musí
zvládat také řadu dodatečných administrátorských funkcí. V heterogenním světě,
kde s sebou každý systém přináší vlastní možnosti obsluhy a rozsah funkcí je
specifický pro určitého výrobce, je téměř nemožné se zcela vyhnout chybám či
poruchám.
Tady získávají na významu moderní SRM nástroje, které ohledně podpory systémů
pro ukládání dat přesahují kompatibilitu s produkty jediného výrobce a pomáhají
integrovat zařízení různých dodavatelů. Zjednodušují tak díky svým pasivním a
aktivním funkcím správu storage v heterogenním světě. Hlavním aspektem je zde
dohled nad definovanými úrovněmi služeb.
Dohoda mezi provozovatelem IT infrastruktury a jejími interními nebo externími
uživateli určuje také dobu, do níž musí být k dispozici nová kapacita po
ukládání dat. Kvůli obavám, že nebudou schopny včas reagovat na nedostatek
úložných zdrojů, vyhrazují mnohá výpočetní centra pro obchodně kritické
aplikace nadbytek kapacity, díky čemuž jsou na ně vázány značně velké nevyužité
zdroje a kapitál. Jestliže je však serveru na druhou stranu přiděleno málo
prostoru, může se rychle dostat na kritickou hodnotu. Pokud mu pak nebude včas
dodatečně přidána dostatečná kapacita, dojde k výpadku aplikace a v návaznosti
na to k prostojům i s příslušnými finančními následky.
Nezbytné je také efektivní plánování kapacity pomocí SRM nástrojů, které jsou
vedle technických náležitostí schopny vzít v potaz rovněž nákladovou stránku.
Dalším důležitým požadavkem je snížení závislosti na lidských zdrojích
zajišťujících správu storage infrastruktury, neboť jsou zpravidla neustále
nastaveny "nadoraz", přičemž pak podléhají riziku chyb způsobených lidským
faktorem a většinou mohou sotva včas reagovat na těsně nastavené parametry SLA.
Dlouhodobým cílem proto musí být i vytvoření odpovídajících politik či pravidel
řízených procesů, které bude nejen možné automaticky identifikovat, jestliže
bude třeba poskytnout další úložný prostor, ale bude dovoleno také jejich
autonomní provádění na pozadí. Tato metoda je často popisována pomocí pojmů
Storage on Demand nebo Automatic Storage Provisioning.

Sedm důležitých kroků
Koncept automatizace provozu řešení pro ukládání dat se z technického hlediska
zakládá na celé řadě předpokladů a funkcí vzájemně provázaných v rámci aktivní
správy storage zdrojů. Následující přehled je pouze hrubým shrnutím
nejdůležitějších kroků při realizaci či rozšiřování SAN a nemůže si klást nárok
na úplnost.
1. Monitoring kapacit: Základem pro inteligentní hledání řešení je korektní
změření a určení zabraných nebo volných storage kapacit v absolutních i
procentuálních hodnotách. Přitom musejí SRM nástroje analyzovat zdroje podle
různých kvalitativních tříd (vysoký výkon, zabezpečení proti výpadku, ceny a
dalších) v závislosti na potřebách určitých aplikací, uživatelů či oddělení i
na dalších kritériích a neustále hlásit aktuální hodnoty. Navíc budou
vyžadovány detailní informace o ukládání až k úrovni souborového systému a
aplikací, jinak nelze provádět odpovídající end-to-end management.
2. Správa politik a událostí: Je porovnáván stupeň naplnění logických úložných
jednotek, jako souborových systémů či tabulek (table spaces), s definovanými
kritickými hodnotami a při jejich vyrovnání je vyvolána odpovídající reakce.
Odezvy mohou mít různou podobu od jednoduchého uvědomění administrátora až po
okamžitý automatický zásah, který proběhne samostatně bez podnětu zvenčí.
3. Detekce volných kapacit s odpovídajícími atributy: Dalším důležitým krokem
je lokalizace volných kapacit ve storage síti. Ne všechna zařízení pro ukládání
dat jsou však stejná a některá tedy nemusejí splňovat všechny požadavky
specifické aplikace. Proto by měla být rozdělena podle svých vlastností, jako
jsou vysoká dostupnost, výkon, náklady i jiné parametry figurující v SLA, do
různých tříd. Ulehčením práce už v předstihu je vytvoření několika oblastí
(poolů), k nimž může administrátor přidělovat nové storage systémy. Takto
sestavené pooly zajistí vyšší přehlednost a zjednodušují provádění dalších
pracovních kroků.
4. Převod storage do serverové zóny: Pokud se nová storage nachází v zóně
serveru, je možné tento krok vynechat. Jestliže ale leží určitý pool nebo nově
lokalizovaná jednotka pro ukládání dat mimo oblast přístupnou serveru, a tedy v
jiné zóně SAN, musí SRM nástroj zajistit změnu konfigurací v této síti. Přes
API rozhraní specifické pro daného výrobce (nebo v budoucnu pomocí SNIA
rozhraní SMI-S) bude přizpůsobeno rozčlenění zón (zoning) Fabric Switch
přepínačů, jejichž prostřednictvím jsou servery s úložným prostorem fyzicky
propojeny.
5. Povolení přístupu serveru k nové storage: Mnohá disková pole využívají v
rámci SAN zabezpečovací funkce jako LUN Binding či LUN Masking pro ochranu
přístupu. LUN Binding přiděluje přístup na příslušná LUN (Logical Unit Numbers)
napevno prostřednictvím určitých Fibre Channel portů úložného systému. LUN
Masking kromě toho řídí přes přístupové tabulky s hodnotami World Wide Names
(WWN), který server obdrží přístupová práva na daná LUN. Pomocí funkcí LUN
Security, jež SRM nástroje nabízejí opět buďto přes API určitého výrobce nebo v
budoucnu pomocí SMI-S, musejí být WWN adresy host bus adaptérů v serverech
zapsány v přístupových tabulkách (seznamech) úložného systému. Teprve pak získá
server oprávnění k přístupu k novým úložným kapacitám LUN, které mají být
přiděleny nějaké aplikaci.
6. Alokace a změny velikosti existujících svazků na serveru: S novými LUN,
potažmo fyzickými disky v JBOD (Just a Bunch Of Discs) systémech, může aplikace
dokázat stále ještě docela málo. Pomocí metody virtualizace bloků musejí být
integrovány do existujících logických diskových svazků (logical volume), s
nimiž aplikace přímo pracuje. Alokace musí proběhnout bez přerušení tedy
"on-the-fly", za běhu, přičemž nesmí vést k žádným výpadkům a prostojům.
Nezbytné změny rozložení diskových svazků jsou s ohledem na úroveň RAID pole
nebo míru zrcadlení disků rovněž provedeny v on-line režimu. Také tady by měla
hrát rozhodující roli specifikace SNIA.
7. Oznámení dostupnosti vyšší kapacity aplikaci: V posledním kroku je třeba
"sdělit" aplikaci, že od nynějška může pracovat s vyšší úložnou kapacitou. Jako
pomůcka slouží k tomuto účelu souběžná změna velikosti souborového systému
společně s pod ním ležícím logickým svazkem. Protože je souborový systém
standardním rozhraním aplikace pro správu obsazených a volných úložných bloků,
bude prostřednictvím současné změny velikosti svazků i souborového systému
navýšen podíl použitelných volných bloků pro aplikaci.
Efektivní koncept plánování úložné kapacity by měl ovšem sloužit naopak i k
tomu, aby bylo možné rozpoznat zřejmé přidělování nadbytečných storage kapacit
v průběhu delšího časového intervalu a následně reagovat se zpětnou vazbou na
přítomnost nevyužívané storage v úložném poolu.

Utility computing
Nelze pominout skutečnost, že správa storage založená na politikách je na trhu
SRM poměrně velmi mladou disciplínou. Teprve málo podniků dnes tento koncept
využívá v plném rozsahu. Avšak další růst úložných kapacit a tlak na snižování
nákladů dříve či později přinutí IT oddělení zabývat se problematikou řešení
Storage on Demand.
Vývoj ovšem nekončí na technické úrovni, ale pokračuje silnější orientací na
zohlednění ekonomických aspektů správy IT. Ačkoliv propočty nákladů jako takové
nepředstavují technický předpoklad automatického poskytování zdrojů pro
ukládání dat, je přece jen smysluplné zabývat se intenzivněji jejich skutečným
využitím.
Storage a příslušné služby bude možné z poolu zdrojů dynamicky vyvolat, měřit i
transparentně kontrolovat a vyúčtovat, a to stejně jednoduše a samozřejmě jako
vodu z kohoutku nebo elektřinu ze zásuvky. Kritikové proti takovým konceptům
namítají, že IT infrastruktura se stane příliš komplexní a komplikovanou, než
aby ji bylo možné srovnávat se zmíněnými dennodenně využívanými službami.
Jeden z dobrých důkazů uskutečnitelnosti myšlenky utility computingu, i když v
trochu jiné formě, v posledních letech podal internet a jeho využití v
privátním sektoru. Zpočátku velmi komplikovaná metoda přenosu dat se pro
uživatele postupně stala díky standardizaci hračkou. Uživatelé si individuálně
volí poskytovatele, uzavírají s ním smlouvu, v průběhu několika minut jsou sami
schopni zprovoznit přístup k internetu a nakonec platí podle smluvního tarifu
také například jen za skutečně využitou dobu surfování nebo objem stažených dat.

Centrální pool
Analytická firma Forrester Research v jedné ze svých studií upozorňuje, že
většina dotázaných uživatelů by ráda využívala model utility computingu, pokud
zajistí efektivnější interní využití IT kapacit a nebude nutně provázán pouze s
outsourcingovým modelem. Tímto směrem se v současnosti orientují vývojové
trendy výrobců. Protože koncepty utility či on demand computingu nejsou omezeny
pouze na oblast ukládání dat, musejí být zavčasu rozpoznána výkonová úzká hrdla
v souhře mezi obchodně kritickými aplikacemi, servery, síťovými komponentami a
storage. Naskýtá se tedy otázka, zda není nasnadě současně virtualizovat také
servery, sdružit je do serverových poolů, nakonfigurovat je podle požadavků
operačních systémů nebo aplikací a dynamicky tyto zdroje přidělovat obchodním
procesům.

SMI-S jako standard
Pro řešení problémů s interoperabilitou s cílem vyvinout řešení pro správu
heterogenní infrastruktury pro ukládání dat ohlásila Storage Networking
Industry Association (SNIA) 21. srpna 2002 strategickou iniciativu pojmenovanou
Storage Management Initiative (SMI). Na základě již existujících standardů WBEM
(Web Based Enterprise Management) a CIM (Common Information Model) coby
informačním modelu nezávislém na hardwaru a implementaci popisuje SNIA fyzické
a logické storage objekty, jejich vzájemné závislosti i funkce pro správu
těchto objektů, které přesahují řešení jediného výrobce.
Podle modelu sdílených úložných zdrojů SNIA Shared Storage Model budou
příslušná rozhraní pro správu fungovat prostřednictvím agentů, kteří komunikují
pomocí CIM-XML přes HTTP s řídicími stanicemi, a odesílat stavové a
monitorovací informace. Příkazy řídicí aplikace pro aktivní správu storage
objektů jsou pomocí agentů překládány na instrukce specifické pro určitého
výrobce, určené pro jednotlivá úložná zařízení, a prováděny.
V listopadu loňského roku SNAI schválila SMI-S (Storage Management Initiative
Specification) ve verzi 1.0.1 jako oficiální specifikaci architektury.
Standardní rozhraní popisují vedle pasivních služeb, jako je identifikace a
monitoring objektů, také aktivní řídicí funkce, například zoning pro SAN
přepínače, správu LUN (Logical Unit Number) v diskových polích nebo
virtualizaci storage pro vytváření logických svazků a správu úložných poolů.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.