Grid pro ukládání dat

DEFINICE Grid storage představuje nový model práce s datovým úložným prostorem. Podobně jako grid computing sází na...


DEFINICE
Grid storage představuje nový model práce s datovým úložným prostorem. Podobně
jako grid computing sází na centrálně využívané a spravované distribuované
zdroje a na využití nevytížených kapacit.
Běžně mluvíme o elektrické rozvodné síti (electrical power grid) nebo o
telefonní distribuční síti (telephone grid) a je nám zcela jasné, co se tím
míní velká, decentralizovaná síť s množstvím spojů a s koordinovaným řízením.
Pojem grid (tedy distribuční síť) označuje propletenou síť, ve které žádný
centrální přepínač nebo hub nemá dominantní postavení při směrování dat.
Gridy nabízejí téměř neomezené rozšiřování velikosti i výkonu, protože nejsou
omezeny potřebou stále větších centrálních přepínačů. Snižují tak náklady na
komponenty a tvoří spolehlivou a odolnou infrastrukturu.
Aplikování koncepce gridu dovoluje ovládat disponibilní, ale nevyužité zdroje
dynamickým alokováním a dealokováním kapacity, pásma a procesů mezi množství
oddělených počítačů. Počítačový grid může překlenout rozdíly v umístění, v
organizaci i v architektuře jednotlivých strojů a nabídnout připojeným
uživatelům vysoký výkon, možnost spolupráce a přístup k potřebným informacím.

Co je grid storage?
Poté, co na svět přišel grid computing, bylo pouze otázkou času, kdy vznikne
podobný model pro využití distribuovaného ukládání dat. Mnoho datových úložných
sítí je uspořádáno do hvězdy, kde jsou všechny servery a paměťová zařízení
připojeny k jedinému centrálnímu přepínači. Topologie gridu je naopak postavena
na síti vzájemně propojených menších přepínačů, která může narůstat s růstem
pásma a dále poskytovat zvýšenou spolehlivost a vyšší výkon i konektivitu.
Na základě existujících a navrhovaných produktů se jeví, že by systém
distribuovaného ukládání dat měl zahrnovat:
Modulární úložná pole: Tyto systémy propojené sítí mohou mít vlastnosti blokově
orientovaných úložných polí nebo úložných gatewayí a serverů připojených k
síti. Společnou virtualizační vrstvu: Úložiště musí být organizováno jako
jediný logický fond zdrojů, dostupných uživatelům.
Datovou redundanci a stálou dostupnost: Napříč uzly v gridu musejí existovat
kopie dat, aby byl zajištěn dostatečný přístup k informacím a aby neutrpěla
dostupnost v případě selhání některé komponenty.
Společné řízení: Jediná úroveň řízení napříč všemi uzly musí pokrývat oblasti
bezpečnosti dat, mobility a migrace, kapacity na požádání a poskytování služeb.
Zjednodušenou platformu/ /architekturu řízení: Protože je společné řízení tak
důležité, úlohy zahrnuté do správy musejí být organizovány modulárně, tak aby
umožňovaly automatické objevování nových uzlů v gridu a automatizaci řízení
objemu ukládaných dat a souborů.

Tři základní přednosti
Aplikace topologie gridu na paměťovou síť přináší několik výhod. Patří k nim
především:
Spolehlivost: Dobře navržený grid je extrémně odolný. Místo poskytnutí pouze
dvou cest mezi kterýmikoliv dvěma uzly nabízí topologie gridu mnoho cest mezi
všemi paměťovými uzly. Tak se dají dobře udržovat a vyměňovat komponenty v
případě poruchy, a to s minimálním dopadem na dostupnost systému.
Výkon: Stejné faktory, které vedou ke spolehlivosti, mohou zlepšit i výkonnost.
Bez potřeby jednoho centralizovaného přepínače s mnoha porty eliminuje síť
potenciální úzká místa provozu; aplikace technik pro vyvážení zátěže na mnoho
cest sítí umožňuje dosáhnout konzistentní výkonnosti celé sítě.
Rozšiřitelnost: Distribuční síť lze snadno rozšířit levnými přepínači s nízkým
počtem portů, které obslouží další servery. Univerzity a výzkumné ústavy již
nyní používají gridy k tomu, aby z mnoha PC i serverů vystavěly struktury,
které se svými schopnostmi blíží superpočítačům.

Grid storage versus konvenční systémy
Konvenční systémy: Vezměme si jednoduchou síť se 16 paměťovými uzly v prostředí
s vysokou dostupností. Všechny uzly vyžadují přístup k sobě navzájem. Obvyklým
způsobem jejich instalace by bylo použití dvou 16 portových přepínačů (druhý
jako záložní) v konfiguraci do hvězdy. Tak je každý přepínač připojen ke
každému ze 16 uzlů a každý uzel je připojen k oběma přepínačům, takže máme 32
kabelových propojení a dva poměrně drahé přepínače. Mezi kterýmikoliv dvěma
uzly existují dvě možné cesty. Jestliže chceme síť rozšířit, můžeme přidat
další uzly pouze tak, že nahradíme oba přepínače jinými s více porty.
Grid storage: V uspořádání do gridu bychom mohli uzly sestavit do 4 skupin po
čtyřech, spojených jednoduchým přepínačem se čtyřmi porty. Také bychom použili
další čtyři přepínače se čtyřmi porty, které by byly spojeny s jedním uzlem v
každé ze čtyř skupin. Nyní máme 32 kabelových propojení (stejně jako předtím),
osm přepínačů se 4 porty místo dvou se 16 porty a každý uzel je připojen na dva
přepínače. V případě poruchy kteréhokoliv z přepínačů existuje mnoho
alternativních cest ke spojení libovolných dvou uzlů. Uspořádání je odolnější
méně náchylné ke katastrofickému selhání než konvenční konfigurace. Pro
rozšíření sítě stačí přidat více uzlů a více malých přepínačů, aniž by bylo
třeba přebudovat celou strukturu. (Podobného výsledku bychom dosáhli
konfigurací se čtyřmi přepínači s osmi porty.)

HP je průkopníkem
Zdá se, že největším hráčem v aréně grid storage je společnost
Hewlett--Packard, první z hlavních výrobců úložných systémů, který dodává
produkty podporující grid. Architektura StorageWorks Grid od HP ukládá
informace do mnoha jednotlivých takzvaných chytrých buněk standardizovaných,
modulárních a inteligentních zařízení. Chytré buňky HP jsou menší než
monolitické systémy, které obvykle nacházíme v sítích pro ukládání dat. A jsou
založeny na levném, konfekčním hardwaru, přičemž poskytují základní paměťové
jednotky, které mohou zákazníci konfigurovat a měnit podle potřeby, vyvolané
různými úlohami.
Podle technických údajů HP obsahují chytré buňky kromě ukládacích zařízení
(diskové, optické nebo páskové jednotky) CPU a volitelně vyrovnávací paměť.
Buňky jsou navzájem propojeny a tvoří silnou, pružnou, peer-to-peer paměťovou
síť. Všechny chytré buňky v sobě mají instalovanou sadu společného softwaru,
ale každé může být přidělena konkrétní funkce nahráním příslušného provozního
softwaru pro úlohy jako je alokace kapacity, aplikace politik a reporting,
údržba, archivování a obnovování bloků dat nebo souborů, případně antivirové
služby a audit. Správci mohou měnit funkce konkrétních chytrých buněk tak, aby
nabízely různé typy služeb podle změn v provozu. Je rovněž snadné rozšířit grid
prostým přidáním modulů, které jsou automaticky detekovány a přiřazeny do
příslušné domény. Chytré buňky jsou schopnější než jednoúčelová disková pole
nebo páskové knihovny. Protože je datová cesta plně virtualizovaná, může každá
chytrá buňka zvládnout jakoukoliv vstupně/výstupní operaci. Software buněk
udržuje konzistenci mezi buňkami a zajišťuje redundanci a dostupnost dat.
V gridu HP StorageWorks všechny komponenty představují z hlediska správy
jednolitý systém. Ten je již ve svém základu zkonstruován tak, aby se sám řídil
úlohy tradičně spojené s řízením datových úložných zdrojů jsou prováděny bez
zásahu člověka. Jediný okamžik, kdy správce musí něco vědět o jednotlivých
chytrých buňkách, nastane, když je třeba opravit nebo vyměnit vadný hardware. I
tehdy ale provede software systému izolaci chyby a identifikuje poruchu, čímž
nutnou údržbu usnadní.
Letos ohlásila společnost HP 4 produkty systému StorageWorks Grid:
Document Capture, Retention and Retrieval (sejmutí, uchování a obnova
dokumentu) s použitím multifunkčních tiskáren, skenerů a digitálních vysílačů
pro zjednodušení konverze záznamů na papíře do digitální formy.
Sharable File System (sdílený systém souborů) autonomní souborový server, který
distribuuje soubory paralelně po clusterech běžných serverů na bázi Linuxu a do
úložných subsystémů.
Reference Information Storage System (RISS, referenční informační úložný
systém), all-in-one archivní a obnovovací systém pro ukládání, indexování a
rychlé otevírání e-mailů a dokumentů Microsoft Office; k dispozici je v
konfiguraci s 1 TB a se 4 TB. RISS je používán například v Nasdaqu, a to kvůli
směrnicím o archivaci e-mailů. Poskytuje zde rovněž strategickou základnu pro
řízení celkového životního cyklu informací.
StorageWorks XP120000 nové diskové pole podnikové třídy, které poskytuje
dvouvrstvou ukládací architekturu a správu obrazu jediného systému.
"StorageWorks Grid je vizionářskou architekturou umožňující vznik inteligentní,
rozšiřitelné, spolehlivé a agilní paměťové platformy," říká Joseph Zhou,
vedoucí analytik u D. H. Brown Associates. Podle Zhoua však zůstává otázkou,
zda HP nezaměří dále svůj vývoj směrem k jedinému unifikovanému gridu, který
pojme jak servery, tak systémy pro ukládání dat.

Další hráči
Letos v létě ohlásila firma Oracle partnerskou spolupráci s několika dodavateli
úložných systémů (včetně EMC, HP a Hitachi), jejímž cílem je zjednodušení
správy úložných systémů pro zákazníky a podpora nového databázového systému
Oracle Database 10g. Oracle a jeho partneři chtějí zautomatizovat správu
úložných systémů, a tím uvolnit ruce správcům databází a úložných systémů pro
produktivnější práci.
Také společnost Exanet nabízí svůj software ExaStore Grid Storage 2.0 stavějící
na grid computingu. Produkt sdružuje všechny zdroje datového úložného systému,
a to včetně polí RAID, serverů i vyrovnávacích pamětí, do jediného paměťového
systému připojeného k unifikované síti s jedním jmenným prostorem operujícím v
heterogenním prostředí a s použitím různých protokolů pro ukládání. Produkt
Exanetu je určen pro aplikace pracující s digitálními medii například s media
streamingem, digitální animací, lékařskými grafickými daty a pro jiné činnost
vyžadující vysoký výkon, velký objem dat a jejich vysokou dostupnost.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.