Čas pro chytřejší ukládání vašich dat

Základní elementy jakéhokoli IT centra využívajícího ukládání dat jsou tři sítě, servery a storage. Zatímco prvn...


Základní elementy jakéhokoli IT centra využívajícího ukládání dat jsou tři
sítě, servery a storage. Zatímco prvních dvou si jejich správci cení,
důležitost role vlastní ukládací kapacity je velmi často přehlížena. Pak se
stává, že jsou na její vzniklé problémy vynakládány zbytečné prostředky.
Přestože dnes většinou nejsou kapacity ukládacích zařízení plně a efektivně
využívány, přichází čas, kdy prudce poroste poptávka po ukládacím prostoru. Tu
totiž způsobí čtyři základní "makrotrendy". Prvním z nich je tzv. killer
aplikace internetu e-mail. Ať už se jedná o zahlcení spamem či prostým a
prudkým vzrůstem využívání e-mailu v součinnosti s jeho zvětšujícími se
přílohami, roste velikost ukládaných dat. Kdysi lidé byli svědomití a své
e-maily si organizovali a promazávali. S jejich rostoucím počtem se ale tato
činnost stala čím dál těžší a e-maily se hromadí závratným tempem v celém
podniku.
Druhým trendem je exploze multimediálního obsahu na internetu. Zatím se jedná
jen o začátek, ale nebude dlouho trvat a prezentace v PowerPointu budou běžně
obsahovat různá videa, 3D grafiku či zvukový doprovod. Třetím důvodem, proč
vznikne poptávka po dalším ukládacím prostoru, je kontinuita podnikání. Díky
potřebě mít přístup k datům i v případě jakýchkoli nehod se mnoho podniků
přiklání k distribuované architektuře a v mnoha případech to také znamená
on-line kopie důležitých obchodních dat na síti. Takový stav vede k tomu, že se
organizace spíše přiklánějí k nasazení celé ukládací a cachovací architektury,
než aby se spoléhaly na pouhé připojení ukládacího zařízení k serveru.
A čtvrtý trend je velmi výrazný potřeba přistupovat k datům v reálném čase
způsobí další rozšíření distribuovaných storage architektur, a tím rovněž
nárůst ukládacích kapacit i uložených dat.
Všechny trendy jsou hezké, ale současně znamenají, že postupem času začne být
vážný nedostatek storage specialistů. Většina ukládacích kapacit prodaných v
minulých letech byla totiž nasazena jako přímo spojená se servery. Jinými
slovy, mnoho podniků zatím neobjevilo výhody a síťové schopnosti SAN (Storage
Area Network).

Miliony terabajtů za pár let
Tak jako mnoho lidí nerado příliš dlouho přemýšlí o smrti nebo o daních, stejně
jsou je na tom ukládání dat. Nejedná se příliš o přitažlivé téma: "Vždyť stačí
koupit další disk, a není co řešit." Přesto byste o něm měli přemýšlet. Podle
analytiků se ve firmách utratí 50 až 70 procent výdajů v IT za řešení
problematiky ukládání dat. Hlubší uvažování o této oblasti přichází s těsnými
rozpočty na IT a současně vyššími požadavky na ukládání více a více dat o
zákaznících, produktech apod. Je jasné, že současné firmy, které potřebují pro
získání konkurenční výhody více informací, potřebují i větší prostory pro
jejich ukládání.
Adam Couture z GartnerGroup udává, že celosvětová kapacita výrazně vzroste z
hodnoty 283 TB v roce 2000 na více než 5 milionů TB v roce 2005. To znamená, že
v následujících letech budete i ve vaší firmě silně investovat čím dál více do
oblasti ukládání dat. Možná si budete pokládat některé z následujících otázek.
Vzniká nová profese
Neutrácím za storage příliš? Podívejme se na zajímavý paradox. Velcí hráči na
poli storage hardwaru jako jsou EMC, Hitachi a IBM, vedli posledních pár let
poměrně krutou cenovou válku, jejímž výsledkem byl pád cen o 35 až 40 procent.
Co je šokující? Náklady na ukládání dat ve firmě přesto kontinuálně rostly.
Takový vývoj vysvětluje Bill Gearhart, šéf IT firmy Rinker Materials, výrobce
stavebních materiálů: "O peníze na další diskovou kapacitu žádám poměrně často.
Důvodem je stále se zvyšující potřeba další kapacity. V podstatě se každých 6
až 12 měsíců zdvojnásobuje. To způsobuje, že i poptávka stále předhání pokles
cen."
Navíc hardware není pouze jednou položkou nákladů. Software a služby, jako je
například outsourcing, zvyšují na výdajích za storage svůj podíl. Celá oblast
vytvořila i nové pracovní pozice. Můžeme je nazývat například storage network
manažeři, přičemž plat takového člověka ve Spojených státech obvykle přesahuje
100 tisíc dolarů ročně.

Data jako důkaz
Další vaší otázkou může být: Nebyli jsme zvyklí využívat příliš ukládacího
prostoru proč bychom měli nyní? O základních trendech jsme se zmínili již na
začátku tématu. Kromě nich jsou velkým generátorem dat i CRM (systém pro vztahy
se zákazníky) nebo ERP (podnikový informační systém) systémy. Data nemohou být
jen tak archivována a uskladněna. S mnoha z nich se stále pracuje a hodně z
nich je využíváno do různých dalších datových skladů či data martů, ze kterých
jsou generovány další informace v podobě reportů, jež jsou opět ukládány atd.
Bill Gearhart udává, že jejich ERP systém momentálně pracuje asi s 1,4 TB dat,
přičemž je jedním z hlavních důvodů potřeby nákupu dalších ukládacích kapacit.
Dalším důvodem pro uchovávání dat jsou i zákony. Nelze jen tak něco smazat, byť
se nejedná o účetnictví. Data je nutné skladovat a archivovat mnoho let zpětně.
Argumentem pro uchovávání mohou být i případné soudní spory, které jako pomocný
důkazní materiál využijí staré dokumenty či e-maily.

Zoufalství při hledání místa
Možná vám bude dělat starosti rozpočet na IT, který budete muset udržet na
stejné úrovni. Jak tedy můžete utratit méně? Lepší organizací svých ukládacích
kapacit (viz také rozhovor v tématu). Podle Nicka Allena, viceprezidenta
GartnerGroup pro storage, bylo dosud levnější místo uvažování nad organizací
dat a čímkoli dalším jednoduše koupit další disk a zapojit jej. Avšak ve
chvílích setrvale vysokého růstu požadavků dojde ke zlomu a IT oddělení firmy
najednou nebude schopno podpořit vlastní podnikání.
Jak se vyvarovat takového selhání? V první řadě je nutné se trochu techničtěji
podívat na to, proč existuje v ukládacích médiích firmy takový nepořádek.
Historicky byla ukládací zařízení vždy individuálně připojena k serverům, které
zpracovávaly vlastní informace. Tato ukládací zařízení nebyla nijak úzce
propojena s dalšími zařízeními u jiných serverů. Ovšem vzhledem k tomu, že
některé servery byly vytíženější než jiné, bylo obvyklé, že zatímco některé
disky byly zaplněny jen ze 30 procent, jiné byly neustále přeplňovány. Nebyla
zde možnost jakýmkoli způsobem sdílet ukládací kapacitu mezi servery navzájem.
Nehledě na to, že například jeden pracoval s OS Windows a jiný třeba s Linuxem.
Své zoufalství vysvětluje Bill Manning, ředitel pro technické služby penzijního
fondu Plumbers and Pipefitters: "Měli jsme pět různých ukládacích zařízení se
servery. Dvě z nich byla neustále přeplněná, zatímco další tři zela téměř
prázdnotou. Bohužel nebylo možné žádným způsobem použít volnou kapacitu pro
uspokojení prvních dvou. Asi si dokážete představit pocity, kdy musíte kupovat
další ukládací prostor, i když víte, že jinde ho máte dost."

Spojené státy datové
Právě kvůli takovým zkušenostem začaly firmy experimentovat se vzájemný
propojováním ukládacích kapacit a využíváním jejich nezaplněného prostoru.
Konceptu se volně říká storage networking a zahrnuje množství různých metod.
Nejčastěji zmiňované jsou SAN (Storage Area Network), NAS (Network Attached
Storage) a IP storage. Princip je však stejný propojit a sdílet.
Jak mohu efektivněji řídit ukládací kapacity? To je úkol pro tzv. SRM (Storage
Resource Management) a nástroje pro virtualizaci ukládání. Ideou SRM je, mít
všechna zařízení, na která se dá v organizaci ukládat, pod kontrolou z jedné
konzole. Takový software potom například hlídá, kdy bude CRM systém potřebovat
více kapacity, realokuje nepoužívaný prostor apod.
Předpokladem ovšem je, že jednotlivé části ukládacích zařízení musejí mít
určitou inteligenci a být schopné zasílat informace o svém stavu a naopak zase
přijímat řídící informace a reagovat na ně. Pak lze využít virtualizaci, kdy i
přes různé operační systémy a další platformy vidíte zařízení jednolitě. Dobrý
software musí umět komunikovat i s různými protokoly a množstvím hardwaru od
rozličných výrobců. Například když budete mít systém jak od EMC, tak od
původního Compaqu, měli byste oba vidět jako jeden celek.

Slovník pojmů
Network Attached Storage (NAS) obvykle znamená připojení ukládacích zařízení do
existující firemní sítě a vytvoření určité základní komunikace mezi nimi.
Problémem ovšem je, že tato komunikace plus datové toky silně zatěžují síť a
zpomalují další práci jiných uživatelských aplikací, jako je například e-mail
či web.
IP Storage je aplikace transportního mechanismu, jejíž snahou je vyřešit
problém posílání ukládaných dat přes běžnou síť pomocí bloků dat místo běžně
používaného souborového přístupu. I když organizace mohou díky tomu ušetřit
nějaké peníze, přece jenom má tato technologie neblahý vliv na výkon firemní
sítě.
Storage Area Network (SAN) se snaží vyřešit problém se zasíláním dat po běžné
síti vytvořením separátní sítě pouze pro ukládací zařízení, servery, zálohovací
systémy apod. Díky tomu může zvládnout poměrně velké zatížení datovým tokem.
Bohužel SAN jsou zatím velmi drahé a poměrně komplikované na vytvoření.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.