Správa sítí SAN

IT správci využívají pro správu změn moderní nástroje, aby byli vůbec schopni orientovat se v labyrintu redundantníc...


IT správci využívají pro správu změn moderní nástroje, aby byli vůbec schopni
orientovat se v labyrintu redundantních cest, které v rámci SAN existují v
mnoha oblastech počínaje servery a konče vlastními úložišti. Tyto nové nástroje
umožňují administrátorům sledovat stopu zmiňovaných závislostí, ať se týkají
čehokoliv od serverů a adaptérů HBA (Host Bus Adapters) až po přepínače Fibre
Channel, porty nebo úložné systémy. Takto lze dokonce spravovat i úrovně čísel
logických jednotek (LUN) a virtuálních svazků, které vycházejí z individuálních
fyzických diskových jednotek.
Pokročilé funkce
Mnoho nástrojů pro správu změn v případě homogenních SAN i SAN vytvořených ze
systémů více dodavatelů nabízí podrobné informace o vyhledávání zařízení a o
topologickém mapování. Některé produkty také poskytují prostředky pro
monitorování v reálném čase, rady při odstraňování závad a funkcionalitu
spočívající v upozornění na právě proběhlou změnu (to však vyžaduje přímé
propojení s databází historie změn v SAN, kterou si uvedené nástroje samy
udržují).
"Některé systémy se také pro údržbu a aktualizace změn snaží využívat nejlepší
metody pro ITIL (IT Infrastructure Library)," říká John Webster, analytik
společnosti Data Mobility Group. Mezi výrobce úložišť se silným zaměřením na
ITIL podle něj patří firmy IBM a Hitachi Data Systems.
Jiné nástroje jdou ještě o krok dále a poskytují funkcionalitu označovanou jako
prediktivní řízení změn. S těmito nástroji mohou správci úložišť provádět
důmyslnou analýzu typu "co se stane, když..." a modelování, ze kterého zjistí
dopady potencionálních změn SAN před tím, než je provedou v produkčním
prostředí.
Babu Kudaravalli z firmy National Medical Health Card Systems (NMHC) tvrdí, že
jejich úložná síť se od doby, kdy před čtyřmi lety nastoupil do společnosti,
zvětšila pětinásobně. Nyní uchovává okolo 65 až 70 TB dat a skládá se z
diskového pole HP StorageWorks XP1024 (a XP128 na vzdálené straně), několika
systémů HP StorageWorks EVA2000 a téměř 400 portů Fibre Channel dostupných na
přepínačích Cisco MDS. Hlavní datové centrum je navíc replikováno kvůli
případnému zotavení po havárii v sousedním městě.
Firma NMHC získala pole StorageWorks v rámci modelu "zaplať za využití" (pay-
per-use). Díky zmíněnému režimu Kudaravalli velmi pečlivě nastudoval systém na
sledování využití úložné kapacity. Chtěl totiž vědět, kolik místa v úložišti
každý aplikační server využívá a kolik volného místa je v celém SAN aktuálně
dostupného.
"Dříve to znamenalo programovat a spouštět vlastní skripty," říká Kudaravalli.
Nyní s použitím produktu HP Storage Elements (dříve od AppIQ) může tyto
informace získat jediným stiskem tlačítka myši. Navíc opustit mohl i nudné
udržování diagramu Visio, jenž znázorňuje vztahy mezi jednotlivými SAN
komponentami. Namísto toho, jak říká Kudaravalli, program Storage Essentials
vytváří a aktualizuje síťovou mapu na obrazovce, která ukazuje, jak je prvek
StorageWorks EVA připojen k přepínači a k příslušným serverům.
"Sledování tohoto komplexního prostředí SAN a trendů v jeho využívání pro
příslušné aplikace je tak oproti práci se serverem s přímo připojeným úložištěm
velmi rozdílné," říká Kudaravalli. "Mnoho lidí úložiště stále vidí jako
diskovou jednotku připojenou k serveru. To ale není pravda, když hovoříte o
tisících serverů a terabajtech úložného prostoru, které musejí být náležitě
propojené a nakonfigurované tak, aby byl zajištěn požadovaný výkon," dodává.
"Společnost ale musí být opatrná v těch případech, kdy stanovuje, které porty
přiřadit ke kterému aplikačnímu serveru," říká Kudaravalli. "Také nemůžete
připojit všechny elektrické spotřebiče na jeden zásuvkový obvod, jinak vám
vypne jistič," říká s nadsázkou. "To samé platí i pro správné řízení a
redistribuci zátěže aplikací mezi různé porty Fibre Channel v síti SAN. Storage
Essentials nám pomáhá identifikovat, které porty má smysl používat, a to v
závislosti na jejich zatížení."
Dilema správy SAN
"Není pochyb o tom, že se SAN rychle stává komplikovanou," souhlasí Webster z
firmy Data Mobility. "Jakmile společnosti začnou konfigurovat svoji SAN, téměř
okamžitě zjistí, že k tomu musejí přidávat i nastavení dalších komponent na
úrovni HBA, přepínače či portu. Jak společnosti míří k mohutnějšímu SAN, chtějí
vědět: "Nevytváříme si potenciální problémy s výkonem?" nebo "Nevystavujeme se
riziku výpadku, když systém SAN rozšíříme?"
Dokonce i nejmenší chyba při zajišťování nového úložného prostoru v prostředí
SAN, v přidělování portů nebo při spouštění serverů může mít významný dominový
efekt, který může ve svém důsledku vést ke zpomalení aplikací, nebo dokonce k
výpadkům.
Firma MessageOne, dodavatel služeb pro business continuity, v nedávném průzkumu
týkajícím se vlastních zákazníků (jde o stovky firem, které dohromady mají více
než milion e-mailových uživatelů), zjistila, že 16 % všech výpadků e-mailových
služeb bylo způsobeno chybami v SAN. Společnost rovněž uvedla, že výpadky
související se SAN vyřadí e-mail z provozu v průměru na dobu 25,5 hodiny.
"Osmdesát procent problémů se SAN je výsledkem někým provedené změny systému,"
říká Bryan Semple, viceprezident firmy Onaro, která je poskytovatelem softwaru
SANscreen pro správu úložných služeb. Jake Roersma, správce síťových služeb ve
zdravotní pojišťovně Priority Health, dohlíží na 125TB síť SAN s třívrstvou
architekturou. SAN se skládá z výkonného pole HP XP12000 na vrstvě 1, systému
HP EVA5000 na vrstvě 2 a produktu HP MSA1500 na vrstvě 3, který bývá většinou
vyhrazen pro zálohování a archivaci. SAN společnosti Priority Health má na
přepínačích Cisco MDS 9509 a 9216i přibližně 512 portů.
Stejně jako Kudaravalli i Roersma zažil to, že se jeho síť SAN za poslední rok
a půl zdvojnásobila. Tento nárůst vyvolal nutnost přijmout druhého
administrátora SAN, což ale správu systému dále zkomplikovalo. "Jakmile SAN
spravuje více než jeden administrátor, můžete zjistit, že zatímco jeden
administrátor mění jednu část, druhý nějakou jinou. Za určitých okolností se
mohou dostat tyto změny do rozporu. Pokud byste to měli vše sledovat manuálně,
zabralo by vám celé hodiny vypátrat, co mohlo být vlastně změněno," upozorňuje.
V případě nutnosti, jak pokračuje Roersma, by správci Windows a unixových
systémů dotazovali jeho tým s tím, zda problémy s výkonem, které
zaregistrovali, nesouvisejí se změnami v SAN. Ve skutečnosti byly častou
příčinou omezené výkonnosti změny týkající se LUN-maskingu nebo portů či velké
zásahy do zón právě tyto parametry nejvíce ovlivňují, ke kterému LUN se
příslušný hostitelský systém připojí. Objevily se rovněž problémy s Windows
clustery kombinovanými s linuxovými nebo unixovými servery.
Manuální sledování a případné odstraňování problémů všech prvků v konfiguraci
SAN a jejich následné změny nebyly zrovna proveditelné. To je důvod, proč se
Roersma začal zajímat o nástroj SANScreen od firmy Onaro. "Jednou ze silných
stránek softwaru Onaro je podpora dvojcestného řešení. Téměř všechny naše
servery jsou připojeny duálně software SANscreen nám je schopen ukázat všechny
cesty k úložné jednotce tak, abychom viděli, zda existuje záložní cesta," říká
Roersma.
V současnosti Roersma a jeho tým často využívá ověřovací nástroj SANscreenu k
modelování změn v SAN, jako je například přidělení úložiště nebo úprava zón, a
k označení jakýchkoliv případných problémů. "Je evidentní, že nám to pomohlo v
našemu růstu. Popravdě řečeno, mnoho našich procesů je nyní navrženo tak, jak
nám programy firmy Onaro naznačily. Chtěli jsme nástroj, který monitoruje
změny. Ale ověřovací nástroj je nyní skutečně zabudován do našeho procesu změn.
Implementujeme jej ještě před přidělováním úložišť nebo před změnami zón," říká
Roersma.
SANscreen se také hodí pro plnění legislativních směrnic, jak dodává Roersma.
"Auditoři řeknou ,V nástroji pro kontrolu změn vidíme, že byl vznesen požadavek
na změnu velikosti úložiště na tomto serveru o kapacitu X. Můžete nám ukázat,
že jste tu změnu provedli a jakým způsobem?" popisuje Roersma. "Moji lidé pak
spustí produkt Onaro a auditorům jednoduše nabídnou snímky z obrazovky
ukazující, že k úložné jednotce bylo přidáno osm LUN o kapacitě X, že bylo
povoleno serveru tyto kapacity využívat a že byly přidány do takové a takové
zóny."
Správný nástroj
"Ať už jsou nástroje SAN pro správu změn jakékoliv, nakonec slouží jako
auditovací nástroj, který pomáhá lidem rozpoznat, co vlastně mají, jak rychle
se věci mění a jak rychle SAN roste," říká Shawn Wagner, specialista na
úložiště ve firmě CDW. Stephen Foskett, ředitel strategických služeb ve firmě
GlassHouse Technologies, souhlasí. "SAN produkty pro správu změn jsou jen o
krok dále za pouhým záznamem akcí ve vztahu k navazujícím stavům a k jejich
efektu napříč úložnou infrastrukturou," říká.
"Mnoho IT systémů má podporu takzvaného syslogu neboli záznamu systémových
událostí. Řada úložných systémů se přitom chová stejně," říká Foskett. "To, co
SAN produkty pro správu změn nabízejí, je ale více než jen pouhé logování změn.
Například pokud někdo provede změnu zón na přepínači nebo změnu LUN-maskingu,
systém nejen zaznamená, že někdo provedl změnu, ale zároveň i to, jaký celkový
efekt v SAN nakonec měla."
Fosket rovněž vidí důležitost těchto nástrojů i pro uživatele, kteří se v
současné době snaží přetvořit svoje IT oddělení do podoby interního
poskytovatele služeb. "Větší firmy si začínají všímat, že jedinou cestou, jak
mohou spravovat svá prostředí, je standardizace procesů i konfigurací," říká.
Vysoká cena
Protože však cena některé z těchto nástrojů řadí spíše do kategorie vozů BMW
než do kategorie Volkswagenu, Foskett upozorňuje, že IT společnosti musejí
velmi dobře zvážit jejich výhody. "Cena mnoha nástrojů je stanovována na
základě velikosti prostředí, ale viděl jsem účty za tato řešení i ve výši více
jak 50 000 dolarů," říká.
Firma Applied Quantitative Research je jednou ze společností, která si myslí,
že by takovouto investici neodůvodnila. "Monitoring pomocí syslogu kombinovaný
se zařízením Cisco MDS a správními nástroji pro úložné matice je pro SAN o
velikosti 30 TB v primárním datovém centru dostačující," říká Ismail Coskun,
ředitel vývoje systémů v uvedené firmě. Jejich SAN využívá v produkční lokalitě
produkt EMC Clariion a přepínač MDS se 48 porty Fibre Channel, přičemž data
replikuje na jiný Clariion na vzdáleném místě.
"Nástroj Cisco Device Manager při zjišťování, jakým způsobem je více než 20
serverů společnosti připojeno k síti SAN, pracuje velmi dobře," říká Coskun.
"Device Manager také nabízí pěkný grafický náhled aktuálního stavu přepínače
příchozí a odchozí kanály či rychlost komunikace," dodává.
Foskett z firmy GlassHouse, když hodnotí nástroje na správu změn SAN,
doporučuje uživatelům zaměřit se na produktové balíky, které podporují veškerá
zařízení využívaná v SAN. Také oceňuje nástroje, které provedou snapshot
konfigurace SAN před a po provedené změně a jež uživateli nabízejí konfigurační
soubor s původním nastavením, pokud by potřeboval obnovit původní stav. Některé
nástroje dokonce umožňují návrat k předchozímu nastavení automaticky.
Nejlepší produkty tohoto typu například mohou pomáhat při procesu přidávání
nových zařízení, nebo dokonce při spojování různých SAN dohromady. "To jsou ty
činnosti", prorokuje, "které budete muset během příštích několika let
dělat."(pal) 6 1523
IBM TotalStorage Productivity Center
Pro správu, analýzu a proaktivní monitoring subsystémů datových úložišť nabízí
řešení i firma IBM. Jedná se o produkt TotalStorage Productivity Center (TPC),
který je z pohledu operačních systémů i hardwaru multiplatformní lze s ním tedy
spravovat i disková pole, switche a disky jiných dodavatelů. TPC má několik
komponent, které mají za účel dohled na infrastrukturou datových úložišť,
zjednodušení správy a předcházení neplánovaným výpadkům TPC for disk, TPC for
data, TPC for replication a konečně TPC for fabric. Prvně jmenovaná komponenta
je určena pro správu, monitoring a analýzu dat na souborových systémech a v
databázích. TPC for Disk komponenta je zase určena pro centralizovanou správu a
monitoring diskových polí a mimo jiné informuje o úzkých místech v systému či
zobrazuje výkonností údaje.
Komponenta TPC for Replication navazuje na TPC for Disk poskytuje nástroje pro
správu a sledování stavu replikačních procesů. TPC for Replication nabízí mimo
jiné konfigurační nástroje pro automatizaci mapování zdrojových jednotek na
cílové jednotky kopírovacích služeb nebo umožňuje vytváření replikačních skupin
či poolů cílových jednotek.
TPC for Fabric poskytuje mimo jiné automatickou detekci SAN zařízení, dynamické
zobrazování topologie sítě SAN, detekci chyb, funkci SAN error predictor
(součást, která předpovídá potenciální problémy v síti SAN dříve, než dojde ke
skutečnému omezení provozu), monitorování v reálném čase, upozornění (pomocí
SMS, e.mailu...) či event management v heterogenních sítích SAN. Součástí
řešení je tzv. Topology Viewer, který umožňuje dynamicky generovat mapy sítě a
zobrazovat konektivitu SAN zařízení a serverů. Mapy zahrnují fyzické propojení,
logické a zónové topologie. Protože administrátoři mohou tímto nástrojem
získávat konfigurační parametry a síťové statistiky a další detailní informace
ze SAN přepínačů, používá se tento nástroj také k vyhodnocování kapacitních
nároků, metrik zatížení, výkonnostních hrdel nebo ke sledování redundantních
cest. Administrátoři mohou použít tento nástroj například ke zjištění, které
systémy pracují na hranici kapacitních možností zařízení a které naopak mají
minimální požadavky tyto údaje jsou pak užitečné pro optimalizaci výkonu. SAN
error predictor je součást, která predikuje potenciální problémy v síti SAN,
dříve než dojde ke skutečnému omezení provozu. TPC for Fabric také poskytuje
nástroje pro správu heterogenní sítě SAN včetně konfigurace zón. (pal)

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.