Hlavní navigace

Cloud pro pokročilé (2): Jak na správu privátního cloudu a datacenter

31. 10. 2011

Sdílet

V současné době je jasně viditelný trend konsolidace serverů. Servery, i ve firmách, se přesunují do datacenter s odpovídající infrastrukturou a zázemím. Virtualizace a privátní cloud totiž firmám přinášejí nesporné výhody. Spolu s pohledem na rozložení IT infrastruktury je však třeba změnit i pohled na její správu, protože původní postupy a procesy na přísná SLA už stačit nemusí.

Centralizace serverů přináší výhody i problémy
Centralizace serverové infrastruktury přináší velice širokou škálu výhod. Na jednom místě jsme podstatně snáze schopni nabídnout odpovídající ochranu proti neautorizovanému přístupu, proti vzniku požárů i proti výpadkům napájení včetně zajištění motorgenerátorů pro pokrytí delších výpadků rozvodné sítě.

Navíc s nástupem virtualizace platí, že čím více virtuálních strojů spravujeme, tím efektivněji dokážeme využít fyzické servery, a tím lépe ochráníme své investice do hardwaru. V okamžiku, kdy se však firma rozhodne přejít k „velkému IT“ a nastaví interní SLA, je třeba začít řešit i další věci než jen změny v infrastruktuře.

SLA jako bič
SLA je jedním z klíčových výhod veřejného cloudu. Provozovatel vám zkrátka garantuje, že vaše infrastruktura bude dostupná obvykle v 99,9 % případů, což  znamená souhrnnou dobu všech výpadků během kalendářního roku v celkové výši 8 hodin 46 minut. Některé firmy jako například Microsoft pak toto SLA garantují na měsíční bázi – tj. výpadek max. necelých 45 minut měsíčně.

Jenže to, co pro velkou nadnárodní korporaci není v zásadě žádný velký problém, protože beztak už provozuje ve svých datacentrech x dalších služeb, pro které musí interně toto SLA zajistit, už pro lokální firmu či veřejnou instituci může být poměrně náročné. Zejména v době, kdy firmy chtějí maximálně využít prostor pro minimalizaci personálních nákladů. Výpadky elektřiny vyřeší stejně jako u veřejného cloudu záloha napájení. Výpadky konektivity, opět stejně jako u veřejného cloudu, záložní konektivita. Dokonce i výpadky hardwaru, jako jsou výpadky disků, větráků, napájecích zdrojů apod., vyřeší redundantní prvky v serverech a výpadky celých serverů virtualizace a využití clusterů.

Jenže pro softwarové chyby, výpadky a nezbytnou údržbu už je potřeba udělat víc. K tomu, aby taková firma s minimálním týmem IT odborníků pro správu více serverů byla reálně schopna vyřešit výpadek způsobený softwarovou příčinou do 45 minut, potřebuje nejen špičkové odborníky, ale také odpovídající softwarové nástroje.

Automatizace procesů šetří čas i peníze
K tomu, aby bylo možné plnit interní SLA a co nejrychleji reagovat na vzniklé problémy, jsou třeba v zásadě tři věci – odfiltrovat veškeré zbytečnosti, aby se lidská obsluha prioritně dozvídala o závažných problémech, nasadit v maximální možné míře automatizaci veškerých IT procesů v oblasti správy, údržby, incident managementu a dát obsluze do ruky jednotný nástroj pro řešení problémů bez ohledu na to, ve které části IT infrastruktury a od kterého dodavatele problém nastal.

O filtrování a prioritizaci problémů k řešení se v dnešní době stará široká škála nejrůznějších softwarů pro vzdálený monitoring a správu. V případě datových center je ovšem nezbytné dodat, že kromě serverů samotných je třeba monitorovat také síťové prvky a všechna storage řešení. Jedině komplexní obrázek o vzniklé chybě totiž pomůže lidské obsluze k jejímu rychlému vyřešení. Ne vždy totiž musí být nedostupnost virtuálního stroje způsobená softwarovou chybou ve virtualizovaném systému. Čím větší datacentrum to je, tím více příčin mohou problémy mít. I proto je důležité mít pokud možno jeden jediný nástroj, který se bude k řešení problémů využívat. Přepínání mezi deseti různými konzolemi s deseti různými prostředími jen zdržuje a neúměrně zdražuje kvalifikovanou obsluhu.

Ostatně o tom, že jednotný monitoring a jednotné ovládání infrastruktury se vyplatí, se už dávno přesvědčili třeba mobilní operátoři, kteří k monitoringu rozsáhlé heterogenní infrastruktury, čítající obvykle aspoň dvě různé mobilní sítě, taktéž využívají specializované jednotné nástroje.

Jenže mít možnost spravovat více nástrojů z jednoho místa může být poněkud komplikované, zejména v okamžiku, kdy storage řešení máte od ECM, síťovou infrastrukturu monitorujete pomocí HP OpenView a serverový cluster máte postavený na nástrojích od VMwaru.

System Center Opalis jako mezičlánek mezi systémy
Jako první si fakt roztříštěnosti infrastruktury zmíněný na konci článku uvědomil Microsoft, který už od svého vzniku staví na univerzální použitelnosti svých nástrojů. Stejně jako si Windows poradí s desítkami milionů kombinací nejrůznějšího hardwaru, tak si nový Microsoft System Center Opalis poradí s desítkami kombinací softwaru pro správu a monitoring od nejrůznějších dodavatelů. Jde o naprosto unikátní řešení, které využívá tu samou logiku, jež se využívá i u zmiňovaných mobilních operátorů.

Opalis nasadí mezi obsluhu a jednotlivé nástroje pro správu od nejrůznějších výrobců a pro nejrůznější platformy jakousi mezivrstvu, která nejenže slouží ke sběru dat, ale také k onomu jednotnému ovládání všech dílčích součástí datacentra.

Aby toho nebylo málo, tak Opalis nabízí automatizaci téměř všech IT procesů, a to i tehdy, vyžadují-li interakci více prvků datacentra od různých dodavatelů. Opalis se tak umí automaticky postarat o údržbu serverů, záplatování operačních systémů, údržbu souborových systémů, databází či automatické zálohování a obnovu dat.

Opalis je tedy jakýsi sjednocující prvek nejen nad celou rodinou System Center produktů, ale také nad produkty všech hlavních konkurentů Microsoftu v této oblasti včetně třeba IBM Tivoli. Jednotným prostředím pro veškerý monitoring, správu a automatizaci IT procesů však výčet jeho funkcí nekončí.

System Center Opalis se postará o IT i po procesní stránce
Zejména pro větší organizace a pro státní a veřejnou správu bude určitě dobrou zprávou fakt, že Opalis se postará i o všechny IT procesy spojené s provozem datového centra, a to přesně podle ITIL. Ostatně bez procesní otázky by se jen těžko dalo měřit reálně dosažené SLA.

Opalis proto umí řešit všechny úkoly spojené s incident managementem včetně detailního trouble ticketingu či automatické delegace jednotlivých specializovaných úkolů dedikovaným pracovníkům. Kromě reaktivních procesů však Opalis pokrývá i proaktivní, jako jsou monitoring změn a jejich řízení, udržování informací o změnách v konfiguracích atd. Opalis je tedy oním chybějícím prvkem na cestě k efektivně fungujícímu datacentru s reálně dosahovaným SLA.

Autor pracuje jako produktový manažer serverové divize ve společnosti Microsoft