IT se opět vrací do výpočetních center

Servery, superpočítače a ukládání dat. Z průzkumu EITO jsme vybrali to nejdůležitější, co ovlivní budoucí podn...


Servery, superpočítače a ukládání dat. Z průzkumu EITO jsme vybrali to
nejdůležitější, co ovlivní budoucí podnikovou infrastrukturu. Zásadní změny
se nekonají, ale přesto některé z trendů směřují k tomu, aby časem způsobily
nenásilnou transformaci vašeho IT.
Možná jste už dlouho z médií neslyšeli o outsourcingu IT. O to více se však
prosazuje v praxi, což má dopady na změnu skladby infrastruktury u
provozovatelů informačních technologií. Podniky, které kdysi měly IT
rozdrobené například na množství menších serverů, dávají stále častěji
přednost převodu starostí o techniku na externího dodavatele. Taková
dodavatelská organizace se však už většinou specializuje na outsourcing
technologií pro více firem. Tím pádem se mění a "povyšuje" její vlastní
infrastruktura. Ke zvyšujícímu se počtu rozsáhlejších infrastruktur vede i
rostoucí množství provozovatelů hostingu, housingu nebo webových služeb.
Zmíněné důvody způsobují trend recentralizace serverů do webových farem a
rozličných center. Vytváří se určitá analogie k tzv. infocentrům v šedesátých
a sedmdesátých letech. Dnes se jim ale spíše říká Internet Data Centra. A
právě ta stále častěji investují do high-end serverů s charakteristikami
mainframů, TCP/IP a unixovou kompatibilitou. Výsledně totiž zjistí, že celkové
náklady na vlastnictví (TCO Total Costs of Ownership), rozpočítané na každého
uživatele, jsou mnohem nižší než v distribuovaném prostředí levnějších
strojů. Navíc dovolují vyšší úroveň bezpečnosti, dostupnosti a řízení.
Jak tedy vypadají trendy v architektuře high-end serverů, které se pak často
promítají i do nižších řad produktů? Technologický vývoj dnes obvykle probíhá
inovacemi v oblasti násobných diskových oddílů, dynamických alokací zdrojů a
řízení zátěže systému.

Specializace high-end serverů
Typickou architekturou je MPP nebo NUMA (viz dále). Schematický obrázek
architektury multiprocesorového systému ukazuje poměry ve "svázanosti"
jednotlivých technologií. Multiprocesorová topologie zahrnuje:
SMP (Symmetric Multi-Processing): Jeden operační systém řídí mnoho procesorů,
které sdílejí paměti a disky. SMP systémy mohou být založeny na tradičních
architekturách se sdílenou sběrnicí nebo na nové architektuře s křížovým
přepínáním (cross-bar switching), která umožňuje vyšší rychlosti přenosu dat.
MPP (Massively Parallel Processing): Každý z procesorů řídí svou vlastní paměť
a vlastní diskové pole.
NUMA (Non Uniform Memory Access): Ve starší verzi jeden operační systém řídí
množství procesorů, které sdílejí paměťovou banku a disky. Evolucí je tzv.
cache-coherent NUMA (cc-NUMA), která spojuje několik SMP bloků
vysokorychlostními vazbami. Paměť každého bloku je využívána jako cache pro
frekventovaná data. Cluster: Volně spojené SMP samostatné systémy, kdy celek
funguje jako jeden virtuální stroj.
Nejběžnějším řešením pro dosažení škálovatelnosti a odolnosti proti chybám je
dnes clustering, což je ovšem poměrně široký termín, který zahrnuje množství
různých provedení a architektur. Nejjednodušší řešení obvykle sestává ze dvou
uzlů jednoho primárního a druhého, který slouží jako záloha (fail-over
cluster). Skutečná clusterová architektura ovšem pracuje s mnohem užší
spoluprácí uzlů, což také znamená intenzivnější výměnu informací a dat. Uzly
mohou dokonce pracovat se společným paměťovým prostorem nebo klasicky každý
se svým. V prvním případě dokonce ani aplikace nemusejí být připraveny pro
práci v clusteru, protože jej pokládají za jediný stroj. Ostatní oddělenější
struktury potřebují systémy řízení clusterů.
Klíčovým trendem ve všech serverových platformách je specializace na
provozované aplikace. Stále častěji se vlastní hardwarová struktura
přizpůsobuje aplikacím, které budou použity. Jedná se například o transakční
servery, databázové a warehousové servery, bezpečnostní servery, management
servery, gateway servery a další.

Superpočítače ve třetí éře
Nejvyšší třída superpočítačů je založena především na MPP a vektorovém
procesingu. Vektorové systémy pracují s malým počtem velmi výkonných
proprietárních procesorů, které dokážou v jednom kroku zpracovávat komplexní
instrukce využívající celá pole dat. Proti nim stojí běžné skalární procesory,
které zpracovávají jednoduché instrukce s malými kousky dat rychle za sebou.
Superpočítače se sice dnes používají především pro vojenské a vědecké
aplikace, ale jejich výhoda se ukazuje i při rostoucím nasazení v oblastech
dolování dat a managementu velkých objemů dat komerčních aplikací. Evoluce
superpočítačů pokračuje a vstupuje do třetí fáze či, chcete-li, éry. První
byla reprezentována známým strojem Cray 1, přičemž jeho nejvyšší výkon byl
založen na velmi rychlých mikroprocesorech pracujících na principu ad hoc.
Druhá éra byla (a stále je) založena na MPP a SMP architekturách, kdy je
vysoký výkon dosahován použitím stovek až tisíců součastně pracujících
procesorů. Třetí fáze, která právě začíná, využívá řízení virtuálních
superpočítačů, které jsou vytvářeny spojením heterogenních počítačů. Idea
virtuálního superpočítače není nová a pravděpodobně byla poprvé prezentována
už v roce 1994 v americkém projektu Beowulf.
V současné době všichni hlavní výrobci počítačů nabízejí superpočítačové
systémy většinou jako nejvyšší úroveň svých škálovatelných platforem. Kvůli
tomu je obtížné definovat konkrétní hranici, kdy se ještě jedná o
multiprocesorový systém a kdy už o superpočítač. Běžně se však za superpočítač
pokládá už i MPP systém, který podporuje alespoň 64 procesorů. A které
operační systémy lídři supercomputingu využívají? Cray Unicos, IBM AIX,
Dynix/ptx a Sun Solaris. Výpočetní síla takových systémů se ale většinou
neudává podle počtu procesorů, nýbrž podle počtu operací v plovoucí desetinné
čárce za sekundu (flops Floating Point Operations per Second). Díky tomu je
lze lépe srovnávat. Dobré superpočítače dosahují 2 T (tera) flops a mají 1 TB
paměti. Špičkové jdou ještě dále. Například Gene Blue od IBM, využívaný ke
studiu struktury proteinů, dosahuje až P (peta) flops.

Uložte se správně
S trendy high-end serverových systémů neodmyslitelně souvisí i problematika
ukládání dat. Jaké jsou trendy u primárních ukládacích prvků? Každých 12
měsíců se zdvojnásobí jejich kapacita. Ať už se jedná o magnetická, optická
či hybridní (magneto-optická) zařízení. Běžné pevné disky charakterizuje
především velikost, rychlost a hustota ukládání dat. Plotny, které se běžně
pohybovaly od průměru 1,8 palce do 5,25, všechny postupně konvergují k
velikosti 3,5 palce. Nejmenší disk na trhu má plotnu s průměrem jeden palec a
své využití nalézá například u digitálních fotoaparátů, což je praktický
protipól podnikových oblastí pro ukládání dat.
Každých 18 měsíců se také zdvojnásobuje hustota uloženého záznamu na pevných
discích díky zlepšení povrchového filmu média nebo zdokonalené
magnetorezistivní technologii hlaviček. Současné špičky disponují hustotou
přes 3 GB na čtvereční palec. Důležité jsou také otáčky ploten, které
dosahují hodnot 15 tisíc ot./min a přitom jsou velmi spolehlivé. Takové disky
mohou mít průměrný čas mezi poruchami (MTBF Mean Time Between Failures) i 130
let.
Nové generace produktů se obvykle objevují po 9-12 měsících a nové ukládací
technologie mají 24měsíční cyklus.

Mezitváře pomáhají rychlosti
Zlepšující se parametry disků by nebyly nic platné bez vylepšování diskových
komunikačních rozhraní. V současné době jsou nejběžnějšími standardy SCSI
(Small Computer System Interface) a EIDE (Enhanced Integrated Drive
Electronics), jejichž řadiče jsou většinou integrovány přímo na základní
desce. Nově pronikajícím rozhraním pro paměťová zařízení je i USB 2.0, které
zřejmě zbrzdí další konkurenty, kterými jsou Fibre Channel, Infiniband a
FireWire. V trochu jiné oblasti použití se nachází SoIP (Storage over IP) se
svými protokoly, iSCSI (Internet Small Computer System Interface) a iFCP
(Internet Fibre Channel Protocol), které jsou projektovány na rychlosti 1,25
Gb/s. Velmi pravděpodobné také je, že jakmile IEEE (Institute of Electrical
and Electronics Engineers) standardizuje 10gigabitový Ethernet, standard
rychlosti zmíněných rozhraní se ještě zvýší.

RAID, SAN nebo NAS?
Nejrozšířenější a také nejjednodušší architekturou pro ukládací subsystémy je
RAID (původně Redundant Array of Inexpensive, dnes častěji Independent Disks),
který pracuje na principu spojení skupiny disků, jež jsou ovládány speciálním
řadičem. Díky tomu vytváří zdání jediné logické jednotky, která má ovšem
výhody násobných fyzických disků. RAID systém umožňuje při selhání jednoho
disku obnovu dat, přičemž pro jejich distribuci mezi fyzické disky je
využíváno několik úrovní RAID od 0 do 5. Trendem vývoje těchto polí je analýza
a odhalování disků, které s vysokou pravděpodobností selžou, zlepšování
softwaru pro znovuzotavení a odolnost vůči chybám v reálném čase. Poslední
trend využívá vlastnosti disků warm-swap (možnost výměny disku, když je systém
ve stand-by módu), hot-spare (automatickou výměnu havarovaného disku systémem
za připravený hot--spare disk a vyjmutí poškozeného disku za provozu) a
hot-swap (možnost vyjmutí a zapojení disku za plného provozu).
Kromě RAID subsystémů je trendem v ukládání rozvoj větších systémů. Jedná se
především o SAN (Storage Area Network) a NAS (Network Attached Storage). SAN
je založen na samostatné vysokorychlostní síti, ke které jsou připojeny
různými rozhraními (obvykle SCSI, SSA, ESCON či Fibre Channel) ukládací
zařízení, k nimž posléze přistupuje množství serverů. Stejně jako běžná LAN
obsahuje i tato architektura přepínače, multiplexery nebo směrovače a využívá
protokolů, které umožňují interakci mezi servery a zařízeními. Kvůli různým
ukládacím zařízením je někdy nutné SAN rozdělit do subsítí, ke kterým se
přistupuje na různé úrovni.
NAS má jednodušší a také levnější architekturu. Lze říci, že se jedná o
nenáročné evoluční řešení, které vzešlo z tradičních souborových serverů.
Stejně jako ony jsou NAS zařízení obvykle připojena k běžné komunikační síti
(Ethernet, TCP/IP atd.). Evoluční změnou je především přidání speciálního
mikrokernelu, který je využíván pro řízení vstupně-výstupních požadavků.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.