Sítě pro ukládání dat ve vývoji

1. 12. 2003

Sdílet

Je tomu už 9 let, co začal vývoj specifikace Fibre Channel, prvního rozhraní určeného k realizaci sítí pro ukládán
Je tomu už 9 let, co začal vývoj specifikace Fibre Channel, prvního rozhraní
určeného k realizaci sítí pro ukládání dat. Dnes však v podobě iSCSI stojí na
startovní čáře další architektura vhodná k budování storage sítí.
Koncept storage sítí se v současnosti vyznačuje tím, že zdroje pro ukládání dat
jsou propojeny prostřednictvím switchů, routerů nebo mostů přímo v síti. Tím se
liší dnes relativně stále ještě nový koncept storage sítí označovaný jako SAN
(Storage-Area Network) od dosud nasazovaných systémů DAS (Direct Attached
Storage), v jejichž případě jsou ukládací zařízení připojována přímo k
jednotlivým serverům.
Sítě SAN byly dosud využívány zejména proto, že jejich vybudování je podmíněno
vysokými počátečními náklady na hardware i zaškolení zaměstnanců především
podniky, které byly schopny dosáhnout vysoké návratnosti investic nebo
potřebovaly řešení, které dosud jinou technikou nebylo možné realizovat.
Dnešní SAN slouží především pro konsolidaci v oblasti ukládání dat, LAN-free
zálohování, virtualizaci storage, clustering, obnovu po havárii, jakož i pro
vzdálené ukládání a zálohování dat.

Konsolidace storage
Pod pojmem konsolidace storage se rozumí to, že subsystém pro ukládání dat může
být využíván různými servery. Z toho pak vyplývá redukce nákladů na hardware
pro ukládání, zmenší se potřebná plocha, kterou tato zařízení zabírají, a navíc
může být centralizována i zjednodušena správa. To má vliv také na snížení
běžných nákladů (především personálních) a významně lze redukovat i investice
do hardwaru. Při konsolidaci storage jsou používány koncepty, které mnohdy
mohou někomu připomínat dominantní pozici mainframů před 20 lety. Tentokrát je
pouze důležitým a ústředním faktorem v síti ukládání dat.
V případě LAN-free zálohování je zabezpečení přenosu dat uskutečněno nikoliv
prostřednictvím LAN, nýbrž právě přes SAN. Z toho vyplývá odlehčení samotné
LAN, a tím také propojení mezi klienty a servery, i serverových CPU. I zálohy
většího množství dat je pak možné provádět rychleji.

Virtuální ukládání
Virtualizace storage je označení používané pro oddělení dostupné kapacity
systémů pro ukládání dat od fyzicky existujících paměťových zařízení a jejich
disponibilní kapacity. Takto mohou být disková pole, a stejně tak jejich
atributy jako výkon, kapacita a stupně dalšího možného škálování odděleny od
pevného přiřazování či rozvržení storage. To dovoluje dynamické přidělování i
přesouvání potřebné kapacity bez přestavby hardwaru, ale také provoz bez
prostojů a plýtvání kapacitou. Virtualizace ukládání dat poskytuje lepší
kontrolu nad rostoucí dynamickou spotřebou storage kapacity.
Dosud bylo možné realizovat sítě SAN pouze s technologií Fibre Channel (FC).
Poté, co organizace Internet Engineering Task Force (IETF) ratifikovala v
polovině února 2003 standard iSCSI, objevila se spolu s ním možnost použít při
implementaci storage sítí ještě druhou techniku.
Nasazení technologie Fibre Channel je jednoduché i složité současně. V případě
FC jsou všechny vrstvy protokolu implementovány v hardwaru, aby šetřily CPU
zdroje. K tomu ovšem musela být definována od základu nová technika přenosu,
která však s sebou přinesla určité komplikace a nedostatky z hlediska
kompatibility. FC definuje a rozlišuje tři různé architektury: Point-to-Point,
Arbitrated Loop a Switched Fabric.
Každá z těchto topologií vykazuje určitá omezení specifická pro použitý
protokol, například u maximálního počtu podporovaných zařízení nebo při
nalogování. Navíc se liší jejich definice, kupříkladu FC-AL pro Arbitrated Loop
nebo FC-SW pro Switched Fabric. To vedlo a dosud může vést k problémům z
hlediska implementace a kompatibility. Velká část konfigurace, která je díky
tomu nezbytná, by měla být vyřešena na straně zařízení a switchů
prostřednictvím autokonfigurace potažmo implementace tzv. G-Portu (Generic
Port, nachází se na FC přepínačích, jeho funkce závisí na tom, k jakému portu
dalšího přepínače je připojen). S tím nicméně vyvstal nový problém, který je
znám už řadu let u Ethernetu 10/100/1000 a týká se Auto-Sensingu (automatické
zjišťování rychlosti připojení): Když obě strany provádějí Auto-Sensing, může
snadno dojít k nedorozumění, takže nakonec musejí být nakonfigurovány manuálně.

Finesy v detailech
Auto-Sensing působil problémy, jestliže se někdo odvážil učinit krok od Fibre
Channelu s přenosovou rychlostí 1 Gb/s (100 MB/s při poloduplexním, potažmo 200
MB/s v plně duplexním provozu) ke 2 Gb/s (200 MB/s poloduplexní nebo 400 MB/s
duplexní). Zařízení musí nejen rozlišovat, ve které FC architektuře má
operovat, nýbrž také jak rychlý přenos má zajišťovat. Vzhledem k tomu, že
neexistuje žádná předepsaná definice nebo standard pro Auto-Sensing u 1Gb/s
nebo 2Gb/s Fibre Channelu, potažmo jeho jednotlivé architektury
(Point-to-Point, Arbitrated Loop či Switched Fabric), je ponecháno na každém
dodavateli, jak jej implementuje, respektive jak obejde problémy s
nekompatibilitou.
Proto není překvapivé, že se už popsané problémy s kompatibilitou brzy vyústily
v další: v nekompatibilitu mezi přepínači různých výrobců. V oficiální
specifikaci FC-SW (Switched Fabric, architektura, která je už delší dobu
dominantní) je definován pouze tzv. E-Port (tj. port určený pro propojení
přepínačů). Definice dalších bodů (například výměny směrovacích informací či
jednotného směrovacího protokolu namísto protokolů různých výrobců, jako je
RIP-I, RIP-II, OSPF, abychom uvedli jen několik) chybějí, stejně jako standard
pro výměnu RSCN (Registered State Change Notification), tj. výměnu informací o
přihlášení respektive odhlášení zařízení, nebo pro výměnu a cachování SNS
(Simple Name Server, decentralizovaná registrace zařízení, obdobná DNS
informacím v IP sítích). V důsledku toho se ukázalo, že FC switche různých
výrobců nebyly vzájemně kompatibilní. Uživatelé, kteří chtěli implementovat FC,
se proto museli rozhodnout, na kterého z dodavatelů se budou spoléhat kdo má
největší šance na přežití na trhu a zároveň nabízí nejlepší ochranu investic?

Poškozený dojem
Teprve přednedávnem, když se začala o storage networking zajímat firma Cisco
(jakožto jeden z předních globálních hráčů na poli síťových zařízení) a
obrátila svoji pozornost na FC i na stále ještě ve fázi vývoje se nacházející
iSCSI, začalo se vše pomalu měnit. Dominantní prodejci FC switchů se ohledně
protokolů pro směrování, SNS, RSCN a dalších velmi rychle sjednotili. To
vyústilo v novou specifikaci "Switch Interoperability", která je základem
standardu FC-SW2.
Bohužel není snadné napravit poškozenou reputaci, kterou si Fibre Channel do té
doby díky problémům s kompatibilitou získal. Stávající i potenciální uživatelé
si stále ještě spojují FC-SW, FC-SW2 a "Switch Interoperability" s domněnkou,
že Fibre Channel nezaručuje kompatibilitu a že pro něj žádný jednotný standard
neexistuje. Těmto předsudkům musejí zástupci FC tábora čelit pouze
vysvětlováním a demonstrováním kompatibility.
Nedávno se Fibre Channel Community rozhodla vložit mezi současné standardy pro
přenosové rychlosti 1 Gb/s, 2 Gb/s a příští standard pro 10 Gb/s mezistupeň s
propustností 4 Gb/s. Důvod pro to lze hledat v neposlední řadě i v rostoucím
tlaku, jemuž je Fibre Channel vystaven ze strany IP storage, která na sebe
poslední dobou strhává pozornost. Takto mají dodavatelé na trhu SAN díky
přenosové kapacitě 400 MB/s (poloduplexní přenos), respektive 800 MB/s (plný
duplex), opět argument, proč se i nadále soustředit především na Fibre Channel.

ISCSI nastupuje
Standard iSCSI vlastně představuje spojení dvou veteránů IT odvětví: Ethernet
oslavil přednedávnem 30. výročí a SCSI je na trhu vlastně už od roku 1979
(tehdy bylo ještě označováno SASI). To je ale vše, co mají obě technologie
společného. Ethernet byl dosud používán výhradně pro zařízení založená na File
I/O přenosu (tzn. tj. pro vstupně/výstupní přenos souborových dat), zatímco
SCSI pro Block I/O (tzn. přenos logických bloků z datového úložiště) což v
podstatě představuje dva protichůdné průmyslové standardy. Při transportu z
SCSI přes TCP/IP vzniká synergie. Aplikace, pro které byl dosud vyhrazen pouze
Fibre Channel, je dnes takto možné realizovat pomocí jiné technologie ať už jde
o vybudování storage sítě nebo propojení blokově založených ukládacích systémů
na větší vzdálenosti (což se týká oblastí jako remote mirroring nebo vzdálené
zálohování).
To přináší vyšší flexibilitu, při níž je možné volit mezi oběma technologiemi
podle různých požadavků s ohledem na minimální náklady, malé zatížení
serverových CPU nebo také typ propojení. Přitom jsou pro iSCSI k dispozici,
stejně jako v případě druhé techniky, různé možnosti nasazení: bridge a routery
(podobné těm, které byly vyvinuty pro SCSI/Fibre Channel), appliance (jako
např. Intransa či Elipsan) a nativní implementace (jako Network Appliance
Filer).

Běžná infrastruktura
Pro transport dat je v případě iSCSI využíván standard Ethernet (a TCP/IP),
díky čemuž může být snadno využita existující síťová infrastruktura nebo
internet. ISCSI přenos je všemi síťovými přepínači a routery zpracováván stejně
jako TCP/IP pakety. Dokonce ani switche pro 2. či 3. vrstvu nemohou rozpoznat,
zda přes TCP/IP přenášejí NFS, HTTP nebo iSCSI data.
Zda je pro implementaci iSCSI smysluplné sdílet infrastrukturu nebo vybudovat
novou síť nelze obecně říci. Zde by mělo být rozhodováno na základě dostupné
šířky pásma přepínačů a infrastruktury jako takové.
Je zřejmé, že pokud by měly být provedeny inovace a změny ve všech vrstvách,
neobejde se vše bez rozsáhlého zaškolování a důrazu na kompatibilitu při
nákupu. SAN založené na iSCSI nabízejí výhodu z hlediska nákladů, neboť firmy,
jejichž IT zaměstnanci už mají zkušenosti s Ethernetem a TCP/IP, mohou jejich
znalosti využít i v případě iSCSI. Přesto však bude nasazení iSCSI řešení
vyžadovat dodatečné školení protože ale čtyři z pěti vrstev spočívají na
principech, které odpovídají už existujícím vědomostem, lze náklady na
proškolení udržet v rozumných mezích. Také v případě hledání chyb se lze vrátit
k dosavadním znalostem a zkušenostem se sítěmi.

Problematická bezpečnost
Teoreticky může být iSCSI nasazeno i v sítích založených na ethernetovém
standardu 10Base-T (10 Mb/s), ty jsou však v praxi při maximální propustnosti 1
MB/s se synchronním přístupem k paměti většinou pomalé. Proto se vychází z
toho, že bude iSCSI obvykle implementováno na bázi Gigabit Ethernetu. V
některých prostředích je smysluplné využívat také standard Fast Ethernet
(100Base-T, 100 Mb/s, tj. přibližně 10 MB/s). Nižší přenosové rychlosti najdou
využití jen stěží. Výjimky se však možná vyskytnou v oblasti metropolitních
sítí, MAN (Metropolitan Area Network), potažmo WAN (Wide Area Network), neboť
při takovém uplatnění je obvykle používán asynchronní přenos, a aplikace tak
nejsou příliš závislé na latenci síťového připojení.
Často je v diskusích o iSCSI uváděn argument týkající se nedostatečného
zabezpečení. Aktuální implementace iSCSI v současnosti ještě nezahrnují
možnosti šifrování dat (jako IPSec), což má důvody zejména ve výkonových
omezeních. V případě FC však šifrování dat také dodnes není ze stejného důvodu
k dispozici. Dokud nebudou související vývojové práce dokončeny, mohou
uživatelé využívat IP šifrování mezi jednotlivými lokalitami TCP/IP sítě. Pro
tyto účely už existují potřebná zařízení a standardy.

FC versus iSCSI
Od roku 1999 s tím, jak začaly práce na definici iSCSI, se rozhořely vášnivé
diskuse o tom, zda by iSCSI mohlo vystřídat Fibre Channel. Přitom ale bylo
často přehlíženo, že Fibre Channel a iSCSI mají oslovit rozdílné cílové
skupiny. Firmy, které disponují potřebnými finančními prostředky a
infrastrukturou, už Fibre Channel využívají, nebo tak plánují učinit v blízké
budoucnosti. Jiné pak budou především na základě výhod z hlediska nákladů
investovat právě do iSCSI.
Další výhodou iSCSI je, že potenciální uživatelé mohou takové SAN systémy
jednoduše testovat v rámci stávající LAN. Většina dodavatelů operačních
systémů, například distributoři Linuxu, Hewlett-Packard nebo i Microsoft, už
podporu iSCSI dala bezplatně k dispozici nebo ji přinejmenším ohlásila.
Jak iSCSI, tak Fibre Channel budou pro přenos v další fázi využívat 10Gb/s
fyzickou platformu. Už dnes existují komponenty pro 10gigabit Ethernet, zatím
však nejsou finančně dostupné pro každou firmu. Při cenách 10-20 tisíc eur na
port je klientela stále dosti omezená. Lze ale vycházet z toho, že s postupnou
akceptací těchto zařízení na trhu začnou ceny postupně padat. Zvýšení objemu
produkce následně způsobí pokles výrobních nákladů, a tím opět i cen.
Ovšem například podle předpovědi společnosti Linley Group by měly prodeje FC
zařízení v nejbližších letech růst a sítě SAN založené na IP by měly převzít
žezlo (a stát se dominantní nebo přinejmenším nejrychleji rostoucí
architekturou) v roce 2007, přičemž právě iSCSI je pro FC největším konkurentem.
Tento proces bude doprovázet i pokles cen FC komponent až na polovinu či méně
oproti současné úrovni (opět predikce pro rok 2007). Špičky by přitom prodeje
měly dosáhnout v následujících dvou letech (s 20% růstem příjmů, v roce 2006 už
to bude porostou pouze o 10 %). To lze vysvětlit tak, že přijetí IP SAN nebude
příliš rychlé jak kvůli konzervativnímu přístupu IT trhu, tak díky pozici,
kterou si Fibre Channel získal a z níž bude ještě nějakou dobu těžit s ohledem
na snahu uživatelů o návratnost investic.

Architektury Fibre Channel
Point-to-Point (bod-bod): V rámci této architektury jsou přímo propojena 2
zařízení. Ta mají k dispozici plně duplexní spojení s celou šířkou pásma.
Arbitrated Loop (řízená smyčka): Bez potřeby FC přepínače lze do jediného
řetězce (smyčky) propojit až 126 FC zařízení. Uzel, který chce předávat data,
zažádá o řízení smyčky a poté zformuje bodové spojení k cílovému uzlu. Všechna
zařízení mezi nimi přitom přenášená data přeposílají. Přenosová linka je
sdílená a navíc vzniká zpoždění při předávání mezi uzly, v praxi se proto AL
používá pro maximálně 30 propojených zařízení.
Switched Fabric (přepínaná křížová struktura): Tato architektura využívá jeden
nebo více FC přepínačů, k jejichž portům se připojují storage uzly. Tak může
více zařízení komunikovat současně a přenosové médium není sdílené (neblokující
architektura). Při 24bitové adresaci je možné propojit maximálně 239 switchů,
které disponují 8-64 porty pro samotné uzly. Takto lze dosáhnout vysokého
výkonu i škálovatelnosti.