DAFS: Soubory na dosah ruky

DEFINICE Zkratka DAFS (Direct Access File System) označuje nově vyvíjený protokol pro ukládání souborů a následný p...


DEFINICE
Zkratka DAFS (Direct Access File System) označuje nově vyvíjený protokol pro
ukládání souborů a následný přístup k nim. Prostřednictvím DAFS jsou data
přenášena k uživateli nikoli jako bloky odpovídající fyzickému ukládacímu
zařízení, ale jako logický soubor. Protokol tak výrazně zvyšuje výkonnost
ukládacích řešení, protože požadavek na data i jeho realizace obcházejí
operační systém serveru a jdou přímo k souborovému systému.
Všichni chceme více prostoru pro ukládání dat. Hned! A s co nejrychlejším
přístupem. Exploze v požadavcích na objem sebraných a uložených informací v
dnešním on-line byznysu znamená, že výrazně stoupají požadavky na objemy
uložených dat i na jejich zpracování. Prostředky, které jsme pro tyto činnosti
zatím vynalezli a používali, však bohužel s rostoucími požadavky přestávají
stačit.
Odpověď na otázku, jak tento problém řešit, by mohla dát technologie DAFS
(Direct Access File System). Jde o protokol, který je schopen využít rychlost a
spolehlivost Gigabit Ethernetu a InfiniBandu, umí zajistit RDMA (Remote Direct
Memory Access) mezi aplikacemi běžícími na separátních strojích v clusteru nebo
v LAN, přičemž je navržen tak, aby pracoval se soubory a nikoli s bloky (které
sice více odpovídají fyzické podstatě uchovaných dat, ale hůře se s nimi
pracuje na vyšších úrovních).

SAN a NAS
Pro lepší pochopení protokolu DAFS je užitečné podívat se podrobně na rozdíly
mezi technologiemi SAN (Storage-Area Network) a NAS (Network-Attached Storage).
SAN představuje kompletní podsíť určenou pouze k ukládání dat. Ta je připojena
k jednomu nebo k více serverům. Připojení k SAN bývá realizováno
prostřednictvím vysokorychlostních technologií, jako jsou Fibre Channel nebo
iSCSI. Ukládací zařízení SAN jsou dostupná ze všech serverů, takže uživatelé
mohou přistupovat k libovolnému úložišti v SAN bez jakéhokoli ohledu na
skutečné umístění serveru nebo uživatele. Technologie SAN byla navržena s
ohledem na to, aby bylo dosaženo vysoké rychlosti ukládání dat prostřednictvím
maximálního zjednodušení cest, kterými musejí data projít. Současně byla z
cesty vyřazena všechna zařízení, která na ní nejsou potřebná. Sítě SAN ale
přenášejí data v blocích odpovídajících jejich fyzickému uložení. Před jejich
použitím v aplikacích je tedy nezbytné převést je zpět do logických souborů.
Idea NAS je podstatně jednodušší než v případě SAN. V podstatě jde o sdílené
diskové úložiště, které má přiděleno vlastní server a adresu v síti. Zařízení
NAS se připojují k běžné lokální síti LAN, a to aniž by bylo potřeba ji
odstavit. Nevyžadují přitom žádné změny na současných souborových serverech v
síti připojených. Technologie NAS byla vyvíjena s ohledem na maximální
jednoduchost připojení k LAN a minimální cenu zařízení. Data jsou zde přenášena
ve formě souborů, tedy tak, jak uživatelé očekávají. Oba zmíněné systémy mají
tedy svá pro i proti. Jednu nevýhodu pak mají společnou: vykazují bohužel
poměrně velkou režii potřebnou pro zpracování dat, což zpomaluje přenosy.

Na scénu
Protokol DAFS využívá tzv. architekturu VI (Virtual Interface), kterou jako
transportní mechanismus pro přenos dat navrhly v roce 1996 společnosti
Microsoft, Compaq a Intel. VI je vysokorychlostní síťový protokol s nízkým
zpožděním, který umožňuje aplikacím na různých strojích v LAN nebo v clusteru
zapisovat a číst data z paměťových úložišť, která jsou současně využívána
jinými aplikacemi v síti. Toto spojení mezi pamětmi se označuje jako RDMA.
DAFS data čte a zapisuje prostřednictvím protokolu založeného na souborech,
takže zachová informace ve tvaru, ve kterém jsou odesílány k uložení. Po
přenosu tedy nemusejí být vždy znovu rekonstruovány do podoby souborů. Mezi
klienty a servery jsou přitom při procesu ukládání a čtení dat (případně
dalších operacích) přenášeny vysokoúrovňové příkazy pro souborový systém např.
k otevření souboru, jeho updatu, připojení dalších dat, zamčení nebo zavření
souboru. DAFS tedy kombinuje rychlost vysokorychlostní sítě SAN a jednoduchost
na souborech založené technologie NAS, přičemž k tomu potřebuje minimální režii.
Ukládací zařízení využívající technologii DAFS mohou být spravována
prostřednictvím několika různých softwarových produktů. Propagátoři nové
technologie slibují, že při jejím použití bude možné z procesu práce s daty
odstranit některé dosud nezbytné operace, které musejí v současnosti realizovat
databáze založené na práci s bloky.

Historie
První práce na návrhu technologie DAFS učinila kalifornská společnost Network
Appliance, v současnosti se k tomuto protokolu hlásí více než 80 členů skupiny
DAFS Collaborative. Ta takřka před rokem dokončila první verzi (1.0)
specifikace DAFS a předložila ji standardizační skupině IETF (Internet
Engineering Task Force) a nově vytvořenému DAFS IF (DAFS Implementors Forum),
které tvoří podskupinu SNIA (Storage Networking Industry Association). První
demonstrace technologie DAFS v praxi byla k vidění loni v prosinci. Výhody
nového protokolu byly prezentovány na spolupráci s databází Oracle. Do dnešního
dne však nespatřily světlo světa finální verze žádných komerčních produktů,
které by DAFS podporovaly, takže zatím nelze hovořit o úspěchu nebo neúspěchu
této technologie u zákazníků. Některé společnosti zabývající se vývojem a
výrobou produktů pro NAS a SAN vyjádřily pochybnosti, zda se v případě DAFS
skutečně jedná o otevřený standard. Jiné ovšem s jistotou prohlašují, že
rozhodně ano, přičemž DAFS prohlašují za přirozený další krok v evoluci
technologie NAS. Podle druhé zmíněné skupiny se ostatně všechny výhody
technologie DAFS brzy prokáží v praxi.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.