Clusterový síťový hardware

Komponenty pro stavbu superpočítačů Při budování clusteru je jednou z nejdůležitějších položek, která rozhodne o ...


Komponenty pro stavbu superpočítačů
Při budování clusteru je jednou z nejdůležitějších položek, která rozhodne o
vlastním výkonu celého systému, síťová vrstva. Oproti normálnímu provozu jsou
zde totiž kladeny úplně odlišné požadavky po síti se u clusterů přenáší daleko
větší množství malých paketů (messages) než při normálním síťovém provozu.
Kromě každému dobře známé maximální šířky pásma tak do hry vstupují další
parametry, především minimální latence (zpoždění). Jednotlivé uzly v clusteru
totiž většinou chtějí opravdu jen drobné informace. Problémem normálních
síťových karet je pak mnohem delší doba potřebná pro vlastní sestavení paketu a
navázání komunikace, než pro její poslání. Na závěr se samozřejmě nesmí
zapomenout na cenu a podporu tohoto hardwaru v operačním systému počítače.
Podívejme se tedy na některé vybrané zástupce:
ATM (Asynchronous Transfer Mode) splňuje vetšinu požadavků kladených na
rychlost (latence je 120 mikrosekund) a spolehlivost (má malý over-head a
efektivně si poradí s malými zprávami). Nevýhodou je ovšem její relativně
vysoká cena.
Ethernet zejména pro svou cenu bude asi řešením, na kterém svůj testovací
cluster postavíte. Pokud máte ovšem nějaké vyšší cíle se svým superpočítačem,
tak musíte počítat v budoucnu se změnou Ethernet totiž byl opravdu stavěn za
jiným cílem než spojovat jednotlivé uzly clusteru. Nesmí se samozřejmě
zapomenout na jeho modernější bratříčky jako je Fast a Gigabit Ethernet, které
požadavkům kladeným na clusterovou síťovou vrstu vyhoví o malinko lépe.
Myricom síťové karty této společnosti jsou velice často voleny pro cluster
zejména díky své hodnotě zpoždění (kolem 9 mikrosekund) a také díky své velice
dobré implementaci pro operační systémy (více informací najdete v článku
věnovaném clusteringu pod Linuxem, začínajícím na straně 18).
SCI úkolem tohoto rozhraní je nabízet síťovou vrstvu zejména pro clustery
založené na sdílené paměti. Je podobně jako Myrinet znám svou malou latencí,
která je kolem 3 mikrosekund, a dobrou implementací v OS (více na str. 18).
SCCI (Small Computer Systems Interconnect) překvapivě tento výčet uzavřeme
trochu nečekaně, SCSI rozhraní je známo především jako možnost, jak připojovat
jednotlivé disky a zařízení k počítači. Zapomíná se ovšem na to, že jej lze
využít také při konstrukci clusteru (v tomto případě jen dvouuzlového). To je
velice užitečné při stavbě sdílených disků a implementaci fail-over mechanismu.
0 1901 / alsn









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.