Sběrnice HyperTransport pro extrémně rychlou komunikaci

Paměťová a I/O propojení v počítačích se po nástupu rychlých CPU v posledních letech stala hlavním úzkým hrdlem,...


Paměťová a I/O propojení v počítačích se po nástupu rychlých CPU v posledních
letech stala hlavním úzkým hrdlem, které je překážkou dalšího růstu výkonu.
Technologie HyperTransport by měla se šířkou pásma až 12,8 GB/s zajistit
dostatečnou rezervu proto také našla široké uplatnění v procesorech Opteron a
Athlon 64 společnosti AMD, a v systémech na nich postavených slouží jako CPU i
systémová sběrnice.
Taktovací frekvence procesorů se od roku 1978 posunula z hodnoty 4,77 MHz až na
2,4 GHz u procesorů společnosti AMD, zatímco čipy firmy Intel dnes sahají až k
hranici 4 GHz, přičemž současně vzrostla šířka datové sběrnice ze 16 na 64
bitů. Zmíněné parametry dnešním čipům umožňují pracovat s až 2 000krát větším
množstvím dat za sekundu, než tomu bylo před 25 lety, a to vůbec nehledě na
rychlé přenosy prostřednictvím 128 bitů širokých multimediálních registrů.
Ve srovnání s tím však zlepšování parametrů I/O sběrnic od 8bitové ISA sběrnice
pracující na frekvenci 4,77 MHz k PCI-X se 133 MHz a šířkou 64 bitů výrazně
pokulhává, neboť odpovídá pouze 20násobnému zrychlování.

Univerzální řešení
I/O sběrnice se přitom jako úzké hrdlo neprojevuje pouze při přístupu k
rozšiřujícím kartám, neboť standardní sběrnice je částečně využívána také pro
výměnu dat mezi komponentami na základní desce. Proto výrobci čipsetů začali
vyvíjet své vlastní vysokorychlostní sběrnice například pro komunikaci mezi
čipy NorthBridge a SouthBridge nebo mezi více procesory v serverech. Díky tomu
může kupříkladu 16 bitů široké propojení MuTIOL firmy SiS poskytnout přenosovou
rychlost až 1 GB/s. Proprietární sběrnice nicméně vyžadují enormní náklady na
vývoj a navíc vylučují spolupráci čipů různých výrobců.
HyperTransport by měla coby univerzální sériová sběrnice vyřešit všechny
problémy s výkonem i kompatibilitou. Jakožto cenově výhodná, škálovatelná a
rychlá technologie by měla sloužit nejenom ke vzájemnému propojení periferních
komponent na základní desce. Například 64bitové procesory Opteron společnosti
AMD komunikují s vnějším světem pouze prostřednictvím tří nezávislých
HyperTransport propojení, a v SMP (Symmetric Multiprocessing) systémech přes ně
sahají dokonce i do operační paměti. V budoucnu by HyperTransport pozice měly
sloužit také pro rychlé připojení rozšiřujících karet.

Vývojové cíle
Sběrnice HyperTransport dnes slouží výhradně k propojení dvou čipů umístěných
na jedné desce. Díky tomu ji nelze přímo srovnávat s externími I/O sběrnicemi,
jako je třeba PCI, PCI-X nebo PCI-Express. Data proto musejí procházet z
procesoru přes sběrnici HyperTransport k odpovídajícím stavebním prvkům, které
nabídnou příslušná rozhraní pro připojení dalších komponent (zásuvných karet
atd.). Infiniband, 10-GByte Ethernet, PCI-X nebo Simple I/O mosty pak přeměňují
signál sběrnice HyperTransport na data určená pro příslušná rozhraní.
Při vývoji HyperTransportu hrály rozhodující roli následující konstrukční
požadavky:
Vysoká šířka pásma při nižší latenci.
Jednotná sběrnice a společný protokol pro veškerá propojení na základní desce.
Flexibilní rozsah rychlostí a variabilní šířka sběrnice.
Různé rychlosti podle směru.
Co možná nejméně vodičů a levné rozhraní čipu.
Menší spotřeba energie a využití mechanismů pro úsporu proudu.
Podpora multiprocesorových systémů a sběrnic System Network Architecture.
Vývoj nové I/O sběrnice řídí organice HyperTransport Consortium založená v
červenci 2001, přičemž univerzálně formulované požadavky odrážejí potřeby
jejích členů z nejrůznějších oblastí k nejznámějším zástupcům konsorcia patří
vedle společností AMD, Sun, Apple, SGI, Transmeta, nVidia a také firmy ze
segmentu sítí, jako jsou Cisco, Broadcom a Api Networks.

Modulární struktura
Sběrnice HyperTransport propojuje dva čipy způsobem point-to-point (bod-bod).
Aby bylo možné takto vytvořit komplexní zapojení, jsou k dispozici tři
generické typy nástrojů:
Cave: Tento typ sestává pouze z jediného propojení HyperTransport Link. Je
umístěno na konci řetězce a přijímá data určená pouze pro něj.
Tunnel: Tunel sestává ze dvou propojení HyperTransport Link. Přijímá data,
filtruje je a předává jiným zařízením v řetězci na odpovídajícím "protějším"
výstupu.
Bridge: Most využívá typicky tři propojení HyperTransport Link. Odpovídajícím
způsobem přijímá vlastní a předává cizí data dalším článkům v řetězci.
Zvláštním případem je Host Bridge, který jakožto výchozí bod celé topologie
přebírá řízení ten může být propojen s další nezávislou sítí a zajistí
vzájemnou výměnu dat.
Každá topologie založená na technologii HyperTransport zahrnuje na "špici"
zmíněný Host Bridge, který řídí datový provoz. Budoucí síťová rozšíření mají
umožnit také přímou peer-to-peer komunikaci mezi součástkami na desce.
Například v systémech s procesory AMD přebírá roli Host Bridge samotné CPU,
přičemž v řetězci může být za sebou propojeno až 32 zařízení, z nichž každé
obdrží unikátní ID. V určitých aplikacích může řetězec obsahovat i dva Host
Bridge toho lze využít zejména v clusterech a redundantních systémech, které
sdílejí společné I/O komponenty. V takovém případě pracuje jeden Host Bridge
jako Master a zajišťuje správu všech zařízení, zatímco druhý je zapojen jako
Slave a může ke každému z nich nezávisle na Masteru přistupovat.

Přepínání
Kromě Host Bridge je od verze 1.05 specifikován také tzv. Switch, který
dovoluje vytvářet odlišné struktury. Switch spravuje více vstupů pro zařízení
Host a Cave a v případě potřeby umožňuje přímé propojení mezi nimi tak, že
vytváří virtuální tunel.
V nejjednodušším případě Switch rozděluje datový provoz Host Bridge mezi více
zařízení, která nejsou zapojena za sebou v řetězci, ale vedle sebe (tedy ve
stromové struktuře). Takové zapojení umožňuje snížit latenci, neboť Host může
na jednotlivá zařízení snáze "dosáhnout". Switch výrazně snižuje riziko
výpadku, neboť zatímco porucha jednoho článku v řetězci způsobí ochromení
celého řetězce, u topologie využívající Switche k tomu dojít nemůže. Navíc lze
s jeho pomocí na základě kaskádování propojit daleko více než 32 zařízení.
HyperTransport využívá diferenční přenos vysokofrekvenčního signálu na základě
metody LVDS (Low Voltage Diferential Signaling) při nízkém napětí 1,2 V (což se
projevuje i v nižší spotřebě). Elektrické specifikace umožňují návrh levnějších
čtyřvrstvých základních desek a díky odolnosti diferenčního přenosu proti
rušení může délka vodičů při taktovací frekvenci 800 MHz dosahovat až 60 cm.
Se jmenovanými stavebními prvky lze vytvořit libovolnou topologii od
jednoduchých propojení mezi dvěma čipy přes celý řetězec až po komplexní
stromové struktury. Tyto topologie bývají označovány také termínem Fabric.

Škálovatelnost
Jedna z výhod HyperTransportu spočívá ve škálovatelnosti šířky sběrnice, tedy v
tom, že bitovou šířku i taktovací frekvenci každého propojení je možné
jednotlivě přizpůsobit podle potřeby. Takto může být realizováno rychlé a
široké propojení mezi CPU a AGP 8x tunelem s rychlostí několika GB/s. Delší
cesta k pomalému SouthBridge pak může být realizována snáze a k tomuto účelu by
měla postačovat rychlost 1 GB/s. Prostřednictvím jednotné sběrnice je možné
kombinovat různá zařízení různých výrobců. Takto mohou být v jednom řetězci bez
problému propojeny například základní deska s AGP mostem, PCI-Express rozhraní
a I/O hub. Návrh nového zapojení se tím pro výrobce redukuje na volbu
existujících stavebních bloků a připomíná jakousi inženýrskou verzi stavebnice
Lego.

Fyzické rozhraní
HyperTransport nabízí se šířkou pásma necelých 60 MB/s na každý pin velmi
vysokou rychlost přenosu dat, kterou bude schopen překonat pouze nový a na trhu
se velmi pomalu rozšiřující standard PCI-Express. Nicméně zatímco
HyperTransport se dodneška už pevně zabydlel na trhu a ve svých designech s ním
počítá množství výrobců, bude ještě chvíli trvat, než se specifikace
PCI-Express prosadí v širším měřítku.
Sběrnice HyperTransport sestává na nejspodnější vrstvě ISO/OSI modelu ze dvou
jednosměrných point-to-point propojení a datová šířka se může pohybovat od 2 až
po 32 bitů (konkrétně to může být 2, 4, 8, 16 a 32 bitů). Vyloučena není ani
asymetrická konfigurace s různými šířkami pro každý směr. Taktovací frekvence
pro datové spoje pak může nabývat hodnot od 400 MHz až po 1,6 GHz (DDR).
Příkazy, adresy i data využívají tytéž komunikační kanály a jsou přenášeny v
paketech o velikosti 4 bajty. Vlastní řídicí vedení zabezpečuje rozlišování
mezi příkazy (s adresami) a daty a jako poslední vysokofrekvenční vedení je
nezbytný ještě taktovací signál.
Protože HyperTransport přenáší data na obou hranách taktu, skutečný takt
sběrnice je oproti datové frekvenci poloviční. Aby při vzrůstající šířce
sběrnice nemohlo u paralelních sběrnic dojít k problémům s časováním, odpovídá
taktovací signál maximálně osmi bitům, u 32bitové sběrnice se pak přidružují 4
taktovací signály. V rámci každé skupiny musejí být strojové časy i délky
vodičů při směrování na základní desce přibližně identické. Při frekvenci 1,6
GHz může časový posuv činit pouze 20 pikosekund, což odpovídá rozdílu několika
milimetrů v délkách vodičů, mezi různými skupinami už je dovolen rozdíl 1 000
pikosekund. Sběrnici HyperTransport doplňují ještě čtyři další vodiče, které
pracují v nekritické nízkofrekvenční oblasti a slouží pro resetování, řízení
spotřeby atd.

Procesory AMD
Na technologii HyperTransport dnes sázejí především 64bitové procesory Opteron
(pro servery) a Athlon 64 (pro desktopy či notebooky) společnosti AMD. Ty
obsahují integrovaný NorthBridge (ve světě x86 procesorů AMD a Intel je tomu
tak poprvé), který přímo komunikuje s pamětí, klasický proprietární FrontSide
Bus zcela odpadá. Kompletní komunikace se všemi ostatními systémovými
komponentami už závisí výhradně na HyperTransportu. S využitím třech
nezávislých HyperTransport rozhraní je možné stavět bez použití propojovací
logiky až 8cestné servery, kde jsou všechna CPU přímo propojena právě s jeho
pomocí. Díky integraci NorthBridge je návrh HyperTransport I/O čipsetů (bohužel
pro množství tchajwanských výrobců) daleko jednodušší, než tomu bylo u jejich
předchůdců. Procesor Opteron obsahuje tři nezávislá HyperTransport rozhraní,
která při šířce 16 bitů a fyzické taktovací frekvenci 800 MHz nabízejí šířku
pásma 6,4 GB/s v obou směrech, dohromady tedy 19,2 GB/s.

Další aplikace
Sběrnice HyperTransport si získává stále širší podporu také ze strany dalších
výrobců využití nalezla v herních konzolích Xbox společnosti Microsoft, v
počítačích Apple Power Mac G5, ve směrovačích Cisco či serverech výrobců Sun
Microsoystems a HP, v superpočítačích Cray a IBM nebo také v procesorech
Transmeta Efficeon, určených především pro přenosné počítače. Optimismus
vzbuzuje i nová verze specifikace (viz vložený text), která naznačuje, že i v
budoucnu bude HyperTransport představovat velmi konkurenceschopnou technologii.

Druhá verze sběrnice
Další vývoj technologie HyperTransport naznačily události z počátku letošního
roku, kdy HyperTransport Consortium zveřejnilo specifikace pro její druhou
verzi. HyperTransport Release 2.0 nabízí především výrazně vyšší rychlost ve
třech variantách úrovně taktovací frekvence sběrnice a možnost lepšího mapování
na PCI-Express. Současnou přenosovou kapacitu 1,6 Gb/s na jeden pin nová verze
zvyšuje na 2,0, 2,4 nebo až 2,8 Gb/s na pin při taktu 1,0, 1,2 a 1,4 GHz (opět
je využíván dual-data rate přenos) takto je možné dosáhnout agregované šířky
pásma až 22,40 GB/s oproti dosavadním 12,8 GB/s v obou směrech.
Používané protokoly, které podporují vyšší taktovací frekvence, jsou přitom
zpětně kompatibilní s předchozími verzemi elektrických specifikací
HyperTransportu. Navíc systémové součásti kompatibilní s PCI-Express by měly
být kompatibilní i s HyperTransportem.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.