Architektura pro rychlé grafické operace

Dá se říci, že konstrukce PC v posledních dvaceti letech nezaznamenala zásadní změny. I když se výkonnost pracovníc...


Dá se říci, že konstrukce PC v posledních dvaceti letech nezaznamenala zásadní
změny. I když se výkonnost pracovních stanic zvyšuje nevídaným tempem, stále
vychází z klasické von Neumannovy architektury s centrální sdílenou sběrnicí a
vývoj probíhá hlavně extenzivně, zvyšováním výkonu a přenosových rychlostí.
Zajímavé novinky sem však relativně nedávno vnesla společnost SGI.
Po loňské změně vedení jakoby SGI nabrala nový směr a stále více přehodnocuje
svou dřívější taktiku vyrábět náročné a drahé grafické stanice pro Hollywood.
Kontrakty s Microsoftem daly jasně najevo, že SGI míní vstoupit na rozsáhlý trh
PC, a v únoru letošního roku se tak stalo, když uvedla pracovní stanici Silicon
Graphics 320 s operačním systémem Windows NT.
Dřívější Silicon Graphics změnila také jméno. Dále už pouze SGI, aby bylo znát,
že skončila výhradní orientace na grafiku. Tomuto kroku předcházely dlouhé
přípravy, díky nimž byly s předstihem z platformy IRIX portovány na Windows NT
klíčové softwarové produkty, a SGI díky tomu může i na této platformě ihned
nabídnout komplexní řešení. Po dvouprocesorové 320 na počátku roku přichází
nyní i vyšší, čtyřprocesorový NT model SGI 540. zkušenosti s výrobou
superpočítačů Cray dovolily postupně inovovat architekturu pracovních stanic.
Současné PC
Extenzivní vývoj na poli PC zahrnuje především zvyšování výkonu procesoru a
přenosových rychlostí. Kapacita pamětí a disků roste každé 3 roky čtyřikrát,
takt procesorů také, přenosová rychlost disků 2,5krát.
Nárůst kapacit a výkonnosti jednotlivých subsystémů počítače dovoluje řešit
složitější a rozsáhlejší úlohy. Zároveň vzniká určité napětí v architektuře,
kdy se některé přenosové kanály stávají úzkým hrdlem, rapidně snižujícím
celkový výkon. Taktovací frekvence sdílené sběrnice je omezena (na 33 66 MHz)
zejména jejími rozměry, které nelze dále zmenšovat, takže jediným způsobem
zrychlování je rozšiřování sběrnice na vyšší počet paralelně přenášených bitů.
To je ekonomicky náročné a snižuje to spolehlivost.
Např. grafické operace dříve prováděl výhradně centrální procesor a po sběrnici
se přenášela pouze data. Akcelerační koprocesory si vynutily přesun části
paměti (videopaměť a texturová paměť) na grafickou kartu. Při graficky
náročných operacích ale byla sběrnice opět zahlcena obrovskými přesuny dat.
Datový tok mezi pamětí textur a rastrovým procesorem je extrémně vysoký, takže
je nutné tuto paměť umístit na kartu. Pak je třeba pokaždé textury do karty
nahrát, ale vznikají kompromisy mezi kvalitou textur, jejich počtem a rychlostí
zobrazování, takže je nutné je downsamplovat většinou na 512 x 512 nebo dokonce
64 x 64 pixelů. Proto se začaly zavádět lokální sběrnice taktované na stejné
frekvenci jako procesor.
Rychle se rozšířila PCI, která je ale univerzální a propojuje mnoho vstupně/
výstupních zařízení, takže se z ní později opět vydělila specializovaná
grafická AGP, navíc s možností přímého přístupu do hlavní paměti.
Poměrně lepších vlastností lze dosáhnout připojením point to point, kdy jsou
spolu propojeny jen dva obvody. Díky kratším spojům lze dosahovat frekvencí
přenosu až v řádech stovek MHz. Pro více obvodů se takovýto způsob propojení
nazývá křížový přepínač a typicky umožňuje několik současných toků dat mezi
různými zařízeními.
Integrovaná architektura
Architektura IVC (Integrated Visual Computing Architecture) v nových počítačích
SGI 540 je nejvíce podobná architektuře UMA, použité v pracovních stanicích SGI
O2. Je vystavěna okolo hlavní systémové paměti, ke které jsou rychlým křížovým
přepínačem připojeny ostatní komponenty, jako grafický subsystém, CPU, diskový
subsystém, audio, video, síť atd.
Samozřejmě vznikl problém, jak tuto architekturu implementovat v počítačích
typu PC s procesory Intel tak, aby byly stoprocentně kompatibilní.
Výrobci základních desek PC používají systémovou logiku od Intelu a právě ta
určuje standardní architekturu. Vývojáři SGI tedy navrhli tři vlastní čipy, do
kterých integrovali všechny potřebné vlastnosti včetně např. síťové a zvukové
karty. Čipy nesou názvy Cobalt, Arsenic a Lithium, přičemž zejména Cobalt je
posledním výstřelkem návrhářského umu SGI. Obsahuje větší počet tranzistorů než
procesor Pentium II a než kterýkoli dosavadní procesor MIPS.
Grafický chipset Cobalt
Srdcem systému je čip kombinující grafický systém pro Windows NT, řadič paměti
s vysokou přenosovou rychlostí a multiprocesorové rozhraní pro jeden až čtyři
procesory Intel Pentium II Xeon (nebo Pentium III). Komunikace je řešena
křížovým přepínačem, který na rozdíl od klasické sdílené sběrnice s
jednosměrným přenosem dokáže přenášet dva vysokorychlostní obousměrné datové
toky.
Sběrnice mezi řadičem paměti a RAM přenáší data rychlostí 3,2 GB za sekundu,
šestkrát rychleji než sběrnice AGP 2X. Systém v minimální konfiguraci obsahuje
128 MB RAM, rozšiřitelných DIMM moduly až na 2 GB. Jedná se o ECC paměť se
samoopravným kódem, který detekuje a opravuje jednobitové chyby. Řadič paměti
také disponuje unikátní vlastností pro dynamické alokování, takže velké bloky
paměti (až do 2 GB) jsou podle potřeby dostupné pro texturování, frame buffer,
z-buffer, video, V/V sběrnici a další DMA transakce.
Grafický systém Cobalt urychluje operace s 3D geometrií, provádí clipping
viditelných oblastí, Gouradovo stínování, osvětlování, hardwarové texturování s
trilineárním mip-mapovým filtrováním a odlesky na texturách, bleskové
vyplňování ploch, vyhlazování včetně tzv. full-scene antialisingu, konverze
barevných prostorů pro video a mnoho dalších funkcí. Spočítá 4,2 milionů
trojůhelníků za sekundu, texturuje rychlostí 180 megapixelů/s.
Pro textury a frame buffer se používá systémová paměť. Maximální velikost
textur je 4 000 x 4 000 pixelů, což obnáší 64 MB dat. Pohnout s takovým
obrázkem na běžném počítači je značný problém a Cobalt právě zde ukazuje svou
sílu. Rozlišení 1 280 x 1 024 běží na 85 Hz při barevné hloubce 32 bitů (24
bitů barva a osmibitový alfa kanál),
maximum je 1 920 x x 1 200 při 66 Hz. Standardem je 32
bitový double buffering a 24bitový z-buffer. Specialitou je digitální výstup na
LCD display SGI 1600SW.
Závěr
Systém disponuje pokročilými schopnostmi zpracování multimédií. Integruje vstup
a výstup kompozitního videa, S-videa a DV (IEEE 1394 neboli FireWire, 400 MB/s)
s 12krát vyšší rychlostí než 32bitové PCI (1,6 GB/s). Architektura zvládne
současný přenos dvou nekomprimovaných videostreamů. Dvě 64bitové nezávislé PCI
sběrnice svou šířkou pásma podporují vysokorychlostní disky a sítě, jako jsou
ATM a FDDI.
Návrhářům od SGI se podařilo vytvořit výkonnou pracovní stanici pro použití
zejména ve 2D a 3D grafice a pro zpracování videa. Kvůli kompatibilitě se všemi
dosavadními i budoucími aplikacemi byla mezi SGI, Intelem a Microsoftem
uzavřena trojstranná dohoda o odtajnění svých plánů do budoucna. Vizuální
pracovní stanice SGI by tak měly bez jakýchkoli dodatečných úprav podporovat
Windows 2000, ve kterých už budou ošetřeny i některé nové vlastnosti těchto
počítačů, které zatím zůstávají nevyužity (FireWire, USB).
9 2342 / pen









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.