Opteron vs. Xeon v pracovní stanici

Intel nadělil serverovému procesoru Xeon DP postavenému na jádře Irwindale 2 MB vyrovnávací paměti druhé úrovně, co...


Intel nadělil serverovému procesoru Xeon DP postavenému na jádře Irwindale 2 MB
vyrovnávací paměti druhé úrovně, což by dle informací společnosti mělo znamenat
až 20% nárůst ve výkonu při jeho osazení do pracovních stanic. Zdali je tomu
opravdu tak, jsme se rozhodli posoudit na profesionálních aplikacích.
Již v červnu 2004 protektoroval Intel svoji xeonovou platformu pro dva
procesory a díky jádru Nocona dostal Xeon DP do vínku další funkcionality,
jakými jsou například instrukce SSE3, 64bitové rozšíření EM64T, jakož i
technologie SpeedStep vytvořená za účelem úspory energie (procesor se při nižší
zátěži přepíná na nižší frekvenci). Od listopadu 2004 jsou procesory (s E0
steppingem) dále vybaveny XD technologií, která slouží k robustnější ochraně
před přetékáním bufferu.
Pohled na základní rysy nového "dvouprocesorového" Xeonu s kódovým označením
Irwindale ukazuje, že čip není příliš odlišný; až na vyrovnávací paměť druhé
úrovně (L2 cache), kterou Intel zdvojil (z 1 na nynější 2 MB). Na druhou stranu
Intel opět "nešetřil" na frekvenci: 3,6 GHz zůstává u Irwindale i nadále
maximem. Implementace 2MB vyrovnávací paměti má u velké pracovní zátěže (v
oblasti serverů a pracovních stanic) zredukovat přístup do paměti. Při stejné
taktovací frekvenci je podle Intelu u nového Xeonu možný až 20% nárůst výkonu.
Co se týká pamětí, využívá Xeon Irwindale i nadále DualDDR2-400 SDRAM, a to ve
spojení s čipovou sadou E7525, určenou pro pracovní stanice. Nové PC tímto
zůstává kompatibilní s platformou stávajících systémů disponujících 800MHz FSB.
Také u konkurenta, společnosti AMD, se toho příliš nezměnilo. Opteron 250
prokázal při náročných grafických aplikacích určených pro pracovní stanice,
svým svižným přístupem do paměti mimořádnou výkonnost. A v únoru představený
nový Opteron 252 (v prodeji od března 2005) za svým bratříčkem rovněž
nepokulhává.

Xeon DP
Intel nabízí Xeon DP s jádrem Irwindale ve čtyřech modelech s taktovací
frekvencí od 3 do 3,6 GHz. Velikost datové L1 cache zůstává oproti předchůdcům
s kódovým označení Nocona nezměněna, tj. má 16 KB, L2 (jak jsme již zmínili)
byla zdvojena z 1 na 2 MB a L3 cache se musejí procesory Irwindale i nadále
vzdát. Stejně jako u Nocony pracuje u Irwindale procesorová sběrnice na 800 MHz
a jeho výroba probíhá 90nm výrobním postupem. Všechny procesory Xeon DP pak
samozřejmě podporují Hyper-Threading a jsou určeny pro Socket 604.
Xeony založené na jádru Irwindale nebo Nocona budou po určitou přechodnou dobu
nabízeny paralelně. Výrobce dokonce ještě ve svém ceníku uvádí starší Xeon
založený na jádře Prestonia (viz tabulka na straně 21).

Opteron
Latinský výraz "optimus" znamená česky "nejlepší" a právě z tohoto slova
odvodilo AMD jméno Opteron. Tímto procesorem společnost AMD oslovuje výrobce
serverů a pracovních stanic a nabízí ho jako řešení pro 1, 2 až 8procesorové
systémy.
Opteron je k dispozici s taktovací frekvencí od 1,4 až po 2,6 GHz. Od února
2004 nabízí AMD také nízkonapěťové verze CPU v podobě Opteronů EE a HE s TDP
hodnotami od 30, popřípadě 55 W namísto 82 až 89 W u standardních modelů.
Všechny Opterony jsou dále vybaveny 64KB L1 cache určenou pro data a instrukce
a vyrovnávací pamětí druhé úrovně (L2 cache) o velikosti 1 MB.
Nižší latenční doba u přístupu do paměti je u Opteronu možná díky integrovanému
DDR333 SDRAM kontroléru. Opterony také dodatečně (od revize jádra C0) podporují
paměti DDR400. Pomocí celkem 8 DIMM modulů (4 pro každý kanál) se dá pro jeden
procesor použít až 8 GB paměti. U I/O konceptu AMD nahrazuje běžné paralelní
FSB rozhraní za HyperTransport, s jehož pomocí Opteron komunikuje s I/O systémy
nebo dalšími procesory.
14. února představilo AMD Opterony 152, 252 a 852 s taktovací frekvencí 2,6
GHz, které pracují se sběrnicí HyperTransport zrychlenou na 800 až 1 000 MHz.
Dodatečně tyto modely podporují také instrukční sadu SSE3. Výroba 2,6GHz modelů
probíhá 90nm výrobním postupem pomocí technologie SOI (Silicon On Insulator).
Podle prohlášení AMD jsou Opterony 252 a 852 k dispozici od března. Opteron 152
začne výrobce dodávat od 30. dubna 2005.

Poznámky k benchmarku
Xeon DP s jádrem Irwindale testovali naši němečtí kolegové, přičemž provedli
srovnání jak s jeho předchůdci, čipy Nocona a Prestonia, tak i s procesory
Opteron. Využívali přitom aplikace postavené na rozhraní Direct3D nebo OpenGL
či aplikace, jež uplatňují rendering. Profesionální software jako 3ds max,
AutoCAD či Maya vyžaduje vedle procesorů i maximální výkon od grafických karet.
Do testovacího stroje tedy nainstalovali akcelerátor nVidia Quadro FX3400.
Kromě toho se procesory pro pracovní stanice musí osvědčit v duálním (dva
současně instalované CPU) provozu. Všechny procesory tedy prošly testy v jednoa
dvouprocesorovém provozu. Xeony kolegové testovali vždy s aktivovaným
Hyper-Threadingem. Operační systém Windows XP Professional SP1a pracoval při
všech testech s multiprocesorovým jádrem.

Testovací platformy
Pro test procesorů Irwindale a Nocona jsme měli k dispozici základní desku
Supermicro X6DA8-G2, určenou ke stavbě pracovní stanice se dvěma procesory.
Deska používá čipovou sadu E7525 Turmwater od Intelu a podporuje DualDDR2-400
SDRAM paměti (konkrétně šlo o paměťové moduly PC2-3200R od Infineonu s CAS
latencí 3). Grafická karta využívala slot PCI Express x16.
Xeony DP postavené na jádře Prestonia (FSB 533 MHz) byly osazeny do základní
desky Intel SE7505VB2 s čipovou sadou E7505 (tento čipset je předchůdce čipové
sady E7525). Díky E7505 jsme ji museli osadit pamětí DDR266 s CL3.
Procesory Opteron byly testovány v základní desce MSI K8T Master2, vybavené
čipovou sadou VIA K8T800 a CL2 SDRAM DDR400 moduly od společnosti Mushkin.
Pro zaručení stejné testovací konfigurace byl procesorům k dispozici vždy 1 GB
operační paměti a stejný diskový subsystém sestávající z pevných disků SCSI
Ultra320 s 10 000 ot./min (připojených řadičem Adaptec 2200S s pamětí o
velikosti 64 MB).

Grafické karty
U pracovních stanic má výkon rozhodující význam hlavně v aplikacích náročných
na grafiku. Při našem testování jsem tedy vsadili na pro pracovní stanice
certifikované OpenGL karty řady Quadro FX, kterou vyrábí společnost nVidia.
Při testech procesorů Irwindale/Nocona jsme do slotu pro grafickou kartu PCI
Express x16 umístili akcelerátor Quadro FX 3400. Tento high-endový model série
Quadro (určený pro slot PCI Express) disponuje 256MB GDDR3 pamětí (frekvence
900 MHz) a 256bitovým rozhraním. Quadro FX3400 je postavena na čipu NV45GL
(frekvence jádra 350 MHz).
V základních deskách se slotem AGP 8x určených pro Opteron a Xeon DP Prestonia
jsme použili grafickou kartu Quadro FX4000. Na této kartě se nachází čip
NV40GL, který je považován za AGP ekvivalent k čipu NV45GL u karty Quadro FX
3400. Standardně pracuje na 375MHz frekvenci jádra (paměti pracují s 1 000MHz
frekvencí).
Pro zajištění srovnatelných testovacích podmínek jsme u systémů s AGP i slotem
PCI Express snížili frekvenci jádra i pamětí tak, aby byla u obou shodná. Obě
karty byly dále osazeny 256MB GDDR3 SDRAM pamětí se šířkou sběrnice 256 bitů.

Závěr
U desktopových procesorů se mluví čím dál více o "vlastnostech" a méně o
"gigahertzích". Ale v oblasti pracovních stanic se v konečném efektu přece jen
počítá čistý výkon. A přesně toho se Intel snaží s procesorem Xeon Irwindale
dosáhnout. Nenajdete tedy u něj žádné nové vlastnosti, "pouze" zdvojenou
vyrovnávací paměť L2 o velikosti 2 MB ta charakterizuje nový Xeon s pracovní
frekvencí 3,6 GHz.
Zvětšení L2 cache mělo za následek v profesionálních aplikacích, jako jsou 3ds
max, Maya a AutoCad v průměru o cca 8 % vyšší výkon, než tomu bylo u Xeonu
Nocona s 1 MB cache. Podle vytížení urychluje větší buffer aplikaci někdy sotva
o 20 %. Samozřejmě existují také případy, kdy větší cache u renderování výkon
vůbec neovlivní.
Xeon Irwindale nabízí mnoho vlastností (EM64T, SpeedStep a XD technologii).
Těmi disponuje rovněž Opteron, přičemž 64bitové rozšíření, ale i rozšířená
ochrana před viry jsou u něj k dispozici již od svého uvedení v dubnu 2003.
Úsporná technologie PowerNow! je v Opteronech integrovaná rovněž ji téměř rok.
Doposud ovšem chybí odpovídající podpora BIOSu ze strany základní desky.
Díky instrukční sadě SSE3 má Irwindale (i Xeon s jádrem Nocona) oproti Opteronu
ještě o jednu vlastnost navíc. Při odpovídající optimalizaci programového kódu
stoupá díky SSE3 v některých aplikacích výkon až o 25 %. Ovšem tuto instrukční
sadu využívá dnes zatím jen velice málo programů. Od uvedení Opteronu 252,
který byl představen 14. února 2005, podporují instrukční sadu SSE3 rovněž
procesory AMD. Nejvýkonnějším protivníkem Xeonu je v současné chvíli Opteron
250 s taktovací frekvencí 2,4 GHz, přičemž jak je vidět z tabulky výsledků
testů, oba procesory se pravidelně (dle testovací aplikace) střídaly na špici.
Zajímavé je škálování výkonu v dvojprocesorovém režimu. U klasických
dvouprocesorových aplikací určených k renderingu, urychluje druhý procesor
práci o cca 80 až 90 %. Zde jednou (opět podle zvolené aplikace) "škáluje" lépe
Xeon, podruhé zase Opteron. Pokud by software, jako například 3ds max, prováděl
místo renderingu operace náročné na grafickou výpočetní sílu, které nepoužívají
žádné SMP (podpora pro využití více procesorů při výpočtu scény), Opteron by
jeho výkon výrazně zbrzdil.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.