Velká 64bitová přestřelka má jasného vítěze

Vyzbrojeni důležitými benchmarky jsme se rozhodli na následujících řádcích odpovědět na ožehavou otázku: Dokáže...


Vyzbrojeni důležitými benchmarky jsme se rozhodli na následujících řádcích
odpovědět na ožehavou otázku: Dokáže se v 64bitovém provozu nadupaný Xeon od
Intelu vyrovnat Opteronu, který produkuje jeho procesorový rival, společnost
AMD? Podle volné parafráze Benjamina Disraeliho existují lži, zpropadené lži a
benchmarky. Syntetické testy procesorů poskytují sice celou řadu údajů a
pomáhají odhalit silné a slabé stránky architektury čipů, ale podstatnější je,
jak jsou procesory výkonné v praktickém provozu.
Již v úvodu jsme konstatovali, že nedávno jsme použili aplikační benchmarky
(používají reálně nasazované aplikace), abychom otestovali server Dell
PowerEdge se zcela novým procesorem Xeon s implementovanou technologií EM64T
(Extended Memory 64 Technology), který měl být odpovědí Intelu na Opteron od
AMD. Ale procesor od Intelu byl natolik nový, že jsme se museli držet
32bitových benchmarků a odložit testování schopností 64bitového x86 čipu, jež
jsou založeny na standardu AMD x86-64; nejsou však totožné.
Čekání je u konce vypulírovali jsme naše aplikační 64bitové benchmarky pro
instrukční sadu EM64T a vrhli jsme se na testování. Výsledky potvrzují to, co
tvrdil technický ředitel TestCentra a náš kolega z amerického Infoworldu Tom
Yager na začátku srpna: AMD je v oblasti procesorů třídy x86-64 výkonnostně
vpřed a Intel má co dohánět. Ačkoliv Xeon EM64T nesedí shrbený v koutku,
Opteron má navrch.

Bitva 64bitových motorů
Na zapůjčených serverech společností Dell a Newsys jsme se rozhodli provést
jednoduché reálné benchmarky, abychom splnili cíl měření produkční výkonnosti.
A protože cílem bylo srovnat 64bitovou výkonnost obou konkurenčních procesorů,
používali jsme po celou dobu pouze 64bitový kód.
Maximálně jsme se přitom snažili, aby oba testovací systémy byly co
nejpodobnější. Na straně Intelu jsme testovali Dell PowerEdge 2800 s dvojicí
3,6GHz Xeonů EM64T, 4 GB RAM a 36GB disky s rozhraním Ultra320 SCSI. Jako
zástupce AMD jsme zvolili server Newisys 2100 s dvojicí 2,4GHz Opteronů 250, 4
GB RAM a rovněž 36GB Ultra320 SCSI pevnými disky. Klientským systémem
používaným pro externí testy byl Compaq ProLiant ML370, na kterém byl
nainstalován Red Hat AS 3.0. Počítač byl vybaven dvěma 32bitovými 2,8GHz Xeony
a 4GB operační pamětí. Všechny systémy byly zapojeny do gigabajtové sítě.
Při výběru operačního systému pro oba testované servery je jednoznačnou volbou
Linux, protože Microsoft stále ještě 64bitovou serverovou platformu nenabízí;
Linux ji už má tři roky. U obou systémů jsme jako základ zvolili distribuci Red
Hat Advanced Serveru 3.0 běžícího na jádru Red Hat 2.4-21-15.EL. Přesněji šlo o
Red Hat AS 3.0 U3 pro x86-64, který byl aktualizován všemi v době testu
dostupnými možnostmi.
Samotné benchmarky zahrnovaly test výkonnosti v databázovém prostředí MySQL
3.23.58 prováděný nástrojem sql-bench od MySQL, dále jsme prověřovali statickou
a dynamickou funkčnost webu postaveného na serveru Apache 2.0.46. Pro ty, které
zajímá výkonnost HPC, jsme také použili benchmarky Linpack via HPL (High
Performance Linpack).
Výsledky testu byly přesvědčivé. Ve všech aplikačních testech předčil server
Newisys s procesory Opteron 250 systém s čipy Xeon EM64T navzdory tomu, že
posledně jmenovaný byl osazen rychlejšími CPU s vyšší taktovací frekvencí. Po
celá léta Intel zdůrazňoval, že vyšší taktovací frekvence je to hlavní, a že
3,6GHz procesor bez problémů vždy předčí CPU o taktovací frekvenci 2,4 GHz. V
těchto testech procesor Opteron 2,4 GHz ale předčil Xeon 3,6 GHz EM64T na celé
čáře. Zdá se, že taktovací frekvence opravdu není všechno.

Nahoru a dolů...
Zajímavé rozdíly ve výkonnosti se mezi oběma servery objevily v téměř všech
fázích testování; podívejme se tedy na benchmarky souvisejícími s webovým
serverem. Zde jsme použili benchmarkový nástroj Apache proti 100,5KB statické
stránce. Rovněž jsme provedli testy s CGI skriptem napsaným v Perlu, který
vytahoval data z MySQL databáze, zobrazoval tabulku obsahující 210 řádků dat
vybraných z databáze o 3 500 řádcích v 10 sloupcích. Statickou stránku zobrazil
Opteron jednoduše s výsledkem o 21 % lepším než Xeon EM64T; u dynamické stránky
dopadl souboj téměř stejně, zde byl výsledek čipu AMD lepší o 25 %.
V reálných číslech to znamená, že systém s Opteron obsloužil u webového
benchmarku se statickou stránkou o více než 700 dotazů za sekundu více než
duální systém s Xeony EM64T a o 10 dotazů za sekundu více u dynamické stránky.
Tyto výkonnostní výhody, které nabízí Opteron, není rozhodně možné přehlédnout.
Testy s databázovým programem MySQL dále potvrzovaly vynikající výkon Opteronu.
Když jsme spouštěli tyto benchmarky, dosáhli jsme v průměru o 26 % lepší
výkonnosti s Opteronem, který test dokončil téměř o devět minut dříve než
systém s čipy Xeon EM64T. Tento test se poněkud více spoléhá na diskové I/O,
než tomu bylo u webového testu, nicméně tyto dva servery byly téměř stejně
výkonné pokud jde o výkon diskového subsystému.
Kde čip společnosti Intel ukázal nějaké svaly, byly testy HPL. Protože jsme na
počátků testů neměli k dispozici benchmarky optimalizované pro EM64T BLAS
(Basic Linear Algebra Subroutines) knihovny, kontaktovali jsme Kazushige Gota,
člena Texas Advanced Computing Center na Texaské univerzitě v Austinu. Goto je
známý svou prací s optimalizovanými BLAS knihovnami pro HPC computing, údržbou
knihoven pro několik procesorů včetně Opteronu, PowerPC 970 a Xeonu. Goto tedy
pro nás vytvořil optimalizovanou knihovnu pro procesory EM64T, na což ale
potřeboval nějaký čas (pro novější 3,6GHz Xeony a duální CPU systémy). Díky
přístupu k systému EM64T v naší laboratoři a celé řadě e-mailů Goto v krátkém
čase uvolnil optimalizovanou BLAS knihovnu pro CPU EM64T (přitom sám v naší
laboratoři spustil HPL testy na hardwaru).
Systém s čipy Xeon EM64T se ale vyznamenal u výpočtů s vysokými čísly s
pohyblivou čárkou vykázal o 44 % vyšší výkonnost než identický test spuštěný na
Opteronech. Ale to ještě není konec. Jak Goto říká: "Vysoké skóre v HPL
benchmarku neznamená, že procesor je výkonný při výpočetních operacích." Rutiny
v HPL DGEMM rutinách mohou schovávat dlouhou latenci vyrovnávací paměti, což je
problém procesorů Xeon EM64T.
Potenciálně důležitější číslo vzešlo z testů souvisejících s účinností CPU. V
testech s jedním procesorem dosáhly Opteron a EM64T téměř identických hodnot,
kde Opteron vykazoval 89,9% a EM64T se blížil k 88,3% účinnosti. To
nejzajímavější ale přichází s prověřováním duálních procesorových systémů.
Opteron dosáhl špičkové výkonnosti 88,8 % a EM64T dosáhl hodnoty 84,8 %. V
prostředí HPC tedy bude dlouhá latence vyrovnávací paměti druhé úrovně u EM64T
nevýhodou; architektura NUMA Opteronu bude naopak značným přínosem.

Sleduj vůdce
Intel je zvyklý být v oblasti vývoje a výroby procesorů jakýmsi vůdcem, ale
nyní musí kvůli zajímavému počinu (jde o procesory Opteron) společnosti AMD
skřípat zuby; zejména když bylo Itanium těžce propagováno jako odpověď na
všudypřítomné 64bitové výpočty. Není téměř pochyby, že instrukční sada IA64
Itania je lepší než instrukční sada x86-64 vyvinutá AMD, ale to je pouze část
příběhu.
Kompatibilita a cena obecně vyhrávají nad výkonností. Pokud bude Intel hrát na
obou frontách IA64 i x86-64 a AMD se bude držet svojí konkurenční výhody v
x86-64, bude to do budoucna zajímavý souboj. Intel je nyní v nepříjemné pozici,
protože má na trhu dva svoje 64bitové procesory a kapitulace v souboji s AMD s
EM64T čipem bezpochyby poškodí prodej Itania.
Na trhu, na rozdíl od tohoto testu, jsou k dispozici další 64bitové procesory.
Je jich ale pouze několik: od Sunu je tu téměř na vymření procesor Sparc nebo
procesor PowerPC 970 od IBM, lépe známý jako G5 osazovaný do produktů
společnosti Apple. Neprováděli bychom srovnávací testy s čipy Sparc (Sun
potvrdil, že u serverů námi testované třídy přechází na Opterony), ale G5 je
snadnou kořistí. Apple dosud neobnovil řadu svých procesorů Xserve novými
2,5GHz G5 čipy; pracovní stanice PowerMac jsou ale s novými CPU již dodávány.
Jakmile budeme mít produkt s novinkovou G5 k dispozici, samozřejmě provedeme
stejné benchmarky (nejlépe na operačních systémech OS X a na Linuxu).
Díky nové vestavěné migrační cestě z 32 na 64bitové výpočty se dá očekávat, že
ceny 32bitových x86 procesorů klesnou až na samé dno a sledujte, jak dodavatelé
hardwaru odsunou dnešní 32bitové Xeony a P4 určené pro ultra low-endové servery
a začnou dodávat servery střední třídy s procesory x86-64.
Výrobci hardwaru přijímali nový Opteron po jeho uvedení velmi pomalu především
proto, že si nechtěli rozházet vztahy s Intelem. V nedávné době se to změnilo;
velcí dodavatelé podnikových serverů, jako například Hewlett-Packard a IBM,
aktivně rozvíjejí a prodávají serverové platformy založené na Opteronu. Ve
skutečnosti je Dell jediný významný dodavatel serverů podnikové třídy, který v
současné době nenabízí žádné servery s Opteronem.
ak Intel, tak i AMD budou tvrdě bojovat za dominantní postavení na novém trhu
x86-64. AMD sice v tuhle chvíli vede, ale závod teprve začal. Výsledkem budou
"průměrné" servery, které zpracovávají podstatně více než současné špičkové
32bitové stroje. Skutečný přínos těchto čipů se však projeví, až když vývojáři
začnou psát výhradně pro instrukční sadu x86-64. Ale s dnešní kompatibilitou a
spolehlivostí x86 není téměř žádný důvod čekat.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.