Nejžhavějšími novinkami v oblasti procesorů jsou v poslední době černé krabičky
tikající nad hranicí 1 000 MHz. Měli jsme příležitost pozvat do našeho
TestCentra závodníky ze stájí Intelu i AMD. Natáhnuli jsme stopky, cílovou
pásku a pohodlně jsme se posadili na testovací lavičku. Jak to dopadlo, si
můžete přečíst i vy.
Intel Pentium 4 nejrychlejší představitel Intelu, zařazený do nové řady Pentium
4, vychází z architektury použité už v Pentiích III, avšak nové označení si
zasluhuje díky určitým rozšířením, které mají za účel připravit tento typ
procesorů na vysoké pracovní frekvence. Pod zastřešujícím názvem NetBurst se
skrývají technologie Hyper Pipelined Technology, Rapid Execution Engine a
Execution Trace Cache. Oživením je také sběrnice pracující na 400 MHz,
umožňující přenosové rychlosti až 3,2 Gb/s.
Hyper Pipelined Technology prodlužuje délku instrukčního pipelinu, resp.
zvyšuje počet jeho stupňů na 20. V procesoru tedy může být (teoreticky)
rozpracováno až 20 instrukcí naráz, čímž se snižuje šance, že některá z nich
nestihne být dokončena během celého průběhu exekučních sekcí v CPU. Bohužel s
prodlužující se délkou pipelinu přichází nazmar stále více výkonu, a to v
okamžiku, kdy technika předvídání skoků (branch prediction) selže a výsledek
větvení odhadne špatně. V takovém případě se zahazují veškeré výpočty a průběh
dalších instrukcí skrz procesor jde opět od začátku.
Pentium 4 používá pro tento případ inovovaný systém vyrovnávací paměti, v němž
se uchovají už dekódované instrukce pro případ, že by v krátké době byly ještě
potřeba, jak tomu často bývá právě po neúspěšném odhadu větvení. Inovací je
také zvýšení výkonu dvojice ALU, které by mělo také omezit problémy vzniklé
prodlouženým instrukčním pipelinem.
Multimediálním aplikacím pomůže též inovovaná instrukční sada SSE2. I když
poskytuje vyšší výkon, je třeba počkat, až bude plně podporována výrobci
softwaru, neboť jen na nich záleží, zda implementují kód využívající SSE2.
Na rozdíl od Pentia 4 jde Athlon zatím spíše cestou zvyšování hrubého výkonu,
což mu v testech paradoxně přináší výhody. AMD v Athlonu neprodloužilo délku
pipelinového řetězce, avšak zvýšilo superskalaritu použitím hned tří jednotek
pro práci s plovoucí čárkou. Tímto řešením Athlon velmi výrazně omezil problém
s nízkým výkonem jednotky FPU v předchozích verzích procesorů K6. Po třech jsou
v procesoru zastoupeny také jednotky ALU pro celočíselné operace a jednotky pro
počítání adres.
Protože ani Athlon není vnitřně čistý x86 procesor, i u něj instrukce musí
nejdříve procházet vícenásobným paralelním instrukčním dekodérem, zajišťujícím
jejich převod do rychlých MacroOPů, jež zpracovává jádro CPU.
Samozřejmostí se stalo předvídání větvení programů technikou Advanced Dynamic
Branch Prediction, a dostatek vyrovnávací paměti na čipu (celkem 384 KB).
Novinkou čipové sady AMD 760 je režim paměťových čipů DDR. Při něm probíhá
přístup do paměti při každém taktu ne jednou, jako je tomu u klasických SDRAM
pamětí, ale dvakrát, a to jak při náběžné tak i při sestupné hraně hodinového
taktu. Výsledkem je teoreticky dvojnásobná rychlost FSB a pamětí.
Jiný systém paměti zvolil i Intel pro Pentium 4, které využívá paměťových
modulů RDRAM, vyvíjených společností Rambus. Paměť Rambus pracuje na vysoké
frekvenci, avšak je konstruována zcela odlišně od SDRAM, což stejně jako u DDR
znamená nutnost použití odlišných základních desek.
Pro testy jsme měli k dispozici počítač s 1,2GHz procesorem Athlon, osazený
základní deskou AMD Corona s čipsetem AMD 760 a 256 MB paměti DDR SDRAM. Pro
tuto výkonnou sestavu jsme použili adekvátní grafickou kartu Creative 3D
Blaster GeForce2 Ultra se 64 MB paměti.
Proti němu stál počítač s 1,4GHz procesorem Pentium 4 se základní deskou Intel,
postavenou na čipové sadě I850 se 128 MB paměti RDRAM. Opět nechyběla grafická
karta Creative 3D Blaster GeForce2 Ultra 64 MB. Ještě připomínáme, že rozdíly
ve výkonu počítačů s pamětí o kapacitě 128 a 256 MB jsou na úrovni několika
málo procent, a proto je můžeme s klidným svědomím zanedbat.
V závodě, který za nás pod operačním systémem Windows 98 počítal testovací
software BAPCo SYSmark 2000, získalo Pentium 4 v celkovém indexu výsledek 167
bodů, zatímco Athlon odešel jako vítěz, když jeho index dosáhl hodnoty 226
bodů. SYSmark je komplexní test celého portfolia aplikací nejčastěji užívaných
na platformě Windows. Zahrnuje celkem 12 programů, mezi nimiž nechybí například
Adobe Photoshop, Corel Draw!, Adobe Premiere či renderovací Bryce 4. Z tohoto
důvodu je možné výsledky v BAPCo SYSmarku považovat za skutečně průkazné
porovnání aplikačního výkonu jednotlivých systémů.
Za zmínku rozhodně stojí, že jedinou aplikací ze skupiny testované
prostřednictvím SYSmarku, v níž Pentium 4 s přehledem poráží Athlon na
nominálně nižší frekvenci, je Windows Media Encoder. Výsledky v Photoshopu 5.5
se u obou procesorů liší o pouhá 3 procenta ve prospěch Pentia 4, a ve všech
zbylých programech vítězí Athlon. Rozdíly jsou skutečně vysoké, například v
Bryce 4 činí zhruba 50 %, v modelačním Elastic Reality kolem 45 % a v Corel
Draw! dokonce 70 %.
Příčin takovýchto výsledku je několik. K nejdůležitějším ale patří menší cache
v Pentiu 4 a celkově problematičtější práce s delším pipelinovým řetězcem.
Zároveň nesmíme zapomínat ani na to, že Athlon má silnější celočíselnou
jednotku a minimálně srovnatelnou jednotku FPU s Pentiem 4.
Oproti aplikačním benchmarkům jsou výsledky z herního Quake III Arena Dema
úspěchem především pro Pentium 4. Při rozlišení 640 x 480 bodů a 16bitové
barevné hloubce v normálním nastavení detailů je výkon Pentia 4 na hodnotě 199
fps, zatímco maximem Athlonu je za stejných podmínek pouze 157 fps. Při nízkém
rozlišení je počet snímků za vteřinu vyjádřením spíše managementu sběrnic
základní desky a procesoru, a v tomto případě je zřejmé, že Pentium 4 je na tom
o poznání lépe. Svou úlohu hraje také optimalizace Quake III pro instrukční
rozšíření SSE2.1 0001/BAM o
Za zapůjčení vzorků AMD a Intel děkujeme firmám AMD a LIBRA Electronics.