Servery s procesory Nehalem překypují výkonem (1.)

Zřejmě nejčastěji skloňovaným pojmem na poli x86, resp. x64 serverů bylo v loňském roce slovo Nehalem, kódové označení architektury nejnovějších procesorů Xeon od společnosti Intel.


Servery založené na těchto CPU postupně představili všichni významní výrobci serverového hardwaru a současná nabídka sahá od levný, ale výkonných modelů vhodných pro menší firmy až po nadupané stroje pro náročné zákazníky. Podívejme se tedy blíže, co aktuální trh nabízí.

Nové procesory Intel Xeon postavené na architektuře s kódovým názvem Nehalem jsou během posledních měsíců nasazovány do nesčetných jedno- a dvou-socketových serverů a pracovních stanic a budí značný zájem. Ostatně i samotný výrobce se chlubí, že Nehalem představuje největší výkonnostní skok od zavedení Pentium Pro.

Proč? Když Intel dříve pilně lepil dvě samostatná jádra do jednoho čipu a označoval jej za dual-core CPU, šířka pásma paměti zaostávala díky centrálnímu externímu paměťovému řadiči. I když celkový výkon procesoru byl přijatelný, citelně se projevila absence architektury NUMA (Non-Uniform Memory Access), která zajišťovala slávu konkurenčnímu Opteronu společnosti AMD. Nehalem však tento přístup využívá, a jeho výkon je tak daleko vyšší, než u dosavadních procesorů Intelu.

Nehalem zevnitř
Zrekapitulujme si stručně základní přínosy nové technologie Intelu. Čipy Nehalem (dodávané v podobě procesorů Xeon řady 3500 pro jedno-socketové a Xeon 5500 pro dvou- socketové systémy) využívají čtyři jádra s celkově 731 miliony tranzistorů, 256 KB L2 cache na jádro, 8 MB L3 cache, hlubší a rychlejší ukládání do vyrovnávací paměti a lepší predikci větvení. V podstatě je tak Nehalem kombinací silných stránek starších procesorů Xeon se zásadní změnou architektury spočívající v začlenění NUMA.

U NUMA má každé CPU svůj vlastní paměťový řadič, který poutá vrstvu DIMM k určitému CPU (jádru) a konkrétně u architektury Nehalem poskytuje šířku pásma o až 25,6 GB/s na spoj nebo 6,4 GT (Gigatransfers) za sekundu při použití DDR3 RAM. Vzhledem k této změně a povaze paměti DDR3 běží hodiny RAM na 800 MHz, 1 066 MHz a 1 333 MHz. Pokud jsou sloty DIMM osazeny jediným RDIMM (registrovaný DIMM) na kanál, je možné využít nejvyšší rychlost 1 333 MHz. S tím, jak je do kanálů přidávána RAM, klesne celková rychlost na 1 066 MHz nebo 800 MHz. Nicméně se 4GB moduly může dvou-socketový systém využívat 24 GB 1 333MHz paměti při použití pouze šesti RDIMM. Použitím čipové sady Tylersburg je možné zvýšit kapacitu RAM celkem až na 144 gigabajtů, tj. 72 GB na CPU, běžících na 800 MHz. Některé servery v současnosti podporují až 192 GB RAM.

Novinek je ale víc. Do hry vstupuje i řada podpůrných faktorů včetně aktualizovaných rozšíření Virtualization Technology, která pomáhají při implementaci virtualizace, zmíněné podpory DDR3 paměti, která může poskytnout dvojnásobek rychlosti DDR2, a instrukcí SSE 4.2, což je relativně menší aktualizace, jejímž cílem je urychlení zpracování textu. Hlavní novinkou je tak významně vyšší propustnost paměti spolu s příchodem technologie QuickPath, nového procesorového propojení, jež nahrazuje starší Front-Side Bus. Ale vítány jsou i další doplňky.

Jedna z nových funkcí je označována jako Turbo mód. Možná si vzpomenete na dny procesorů Intel 8088, běžících buď na 8 MHz, nebo na 16 MHz, pokud bylo spuštěno „Turbo“. Není to ale úplně totéž. Tato funkce v Nehalemu umožňuje jádru přepnout se na vyšší takt, pokud to vyžaduje zatížení. Turbo využívá tzv. „bins“, které představují kroky zvýšení taktu o 133 MHz pro jednotlivá jádra, což v podstatě dovoluje, aby se některá jádra přetaktovala podle potřeby.

Ač to působí trochu nezvykle, Turbo může být užitečné u jedno-vláknových úloh nebo u těch, které využívají menší počet vláknen, neboť jej lze být využít pouze na podmnožinu fyzických jader. Například jedno nebo dvě jádra si budou moci alokovat další tři biny, ale několik vláken běžících současně může mít přístup k jednomu binu na každé ze čtyř jader. Vše je závislé na tepelném a energetickém stavu procesoru v dané chvíli a dynamicky se průběžně upravuje.

Větší výkon na jádro
Všechny nové prvky architektury Intel Nehalem se odrážejí do značného nárůstu výkonu nových procesorů Xeon 5500. Jak významného? Potenciál ilustrují výsledky testů realizovaných v rámci IDG (konkrétně časopisem InfoWorld, IDG USA) – v mnoha z nich například Nehalem běžel při jedno-vláknových operacích zhruba dvakrát rychleji než platformy založené na CPU Intel Xeon 5300 a o 50 procent rychleji než systémy postavené na Xeonu 5400.

Výsledná čísla jsou velmi působivá, i když je výkon měřen proti čipům z éry Tigertown. Při testování byl porovnáván i výkon proti serveru HP ProLiant DL580 se čtyřmi čtyř-jádrovými CPU Intel Xeon X7350 taktovanými na 2,93 GHz na jádro. Systém s archikturou Nehalem využíval dva čtyřjádrové procesory Intel Xeon W5580 s taktem 3,2 GHz a se spuštěným HyperThreadingem. Ačkoliv uvedené testování bylo založeno převážně na jednovláknových úlohách (kódování audio, komprese, výpočty MD5 atd.), ty byly spouštěny v dávkách 16 současně zpracovávaných úloh.

Dvou-socketový systém s celkově osmi jádry Nehalem hravě porazil čtyř-socketový systém X7350 na všech úrovních. CPU X7350 přitom používala jedno fyzické jádro na proces, zatímco Nehalem s použitím HyperThreadingu zpracovával dva procesy na fyzické jádro. Server X7350 byl navíc vybaven hardwarovým RAID0 a sadou čtyř SAS disků s 15 000 ot./min a nedělal nic jiného, než že zpracovával testovací scénáře, zatímco systém Nehalem běžel se čtyřmi SATA disky v softwarovém RAID5 poli a sloužil zároveň jako pracovní stanice. To vše podtrhuje vyšší energetická efektivita, která se spolu s potenciálem nových procesorů odráží ve velkém rozdílu výkonu na watt.

Dokončení článku vám přineseme zítra....











Komentáře