Dvě jádra na jedné parcele

1. 12. 2004

Sdílet

Intel na IDF (Intel Developer Forum) demonstroval potenciál Pentia 4 a Itania sdvoujádrovým procesorem a dále zveřejnil podrobnosti ohledně dvoujádrového procesoru Yonah. Současně předsta...
Intel na IDF (Intel Developer Forum) demonstroval potenciál Pentia 4 a Itania s
dvoujádrovým procesorem a dále zveřejnil podrobnosti ohledně dvoujádrového
procesoru Yonah. Současně představilo AMD svůj dvoujádrový procesor Opteron v
provozu.

Pohádka je pořád stejná: Intel pozve IT novináře na Intel Developer Forum do
Kalifornie. AMD této možnosti využije a uhnízdí se v hotelu, který je od fóra
dosažitelný pěšky - stejně jako letos. Kolegové z německého tecCHANNELu zašli
na návštěvu k oběma firmám. Již před Intel Developer Forem se hodně šuškalo o
plánech Intelu na dvoujádrový procesor. S napětím očekávanou hlavní myšlenku
odhalil prezident Intelu a COO, Paul Otellini, když zveřejnil o dvoujádrových
procesorech podrobnosti. Výrobce by chtěl vybavit své stolní, mobilní a
serverové procesory dvoujádrovou technikou do roku 2006. Navíc zde byly k
vidění provozuschopné prototypy desktopových procesorů.
AMD nedopřálo Intelu klid ani při přípravách, ani nyní. Již koncem srpna
vzbudil výrobce zájem se zprávou o provozuschopném systému dvoujádrového
procesoru Opteron. A v době konání Intel Developer Fora dokonce AMD ukazuje
dvoujádrový Opteron veřejně a mimo firemní budovu. Přitom AMD prozradilo
několik nových podrobností. tecCHANNEL v tomto článku shrnuje všechny
podrobnosti o procesorech od Intelu a AMD s dvoujádrovou technologií.

Cestovní mapa intelovského dvoujádra
Podle COO Intelu Paula Otelliniho převede Intel v roce 2005 své produktové
portfolio na dvoujádrovou technologii. Vedle serverových procesorů pak budou s
dvoujádrovou technikou pracovat i nejvýkonnější verze z odvětví stolních a
mobilních počítačů. Začátek by měl v polovině roku 2005 představovat intelovský
nástupce Itania 2 Montecito. V oblasti stolních a mobilních počítačů se však
Intel s podrobnostmi o procesorech drží poněkud zpátky. Podle nejrůznějších
plánů by však měl přijít na trh nástupce Pentia 4 s kódovým označením
Smithfield ve třetím čtvrtletí roku 2005. Podle neověřených informací je tento
procesor založen na architektuře NetBurst. Co se mobilních procesorů týče, měl
by se nástupcem aktuálního Pentia M "Dothan" stát Yonah. Tento dvoujádrový
procesor sází na dvě jádra Dothan a měl by se rovněž objevit v druhé polovině
roku 2005. V roce 2006 by chtěl Intel dodávat 40 procent svých stolních
procesorů s dvoujádrovou technologií. V oblasti serverů Intel počítá s tržním
podílem více než 85 procent. Ambiciózně zní i předpovědi ohledně intelovských
mobilních procesorů: přes 70 procent produkce by k tomuto datu měly
představovat dvoujádrové procesory. Dvou jader by měly být zatím ušetřeny
low-endové procesory Celeron D a Celeron M.

Dvě jádra pro stolní počítače
Viceprezident Intelu a hlavní manažer Desktop Platforms Group, Bill Siu, poprvé
představil stolní procesor s dvoujádrovou technologií v provozu. Demosystém
používal základní desku s čipsetem Intel 915. Předvedeno bylo rozdílné zatížení
procesoru v různých architekturách: Single--Core (jednojádrový), Single-Core
(jednojádrový) s Hyper-Threadingem a Dual-Core (dvoujádrový).
Na všech třech systémech probíhala videokonference se třemi účastníky. Stroj s
jednojádrovým procesorem přitom ukazoval stoprocentní zatížení procesoru. PC s
procesorem Hyper-Threading se ustálilo u 70 procent, zatímco dvoujádrový systém
udával padesátiprocentní zatížení. Dvoujádrový procesor ale ve Správci úloh
hlásil pouze dva procesory. Prototyp tedy ještě nedisponoval technologií
Hyper-Threading. Intel neodpověděl na otázku, zda u prototypu ještě nebyla
aktivována. To samozřejmě nabízí prostor pro spekulace: možná se musí stolní
dvoujádrové procesory obejít bez HT ze softwarově-licenčních důvodů. Tak by
například Windows XP Home Edition pracovala s maximálně dvěma virtuálními
procesory. Dvoujádrový procesor s Hyper-Threadingem by poskytoval čtyři
virtuální procesory. Existující Home Editions by je pak nemohla využívat.
Nezbytná by pak byla Windows XP Professional.
Další údaje k dvoujádrovým procesorům pro klientská PC Bill Siu nesdělil. Takže
jsme nezískali ani podrobnosti o procesorech použitých v systémech, ani údaje o
jejich taktovací frekvenci. U dvoujádrového prototypu by se - podle různých
"neoficiálních" plánů - mělo jednat o nástupce Pentia 4 s kódovým označením
Smithfield. Podle plánu je tento procesor připravován na třetí čtvrtletí roku
2005 a podle zmíněných zdrojů je postaven na architektuře NetBurst.

Mobilní platforma Napa s dvoujádrovým procesorem
Aktuální platforma Intel Centrino bude v prvním čtvrtletí roku 2005 nejprve
obnovena Sonomou. Sonoma používá Intel Pentium M Dothan s frekvencí sběrnic
zvýšenou ze 400 na 533 MHz. Mimo to drží Sonoma s DDR2 SDRAM a technologií
PCI-Express krok v oblasti notebooků.

Sonomu Intel koncem roku 2005 zase vystřídá Napou. Anand Chandrasekher,
viceprezident a hlavní manažer Mobile Platforms Group Intelu, na IDF poprvé
oznámil i podrobnosti o nástupci Centrina. Jádrem Napy je dvoujádrový procesor
Yonah. Poté, co představoval Dothan evoluční krok ve vývoji, vidí Mooly Eden,
viceprezident Mobile Platforms Group, Yonaha jako revoluci. Podle Intelu zavádí
výrobce do kompletně nově zhotoveného a pro mobilitu optimalizovaného procesoru
i 65nm proces.
Intel své první dvoujádrové procesory pro notebooky vybaví virtualizační
technikou Vanderpool. V oblasti serverů a pracovních stanic se tato technika
objeví v polovině roku 2005 v podobě nástupce Itania-2 Montecita pod jménem
Silvervale. Intel navíc plánuje, že Yonah bude obohacen technologií LaGrande
pro Trusted Computing. Yonah by měl být určen pro notebooky všech velikostí.
Ztrátový výkon procesoru by tedy neměla zásadně stoupnout. Jak Intel sdělil,
lze u Yonaha s ohledem na úsporu energie dynamicky vypnout jádro. Se současnými
platformami Centrino však Yonah kompatibilní nebude. Podle údajů výrobce
dostane procesor nový pinout.
K nové platformě Napa patří taktéž nový chipset Calistoga. V něm je integrován
nový grafický engine s rozšířenými vlastnostmi displeje a multimédií. Další
podrobnosti výrobce nesdělil. Vypadá to, že za periferie u Napy bude odpovědný
ICH7-M. Mobilní I/O-Hub poskytuje šest PCI-Express portů a další funkce pro
úsporu proudu. O bezdrátový přístup na síť se u Napy s Golanem bude starat nová
mini karta s integrovanými bezpečnostními vlastnostmi. Otázku zda bude Golan
podporovat WiMAX-Standard 802.16, nechává Intel zatím otevřenou. Stejně tak
ještě neuvádí informace ohledně architektury nebo taktovací frekvence Yonaha.

Intel ukazuje Montecito v provozu
Vývoj Montecita oznámil Intel již před několika lety. Tento procesor funguje
jako nástupnická architektura aktuálních procesorů Itanium 2. Hlavní
specialitou Montecita jsou dvě jádra integrovaná na jedné destičce. Montecito
bude v polovině roku 2005 prvním prezentovaným dvoujádrovým procesorem.
Na Intel Developer Foru na podzim roku 2004 Intel poprvé předvedl prototypy
Montecita v provozu. Při praktické ukázce zde výrobce použil čtyři procesory v
jednom systému. Každé jádro Montecita zvládá navíc jeden dvoucestný
multithreading, tedy v principu technologii Hyper-Threading. Navenek se
Montecito jeví jako čtyři procesory.
Na ukázce se čtyřmi Montecity za provozu pod 64bitovými Windows ukazoval
Správce úloh dohromady šestnáct procesorů. Všechna jádra byla pod zatížením.
Jako aplikaci použil Intel složitou simulaci počasí.

Podrobnosti o Montecitu
U Montecita se obě jádra zakládají na Itaniu 2 "Madison 9M". Avšak výrobce je
obdařil větší L3-Cache s kapacitou 12 MB místo 9 MB. Od společné L3-Cache se
Intel odklonil, protože by vyžadovala příliš dlouhý vývoj. Nevýhodou oddělené
L3-Cache ve srovnání se společnou je podle Intelu zhruba 10% ztráta výkonnosti.
Rovněž L2-Cache Montecita získá rozšířenou kapacitu, jedno jádro má 256 KB pro
data a 1 MB pro příkazy. Dvoujádrové Itanium, zhotovené 90nm procesem,
disponuje společně se všemi dalšími vyrovnávacími pamětmi celkovou Cache o
objemu 27,5 MB. Intel Montecito tak dosáhne zřejmě rekordního počtu 1,72
miliardy tranzistorů.

Výkon Montecita
Obě jádra Montecita připojuje na společné rozhraní sběrnic jeden řadič Intel u
Montecita opět používá patici PAC611, známou z Itania 2, tím pádem se
dvoujádrový procesor hodí pro upgrade současných systémů Itanium 2.
Alternativně bude k dispozici Montecito s navýšenou frekvencí sběrnice ze 400
na 533 MHz. Podle Intelu se Montecito spokojí s průměrnou tepelnou ztrátou 100
W, což by bylo o poznání méně, než činí tepelná ztráta současných Itanií, jež
je 130 W. Aby procesor nepřesáhl zmiňovanou hranici 100 W, byla v něm použita
technologie Foxton.
Podle Abhi Talwalkara, viceprezidenta a hlavního manažera Enterprise Platforms
Group Intelu, by mělo Montecito ve srovnání s aktuálním Itaniem 2 dosahovat 1,5
až 2krát vyššího výkonu. Za výkon na jeden thread jsou zde odpovědné vyšší
taktovací frekvence, větší paměti Cache a podle jednotlivých verzí i FSB 533.
Intel u Montecita usiluje o počáteční taktovací frekvenci
2,0 GHz. Ve srovnání s Itaniem 2 6M L3 s taktovací frekvencí 1,5 GHz jde o 40%
výkonnostní nárůst na jeden thread. Dalšího navýšení rychlosti dosahuje
Montecito prostřednictvím dvoujádrového designu a dvoucestného multithreadingu
(hyper-threadingu).

Novinka: Montecito s Foxtonem a Pellstonem
U Montecita budou nasazeny dvě nové technologie s označením "Foxton" a
"Pellston". Foxton reguluje výkon, Pellston zvyšuje spolehlivost Cache. U
Foxtonu je výkon modulován ve vztahu k maximálně povolené Thermal Design Power
(TDP). Tato technologie rozšiřuje Demand Based Switching (proces SpeedStep)
procesorů Xeon s jádrem Nocona. Foxton zvyšuje výkon (taktovací frekvenci)
procesoru dynamicky v závislosti na aktuálním příkonu. Procesor poskytuje
optimální výkon podle aktuálního pracovního zatížení. Maximální specifikovaná
TDP je přitom stále zachovávána.
Foxton tak rozpozná prostor v aktuálním příkonu a může - oproti procesorům bez
Foxtonu - zvýšit výkon až o deset procent. Pro tuto funkci jsou v procesoru
integrovány senzory teploty, příkonu a napětí. Řízení Foxtonu rovněž přebírá
integrovaný Micro-Controller. Je-li například přípustná TPD překročena, Foxton
okamžitě redukuje napětí a tím i taktovací frekvenci. Pokud procesor nevyužívá
povolenou spotřebu energie, může Foxton v případě potřeby napětí zvýšit a
umožnit tak dosažení maximální taktovací frekvence. Pokud jsou podle
jednotlivých aplikací v akci jen určité výpočetní jednotky, pak Foxton procesor
"přetaktuje". TDP je při tom zachována, neboť ne všechny jednotky jsou plně
zatížené.
Technologie Pellston je pro zvýšení spolehlivosti Cache u Montecita taktéž
použita poprvé. Pellston dovoluje procesoru odhalit defekty v řádcích
vyrovnávací paměti. Pokud je defekt zaregistrován, pak jsou tyto řádky
automaticky deaktivovány a v dalším provozu se již nepoužívají. Zároveň
Pellston zachytává chyby 2-Bit-ECC v L3-Cache, které vznikají z chyb
Single-Bit-Hardware. S technologií Pellston tak defekty v Cache již nezpůsobí
pád - provoz pokračuje normálně dál.

Cestovní mapa dvoujádrových procesorů AMD
Procesory AMD se dvěma jádry na jedné destičce by měly slavit svůj debut v
polovině roku 2005. Jedná se o procesory Opteron pro použití na serverech a
pracovních stanicích. Odpovídající názvy již AMD zveřejnilo: Denmark (série
100), Italy (série 200) a Egypt (série 800). AMD tak pokračuje ve známých
sériích Opteronu pro jedno, dvou, a osmicestné systémy. Výroba dvoujádrového
Opteronu probíhá 90nm procesem s technologií SOI. AMD již přechod na 90 nm
zahájilo a aktuální modely Opteron chce dodávat s menší šířkou struktury již v
druhé polovině roku 2004 (názvy Athens, Troy & Venus).
První stolní procesor s dvojitým jádrem chce AMD dodávat od poloviny roku 2005.
AMD tomuto procesoru AMD 64 dalo jméno Toledo. Tento procesor se dvěma srdci by
se měl rovněž zakládat na 90nm výrobním procesu a technice SOI. Procesor přitom
funguje jako nástupce série Athlon FX. Jak AMD již dříve oznámilo a nyní to
opět potvrzuje, měl by přechod na 65nm proces v drážďanské Fab 36 začít již v
polovině roku 2005. První produkty s ještě více zúženou šířkou struktury chce
tato společnost dodávat od roku 2006. Uvedení mobilních procesorů s dvojitým
jádrem však AMD v roce 2005 na rozdíl od Intelu nepovažuje za nutné.

Dvoujádrový Opteron od AMD v provozu
AMD předvedl stejně jako Intel své první provozuschopné dvoujádrové procesory v
oblasti serverů a pracovních stanic. Jako platformu pro demonstraci
dvoujádrového Opteronu zvolilo AMD server ProLiant DL 585 od HP. Server pro
čtyři procesory Opteron používá známý socket 940. Podle AMD se na serveru od HP
musel pro provoz dvoujádrových procesorů pouze upravit BIOS. I opteronové
systémy od IMB a Sun by se měly díky pozdějším upgradům na dvoujádrové
procesory od AMD hodit. Jediným předpokladem je kompatibilita systémů s
Opterony, které by se ještě v roce 2004 měly objevit v provedení technologie 90
nm.
Opterony zabudované do HP ProLiant DL 585 jsou zhotoveny 90nm technologií s
SOI. S menší šířkou struktury se zvětšuje plocha destičky dvoujádrového
Opteronu jen o zhruba 10 až 15 procent (ve srovnání s aktuálními Opterony 130
nm s jednoduchým jádrem). Podle AMD zůstane TDP dvoujádrového Opteronu na
srovnatelné úrovni s aktuálními modely. Díky tomu by spotřeba dvoucestného
procesoru mohla zůstat pod 100 W.
AMD předvedlo čtyři dvoujádrové Opterony na HP ProLiant DL 585 v provozu na
Windows 2003 Serveru. Jak je vidět ve Správci úloh, systém rozpoznává celkem
osm procesorů. S pomocí AMD aplikace System Stress Test 4.0 pracují všechna
jádra pod plným zatížením. Kromě serveru HP vybavilo AMD i svůj vlastní server
Quartett, který je referenčním designem pro čtyři Opterony s dvoujádrovými
procesory. Systém Linux taktéž identifikuje osm procesorů a nechává je pracovat
pod plným zatížením.

Dvojité jádro s SSE3

Architektura AMD 64 procesorů Athlon 64 a Opteron byla podle sdělení v roce
2001 dimenzována pro dvoujádrové procesory. Odpovídající odkazy se již tenkrát
nacházely v podkladech. Design zapojení pro první produkty s dvojitým jádrem
AMD dokončilo již v červnu roku 2004.
Dvoujádrová technologie AMD spojuje dvě jádra procesoru na jedné destičce přímo
integrovaným kontrolerem paměti a rozhraním HyperTransport. Ovládání obou jader
převezmou System Request Queue (SRQ) a Advanced Priority Interrupt Controller
(APIC). Crossbar Switch, který následuje za SRQ, slouží jako spínací centrála k
rozhraní HyperTransport a kontroleru paměti. AMD používá jako nový název pro
integrovaný paměťový kontroler a sběrnici Hypertransport spojení "Direct
Connect Architecture".
Novinkou u dvoujádrových procesorů AMD bude podpora intelovských instrukcí
SSE3. Avšak AMD implementuje pouze 11 z celkových 13 příkazů. Kvůli absenci
technologie Hyper-Threading u procesorů AMD tak chybí "MONITOR" a "MWAIT".

Rozdělené Cache
Každé jádro u dvoujádrových procesorů AMD má vlastní L1 a L2 Cache. AMD udává
velikost L2 Cache 512 KB nebo 1 MB. Od společně využívané L2 Cache AMD
upustilo. Hlavním důvodem je jednodušší a tím pádem i rychleji realizovatelný
design zapojení. Společná L2 Cache by vyžadovala změnu designu jader. Spojení
L2 Cache však nabízí i výhody: každé jádro může rychle sahat na větší množství
dat. Navíc odpadá problém se zajištěním koherence Cache. IBM například používá
u svých procesorů Power4 a Power5 společné L2 Cache.
Jakým způsobem bude AMD L2 Cache nastavovat, není zatím jisté. Obě jádra mají
přístup ke společné operační paměti. S exkluzivními zdroji (jako lokální
vyrovnávací paměť procesoru) může dojít k problémům: pokud se data určité části
paměti nacházejí v Cache jádra 0, pak je "sáhnutí" na tato data při obnoveném
přístupu rychlejší. Zde však může dojít k nekonzistenci, když jádro 1 mezitím
přepíše danou část paměti novými daty. Typickým způsobem zajištění koherence
Cache jsou protokoly MESI a MOESI. Ten druhý používalo AMD již u čipsetu pro
duální procesory 760MP. Společný přístup jader do paměti a na HT Links vede
podle AMD k 10% ztrátě výkonu. Zároveň klesá latenčí doba mezi jádry, na rozdíl
od dvoucestného systému s jednoduchým jádrem procesoru.

Dvojité jádro AMD předstírá HT
Dvoujádrové procesory AMD udávají přes rozšířenou funkci CPUID (eax =
8000_0008) počet jader na jednu patici. Avšak současný software s těmito novými
ID nemůže nic dělat. Programy doposud rozlišují maximálně mezi diskrétními
systémy SMP a Hyper-Threadingem.
Aby byly přímo využity přednosti současných programů optimalizovaných pro
Hyper-Threading, budou se dvoujádrové procesory AMD tvářit jako procesory
schopné Hyper-Threadingu. Bude tedy přes CPUID.HTT dodána hodnota 1. Navíc
software přes CPUID.logical_number_ of_processors = 2 rozpozná dva logické
procesory. Tento postup při identifikaci dvoujádrových procesorů AMD je mazaným
tahem. Intel totiž od uvedení technologie Hyper-Threading utratil nemalou sumu,
aby softwaroví vývojáři programovali své aplikace jako optimalizované pro
vlákna. Podle AMD pracují pravidla Hyper-Threading-Scheduling s "pravými"
dvoujádrovými procesory bez problémů.
Aby byla v budoucích programech možná korektní identifikace, je k dispozici v
rozšířeném CPUID Feature-Bit HTVALID. Tento Bit bude mít u dvoujádrových
procesorů AMD hodnotu 0. Vývojáři softwaru pak budou moci rozpoznat, zda
procesor Hyper-Threading skutečně podporuje, či zda to pouze předstírá.

Shrnutí
Pojmy jako "Parallelism", "Multithreading" a "Dual-Cores" patří k novým
oblíbeným slovům AMD a Intelu. Taktovací frekvence jsou, pokud vůbec, zmiňovány
pouze vedlejší větou. Není divu, neboť klasická cesta zvyšování výkonu přes
taktovací frekvenci vede k častým problémům. V první řadě bychom měli jmenovat
výdej tepla a s ním spojený vysoký ztrátový výkon procesorů. Vyššího výkonu
chtějí výrobci dosáhnout paralelizací. Tak by dvě jádra na jedné destičce
vyřizovala v ideálním případě početní úkoly skoro dvakrát rychleji. Zde je však
nezbytná odpovídající softwarová podpora. AMD stejně jako Intel proto začíná s
dvoujádrovými procesory v oblasti serverů a pracovních stanic. V této oblasti
jsou totiž aplikace programovány převážně multithreadově. V mobilním a stolním
sektoru však situace vypadá jinak.
Intel i přesto hodlá v druhé polovině roku 2005 převést své stolní a mobilní
procesory na dvoujádrovou technologii. Proto od uvedení technologie
Hyper-Threading vynaložil značné úsilí, aby vývojáři optimalizovali své
aplikace pro využití vláken. I AMD vybaví svůj Athlon 64 FX do konce roku 2005
dvojitým jádrem. V mobilní oblasti je však AMD ohledně nutnosti dvojitých jader
ještě skeptické - zde bude muset v roce 2005 stačit jedno jádro na jednu
destičku.