Čím více jader, tím více Intel

1. 5. 2007

Sdílet

Pohled do současnosti a budoucnosti procesorů cd/dvd Společnost Intel se v posledních měsících doslova překoná...


Pohled do současnosti a budoucnosti procesorů cd/dvd


Společnost Intel se v posledních měsících doslova překonává co do množství zpráv a novinek týkajících se budoucího vývoje procesorů. V lednu to bylo představení 45nm výrobní technologie, která poprvé v hradle tranzistorů uvnitř procesoru vyměnila křemík za kovové sloučeniny na bázi hafnia. V únoru pak přišlo Tera-scale jakýsi náhled do budoucnosti procesorů s desítkami jader.
Při naší nedávné návštěvě Silicon Valley jsme si proto domluvili audienci u Roba Willonera, technologického analytika společnosti Intel, abychom mu položili několik otázek souvisejících s novými výrobními procesy, nanotechnologiemi či Tera-scale. Nejlepší ale bude začít stručnou rekapitulací současného stavu výroby mikroprocesorů a novinek, které Intel počátkem roku ohlásil.
45 nm a Penryn
Zatímco před pěti či deseti lety byl přechod na novou výrobní technologii ve světě procesorů změnou, které se věnovala prakticky výhradně odborná veřejnost, dnes se jedná o událost vstupující do masového zpravodajství. Z výrobních technologií se stala marketingová zbraň, kterou je třeba využít na maximum. Z televize se tak dozvíte, kolik tranzistorů vyrobených 45nm technologií je možné vměstnat do červené krvinky, případně, že věk křemíku skončil a nové procesory budou vyráběny z hafnia. Ve směsi marketingových sloganů a omylů se snadno ztratí to nejpodstatnější: co znamená nový výrobní proces pro budoucí procesory a jaké ony budoucí procesory vlastně budou?
Prvních 45nm procesorů Intel se přitom dočkáme již na sklonku letošního roku (Intel ohlásil úspěšný test funkčních exemplářů letos v lednu) a v roce 2008 budou následovat též procesory od AMD. 45nm výrobní proces si skutečně vyžádal zásadní změny v materiálech použitých při výrobě tranzistorů a tyto změny by se měly pozitivně odrazit v jejich vlastnostech a potažmo ve vlastnostech nových procesorů. Podle Intelu se jedná především o následující zlepšení:
l30% snížení spotřeby pro spínání tranzistorů.
l20+% nárůst rychlosti spínání tranzistorů nebo 5x snížení energetických ztrát v kanálech tranzistoru.
l2x vyšší hustota tranzistorů menší procesory nebo výkonnější CPU s více tranzistory.
l10x snížení energetických ztrát na hradle tranzistoru.
Většina těchto změn souvisí s použitím nových materiálů: oxidu hafničitého (HfO2) či hafnonu (HfSiON) pro dielektrikum hradla tranzistoru a kovových materiálů (Intel blíže nespecifikuje složení) v hradle samotném, případně tranzistorů s více hradly (Tri-gate). Výhodou kombinace hafnia a kovového hradla je především menší únik napětí a tedy výrazné snížení tepelných ztrát, spolu s vyšší rychlostí spínání tranzistorů (díky výrazně vyšší dielektrické konstantě).
První rodinou procesorů, která bude vyráběna technologií 45 nm, bude v závěru letošního roku Penryn. Tato CPU vycházejí z architektury Core2, došlo u nich ale k některým změnám tou nejzřetelnější je 6MB L2 cache u dvoujádrových čipů. Ty budou mít celkem 410 milionů tranzistorů, z čehož zhruba 288 milionů připadá na cache a zbývajících 122 milionů na dvě jádra. Z čistě matematického hlediska je jasné, že Penryn bude vybaven novými funkcemi (samotná procesorová jádra mají totiž o zhruba 20 % více tranzistorů) tou v současné době již oznámenou je SSE4. V první fázi budou čtyřjádrové procesory Penryn konstruovány jako dvě propojená dvoujádra, podobně jako tomu je u současných C2E QX6xxx, časem ale Intel plánuje přechod na nativní čtyřjádrové procesory. Názvy jednotlivých variant ani frekvence nejsou prozatím známy, frekvence FSB by ale měla být patrně 1,3 GHz, u hi-end čipů pak 1,6 GHz.

Čím více jader...

Že dualcore či quad-core je teprve začátek, bylo jasné již při prvním ohlášení Pentia D a dvoujádrových serverových procesorů před třemi lety. Již tehdy Intel zmiňoval plány na procesory, které mohou mít řádově desítky jader, počátkem února byly ale tyto plány značně upřesněny při ohlášení projektu Tera-Scale computing. Tím nejzajímavějším na Tera-Scale projektu není množství jader v procesoru, ale způsob, jímž se Intel rozhodl řešit nejpalčivější problémy vícejádrových procesorů: přístup do paměti a komunikaci mezi jádry. Nejedná se přitom o pouhou teorii Intel již nyní vyrábí prototypy 80jádrových procesorů "Teraflops research chip", jejichž smyslem je vyzkoušet různé techniky a postupy a v budoucnu tímto způsobem propojit velké množství x86 jader.
Již u dvoua zejména u čtyřjádrových procesorů je možné sledovat nedostatečnou kapacitu propojení CPU s operační pamětí. Více jader vyžaduje současně přenos větších objemů dat a zvyšování frekvence FSB či rozšiřování šířky paměťové sběrnice není možné do nekonečna (u prvního jsme limitováni kvalitou a délkou spojů, u druhého zase jejich počtem). Současné dvoukanálové řadiče je sice možné rozšířit na čtyřiči osmikanálové, ovšem za cenu výrazného prodražení výroby základních desek a dalších technologických problémů. Alternativou je pochopitelně přidání další "vrstvy" rychlé vyrovnávací paměti, která dokáže částečně kompenzovat přetíženou FSB sběrnici. Vyrovnávací paměť ale nelze zvětšovat donekonečna zabírá totiž velký prostor v jádře CPU a větší velikost výrazně zvyšuje jeho výrobní cenu a potenciální procento zmetků. Intel se proto rozhodl pro budoucí mnohajádrové procesory využít již dříve diskutovaný koncept "stohování" jader procesoru, či přesněji stohování velkých rychlých vyrovnávacích pamětí nad jádro procesoru. Jedna vrstva takovéto rychlé DRAM by mohla mít kapacitu 256 MB to je víc než dost pro výrazné odlehčení FSB a hlavní systémové RAM, která bude podle všeho i nadále nezbytná. Problém komunikace a spolupráce mnoha jader je u výzkumného procesoru TeraFlops vyřešen směřovači miniaturními routery, jimiž je vybaveno každé z osmdesáti jader. Ty se starají o výměnu dat mezi jednotlivými jádry a o případné požadavky na čtení a zápis do vyrovnávacích pamětí či systémové RAM. Kromě toho obsahuje každé z jader, která jsou v tomto případě označována jako "dlaždice", dvě jednotky pro operace v plovoucí desetinné čárce, instrukční paměť 3 kB a datovou paměť 2 kB. Procesor je postaven na architektuře VLIW (ta je kupříkladu základem čipů Itanium), jak jsme již ale zmínili, v budoucnu by zkušenosti s tímto prototypem měly napomoci při návrhu mnohojaderných procesorů x86.

Hafnium

Hafnium (Hf) je prvkem s atomovým číslem 72. Jedná se o šedý až stříbřitě bílý vzácný těžký kov, podobný zirkoniu. Hafnium se vyznačuje především chemickou stálostí: je netečné k působení vody a odolává působení většiny minerálních kyselin a roztoků alkalických hydroxidů. Bylo objeveno v roce 1923 a je pojmenováno podle latinského názvu města Kodaň, kde k objevu došlo. V zemské kůře se vyskytuje zhruba 4,5 mg/Kg hafnia, ve vesmíru připadá jeden atom hafnia na 200 miliard atomů vodíku. V přírodě se nevyskytuje v čisté formě, obvykle ve sloučeninách se zirkoniem. Kromě využití oxidů hafnia při výrobě mikroprocesorů se využívá v jaderné energetice, v elektrodách pro plazmové řezání a sváření a také v odolných slitinách. Zdroj: cs.wikipedia.org

O budoucnosti výrobních procesů jsme si povídali s Robem Willonerem

Intel hledal nové materiály pro použití v tranzistorech prakticky od chvíle, kdy na počátku sedmdesátých let vyrobil první mikroprocesor. Kompozice a výrobní postupy bylo v minulosti nutné změnit již mnohokrát, proč tedy nyní hovoříte o nejvýznamnější změně za posledních dvacet či více let? To, že jsme tak dlouho zůstali u sloučenin křemíku, má své logické důvody. Předně křemík je poměrně snadno dostupný a lze jej relativně levně zpracovat (čistit). Navíc díky tomu, že se jedná o oxidy křemíku, je velmi snadné s nimi pracovat existuje pochopitelně velké množství dalších polovodičů jako třeba germanium, ty jsou ale mnohem hůře dostupné či opracovatelné. V sedmdesátých letech se tak křemík, či přesněji oxid křemičitý stal základním stavebním kamenem pro hradla tranzistorů v integrovaných obvodech a mikroprocesorech. V uplynulých dvou desetiletích se nenašel materiál, který by jej mohl ve spínacích částech tranzistoru, tedy především v hradle, efektivně nahradit.
Důvodem, proč jsme nyní nuceni křemík ve spínacích částech tranzistorů opustit, je pochopitelně další zmenšování struktury procesoru. A změna je to vskutku významná: asi jako kdybyste ve stavebnictví při výrobě železobetonu hledali náhradu za ocel. V případě křemíku máme totiž mnohaleté zkušenosti v jeho zpracování a používání, nahrazení jinými sloučeninami (např. na bázi kovů pozn. red.) je tedy nejvýznamnější změnou od zrodu polovodičového průmyslu před čtyřiceti lety.
Nyní je Intel v situaci, kdy bylo nutné spínací části tranzistorů v integrovaných obvodech nahradit novými materiály. Proces zmenšování struktury procesorů a dalších čipů ale pochopitelně pokračuje: 45 nm rozhodně nebude konečná. Jaké další změny a případné nové materiály bude nutné v příštích pěti či deseti letech zavést?
Rád bych zdůraznil, že Intel není jediným výrobcem, který tyto otázky řeší. Problematika nahrazení oxidů křemíku jinými materiály je na konferencích, jako je IDF diskutována již přinejmenším deset let. Prakticky všichni výrobci se této problematice věnují a většina souhlasí, že řešením (pro hradlo tranzistoru pozn. red.) jsou High-K materiály. Takovéto materiály umožňují vyrábět procesory se silnějším (vyšším pozn. red.) hradlem, které má přesto podobné či dokonce lepší vlastnosti než oxid křemičitý. Intel byl první, komu se podařilo celý proces přechodu na nové materiály dokončit: nejen že jsme našli vhodné složení High-K materiálu pro hradlo (na bázi hafnia pozn. red.), ale také jsme přišli s novým materiálem pro vlastní spínací část tranzistoru na bázi kovových polovodičů. Ukazuje se totiž, že pokud změníte pouze materiál hradla, získáte pouze částečné zlepšení výkonu. Co se dalších úskalí při zmenšování struktury tranzistorů týče, největším problémem bude asi zkracování kanálů; to obecně sice pomáhá zvýšit výkon, neboť jak se spolu se zmenšováním struktury tyto vzdálenosti zkracují, elektrony překonávají kratší vzdálenost. Se zmenšením na 45 nm (kanály jsou v takovém případě jen asi 20 mm široké pozn. red.) či ještě méně ale nastává problém příliš malých vzdáleností; tranzistory se v takové situaci začínají chovat zcela nestandardně. V budoucnu Intel, ale i ostatní výrobci budou muset hledat jiné způsoby organizování tranzistorů v integrovaných obvodech: jedním z možných řešení jsou kupříkladu 3D tranzistory či tranzistory se třemi hradly. Nebudou ale technologie jako 3D tranzistory či jejich vrstvení vyžadovat komplexní změny v přístupu při navrhování procesorů?
Ne nezbytně v podstatě máte i nadále tranzistor, který je buď zapnutý, či vypnutý. Samozřejmě že z hlediska rozložení a návrhu procesoru k nějakým změnám dojde, ale to jsou problémy, které lze vyřešit. Koneckonců podobné změny se ve větší či menší míře týkají prakticky každé změny výrobního procesu. Podívejme se nyní do vzdálenější budoucnosti jednou z často diskutovaných otázek je použití uhlíkových nanotrubic. Jaké jsou podle vás reálné vyhlídky jejich nasazení při výrobě mikroprocesorů?
Uhlíkové nanotrubice jsou velmi zajímavým materiálem: mají výtečnou vodivost a minimální elektrický odpor lze je využít pro tranzistorové kanály či pro spoje (místo v současné době používané mědi pozn. red.), ale kupříkladu také pro odvod tepla, neboť mají výtečnou tepelnou vodivost. Jejich praktické využití je ale opravdu spíše otázkou vzdálenější budoucnosti, pro jejich nasazení totiž nelze použít litografii a největší problém tak v současné době je, jak uhlíkové nanotrubice jaksi "zkrotit" dnes totiž při jejich aplikaci získáme pouze takříkajíc "Promíchané špagety" a nikoliv funkční strukturu. V této oblasti je tedy reálné nasazení ještě stále poměrně daleko. Je třeba mít na paměti, že pronásledujeme pohybující se cíl a jestliže budeme schopni nasadit uhlíkové nanotrubice kupříkladu v roce 2012, bude to v procesorech, které budou mít řádově deset miliard tranzistorů. V takových procesorech bude pochopitelně třeba přesně umístit mnohem větší počet uhlíkových nanotrubic, než kolik by jich bylo zapotřebí v současných procesorech. Hlavní problém tedy je, že čím později je budeme chtít nasadit, tím složitější to paradoxně bude. To platí prakticky o jakékoliv technologii, ale v případě uhlíkových nanotrubic dvojnásob, protože prakticky nikdo neví, jak s nimi správně pracovat. Existují sice první výsledky a úspěchy IBM se kupříkladu podařilo vyrobit tranzistor za použití této technologie, v podstatě toho ale dosáhli tak, že na wafer takříkajíc "rozhodili" uhlíkové nanotrubice a víceméně šťastnou náhodou se na několika místech nanotrubice překřížily správným způsobem a vytvořily funkční tranzistor. To je ale pochopitelně na míle daleko od vytváření přesných struktur nezbytných pro výrobu procesorů. V této oblasti nás tedy ještě čeká hodně práce, než budeme schopni nanotrubice nasadit do výroby.
Zkusme se nyní věnovat věci, o které se v posledním roce či dvou příliš nehovoří růstu frekvencí. Je to už zhruba šest let, kdy Intel oznámil první úspěšné pokusy s tranzistory (nikoliv s celými CPU) pracujícími na frekvenci 10 GHz. Měl to být svým způsobem důkaz, že i architektura NetBurst může v budoucnu této hranice dosáhnout či ji překonat. Posléze se ale ukázalo, že problémy s úniky napětí v tranzistorech patrně neumožní tohoto cíle dosáhnout. Jaká je tedy budoucnost "MHz"?
To není úplně přesné. Hlavním problémem nebyl únik napětí ten nás u současných a budoucích architektur bude trápit ještě více. Zákazníci prostě nechtěli procesory, které vyzařují 150 či více wattů tepelného výkonu. Pokud bychom nemuseli brát ohled na ztrátové teplo v řádu stovek wattů, mohli bychom snadno vyrobit procesory pracující na frekvenci 6, 8 či 10 nikdo by je ale patrně nekupoval.
Je tedy možné, s ohledem na současný vývoj a změny v použitých materiálech a výrobních postupech, očekávat další výrazný nárůst pracovních frekvencí, nebo něco podobného již není na pořadu dne?
S příchodem 45 nm rozhodně dojde k významnému zvýšení frekvencí procesorů, neočekávám ale, že by nás v budoucnu čekal nějaký trvalý rychlý nárůst, žádný další závod k hranici deseti GHz.
Tím se celkem logicky dostáváme k otázce více jader, která by měla být do budoucna cestou ke zvyšování výkonu. V současné době jsme se dočkali prvních čtyřjádrových procesorů, Intel ale nedávno ohlásil své střednědobé a dlouhodobé plány v této oblasti zejména Terascale, tedy osmdesátijádrové procesory. Máme tomu rozumět tak, že vícejádrové procesory jsou v současné době z hlediska designu a výroby tím nejefektivnějším způsobem, jak zvyšovat výkon?
Myslím, že když navštívíte současné konference o architektuře CPU a PC, prakticky jedinou cestou ke zvyšování výkonu, o níž je dnes řeč, je vyšší paralelizace tedy multithreading a multicore. Tady ale narážíme na zásadní problém týkající se současného softwaru. Dokonce i ty nejpokročilejší profesionální aplikace jsou obvykle schopné rozložit výpočty na dvě, či v lepším případě na čtyři vlákna. A drtivá většina aplikací a programů pracuje pouze s jediným vláknem. Navíc mnohé uživatelské programy či hry jsou jednovláknové jendíky své podstatě a způsobu, jakým se s nimi pracuje. Myslíte si, že software bude schopen v této oblasti skutečně následovat hardware a využít jeho možností? Není pochyb, že multicore nabízí potenciálně vysoký výkon, otázkou ale zůstává, jaký výkon získáte v reálném světě s ohledem na software.
Je skutečně pravda, že mnohé typy programů závisejících na vstupu uživatele jsou sériové povahy a nelze je paralelizovat. Přesto ale existuje mnoho oblastí, kde lze vícejádrové procesory efektivně uplatnit a nemusí se jednat jen o profesionální programy, ale například i o hry, v nichž probíhá mnoho výpočtů souvisejících s během herního světa, které lze výtečně paralelizovat. Musím se přiznat, že nejsem natolik obeznámen s oborem vývoje her, abych mohl posoudit, zda současné nástroje vývojářům umožňují něco podobného snadno do her implementovat, je to ale bezpochyby oblast, v níž by procesor se čtyřmi či osmi jádry, z nichž každé je schopno zpracovat dvě vlákna současně, mohl být naplno využit. 7 0168/LUC o

Test: Čtyři jádra na speedu

Jako první v České republice jsme si měli možnost podrobně prohlédnout a otestovat nejvýkonnější stolní mikroprocesor současnosti jedná se pochopitelně o další čtyřjádrový procesor ze série Core 2 Extreme, s označením QX6800.
Logika současného značení procesorů Intel napovídá, že frekvence novinky je stejná jako u dvoujádrové varianty X6800, tedy 2 930 MHz. To je oproti předchozímu modelu QX6800 nárůst o plných 266 MHz, v řeči procent pak o 10 %. Nejnáročnější uživatelé tak již nemusí volit mezi nejvyšší frekvencí u X6800 a čtyřmi jádry u QX6700 nový procesor jim nabízí obojí. Také to ukazuje, že výrobní technologie Intelu se podle všeho těší dobrému zdraví, neboť vměstnat do jednoho pouzdra dva procesory X6800 (ničím jiným totiž QX prakticky není) a zároveň zajistit bezproblémovou stabilitu a chlazení je vcelku výkon.
Nový mikroprocesor Intel Core 2 Extreme QX6800 (žádný název dnes není tak krátký, jak by se na první pohled mohlo zdát) není pochopitelně nativním čtyřjádrovým CPU jedná se o dva dvoujádrové procesorů Core 2 Extreme propojené pomocí FSB sběrnice v pouzdře pro patici LGA 775. Intel tak v případě čtyřjádrových procesorů C2E používá stejnou techniku jako u prvních dvoujádrových Pentií D. Z hlediska operačního systému se ale pochopitelně jedná o čtyři samostatná jádra, jejich potenciální výkon je ale daným řešením do jisté míry brzděn. Problém spočívá, podobně jako u starších Pentií D, v relativně pomalém rozhraní FSB, přes nějž jsou přenášena data nejen z a do paměti či periferií, ale také mezi dvěma dvoujádry procesoru. Typickým příkladem je využití vyrovnávací (cache) paměti ta má sice celkovou kapacitu 8 MB, ty jsou ale rozděleny po 4 MB pro "dvoujádro" a v okamžiku, kdy jedna polovina QX6800 (či QX6700) potřebuje data uložená ve vyrovnávací paměti druhých dvou jader, musí se veškerá komunikace odehrát přes výrazně pomalejší sběrnici FSB. U čtyřjádrových procesorů je navíc sběrnice zatížena více i díky tomu, že dokáží zpracovávat větší objem dat najednou (měřeno hrubou výpočetní silou CPU) a sběrnice je tedy více vytížena kupříkladu požadavky na čtení a zápis v systémové RAM. Dvě dvoujádra pracující na frekvenci bezmála 3 GHz spotřebují navzdory jinak úsporné architektuře Core2 nemalé množství elektrické energie. Maximální vyzařování může při plné zátěži dosáhnout až 130 W (TDP). QX6800 pochopitelně podporuje snižování frekvence EIST, takže při nižší zátěži může frekvence poklesnout až na 1 600 MHz a teplota CPU se s originálním chladičem drží pod úrovní čtyřiceti stupňů, ale při plné zátěži a maximální frekvenci 2 930 MHz se teplota zvýšila až na 70 stupňů Celsia. Samozřejmostí u nového hi-end procesoru je podpora virtualizace a v případě C2E též odemknutý násobitel, díky čemuž máte poměrně volné ruce při experimentování s optimálním nastavením a případným zvyšováním frekvencí FSB a jádra procesoru.
C2E QX6800 potvrdil v testech to, co všichni očekávali: jedná se o bezkonkurenčně nejrychlejší procesor na trhu. U aplikací využívajících malý počet vláken (jedno či dvě) hraje roli vysoká frekvence, zatímco v ostatních případech napomáhají k vysokému výkonu čtyři jádra (v některých specifických případech nárůst výkonu proti QX6700 dosahuje až 10 %). QX6800 má navíc i jistou výkonnostní rezervu v oblasti přetaktování se vzorkem, který jsme měli k dispozici na testy, se nám bez problémů podařilo dosáhnout stabilní frekvence 3 467 MHz (13 x 266 MHz) se standardním chladičem. Jediným problémem v této situaci bylo najít reálné aplikace, které by procesor dokázaly naplno vytížit (nejblíže jsou tomu programy pro rendering a vizualizace, schopné pracovat s více vlákny).
Intel ví, že má v současné době nejvýkonnější procesor na trhu, a tak není divu, že si za něj nechá pořádně zaplatit. Cena C2E QX6800 přesáhla tradičních 999 dolarů za nový procesor zaplatíte ještě o dvacet procent víc, tedy 1199 dolarů (přibližně 33 000 Kč). Zajímavé je, že AMD si tuto hru s čísly velmi dobře uvědomilo a chytře na ní zareagovalo poměrně agresivní cenovou politikou u výkonných dvoujádrových procesorů Athlon 64 X2 5600+ a 6000+. Počátkem dubna byly totiž ceny těchto procesorů sníženy bezmála o 50 % (přesněji 42 % a 48 %, tedy na necelých 6 000 Kč a 7 000 Kč) a o něco menší, byť stále výrazné snížení cen se dotklo i ostatních procesorů ze zelené stáje. Ve vzduchu je cítit volné elektrony a křemíkový prach: schyluje se k další bitvě, tentokráte mezi K8L a 45nm procesory Intelu. Už se nemůžeme dočkat! V současné době má nejsilnější arzenál Intel, zatímco AMD sází na cenu. Pokud tedy chcete vodíkovou bombu mezi procesory (a můžete si jí dovolit), má Core 2 Extreme QX6800 naše doporučení.

Intel Core 2 Extreme QX6800

Nejvýkonnější čtyřjádrový procesor ze stáje Intel osloví zejména nejnáročnější
uživatele a majitele bezedných peněženek
Instalace
konfigurace Vyšší cena
Cena vč. DPH: 33 000 Kč
Zapůjčil: Intel, www.intel.com