Multiprocessing na jednom čipu

DEFINICE Chip Multiprocessing je technika, se kterou se budeme již brzy setkávat v návrzích moderních CPU. Jde o to, že...


DEFINICE
Chip Multiprocessing je technika, se kterou se budeme již brzy setkávat v
návrzích moderních CPU. Jde o to, že se na jednom čipu vyrobí dva nebo více
procesorů tak lze dosáhnout vyššího výpočetního výkonu než při použití jednoho
nebo více diskrétních CPU. Uvedená technologie je známa též jako "on-chip
multiprocessing" nebo "víceprocesorový systém na jednom čipu
(multiple-processor system-on-a-chip)."
Asi již v tomto roce si budou moci nejnáročnější uživatelé na vlastní kůži
ověřit, že dvě hlavy jsou lepší než jedna. Sun Microsystems, IBM, Compaq
Computer, Hewlett--Packard i další společnosti začnou totiž nasazovat high-end
servery, které využijí výhody technologie CMP (Chip Multiprocessing
multiprocessing na čipu). Jde o významný krok vpřed oproti současným systémům,
které používají mnoha diskrétních čipových modulů. (V uvedené skupině viditelně
chybí společnost Intel, která sází na zvyšování výkonu prostřednictvím
paralelního zpracování instrukcí v rámci jednoho procesoru, tedy na méně
nákladný způsob přidávání výkonu.) "Hlavní ideou je, raději než vytvářet mnohem
komplikovanější procesory, dávat raději rovnou dva do stejného modulu," říká
Linley Gwennap, hlavní analytik u mikroprocesorové konzultační firmy The Linley
Group z Kalifornie. "Problém vznikne, když operační systémy nepochopí, že máte
dvojici procesorů pak příliš výkonu navíc nezískáte," dodává. Za určitou dobu
se však podle něj operační systémy stanou multiprocesorově inteligentní, větší
problém ovšem může nastat při programování aplikací. Nárůst výkonu
Prvotní testy ukazují, že dva procesory v jednom modulu překonávají ve výkonu
více diskrétních procesorů alespoň o 50 procent. Uložením dvou CPU na jeden
kousek křemíku mohou inženýři využít výhodu kratší vzdálenosti a větší
rychlosti sběrnice při přesouvání dat mezi jádry dvou CPU. "Výsledkem může být
např. pokud jde o síťový výkon procesoru Power4 od IBM schopnost zpracovat 100
GB dat za sekundu tedy 20 celovečerních filmů na DVD," říká Joel Tendler,
ředitel technologických strategií serverové skupiny u IBM v Texasu. Takové
zpracovávání dat bude pravděpodobně přicházet spolu s astronomickými cenami
systémů stovkami tisíc až miliony dolarů což dělá z CMP systémů skutečný
high-end a směřuje je k velmi náročným zákazníkům. Zmíněné systémy by měly
nalézt využití např. při zpracování seizmických dat pro těžařské společnosti, v
e-business serverech schopných zvládat nepředvídané provozní zatížení a špičky,
v hardwaru pro náročné grafické výpočty nebo v počítačích, které zpracovávají
údaje o lidském genomu. Ne všechny high-end aplikace jsou však vhodné pro CMP.
Finanční programy dávkového zpracování, které sekvenčně posouvají přes
účetnictví jednu úlohu v daném čase, budou ještě dlouho závislé na
jednoprocesorových systémech. Doba pro komerčně životaschopné CMP systémy
přišla díky kontinuální miniaturizaci obvodů na čipech. Tak totiž inženýři
mohou na stejnou plochu umístit podstatně více součástek. V prvních systémech
se počítá s maximálně dvěma procesory na čipu, v pozdějších generacích by jich
tam mělo být až osm. Prosté směstnání dvou čipů do "jedné krabičky" ovšem
nemusí nutně přinést vznik efektivního "multiprocesoru". Největší výzvou pro
inženýry je udržet tyto dvouhlavé "stroje" nacpané daty, a to je důvod, proč se
mezi výrobci čipů objevují poměrně velké rozdíly v návrzích CMP. Kontrasty
návrhů Společnost Sun naplánovala již pro první pololetí tohoto roku modul
MAJC--5200 se dvěma 500MHz CPU, grafickým preprocesorem a systémem pro externí
datovou komunikaci. Špičkové přenosové kapacity mají činit 4,8 GB/s. Procesory
sdílejí 16KB čtyřcestných asociativních datových cache a každá CPU má také svou
vlastní 16KB dvoucestnou asociativní instrukční cache. V MAJC-5200 se využívá
multithreadingu tak, že hardware dělí zpracovávané úlohy do bitových dílů
(bite-size chunks), které uspořádaně jdou do každého jádra, přičemž se brání
vzniku jakéhokoli chybného procesního cyklu. Marc Tremblay, vedoucí návrhář v
procesorové skupině Sunu, potvrzuje, že mnohé softwarové aplikace nejsou
optimalizovány pro multithreading. Aby to vykompenzoval, má MAJC-5200 používat
Java Virtual Machine na případné generování threadů v javových programech.
Naproti tomu IBM se ve svých vysokorychlostních 1GHz čipech Power4 nepřiklonila
k implementaci multithreadingu. Aby zajistil efektivní průchod dat, má být jeho
32MB paměti rozděleno na cache druhé a třetí úrovně. V nich by měl být prostor
jak pro výměnu dat mezi jednotlivými procesory, tak pro přednahrávání informací
získaných ze systémové paměti. "Problém, který máte se všemi systémy, když
zvýšíte frekvenci, je ten, že se paměť jeví, jako by byla daleko vzdálenější,"
vysvětluje Tendler. "Procesní cyklus při 500 MHz trvá 2 nanosekundy; při 1 GHz
je to 1 nanosekunda. Takže k hierarchii ukládání přidáváme další cachování."
IBM očekává, že uvede svůj CMP procesor ve druhé polovině tohoto roku. Sun a
IBM se shodují v jedné věci: Multiprocessing na čipu je další velká věc v
návrhu CPU. Je to velká zpráva pro náročné uživatele, ale možná ještě větší
výzva pro programátory aplikací.
1 0021 / pen









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.