Procesory včera, dnes i zítra

MINULOST... První mikroprocesory Úplně první mikroprocesor, nazvaný prozaicky 4004, se zrodil v dílnách firmy Intel (...


MINULOST...
První mikroprocesory
Úplně první mikroprocesor, nazvaný prozaicky 4004, se zrodil v dílnách firmy
Intel (INTegrated ELectronics) roku 1970. Společnost, kterou založil Robert
Noyce a Gordon Moore, tak uvedla dva roky po svém založení na trh čip
obsahující 2 300 tranzistorů. Jeho užití směřovalo především do oblasti
kapesních kalkulátorů. Autorem projektu byl Marcian Hoff. 4bitový, 108kHz
procesor se prodával za cenu 200 dolarů, což znamenalo poměrně dobrou
prodejnost. Mikroprocesor se od již existujích integrovaných obvodů lišil
především svou schopností pracovat s instrukce-mi jednoduchými kódy
jednotlivých operací a údaji daty.
Rok 1972 znamenal další výrazný krok kupředu, když byl na trh uveden první
8bitový mikroprocesor 8008 sestavený z 3 500 tranzistorů. Procesor uměl
adresovat 64 KB paměti a pracoval na frekvenci 200 KHz. Jeho výkon se pohyboval
kolem 60 000 instrukcí za sekundu.
Roku 1974 byla uvedena jeho vylepšená verze s frekvencí 2 MHz. Ta už uměla
zpracovávat 640 000 instrukcí za sekundu. Procesor používal 6 000 tranzistorů a
mohl adresovat až 64 KB paměti. Měl označení 8080.
V témže roce se objevil i první procesor s architekturou RISC, ačkoliv sama
zkratka RISC byla poprvé použita až v roce 1980. Firma RCA začala prodávat
mikroprocesor 1802 běžící na závratných 6,4 MHz. Používal se v mnoha odvětvích,
od videoher až po vesmírné simulace NASA.
V následujícím roce 1975 by-ly uvedeny na trh dva procesory z dílny MOS
Technology MC6501 a MC6502, za cenu 20 a 25 dolarů. V té době stál Intel 8080
150 dolarů, takže MOS získal náskok na poli levných domácích mikropočítačů.
Na počátku roku 1976 Intel začal prodávat 5 MHz procesor 8085 využívající 6 500
tranzistorů. V červnu uvedl Texas Instruments na trh dokonce první 16bitový
procesor TMS9900, který použil ve svém 16bitovém minipočítači TI 990. Červenec
znamenal úspěch pro Zilog, neboť byl uveden 2,5MHz Zilog Z80, osmibitový čip
částečně kompatibilní s 8080.
Začátek moderního věku počítačů
Od roku 1978 se začíná moderní počítačová doba, neboť v březnu byl uveden na
trh procesor Intel 8086, s nímž jsou procesory x86 až dodnes kompatibilní. 8086
je plně 16bitový obvod sestávající z 29 000 tranzistorů. Může adresovat 1 MB
paměti. Verzi 4,77 MHz následovala rychlejší 8MHz.
V červnu 1979 přišel Intel s procesorem 8088. Vycházel z 8086 a byl s ním plně
instrukčně kompatibilní. Pro zapojení do starších osmibitových systémů byla
jeho externí sběrnice přepracována taktéž na 8bitovou šířku. Stejně jako 8086
byl i 8088 vyráběn nejdříve na frekvenci 4,77 MHz, později přibyla verze
pracující na 8 MHz s více než dvojnásobným výkonem (0,75 proti 0,33 MIPS).
Září 1979 se stalo datem narození 16bitové Motoroly 68000. Její číselné
označení vycházelo z toho, že obsahovala 68 000 tranzistorů.
Následující rok 1980 byl ve znamení dějů, které výrazně ovlivnily další běh
událostí i v oboru procesorů, neboť došlo k jednáním mezi IBM a Microsoftem o
vývoji operačního systému pro počítače IBM PC, které se měly zanedlouho objevit
na trhu.
Ještě během téhož roku vyvinul Intel procesor iAPX-432 první 32bitový procesor
od Intelu. Budoucí vývoj však ukázal, že 432 o mnoho předběhl svou dobu, takže
jeho užití nebylo příliš rozsáhlé. Intel dokonce později "zaplácl" výkonovou a
technologickou mezeru mezi 8086 a 432 procesorem 80286.
V srpnu 1981 oznámila Velká Modrá ukončení vývoje svého počítače IBM 5150 PC
Personal Computer. V konfiguraci Intel 8088 na 4,77 MHz, 64 KB RAM, 40 KB ROM,
jedna 5,25" disketová mechanika a PC-DOS 1.0 stála sestava 3 000 dolarů. S
barevnou grafickou kartou a monitorem se cena vyšplhala až na 6 000 dolarů.
Bylo to skutečné "PCčko", první příslib nového věku.
V září 1981 pak Microsoft začal práci na uživatelském rozhraní, které mělo
oddělit periferie, například tiskárny a videokarty, od programů a uživatelů.
Původně bylo nazýváno Interface Manager, ale později se objevil název Windows.
Procesor Intel 80286 se objevil v únoru 1982. Používal 134 tisíc tranzistorů a
opět plně 16bitovou sběrnici. Mohl adresovat 16 MB skutečné a až 1 GB virtuální
paměti. Zcela byla přepracována možnost adresace, rozšířeny byly funkční režimy
na reálný a chráněný. V reálném je procesor v podstatě rychlejší 8086, může
adresovat pouze 1 MB paměti. V chráněném režimu jsou dostupné všechny funkce
286. Segmenty paměti jsou však pouze 16bitové, takže jejich maximální velikost
je 64 KB. To dost omezovalo možnost práce v chráněném režimu, neboť zavádění a
práce s programy, většími než 64 KB, bylo provázené velkými potížemi. Do jisté
míry byli programátoři nuceni používat techniky z reálného režimu, který má 64
KB segmenty standardně. První verze procesoru běžela na 6 MHz a měla výkon 0,9
MIPS. Následovaly verze 10 a 12 MHz s odpovídajícím nárůstem výkonu (1,5 a 2,66
MIPS).
V červnu 1982 Intel oznámil procesor Intel 80186, nedlouho po něm následovala i
verze 80188. Oba procesory vycházely z 8086 (resp. 8088), byly rozšířeny o 2
kanály rychlého přístupu do paměti (DMA), tři programovatelné časovače,
programovatelný řadič přerušení, generátor časových impulzů a o několik málo
instrukcí.
V průběhu roku 1982 byla ještě podepsána desetiletá dohoda o spolupráci a
výměně technologií při vývoji procesorů x86 mezi firmami Intel a Advanced Micro
Devices (AMD). Později se ukázalo, že zřejmě pomohla velmi rychlému vývoji v
oblasti procesorů x86 a zároveň s její pomocí získala AMD technologii, která jí
pomohla stát se citelným konkurentem Intelu v oblasti procesorů.
Další mezník, zrod PC XT
Další legenda se zrodila v březnu 1983, když IBM přidala do svého PC 10 MB
pevný disk, sériové rozhraní a dalších 64 MB paměti. Se 128 KB tak sestava
stála úctyhodných 5 000 dolarů. IBM ji nazvala PC XT.
Na počátku března roku 1984 začala IBM prodávat PCjr. Protože používalo pouze
procesor 8088, 64 KB RAM a jednu 5,25" disketovou mechaniku, příliš se toto PC
neujalo, a tak byl projekt po roce zastaven.
IBM dále zůstala na platformě PC XT, kterou v srpnu rozšířila na procesor 286,
256 KB RAM a 1,2MB disketovou mechaniku. Výsledek, nazvaný PC AT se i s pevným
diskem o kapacitě 20 MB, barevnou grafickou kartou a monitorem prodával za
celých 6 700 dolarů.
Ještě téhož roku Motorola předvedla svůj nový procesor 68010.
Říjen 1985 byl ve znamení nového procesoru od firmy Intel 80386. Intel v něm
dal jasně najevo, že hodlá být v této oblastí lídrem a nedá nikomu šanci.
Vnitřní uspořádání bylo částečně převzato z APX-432, částečně bylo nové.
Procesor rozšířil své pracovní režimy z reálného a chráněného také na virtuální
8086. V reálném režimu se pak choval stejně jako 8086, ale bylo možné s pomocí
32bitových registrů naadresovat až 4 GB fyzické paměti. Struktura chráněného
režimu byla zachována, 16bitové registry byly nahrazeny 32bitovými, a tak se
maximální velikost segmentu zvedla až na 4 GB. S pomocí selektorů šlo
naadresovat celkem 64 TB a tyto parametry chráněného režimu zůstaly zachovány
až dodnes. Technologický rozdíl mezi procesory 386 a 286 byl téměř stejně
propastný jako mezi 286 a 8086, kompletní přechod na 32bitovou platformu se
ukázal být dobrou investicí do budoucna. Procesor se začal prodávat v srpnu
1986 v 16MHz verzi, později přišly verze 20 MHz, 25 MHz a 33 MHz.
Roku 1986 se objevily dvě firmy, které se později rovněž staly významnými
producenty procesorů. MIPS Technologies uvedla 8MHz procesor R2000 32bitový čip
s 110 000 tranzistory a rychlostí 5 MIPS, a NexGen oznámil, že začíná pracovat
na další generaci procesorů x86 nazvané F86.
Známá řada IBM Personal System/2 (PS/2) pochází z roku 1987, špičkovým kouskem
od IBM té doby byl Model 80 používající 20MHz procesor 80386.
V červnu 1988 Intel oznámil 16MHz verzi nového procesoru 80386SX. Je to sice
vnitřně 32bitový procesor, vnější sběrnice je však pouze 16bitová. Mělo to
umožnit jeho použití v systémech, které byly vybaveny levnějšími základními
deskami.
V průběhu roku 1988 začal Digital pracovat na prvním 64bitovém procesoru. Na
trh byl dodán v roce 1992 jako Alpha 21064 na 150 MHz. Také Intel nezahálel a
uvedl svůj procesor i960KB s vnitřní architekturou, která byla podobná
technologii RISC, díky čemuž procesor dovedl zpracovávat dvě instrukce
najednou. Tento procesor se až doposud používá jako řídicí obvod některých
laserových tiskáren.
Procesor Intel 486 se zrodil v dubnu 1989. Obsahoval přepracované jádro
procesoru 80386, integrovaný koprocesor (speciální obvod pro zrychlení
numerických výpočtů) a 8KB primární cache. Používal 1,2 milionu tranzistorů
rozložených v jednomikronové technologii (udávaná hodnota je nejmenší
vzdáleností mezi jednotlivými kanály v křemíku, ze kterého je obvod vyroben).
Rychlost verze 25 MHz byla 20 MIPS. Rozdíl mezi 486 a 80386 byl velmi malý. Šlo
pouze o několik přidaných či přepracovaných instrukcí, 8 KB cache a integrovaný
koprocesor. Vnitřní logika reži-mů zůstala zachována, stejně jako kompletní
32bitová sběrnice. Procesor stál při svém uvedení na trh 900 dolarů.
Taktéž v dubnu 1989 se zrodil nový procesor Motorola, který nesl na hřbetě
označení 68040. Obsahoval 1,2 milionu tranzistorů, byla plně 32bitový, měl
integrovaný koprocesor a datovou a instrukční cache. Motorola také zrychlila
předchozí model 68030 až na 50 MHz.
V roce 1990 se kupodivu nestalo v tomto oboru nic technicky důležitého, pouze
soud rozhodl, že konkurenti Intelu mohou bez jakéhokoliv omezení v názvech
svých procesorů používat označení x86, aniž by narušovali autorská práva
Intelu. To byl hlavní důvod, že Intel svuj další procesor nepojmenoval 586,
ačkoliv to měl původně v plánu.
V březnu 1991 se dočkalo svého úspěchu také AMD. Začaly se prodávat jeho
procesory Am386 ve frekvencích 20 a 40 MHz. Svou vnitřní architekturou výrazně
překonávaly obdobné čipy od Intelu, neboť byly jednak postaveny na vyšších
hodinových kmitočtech a také zahrnovaly mnoho technologických novinek
implementovaných do procesorů 486, jako například 8KB interní cache. Díky těmto
vlastnostech předstihly konkurenční obvody od Intelu asi o 25 % ve výkonu,
ačkoliv hodinový kmitočet byl pouze o 21% vyšší. Obchodní úspěch klonu byl
nesporný, během jednoho měsíce se prodalo více než 1 milion kusů.
V dubnu 1991 Intel uvedl procesor 486SX. Rozdíl proti 486DX, jak byl nazýván
čistokrevný Intel 486, spočíval v absenci koprocesoru. Částečně se proto
jednalo o běžný procesor 486, jehož koprocesor neprošel náročnou výstupní
kontrolou, zatímco procesor byl v pořádku. Koprocesor byl pak fyzicky i
elektronicky oddělen a procesor pakován s názvem SX..
Intelovský procesor 486DX na 50 MHz byl uveden v červnu 1991. Hlavní
technologickým pokrokem byl přechod na 0,8mikronovou technologii. Bohužel se
Intel nevypořádal dobře s problémy kolem chlazení, a tak byl procesor, který se
přehříval, po několika měsících stažen.
V březnu 1991 začal Intel prodávat procesory Intel 486DX2/50. Byly to externě
25 MHz čipy, které však vnitřně frekvenci násobily dvěma, a tak dosahovaly
uvedených 50 MHz. Tato technologie dvojí frekvence se v dalších letech hojně
rozšířila, neboť se ostatní komponenty kolem procesoru nedokázaly tak rychle
přizpůsobovat rostoucím kmitočtům procesorů.
V červnu 1991 uvedl Cyrix svůj klon 486 nazvaný Cx486DLC. Ve své podstatě to
byl velmi ochuzený Intel 486, vybavený pouze 1KB cache a postavený na 600 000
tranzistorech. To se velmi negativně projevilo na výkonu a také spolehlivost
nebyla nejvyšší.
Téhož roku začalo AMD s vývojem procesoru 5. generace.
Věk Pentia
V březnu 1993 Intel uvedl na trh procesor Pentium. Využíval 32bitové registry a
64bitovou datovou sběrnici. Adresovatelný prostor byl opět 4 GB. Procesor
obsahoval 3,1 milionu tranzisto-rů používajících 0,8mikronovou BiCMOS
technologii. Procesor byl uveden ve verzích 60 a 66 MHz, které byly napájeny 5
V. Další verze Pentia byly však 3,3-voltové, a proto byly základní desky pro
verze 60 a 66 MHz nekompatibilní s vyššími verzemi. V procesoru se však
objevila chyba, která byla důvodem rozsáhlých bezplatných výměn. Intel na ně
přistoupil po četných protestech odborné veřejnosti. Rozdíl mezi 486 a Pentiem
je sice značný, ale pouze vnitřně. Z pohledu softwaru se přidalo jen několik
instrukcí.
V dubnu začalo AMD prodávat procesor Am486 na 40 MHz a Am486DX2 na 25/50 MHz.
Pro Intel oblíbený měsíc březen přinesl novinku i v roce 1994. Intel uvedl
procesor 486DX4 na 100 MHz. Kdo by si myslel, že šlo o vnitřně zečtyřnásobenou
frekvenci 25 MHz, byl by na omylu, neboť tento procesor násobil vnitřně pouze
3x. Proč byl tedy nazván DX4 ví snad jen výrobce. Také se začaly prodávat nové
verze procesorů Pentium na 90 a 100 MHz, využívající 0,6mikronovou BiCMOS
technologii.
V říjnu 1995 zakoupilo AMD firmu NexGen, která byla jedním z konkurentů na poli
procesorů. Transakce byla ukončena v lednu 1996 a stála AMD 623 milionů dolarů.
Procesor Pentium Pro byl oficiálně představen v listopadu 1995. Obsahuje 5,5
milionu tranzistorů a jako první byly uvedeny verze 150, 180 a 200 MHz. Vnitřní
architektura byla optimalizována pro 32bitové instrukce, takže při použití
16bitových programů se procesor choval jako pomalejší Pentium na stejné
frekvenci. Zpočátku stál až 1 682 dolarů.
V tomto období začalo AMD už viditelně ztrácet dech, neboť rovněž v listopadu
1995 představilo svůj procesor Am5x86, nazývaný též Am486DX5. Vnitřně šlo o
procesor s podobnými prvky, jako má Pentium, používal se však v deskách pro
procesor 486. Vnitřní frekvence byla zečtyřnásobena.
V únoru 1996 předvedl Cyrix své procesory CX6x86 a zavedl značení podle toho,
jaké frekvenci Pentia procesor výkonově odpovídá. Modely byly proto nazvány
CX6x86 P133+, P150+ a P166+. Cyrix je ve skutečnosti nevyráběl, pouze vytvořil
návrh, podle něhož s výrobou začala procesorová divize IBM. Velká Modrá později
začala tyto procesory prodávat pod vlastní značkou.
Teprve v březnu 1996 začalo AMD prodávat vlastní klony Pentia, nazvané AMD5K86.
Byly dostupné ve verzích P75 a P90. V červnu byly nahrazeny procesorem K5
PR100, kde AMD převzalo značení Cyrixu podle výkonu odpovídajícího Pentiu.
Ke konci roku 1996 oznámily firmy AMD a Cyrix každá svůj procesor další
generace. K6 od AMD je, stejně jako 6x86MX od Cyrixu, optimalizován jak pro
16bitové, tak pro 32bitové aplikace, a zahrnuje také 64KB cache. K6 obsahuje
MMX kód, který zakoupilo AMD od Intelu, 6x86MX má vlastní techniku, která je s
MMX kompatibilní.
SOUČASNOST...
K 15. 1. tohoto roku jsou na českém trhu procesory Intel Pentium MMX, Pentium
Pro a Pentium II, AMD K5 a K6, Cyrix 6x86MX a MediaGX.
I n t e l
P e n t i u m M M X
Intel Pentium MMX je potomkem procesoru Intel Pentium a přejímá téměř veškeré
jeho vlastnosti, k nimž přidává někte-ré nové. Pentium je opět potomkem,
tentokrát však procesoru Intel 486. Hlavními rysy Pentia MMX jsou:
lsuperskalární architekura, která umožňuje provádět až dvě instrukce ve dvou
instrukčních frontách zároveň, spolu se zřetězením (pipelining), jehož výhodou
je rozfázování provádění instrukce do pěti nezávislých fází;
ldynamické předvídání skoků, s jehož pomocí lze výrazně urychlit provádění
podmíněných skoků;
lzřetězená FPU, což zrychluje provádění operací s desetinnými čísly;
loddělené 16KB datové a instrukční vyrovnávací paměti pro zaručení plynulého
toku dat do procesoru a zpět do paměti;
l64bitová datová sběrnice, která navazuje na 64bitovou datovou sběrnici systémů
Pentium kompatibilních;
lrozšíření MMX, pro zrychlení multimediálních aplikací;
Superskalární architektura
Ke zvýšení výkonu Pentia bylo použito několika technologií, z nichž
nejvýkonnější je pravděpodobně dvojitá instrukční fronta spojená se zřetězením
instrukcí. Většina instrukcí je prováděna v 5 fázích. Ve fázi Prefetch (PF) se
instrukce vybírá z paměti, fáze FIFO (F) je transparentní vyrovnávací paměť
typu FIFO, jejímž úkolem je vyrovnávat možné ztráty rychlosti při fázi
Prefetch, kdy by nestihly být načteny příliš dlouhé instrukce, takže by chyběla
potřebná instrukce do páru. Během fáze Instruction Decode (D1) je provedeno
dekódování instrukce, fáze Address Generate (D2) vytváří potřebné adresy, ve
fázi Execute (EX) dojde ke skutečnému provedení instrukce a konečně fáze Write
Back (WB) dokončuje instrukci.
Na všechny tyto fáze je v Pentiu MMX k dispozici samostatná jednotka. Jednotky
jsou na sobě nezávislé a navíc zdvojené, takže dochází-li k dekódování
instrukce v jednotce D1, může jednotka PF už následující instrukci načítat.
Tato technika umožňuje Pentiu dokončit během jednoho hodinového cyklu až 2
instrukce. Tyto dvě zřetězené fronty se nazývají "U" a "V". Ačkoliv procesor
nebude do obou front dávat jakékoliv instrukce, popisovat technologii, jakou se
rozhodne každá instrukce kam může jít, je nad rámec tohoto článku. Proto se
smiřme s faktem, že fronta "U" je univerzální a fronta "V" je pouze pro
jednodušší a kratší instrukce.
Dynamické předvídání skoků
Algoritmus dynamického předvídání skoků, který má v sobě procesor Pentium MMX
implementován, je založen na jednoduché myšlence je-li v programu podmíněný
skok, bylo by dobré odhadnout, jaký bude výsledek podmínky ještě předtím, než
se vyhodnotí, aby byly ve vyrovnávací paměti instrukce připravené na zpracování
bez zbytečné prodlevy. Při tomto zadání se vychází z faktu, že když podmíněný
skok skutečně nastal, je velmi pravděpodobné, že se uskuteční i opakovaně.
V procesoru je pro tyto případy zahrnuta paměť adres skoků (BTB Branch Target
Buffer). Procesor do ní ukládá cílové adresy skokových instrukcí a informace o
tom, zda se v předchozích cyklech skákalo či neskákalo. Když procesor narazí na
instruk-ci podmíněného skoku, podívá se nejdříve, není-li cílová adresa uvedena
v tabulce BTB, která má kapacitu 256 položek. Pokud není, tuto položku zavede a
počká na skutečné vyřešení podmínky. Pokud tam tuto položku najde, zkontroluje
si s jakou pravděpodobností bude výsledkem skok a podle toho požádá či nepožádá
o čtení instrukcí, které následují za skokovou instrukcí. Je-li odhad BTB
správný, jsou instrukce okamžitě k dispozici, je-li chybný, pošle požadavek do
paměti na výběr správných instrukcí.
Zřetězená FPU
Stejně jako jsou instrukce v jádře procesoru prováděny postupně v několika
nezávislých blocích, které lze plnit odděleně a tak zvýšit průtok instrukcí,
stejné pravidlo se používá i v jednotce pro práci s desetinnými čísly (FPU
Floating Point Unit).
Oddělené 16KB datové a instrukční vyrovnávací paměti
Pro data i instrukce je v procesoru implementováno celkem 32 KB vyrovnávací
paměti ve dvou blocích instrukčním a datovém. Každá cache má vlastní TLB
(Translation Lookaside Buffer) pro převádění lineární adresy paměti na
fyzickou. Obě vyrovnávací paměti jsou plně softwarově či hardwarově
konfigurovatelné a chovají se podle MESI protokolu.
Vnější řešení
Intel Pentium MMX je, stejně jako starší Pentium, prodáváno v pouzdře PGA (Pin
Grid Array) uspořádaném podle standardu Socket 7. Požadavkem na základní desky
je hlavně podpora správné detekce procesoru a možnost práce s dvojím napájením
napěťové úrovně logických hodnot se liší od napětí, kterým se napájí pracovní
část procesoru. V současné době je Intel Pentium MMX de facto standardním
procesorem, nicméně je společností Intel postupně nahrazován procesorem Pentium
II.
P e n t i u m P r o
Intel Pentium Pro vychází z pokročilých technologií, které v sobě obsahovalo
Pentium, a dále je rozvíjí. Superskalarita se dostala na úroveň 3, je tedy
možno dokončit provádění až 3 instrukcí během jednoho hodinového taktu
procesoru. Byly také přidány další techniky pro zvýšení výkonu procesoru:
lvícenásobné předvídání skoků, předvídá tok programu během několika větvení;
lanalýza toku dat, která analyzuje a třídí instrukce tak, aby byly vykonány v
optimálním postupu, nezávisle na skutečném pořadí;
lspekulativní provádění instrukcí, kdy procesor vykonává instrukce napřed, aby
neztrácel čas čekáním na přístup z paměti.
Vícenásobné předvídání skoků
Stejně jako Pentium MMX má v sobě také Pentium Pro implementováno předvídání
skoků, jehož přesnost se udává za hranicí 90 %. Na rozdíl od běžného Pentia má
algoritmus schopnost jít více do hloubky kódu a odhadnout i další než nejbližší
větvení. Opět je použita paměť BTB (Branch Target Buffer), v instrukční cache
se však na každou položku BTB rezervuje 16 byte pro instukce, které budou za
větvením pokračovat, takže ty jsou jednotce DECODE k dispozici.
Analýza toku dat
Toto je zásadní funkce, která umožňuje práci spekulativního provádění
instrukcí. Její podstatou je fakt, že některé instrukce nemusejí být vykonány
přesně v pořadí, v jakém jsou skutečně v programu, ale lze je vykonat už dříve,
pokud si zajistíme, aby se registry do doby skutečného provedení instrukce
nezměnily. Právě k tomu slouží analýza toku dat.
Příslušné obvody procházejí kód a hledají instrukce, které lze provádět bez
ohledu na okolí. Instrukce jsou označeny jako nezávislé na okolí a tento
atribut je poté využit během fáze spekulativního provádění instrukcí. Systém,
kdy se instrukce ve skutečnosti provádějí v pořadí, které neodpovídá tomu, jak
jsou zapsány v programu, se nazývá "Out-of-order execution" provádění mimo
pořadí.
Spekulativní provádění instrukcí
Předtím než si vysvětlíme princip spekulativního provádění instrukcí, je dobré
si uvědomit jednu zásadní věc. V posledních deseti letech se zvýšil výkon
procesorů desetinásobně, ale rychlost paměti se zvýšila pouze o 60 %. Z toho
jasně vyplývá, že nejslabším místem při práci procesoru bude čekání na přísun
dat z paměti. Procesor Pentium Pro to řeší tak, že s pomocí analýzy toku dat
zjistí, kterou instrukci je možno provést, aniž by bylo nutné čekat na výsledek
předchozích instrukcí. Tyto instrukce provede a výsledek uloží do zvláštní, k
tomu určené paměti ROB. Když tok programu dojde do místa, odkud začalo
spekulativní provádění instrukcí, pouze se zkontrolují stavy registrů, zda
odpovídají stavům, které se předpokládaly, když se instrukce napřed řešily.
Výsledek se v tom případě použije a procesor tak může využít i čas, kdy čeká na
data z paměti.
Tyto výše popsané techniky se souhrnně nazývají Dynamic Execution dynamické
provádění instrukcí. Jsou hlavní příčinou velmi vysokého výkonu procesoru
Pentium Pro a představují výbornou alternativu pro zvýšení výkonu procesoru,
aniž by bylo nutné investovat do zvětšení kapacity L2 cache. Bohužel jsou
optimalizovány pro 32bitové programové vybavení, z čehož vyplývá ztráta výkonu
při provozu 16bitových aplikací, např. Windows 95.
Vnitřní provádění instrukcí v jednotce DISPATCH/EXECUTE je ve skutečnosti
prováděním výsledků trojnásobného instrukčního dekodéru (ID). Ten dekóduje
instrukce do jednotlivých "uopů", jež jsou v podstatě RISC instrukcemi. Uopy
jsou dále posílány do DISPATCH/EXECUTE, která jich zvládne zpracovat nárazově
až 5 zároveň, i když běžně se zpracovávají 3 uopy najednou.
Jednotka RETIRE se stará o odstraňování už vykonaných uopů z Instruction Poolu
(ROB). K tomu používá poměrně složitý algoritmus, který řeší, zda by-la
vykonána příslušná přerušení, traps, chyby, breakpointy, případně chybné odhady
větvení. Složitost jednotky RETIRE je daní za velmi pokročilou vnitřní
architekturu Pentia Pro s unifikovanou pamětí na dekódované instrukce, zvanou
Instruction Pool, kde jsou uopy bez ladu a skladu naházeny.
Vnější řešení
Pentium Pro se dodává v pouzdře PGA podle specifikace Socket 8. Na jednom
podkladu je integrován jak procesor, tak 256 KB až 1 MB vyrovnávací paměti
(cache) L2 s příslušným řadičem. Je velmi pravděpodobné, že procesory Pentium
Pro jsou poslední, u nichž Intel použije patici typu Socket, protože dále už
hodlá přecházet na patice typu Slot. Hlavním požadavkem na základní desky je
přítomnost Socket 8 a schopnost desky pracovat s procesory Pentium Pro. Pentium
Pro je dnes standardem pro serverové systémy, i když začíná být někdy
nahrazován Pentiem II, což se týká hlavně moderních aplikací.
P e n t i u m I I
Vnitřní struktura procesoru Intel Pentium II je velmi blízká procesoru Pentium
Pro. Byly zachovány veškeré rozšiřující algoritmy, které zajišťovaly vysoký
výkon, zároveň byla zlepšena možnost práce s 16bitovým kódem.
Hlavním rozdílem je odlišný způsob zapouzdření a přidání instrukcí MMX.
Vnější řešení
Procesor Pentium II se dodává v pouzdře S.E.C. cartridge (pouzdro s jednou
řadou kontaktů). Uvnitř balení procesoru je mimo vlastní procesní jednotky také
integrovaná cache L2 a její řadič. Použitá patice procesoru je nazývána Slot 1
a Intel tvrdí, že bude standardem pro všechny modely Pentium II. Hlavním
požadavkem na základní desky, u nichž je požadována podpora procesoru Pentium
II, je přítomnost Slot 1 a samozřejmě čipová sada, která Pentium II podporuje.
A M D
AMD K 5
Procesor AMD-K5 je poněkud přepracovanou variantou procesoru Am5x86, který se
používal v základních deskách Procesoru 486. Jádro procesoru K5 je RISCová
superskalární část obsahující šest samostatných jednotek dvě jednotky ALU
(aritmeticko-logické), dvě načítací a ukládací, jednu větvící a jednu FPU
(floating-point unit, jednotka pro práci s desetinnými čísly). Procesor se
vyznačuje především těmito vlastnostmi:
lsuperskalární RISCové jádro;
lvykonávání instrukcí mimo pořádí (Out-of-Order Execution);
lpřejmenovávání registrů;
lpredekódování a dekódování x86 instrukcí;
lpředvídání skoků.
Superskalární RISCové jádro
Vlastní RISCové jádro procesoru je plně odděleno od instrukcí x86 tím, že mu
předchází dekodér těchto instrukcí do operací RISC s pevnou délkou (takzvané
ROPy). Každá instrukce x86 je tak konvertována do těchto ROPů, které, právě
díky své pevné délce, mohou být zpracovávány mnohem snadněji a rychleji, než
standardní x86 instrukce.
Superskalární jádro procesoru K5 zvládne zpracovat běžně 4 ROPy během jednoho
taktu, špičkovým výkonem je až 6 ROPů za takt. Tato architektura také umožňuje
provádět instrukce přímo za sebou, aniž by bylo nutné čekat na to, jak
konkrétně změnila předcházející instrukce registry a znovu registry načítat.
Vykonávání instrukcí mimo pořadí (Out-of-Order Execution)
Technika Out-of-Order Execution je v K5 implementována kvůli tomu, aby
eliminovala možné mezery ve zpracovávání kódu způsobené vlastnostmi zřetězeného
zpracování instrukcí (pipelining). V 16položkovém bufferu se nacházejí
predekódované ROPy, z nichž si jednotlivé exekutivní jednotky vybírají kód ke
zpracování "své" instrukce, a ten pak zpracovávají. Reorder buffer (ROB) se
stará o to, aby se dodrželo původní pořadí instrukcí a dává pozor, aby výsledky
byly poskytovány ve správném sledu.
Přejmenovávání registrů
Architektura x86 má pouze 8 registrů pro všeobecné použití. To je velmi
nepříjemné, protože sčítací či odečítací instrukce často dávají výsledky do
stejného registru, odkud berou zadání. Tato technika však není slučitelná s
Out-of-Order execution, protože tím vnikají těžko řešitelné závislosti na
skutečných registrech. K5 se k tomuto problému staví tím způsobem, že do mnoha
vnitřních registrů namapuje příslušné x86 registry a vyvaruje se toho, aby
zdroj byl současně i cílem. To umožňuje učinně řešit instrukce mimo pořadí a
eliminuje vzájemné závislosti.
Predekódování a dekódování x86 instrukcí
Problémem instrukcí x86 je také jejich proměnná délka. To samo o sobě téměř
znemožňuje konvenčním způsobem vykonávat instrukce mimo pořadí a proto se K5
uchyluje k převádění dlouhých instrukcí x86 na skupinky ROPů, jejichž
jednotlivá délka je však konstantní. Predekódovací obvody proto dekodéru označí
u každé x86 instrukce, která jimi projde, také její délku, takže dekodér může
pouze převádět na ROPy jednotlivé bloky kódu.
Predekodér předává dekodéru instrukce v predekódovacím bufferu už s označenými
začátky a konci jednotlivých instrukcí. Na začátku vlastního dekódování si
dekodér prohlédne celý blok instrukcí a zvolí si nejvhodnější pozici pro jejich
dekódování. Situaci mu ulehčuje také to, že predekodér odhadl, na kolik ROPů se
instrukce rozkóduje.
Dekodér se rozhoduje, na kolik ROPů jednotlivé instrukce rozkóduje. Pokud to je
stejně nebo méně než 4 ROPy, instrukce jsou posílány přímo do jedné ze čtyř
dekódovacích pozic (Fast-path) Komplexní x86 instrukce, které vyžadují více než
4 ROPy, jsou převedeny podle Microcode ROM (MROM). Po dekódování jsou instrukce
poslány přímo do exekutivních jednotek.
Přestože jsou instrukce posílány do jednotlivých exekutivních jednotek v
původním pořadí, mohou být vykonávány i mimo pořadí, protože jednotky si mohou
své instrukce odebírat zcela nekoordinovaně. Toto vykonávání mimo pořadí
eliminuje nutnost, aby překladač, ve kterém je vytvořen program, musel řešit
optimalizaci kódu, protože ta se provádí až v procesoru.
Předvídání skoků
Také procesor K5 obsahuje techniku předvídání skoků (Branch prediction) podobně
jako Pentia. Její přesnost se udává na úrovni 75 %. Princip je velmi podobný
principu předvídání skoků u Pentia MMX.
Vnější řešení
K5 se prodává na patici Socket 7, která je součástí všech pentiových boardů.
Nevyžaduje žádné zvláštní zásahy do uspořádání desky, pouze je dobré, aby byl
přímo podporován.
Procesor AMD-K5 je typickým představitel levných čipů do méně náročnějších
stanic. Jeho výkon je o něco nižší než výkon odpovídajícího Pentia MMX, pokud
však vezmeme v úvahu i cenu, je to velmi silný konkurent. AMD už postupně
výrobu procesorů K5 opouští a je pravděpodobné, že v dohledné době úplně vymizí
z nabídek distribučních společností.
AMD K 6
AMD-K6 MMX je zatím posledním článkem rodiny procesorů AMD. Jeho hlavní devizou
na exponovaném trhu mikroprocesorů je především vnitřní architektura nazvaná
RISC86. Významným zlepšením je též implementace rozšíření MMX. Procesor však
zůstává nadále kompatibilní se staršími deskami tím, že je zapoudřen do
keramického PGA modulu odpovídajícího specifikaci Socket 7.
Vnitřní architektura AMD-K6 se vyznačuje především:
lsuperskalaritou;
lvícenásobným dekodérem instrukcí x86 do RISC86;
ldvouúrovňovým předvídáním skoků;
lspekulativním prováděním instrukcí;
lprováděním instrukcí mimo pořadí;
lpřejmenováváním registrů;
l64 KB vyrovnávácí paměti na čipu.
Predekodér
Dekódování x86 instrukcí je poměrně složitá záležitost, protože instrukce mají
proměnnou délku od 1 do 15 bajtů. Predekódovací logika dokáže poskytnout
dekodéru informace o tom, kde která instrukce začíná a kde končí, což zvyšuje
výkon dekodéru. Výsledná označení začátků a konců instrukce jsou se samotnými
instrukcemi ukládány do instrukční L1 cache, která je mezi predekodérem a
dekodérem. Instrukční cache pojme 32KB instrukcí a jejich predekódovací bity.
Cache samozřejmě obsahuje bity podle MESI standardu, aby byla zajištěna její
aktualizace, když přicházejí nová data.
Dekodéry
Dekódování instrukcí x86 začíná, když je naplněna vnitřní cache v procesoru.
Procesor může natáhnout během jednoho hodinového cyklu až 16 bajtů z instrukční
cache. Natažené instrukce jsou přesunuty do 16bajtového instrukčního bufferu,
který je posílá přímo do dekodérů. Natahovací logika je schopná vytáhnout z
32bajtového instrukčního rámce 16 za sebou jdoucích instrukčních bajtů. Logika
je schopná to zvládnout i v případě, že se těchto 16 bajtů nachází na rozhraní
dvou rámců. Ani v takovém případě se neztrácí hodinový cyklus. Poté jsou
instrukce přesunuty do instrukčního bufferu a zpracovány dekodéry. Přestože
instrukce jsou zarovnávány s bajtovou přesností, instrukční buffer je zarovnává
s přesností na wordy. Proto jsou instrukce z instrukční cache také poskytovány
po blocích zarovnaných na celé dvoubajty. Když přijde ovládací instrukce (např.
skoková JMP), celý instrukční buffer je vyprázdněn a nahrazen novou sadou 16
instrukčních bajtů.
Dekódovací logika je navržena k tomu, aby uměla zpracovat více x86 instrukcí
během jednoho hodinového cyklu. Dekodér přijímá bajty x86 instrukcí a jejich
predekódované bity z instrukčního bufferu, označuje aktuální hranice instrukcí
a generuje z nich operace RISC86.
Operace RISC86 jsou vnitřní instrukce s pevným formátem. Mnoho z nich je
vykonáno během jediného hodinového cyklu. Z instrukcí RISC86 lze složit každou
instrukci x86. Existují také instrukce x86, které po dekódování nejsou žádnou
RISC86 operací např. instrukce NOP nebo pouze jedinou operací přičítání z
registru do registru. Komplexnější instrukce x86 jsou dekódovány do několika
RISC86 operací.
K6 obsahuje tři sady dekodérů dva paralelní krátké dekodéry, jeden dlouhý a
jeden vektorový dekodér. Paralelní krátké dekodéry jsou určeny pro překládání
nejčastěji užívaných x86 instrukcí (přesuny, rotace, větvení, ALU, MMX, FPU) do
žádné, jedné nebo dvou RISC86 operací. Krátké dekodéry zpracovávají instrukce
x86 pouze pokud jsou kratší, než 8 bajtů. Navíc jsou konstruovány tak, aby byly
schopné přeložit dvě krátké instrukce během jediného hodinového cyklu. Často
jsou v kódu zastoupeny instrukce delší než 7 bajtů, ale kratší, než 12. Ty jsou
spolu s méně častými krátkými instrukcemi (do 7 bajtů) zpracovávány nepárovým
dlouhým dekodérem.
Dlouhý dekodér umí zpracovávat pouze jednu instrukci během jednoho hodinového
cyklu a vytvoří z ní až 4 RISC86 operace. Všechny ostatní instrukce jsou
zpracovány kombinací vektorového dekodéru a sekvencí RISC86 instrukcí načtenou
z paměti ROM na čipu.
Přestože všechny tři sady dekodérů načítají instrukci z instrukčního bufferu,
během jednoho hodinového cyklu může být použit pouze jeden typ dekodéru.
Centrální plánovač
Plánovač je srdcem procesoru AMD-K6 MMX. Obsahuje logiku, která je potřebná k
provádění instrukcí mimo pořadí, postupování dat, přejmenovávání registrů a
zpracovávání více instrukcí RISC86 zároveň. Buffer v plánovači má kapacitu až
24 RISC86 operací. To odpovídá maximálně 12 x86 operací. Pokud je to možné,
plánovač může simultánně rozesílat operace RISC86 do jakékoliv volné exekutivní
jednotky (ukládací, načítací, větvící, celočíselné, celočíselné/multimediální
nebo FPU). Celkem může plánovač rozeslat šest a odebrat 4 RISC86 operace během
jediného hodinového cyklu.
Výhodou plánovače je, že si může až 12 x86 operací přeorganizovat tak, aby
optimalizoval jejich provádění. To je způsobeno paralelním řízením toku operací
RISC86. Přestože plánovač rozesílá RISC86 i mimo pořadí, z dekodéru přijímá
dekódované x86 instrukce sekvenčně.
Exekutivní jednotky
Procesor AMD-K6 MMX obsahuje šest exekutivních jednotek ukládací, načítací,
celočíselnou X, celočíselnou Y, multimediální, desetinnou a větvící. Každá z
jednotek je zcela nezávisle schopná zpracovávat instrukce RISC86.
Předvídání skoků
Logika pro předvídání skoků v AMD-K6 je implementována proto, aby zamezila
zbytečným prodlevám při řešení podmíněných skokových instrukcí. Dvouúrovňový
algoritmus na zpracovávání historie skoků posílá své výsledky do výsledkové
tabulky o 8 192 položkách. Aby procesor nemusel mít příliš velkou tabulku a
mohl disponovat spíše více položkami, do tabulky se neukládají předpověděné
cílové adresy. Místo toho jsou plynule dopočítávány v případě potřeby speciální
aritmetickou jednotkou během doby, kdy jsou instrukce v dekodéru. Jednotka
spočítá všechny možné adresy a procesor si po dokončení dekódování vybere tu
adresu, která platí.
K tomu, aby nedošlo ke ztrátě jednoho hodinového cyklu, pokud by byla použita
předpovězená větev programu, vestavěná cache obsahuje také prvních 16 bajtů
instrukcí, které pak okamžtě posílá do instrukčního bufferu u dekodéru. Celková
úspěšnost předvídání skoků je vyšší, než 95 %.
Zásobník návratových adres
Zásobník návratových adres je speciální zařízení určené k tomu, aby
optimalizovalo zpracovávání párových instrukcí CALL a RET. Programy jsou běžně
kompilovány s rutinami, které jsou často volány z různých míst programu. Rutina
je volána pomocí instrukce CALL. V tom okamžiku procesor odloží aktuální adresu
do zásobníku a skočí do rutiny, kterou začne provádět. Na konci rutiny je
instrukce RET, při které procesor ze zásobníku opět natáhne adresu, z níž byla
rutina volána, a vrátí se na ni. Aby K6 zkrátil čas natahování návratové adresy
ze zásobníku, udržuje si ji v rychlé vyrovnávací paměti, odkud ji použije, když
přijde instrukce RET.
Jednotka provádění skoků
V této jednotce nastává spekulativní provádění instrukcí. Tato jednotka dává
procesoru možnost řešit instrukce za podmíněnými skoky ještě před tím, než se k
těmto instrukcím program dostane, a dokonce ještě před tím, než je vůbec jisté,
že tato větev programu bude použita. Procesor totiž průběžně neobnovuje x86
registry, ale uchovává si výsledky ve svých vnitřních registrech. Pokud je
předpověď nesprávná, všechny použité registry se vynulují a procesor se chová,
jako by k předvídání vůbec nedošlo. AMD-K6 může takto zpracovávat až sedm
nezávislých větví.
AMD-K6 MMX je pakován do keramické PGA patice podle specifikace Socket 7. Tím
je pro návrháře základních desek jednodušší jeho podporu integrovat do svých
výrobků, protože stačí pouze změnit ROM BIOS a povolit dvojí hodnoty napájení.
C y r i x
6 x 8 6 M X
Ani Cyrix nezaspal a prodává procesor 6x86MX. Hlavními atributy, kterým se
6x86MX vyznačuje, jsou:
lsuperzřetězení (superpipelining);
lpředpovídání skoků, spekulativní provádění, data forwarding, vykonávání
instrukcí mimo pořadí, podpora MMX.
Superzřetězení
Odstavce o zřetězeném provádění instrukcí lze nalézt jak v popisu Pentia MMX,
tak i ostatních procesorů, včetně konkurentů od AMD. Cyrix se k tomu problému
postavil ještě s větší pečlivostí a dokonce i dekódovací jednotka a část pro
výpočet adres je rozdělena na dvě samostatné části, čímž se zvýšil počet kroků
a zvýšila se volnost prostoru v provádění instrukcí mimo pořadí.
Předpovídání skoků,
spekulativní provádění,
data forwarding, vykonávání instrukcí mimo pořadí
Zbytek procesoru je velmi podobný Pentiu MMX. Samozřejmě, že přibyly nové
možnosti, ale žádné vnitřně odlišné řešení, jako jsou uopy nebo RISC86 u Pentia
Pro nebo K6, se nedají očekávat. Navíc oproti Pentiu MMX tedy zůstává
přejmenování registrů, které je použito stejným principem jako u čipů AMD či
Intel, aby eliminovalo časové ztráty při vykonává aritmetických operací.
Vícenásobné předpovídání skoků je velmi známé z Pentia Pro. Stejně tak
spekulativní provádění instrukcí nebo provádění instrukcí mimo pořadí.
Procesor také obsahuje 64 KB unifikované L1 cache, která je podle potřeby
rozdělována na data nebo na instrukce.
Cyrix 6x86MX je k dispozici ve verzích PR166, PR200 a PR233, v nejbliší době by
se měla objevit verze PR266. Cyrix stále uvádí u svých procesorů tzv. Pentium
rating, tedy jakému procesoru Pentiové řady asi odpovídá. U 6x86MX se toto
porovnání týká Pentia II. Výkonové testy zveřejněné firmou Cyrix naznačují, že
v případě provozování 6x86MX s Windows 95 jde o velmi silného konkurenta
procesoru Pentium II, který jej dokonce o 1% překonává. Za tento výkon však
Cyrix platí krutou daň nekompatibility. Běžné procesory v současnosti pracují
na frekvencích 66 MHz, 100 MHz je teprve v dohledu. Aby 6x86MX dosáhl vysokého
výkonu, používá téměř trikový manévr, při kterém nutí sběrnici běžet na 75 MHz,
což se samozřejmě projeví i na celkovém výkonu procesoru. Proto je velmi
důležité před tím, než si koupíte procesor Cyrix 6x86MX, se přesvědčit, zda
základní deska podporuje frekvenci 75 MHz nebo ještě lépe, zda podporuje přímo
procesor 6x86MX. To je důležité hlavně pro udržení sběrnice na 75 MHz, ale také
pro zajištění dvojího napájení jádro procesoru je vyživováno napětím 2,9 voltu,
zatímco logické hodnoty na nohách procesoru jsou napěťové úrovně 3,3 V. Toto
rozdělení je typické pro procesory třídy MMX, a Intel jej označuje specifikací
P55C. 6x86MX samozřejně padne do desky s paticí Socket 7.
M e d i a G X
Při probírání materiálů o revolučním obvodu z produkce Cyrixu jsem byl velmi
překvapen. MediaGX se totiž vymyká našim představám o současném nebo i blízce
budoucím procesoru pro počítače třídy x86. Tato řada vděčí za svou úspěšnost
především modularitě, která je jí bližší než cokoliv jiného. Málokdo z výrobců
totiž řekne, že své PC vyrábí, ale určitě prohlásí, že jej staví. To, co se na
první pohled může zdát jako slovíčkaření, je ve skutečnosti obrovský rozdíl.
Popularita platformy x86 není založena jen na poměrně dobře dodržované
kompatibilitě dolů, ale hlavně na modularitě. Zákazník, který hledá slušný
výpočetní výkon, ale nezáleží mu tolik na zvuku, si nejspíše nepořídí poslední
modul poloprofesionální zvukové karty, stejně jako hudební nadšenec si nebude
ničit uši poslechem zvuku z šumítka za několik stokorun. Podobně může grafik
vyžadovat rychlou videokartu nebo náruživý hráč 3D grafický akcelerátor. To
celé se dá shrnout jedním slovem modularita.
Cyrix se k celému problému staví dílem vizionářsky, dílem radikálně nabízí
procesor MediaGX, který v sobě obsahuje všechny běžné komponenty týkající se
multimédií. Vlastní řadič paměti XpressRAM, který bude vyžadovat paměť typu
SDRAM hlavně proto, aby stačila rychlost videokarty. Vlastní grafickou část
XpressGRAPHICS, která nahradí tradiční zobrazovací adaptér připojený přes
pomalejší PCI sběrnici. XpressGRAPHICS bude využívat standardní systémovou
paměť a bude si z ní ukrajovat softwarově volitelný díl potřebný pro tvorbu
obrazu. Modul XpressAUDIO nahradí běžnou zvukovou kartu tak, že bude emulovat
běžné standardy typu Sound Blaster.
Celkově je MediaGX bezpochyby zajímavým nápadem. Řeší velmi časté problémy při
přidělování systémových zdrojů pro různé komponenty a zaručuje jejich dokonalou
souhru a spolupráci. Otázkou však zůstává, zda se uživatelé nebudou cítit
příliš omezení tím, co MediaGX nabízí, nebo naopak nebude MediaGX příliš drahý
na to, aby mohl poskytnout kvalitní výsledky. Samozřejmě je nutné se ještě
zmínit o tom, že procesor poskytuje také podporu dekompresi videoformátu MPEG1
a zvuku podle normy AC97 a samozřejmě je vnitřně kompatibilní s instrukcemi MMX.
VÝROBCI PROCESORŮ
Intel
Firma Intel jednoznačně určuje směr vývoje v oboru mikroprocesorů pro PC
kompatibilní počítače. Její výrobky jsou vždy předznamenáním toho, co se stane
v několika dalších letech standardem. Tato pozice však s sebou přináší také
různé slepé cesty, ze kterých se Intel musí zotavovat. Připomeňme nepříjemnou
záležitost s chybou v prvních procesorech Pentium, nebo problémy, které
provázely procesor Intel 486DX/50. To všechno je daň za dominantní postavení na
trhu procesorů pro PC.
Na druhou stranu má Intel díky své pozici velmi dobré postavení v jednání s OEM
partnery. Téměř každý výrobce počítačů má ve své nabídce sestavy s intelovskými
procesory, ale jen někteří nabízejí také alternativy. Pokud by byla pozice
firmy Intel silnější, prodělal by na tom hlavně zákazník, protože by se
zákonitě zvedly ceny intelovských procesorů.
Doménou Intelu jsou především high-end stanice s vysokým výpočetním výkonem.
Tam se nejlépe mohou uplatnit novinky, které Intel zavádí a díky nimž je v
současné době na špičce. Málokdo si umí představit server postavený na jiném
procesoru než Pentium Pro či Pentium II. Pouze Intel také umožňuje použít své
procesory ve víceprocesorových serverech využívajících symetrický
multiprocessing. Tato možnost je k dispozici už od Pentia, ale zůstala i ve
všech vyšších intelovských procesorech. I když je nutné přiznat, že u Pentia II
je její implementace poněkud horší. Není příliš pravděpodobné, že by se v tomto
sektoru mohlo na monopolním postavení Intelu něco změnit, neboť v současnosti
není firma, která by se do něj místo Intelu tlačila.
Také procesory pro mobilní výpočetní techniku jsou pouze z produkce Intelu.
Jedině Intel má zkušenosti a technologii na výrobu speciálních obvodů s velmi
nízkým odběrem, do kterých se žádnému z konkurentů nechce pouštět. Tak se
příliš nelze divit ani tomu, že se v současnosti snaží o zavedení dalšího
standardu na tomto poli, což by měly být procesorové moduly MMO. MMO je náhrada
současného procesoru za speciální modul, na kterém je jak procesor, tak L2
cache spolu s řadičem a také čipová sada. Spojení se základní deskou zajištuje
speciální konektor. Výhodou toho uspořádání by měla být snadná možnost záměny
procesorů Pentium například za Pentium II pro mobilní počítače, což je v
současné době, díky rozdílnosti patic, prakticky vyloučené.
AMD
Společnost Advanced Micro Devices si za celou svou dlouhou historii vybudovala
slušnou pozici druhého největšího dodavatele procesorů pro PC a zvláště v
sektoru trhu střední a nižší výkonové třídy je Intelu důstojným soupeřem. Firma
AMD se vždy snažila o prosazování srovnatelných či vyšších výkonů procesorů při
podstatném snížení ceny. V dobách procesorů 80386, kdy Intel uvedl čip na
frekvenci 33 MHz, AMD kontrovalo procesorem s frekvencí 40 MHz s velmi slušným
výkonem. Což nebylo způsobeno tím, že AMD má lepší technologické a vývojové
zázemí, ale prostým faktem, že procesory AMD byly uvedeny na trh s velkým
spožděním. U Intel 80386 proti Am386 to bylo téměř 5 let. Tak mohl AMD do svého
procesoru implementovat techniky, s jejichž pomocí se výkonový rozdíl mezi
Intel 80386 na 33 MHz a Am386 na 40 MHz dostal až na 25 % ve prospěch AMD, ale
procesor AMD byl současně i levnější.
Velmi podobná situace nastala také v době procesorů 486. Tam sice AMD opět
ztrácelo 4 roky, ale nasadilo procesory nejen frekvenčně ale i technologicky
vyspělejší, což se samozřejmě projevilo také na výkonu. Ceny AMD však byly opět
nižší.
V polovině 90. let se situace pro AMD nevyvíjela příliš růžově. Pentium bylo
představeno v roce 1993, Pentium Pro v roce 1995, ale AMD neměl stále
odpovídajícího konkurenta pentiové řady. Blížily se teprve závěrečné práce na
procesoru Am5x86, což bylo v podstatě Pentium od AMD, pro 486kové desky.
Ačkoliv sice dosahoval výkonů podobných jako Pentium 75 MHz, což bylo o mnoho
více než vlajková loď pro 486kové desky Intel 486DX4/ /100, cenově Intel
podběhl. To, že nezaznamenal úspěch, který by odpovídal jeho technologii, bylo
způsobeno především tím, že trh už v té době požadoval pro většinu stanic
středního výkonu procesory Pentium a pro servery tehdejší novinku Pentium Pro.
V AMD sice už měli připravenou výrobu procesorů K5, ale vinou technologických
potíží byla přesunuta až na březen 1996.
V době, kdy procesory K5 začínaly, byly nazývány Am5k86. Přestože byly
technologicky na úrovni Pentií, výkonově na tom byly o něco hůře, na čemž měl
velký podíl špatně zpracovaný numerický koprocesor. Ostatně problémy s
koprocesorem provázejí AMD už dlouho. Na druhou stranu se K5 prodávaly poměrně
dobře, zvláště pro nejslabší sestavy. Byly rozumnou volbou, protože používaly
Pentiové desky s paticí Socket 7, takže se daly snadno upgradovat v případě
potřeby na vyšší procesory, cena byla leckdy nižší, než v té době už téměř
výprodejové Intel 486.
Procesor AMD-K6 byl představen dokonce před procesorem Intel Pentium II,
kterému měl být výkonovým protivníkem. Ačkoliv benchmarkové testy výkonu
nepotvrzují, že K6 je na úrovni Pentia II, je velmi dobrou cenovou alternativou
pro střední a vyšší střední třídu sestav. Dá se říci, že s procesorem K6 smazal
AMD svůj dlouholetý technologický deficit proti Intelu a dostal se tak téměř na
jeho úroveň. Výkonově vychází AMD-K6 mnohem lépe než Intel Pentium MMX na
stejné frekvenci, je však ve verzi 233 MHz levnější téměř o 30 %. Výborným
marketingovým tahem byla skutečnost, že K6 využívá stávající patici Socket 7,
která je používána i u Pentií. To velmi pomohlo hlavně menším OEM výrobcům
základních desek, kteří tvoří většinu nabídky na trhu, protože nemuseli
navrhovat kompletně nové desky. Stačilo jim pouze přepracovat ROM BIOS, aby byl
ochotem akceptovat AMD-K6, což ostatně s nástupem Pentia MMX ve stejné době,
jako K6 museli udělat stejně. Vzhledem k tomu, že současným standardem je
Pentium 166 až 200 MMX, AMD se se svým K6/233 vymanilo názvem i výkonnostními
výsledky definitivně z pozice dodavatele procesorů pouze pro low-end stanice.
I přes svoji vyspělou architekturu má K6 ještě co zlepšovat. Zůstává mu stigma
horšího koprocesoru a ani jednotka MMX není příliš vyvážená a poněkud za
Pentiem MMX zaostává.
Dva nejvýznamnější výrobci procesorů pro PC však ukázali, že se umí také
dohodnout. Již v minulosti několikrát podepsali smlouvy, které jim zajistili
sdílení moderních technologií, jež vynalezli a ani v současnosti se nechovají
vůči sobě jako silní konkurenti. V současné době spolupracují na výzkumech
technologií pod 0,1 mikronu a ukazují, že i v tak napjatém oboru, jako je
informační technologie, se lze chovat tržně, ale při tom spolupracovat. To
všechno v době, kdy se dá směle tvrdit, že mezi AMD a Intelem zuří cenová válka.
Alternativa, kterou svými procesory poskytl AMD, je pro zákazníka výhodná hned
ze dvou pohledů: Pro toho, kdo hledá výkonný, ale při tom levný procesor, jsou
nabídky AMD příjemnou alternativou. Současně z této situace těží i příznivci
intelovských procesorů, protože AMD tlačí i jejich ceny velmi rychle dolů.
Ostatně, výrazné zlevnění procesorů Pentium MMX a Pentium II v průběhu loňského
léta, tedy přibližně čtvrt roku po uvedení K6, je toho jasným důkazem.
Cyrix
Společnos Cyrix je významným výrobce procesorů, její výrobky jsou však velmi
rozporuplné. Na jednu stranu dovede navrhnout čip, který dosahuje výborných
výkonů a překonává své konkurenty, na druhou stranu se stále potýká s problémy
s kompatibilitou, s přehříváním a podobně. V dobách procesorů 386 a 486 se
klony od Cyrixu vyznačovaly hlavně slabým výkonem a nízkou spolehlivostí.
Procesory přechodové řady mezi 486 a Pentiem, které Cyrix nazval 5x86, a i
pentiové klony 6x86 měly především velmi špatně vyřešený odvod tepla, které
procesor vyráběl a proto se často přehřívaly. Současně měly značné problémy s
kompatibilitou, i když ne kvůli tomu, že by byly špatně navržené, ale spíš
přehnaně moderně, což se leckterému programovému vybavení nelíbilo.
Cyrix v minulosti prokázal alternativním výrobcům procesorů medvědí službu,
neboť jeho výrobky téměř mohly vyvolat dojem, že pouze značka Intel je zárukou
kvality. V dnešní době už tomu tak není a procesory 6x86MX jsou rozumnými
pentiovými alternativami, i když je nutno poznamenat, že za cenu takového
malého podvůdku s přetaktováním sběrnice počítače. Nicméně pokud to konkrétní
základní deska snese a je v její dokumentaci výslovně napsáno, že procesory
Cyrix 6x86MX podporuje, je to jedna z možností, jak si za rozumný peníz koupit
moderní a rychlý procesor.
Procesory MediaGX jsou zajímavým krokem, který možná trochu předešel dobu. O
spojení procesoru s částí videokarty a zvukové karty se tu totiž hovoří už
dlouho, ale zatím jsou všechny varianty ve stavu projektů. Intel i AMD už
oznámily svá řešení, ovšem Cyrix s Media GX zašel zřejmě nejdál. Vzhledem k
tomu, jakým způsobem zasahuje MediaGX do koncepce celého počítače, je jasné, že
nebude stačit současná patice Socket 7 a že bude nutné vytvořit zcela novou
základní desku, která bude umět spolupracovat s veškerými vymoženostmi, které
MediaGX poskytuje. A přiznejme si, že jakmile se po výrobcích základních desek
chce, aby speciálními návrhy podporovali jeden jediný procesor, moc se jich do
vývoje nežene. Velmi podobná situace nastala u procesorů firmy NexGen, které
byly sice velmi moderní a pokročilé, bohužel je však zabila nutnost zvláštní
základní desky. AMD, který je oživil, je samozřejmě přepracoval na Socket 7.
Ale i v tomto kontrastu je MediaGX velmi poučný čip, který by mohl zahýbat
trhem levných domácích počítačů, od kterých se čeká multimediální výkon.
BUDOUCNOST...
Své plány do budoucna představují firmy z tohoto oboru na speciální akci
nazvané Mikroprocesorové fórum. Loňské fórum ukázalo, co nás v následujících
letech pravděpodobně od výrobců procesorů čeká.
I n t e l
Celkově je zřejmý ústup z frekvencí pod 200 MHz. Klasická Pentia se přestala
vyrábět už ke konci minulého roku a stejný osud potká také procesory Pentium
MMX. V prvním čtvrtletí 1998 se přestanou vyrábět verze Pentium MMX 150 MHz a
166 MHz. Do pololetí 1998 se přestane vyrábět také Pentium MMX na 200 MHz a v
druhé polovině roku ho bude následovat i nejrychlejší verze Pentia MMX na 233
MHz.
Pentia Pro pro běžné desktopové systémy s 256 KB L2 cache se už téměř přestala
vyrábět. Během prvního pololetí také skončí produkce procesorů Pentium Pro s
512 a 1 024 KB L2 cache. Intel by ji ukončil dříve, ale do té doby nebude mít
ještě řešení pro serverové systémy. Není úplně jasná situace okolo Pentium Pro
Overdrive, což by měl být procesor Pentium II s paticí Socket 8. To je jediný
způsob, jak udržet při životě základní desky s paticí Socket 8 v roce 1998.
Ve druhém čtvrtletí 1998 nastoupí distribuce procesorů Pentium II na 350 a 400
MHz se sběrnicí taktovanou na 100MHz, ve druhé polovině roku přijde verze s
frekvencí 450 MHz. Nové typy s frekvencí sběrnice 100MHz budou vyžadovat nový
typ čipsetu 440 BX, který by 100MHz frekvenci sběrnice podporoval. Vypadá to,
že pouze verze se 100MHz sběrnicí budou obsahovat odlišený řadič paměti, který
dovolí pracovat s více jak 512 MB RAM. Pentium II bude schopno pracovat v
maximálně dvouprocesorových serverech.
Tillamook je kódové označení pro procesor Pentium MMX postavený na bázi 0,28
mikronu, který bude mít samozřejmě také nižší odběr. Verze 200 a 233 MHz jsou
už v prodeji a jsou určeny především pro mobilní systémy. Verze 266 MHz však
bude také zajímavá pro desktopy, protože Pentium MMX s 0,35mikronovou
technologií se vyrábí maximálně na 233 MHz. Bude dostupná v průběhu prvního
čtvrtletí tohoto roku. Měl jsme možnost se v TestCentru setkat s verzí 233 MHz
a příjemně nás překvapila svým výkonem, kdy se notebooky dostávají na úroveň
stolních systémů se stejným procesorem.
Mobilní Pentium II speciální verze Pentia II se sníženým odběrem by měla být na
trhu v nejbližší době a určitě zahýbe s trhem notebooků. Bude mít nejspíše méně
L2 cache než desktopové systémy a poběží snad i na menším napětí než 2,5 voltu.
Po verzích 233 a 266 MHz přijde také v druhém čtvrtletí 1998 verze 300 MHz,
stále se sběrnicí na 66 MHz.
Intel Deschutes, značený též IA32, bude Pentium II postavené na 0,25mikronové
technologii. To dovolí zvýšit frekvenci a samozřejmě také výkon. Přijde ve dvou
verzích, s paticí typu Slot 1 a Slot 2. Verze se Slot I bude stále nazývána
Pentium II a je popsána v odstavci o Pentiu II. Deschutes se Slotem 2, který
doposud nemá jiné než kódové označení, bude směrován především do serverových
systémů, kde by měl nahradit postarší Pentiu









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.