Lecture 4 Ing. Martin Molhanec, CSc. 13AMT Procesory III. Lecture 4 Ing. Martin Molhanec, CSc.
80486, 80486SX – základní údaje Rok vzniku 1989 Rychlost 25MHz 1 200 000 tranzistorů 1 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 32 bitová data 80486 – má FPU 80486SX – nemá FPU Později se 80486 přejmenovala na 80486DX !
80486, 80486SX – vlastnosti Vylepšený vnitřek (2x rychlejší) Dvě datové sběrnice. 80486 ≈ 80386 + FPU + L1 cache 80486SX ≈ 80486 – FPU 80487 ≈ 80486 (jiné zapojení) Později se 80486 přejmenovala na 80486DX ! L1 cache = 8kB, Write-Through Patice PGA + ZIF (Zero Input Force)
80486 - architektura
80486DX2, 80486DX4 Interní přetaktování – CPU běží na vyšší frekvenci nežli sběrnice ! 80486DX2 : násobitel 2x 80486DX4 : násobitel 3x ! + L1 cache 16kB (8kB data+8kB kód) 20 25 33 50 DX DX2 66 DX4 75 100
Socket 1,2,3 Více pinů! Menší napětí! 169 Pinů 17 x 17 PGA 5v SX / SX2, DX/DX2, DX4 OverDrive 238 pinů 19 x 19 PGA SX/SX2, DX/DX2, DX4 OverDrive, 486 Pentium OverDrive 237 pinů 5v/3.3v Více pinů! Menší napětí!
Pentium – základní údaje (1. generace – P5,P54C) Rok vzniku 1993 Rychlost 60MHz 3 100 000 tranzistorů 0.8 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Původně 80586, ale nakonec se INTEL rozhodl pro název Pentium, který bylo možné lépe komerčně ochránit!
Pentium – vlastnosti První procesor, který obsahuje velice rafinované techniky pro zvýšení výkonu vykonávání kódu! Pentium = 80486 + vylepšení Významná vylepšení Skalární procesor = 2 * ALU Souběžné vykonávání = 2 * pipeline pro INT INS Předpovídání skoků BTB SMM (Systém management Mode): power control L1 cache = 8kB kód + 8kB data, Write-Back Napájení STD = 3.3V Patice PGA + ZIF (Zero Input Force)
Pentium – P5, P54C Technologie (µm) 1993 P5 3 100 000 0,80 60/66 1994 codename tranzistorů Technologie (µm) Rychlost (MHz) 1993 P5 3 100 000 0,80 60/66 1994 P54 3 200 000 0,50 75/90/100/120 1995 3 300 000 0,35 120/133 1996 3 300 00 150/166/200
Násobitelé, napájení, atp. 50 60 66 75 83 1x 1.5x 90 100 2x 120 133 2.5 150 166 3x 200 Napájení STD 3.3.V VRE 3.53V VRT 2.8 / 3.3 Pentium Overdrive (P24) Pentium do patice 80486. Drahé, neúspěch
Pentium - architektura
Pentium - architektura
Socket 4 Pinů: 273 21 * 21 PGA 5V Pentium 60/66 Pentium 60/66 OverDrive
Socket 5 Pinů: 320 37 * 37 PGA 3.3V Pentium 75 – 133 Pentium 75+ Overdrive
Socket 7 Pinů: 321 37 * 37 PGA VRM (Voltage regulator module) 2.5V až 3.3V Pentium 75 – 300 Pentium 75+ Overdrive Pentium MMX Pentium MMX OD K5, 6x86, K6, 6x86MX
Pentium Pro – základní údaje Rok vzniku 1995 Rychlost 150MHz 5 500 000 tranzistorů 0.5 µm technologie 32 bitová CPU 36 bitová adresa 64 GB fyzické paměti 64 TB virtuální paměti 64 bitová data V jednom pouzdru je na společném substrátu chip CPU a 2 chipy L2 cache na plné rychlosti jádra, společně propojené speciální 64 bitovou sběrnicí. Tento procesor byl určen speciálně pro servery!
Pentium Pro – vlastnosti Vylepšené Pentium určené speciálně pro servery. Možnost spolupráce až 4 Pentií Pro – multiprocesing ! Významná vylepšení Skalární procesor = 3 * ALU Souběžné vykonávání, vykonávání mimo pořadí Předpovídání skoků SMM (Systém management Mode): power control CISC instrukce si interně překládá do RISC instrukcí Cache L1 cache = 8 kB data +8 kB kód L2 cache = 256kB, 512kB, 1MB v pouzdře, full speed Je umístěna společně s CPU na společném substrátu v jednom pouzdře DIB (Dual Independent Bus) : CPU může současně přistupovat do paměti, tak i do L2 cache. Pentium Pro = Pentium + L2 cache + vylepšení Napájení STD = 3.1 až 3.3V Socket 8 (242 pinů)
Pentium Pro Počet tranzistorů L2 cache 256 Kb je 15 500 000 ! codename tranzistorů Technologie (µm) Rychlost (MHz) L2 cache 1995 P6 5 500 000 0,50 150 256/512 kB 1996 0,35 160/180/200 1997 200 1 MB Počet tranzistorů L2 cache 256 Kb je 15 500 000 !
Pentium MMX – základní údaje (2. generace – P55C) Rok vzniku 1997 Rychlost 166MHz 4 500 000 tranzistorů 0.28 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Pentia 2. generace mají tzv. MMX (MultiMedia eXtensions) určené pro lepší výkon při zpracování multimediálních dat.
Pentium MMX – vlastnosti První procesor, který obsahuje podporu multimediální aplikací! MMX = MultiMedia eXtensions Možnost vykonávat jednu operaci nad několika operandy ! Pouze pro celá čísla. Až 8 celých čísel 8 bitových. Pentium MMX = Pentium + MMX L1 cache = 16kB data + 16kB kód Napájení VRM = 2.8 až 3.3 V Patice PGA + ZIF (Zero Input Force) Socket 7
Pentium MMX Technologie (µm) 1997 P55 4 500 000 0,28 166/20/233 1998 codename tranzistorů Technologie (µm) Rychlost (MHz) 1997 P55 4 500 000 0,28 166/20/233 1998 0,25 266
Pentium II Rok vzniku 1997 Rychlost 233MHz 7 500 000 tranzistorů 0.28 µm technologie 32 bitová CPU 36 bitová adresa 64 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Pentium II je nástupcem Pentia Pro (6. generace x86), s určením od desktopů po servery. V pouzdře typu slot obsahuje L2 cache na společné destičce s CPU.
Pentium II – vlastnosti V pouzdře je na jedné destičce umístěn chip CPU a CHIPy L2 cache. Protože nejsou umístěny na společném substrátu pracuje L2 cache na nižší frekvenci nežli jádro procesoru, ale na frekvenci vyšší než hlavní paměť. Pouzdro připomíná spíše kartu do PC DIB jako u Pentia Pro MMX jako u Pentia MMX Pentium II = Pentium Pro + Pentium MMX + vylepšení Cache L1 cache = 16kB data + 16kB kód L2 cache = 512kB, ½ rychlosti CPU, 64 bitová dedikovaná sběrnice FSB : 66, 100 MHZ Napájení VRM = 2.8 SECC (Single Edge Contact Cartridge) : pouzdro SLOT 1 : patice
SLOT 1 - SECC GTL+ bus, podporou 2 procesorů
Pentium II Technologie (µm) 1997 Klamath 7 500 000 0,28 233/266/300 66 codename tranzistorů Technologie (µm) Rychlost (MHz) FSB (MHz) 1997 Klamath 7 500 000 0,28 233/266/300 66 1998 Deschutes 0,25 333/350/400 66/100
Celeron Rok vzniku 1998 Rychlost 266MHz 7 500 000 tranzistorů 0.25 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Celeron vznikl jako levná alternativa Pentia II. Má levnější pouzdro SEPP (Single Edge Processor Package)
Celeron – vlastnosti Levná varianta Pentia II. Levnější pouzdro Nejdříve bez L2 cache Později menší L2 cache, ale ON DIE, čili ve stejném chipu jako CPU na plné rychlosti CPU ! Nejprve varinty SEPP pro SLOT1, později pouzdra PPGA (Plastic Pin Grid Array) pro Socket 270 Celeron = Pentium II v levnější a méně výkonné variantě cache L1 cache = 16kB data + 16kB kód L2 : starší verze není ! L2 : novější verze, 128kB on die (výkonově se rovná téměř Pentiu II, proto INTEL omezuje FSB na 66MHz )
Celeron - patice Napájení VRM = 2.8 Starší verze SEPP (Single Edge Processor Package) SLOT 1 Novější verze PPGA (Plastic Pin grid Array) Socket 370
Celeron - patice Napájení VRM = 2.8 Starší verze SEPP (Single Edge Processor Package) SLOT 1 Novější verze PPGA (Plastic Pin grid Array) Socket 370
První procesor, který se začal výrazně přetaktovávat ! Celeron codename tranzistorů Technologie (µm) Rychlost (MHz) L2 cache 1998 Covington (Deschutes) 7 500 000 0,25 266/300 Nemá L2 cache Mendocino 19 00 000 300A/333 128kB on die 1999 366 – 500 2000 533 První procesor, který se začal výrazně přetaktovávat !
Pentium Xeon Rok vzniku 1998 Rychlost 400MHz 7 500 000 tranzistorů 0.25 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Pentium Xeon je varianta Pentia II určená pro servery.
Pentium Xeon - vlastnosti Varianta Pentia pro servery L2 cache : 512 KB, 1MB, 2MB (1999) na plné rychlosti CPU Podpora 4 a 8 procesorů (multiprocesong) Pentium Xeon = Pentium II + Pentium Pro Pouzdro SECC2 Patice SLOT 2
Pentium III Rok vzniku 1999 Rychlost 450MHz až 1.4GHz 9 500 000 tranzistorů 0.25 µm technologie 32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Socket 370, Slot 1 Pentium III je nástupce Pentia II vylepšeními.
Pentium III - vlastnosti Jediná podstatná změna je přidání tzv. SSE (Streaming SIMD Extension), jde o další instrukce typu MMX, tentokrát umějí již pracovat i s čísly typu FLOAT ! Pouzdra a patice SECC+SLOT1, kvůli upgrade starších systémů FC-PGA + Socket 370, následuje celeron FC-PGA2 + Socket 370 (Tualatin), nové jádro! Cache 32kB L1 L2 se mění dle generace PIII FSB 100/133 Mhz
Pentium III codename tranzistorů Technologie (µm) Rychlost (MHz) L2 cache 1999 Katmai 9 500 000 0,25 450/500/550 512 ½ CPU Coppermine 28 100 000 0,18 533 – 733 256 on die 2000 850 – 1GHz 2001 Tualatin 44 000 000 0,13 1.2 – 1.4GHz 512 on die Tualatin je sice mechanicky kompatibilní s paticí Socket 370, ale nikoliv fyzicky (napájení).
low home middle office high server Celeron (Covington) nemá L2 cache Celeron Mendocino 128kB, OD Celeron Coppermine-128 128kB, OD, SSE Pentium MMX Pentium II Klamath Pentium II Deschutches 512kB, 1/2S Pentium III Katmai 512kB, 1/2S SSE Pentium III Coppermine 256kB, OD SSE Pentium Pro Klamath 2MB, FS Pentium II XEON 2MB, FS Pentium II XEON Tanner Pentium III XEON Cascade
high server Pentium 4 Xeon low home celeron middle - office Pentium III Pentium 4 Foster až 2Ghz 0.18 256L2 Socket 603 Prestonia přes 2GHz 0.13 Coppermine až 800MHz 0.18, 133FSB 256L2 FC-PGA 370 SECC2 (SLOT1) Tualatin až 1.4GHz 0.13, 133FSB 256L2 FC-PGA2 370 PIII-S Varianta s větší L2=512 Willamete až 2Ghz 0.18 Socket 423 Northwood přes 2GHz 0.13, 400FSB 512L2 Socket 478 Coppermine-128 až 800MHz 0.18, 66FSB 128L2 FC-PGA 370 Coppermine-T až 1.2GHz 0.18, 100FSB 128L2 FC-PGA 370 Tualatin až 1.4GHz 0.13, 100FSB 256L2 FC-PGA2 370
INTEL PIII P4 64bit standard Centrino Celeron Xeon mobile
32 bitová CPU 32 bitová adresa 4 GB fyzické paměti 64 TB virtuální paměti 64 bitová data Pentium 4 Procesor 7 generace (PIII, PII je generace 6 a vychází z architektury Pentia Pro!) s novou architekturou! NetBurst Hyper Pipelined Technology (pipeline na 20 úrovní) Rapid Execution Engine (ALU pracuje na 2x rychlosti jádra!) Systémová sběrnice 400 MHz Execution Trace Cache SSE3 (dalších 144 instrukcí) Hyperthreading 2 logické procesory v jednom fyzickém! EE (ExtremeEdition) Přidána L3 cache 2MB LGA 755 Nový typ patice ! Místo nožiček kontaktní plošky!
Pentium 4 Stav v roce 2004 Technologie (µm) 2000 Willamette 42 000 000 codename tranzistorů Technologie (µm) Rychlost (GHz) Socket 2000 Willamette 42 000 000 0.18 1.4 - 2 423, 478 2002 Northwood 55 000 000 0,13 1.7 – 2.8 478 2004 Prescott 125 100 000 0,09 2.8 – 3.4 478, LGA 755 2005 Tejas ??? >3 LGA 775 Stav v roce 2004
LGA755
LGA755
LGA755
P4 XEON Stav v roce 2004 Techno- logie (µm) XEON Foster 256 kB 0.18 2 name codename L2 cache L3 cache Techno- logie (µm) Multiproc. Socket XEON Foster 256 kB 0.18 2 603 Prestonia 512 kB 0,13 XEON MP Gallatin Až 1MB >=4 Nocona 0,09 Potomac Stav v roce 2004
Roadmap
Roadmap
Současný stav P4 INTEL rozšiřuje počet variant všech procesorů Zavádí nový způsob označování řad procesorů ! Ztráta přehlednosti !
Hyper-Threading Technology HT Technology is ground-breaking technology that changes the landscape of processor design by going beyond GHz to improve processor performance. It allows software programs to "see" two processors and work more efficiently. This new technology enables the processor to execute two series, or threads, of instructions at the same time, thereby improving performance and system responsiveness. The Pentium 4 processor supporting HT Technology is designed specially to deliver immediate increases in performance and system responsiveness with existing applications in multitasking environments (that is, where two or more functions are running at the same time) and with many stand-alone applications today. Furthermore, the Pentium 4 processor supporting HT Technology provides performance headroom for the future.
Intel® Enhanced Memory 64 Technology (Intel® EM64T) Intel EM64T provides an enhancement to Intel's 32-bit architecture by enabling the desktop processor platform to access larger amounts of memory. With appropriate 64-bit supporting hardware and software, platforms based on an Intel processor supporting Intel EM64T can enable use of extended virtual and physical memory. Intel EM64T provides flexibility for 32 bit now and future software that supports 64-bit computing.
Windows XP 64-Bit Edition for 64-Bit Extended Systems Windows Server 2003 for 64-Bit Extended Systems Future versions of Red Hat Enterprise Linux SUSE LINUX 9.1 Professional
64-bit flat virtual address space 64-bit pointers 64-bit flat virtual address space 64-bit pointers 64-bit wide general purpose registers 64-bit integer support Up to 1 terabyte (TB) of platform address space
Current IA-32 systems that use more than Legacy PAE Mode Current IA-32 systems that use more than 4 GB of physical memory do so by using Physical Addressing Extensions (PAE). This is a segmented memory model that requires the use of Address Windowing Extensions (AWE) to manipulate data above the 4-GB limit. This approach has associated overhead because the memory beyond 4 GB is swapped in and out of an AWE “window,” which exists in the first 4 GB of memory. Such software memory management schemes are expensive and are not as straightforward as 64-bit addressing. Legacy PAE Mode Current IA-32 systems that use more than 4 GB of physical memory do so by using Physical Addressing Extensions (PAE). This is a segmented memory model that requires the use of Address Windowing Extensions (AWE) to manipulate data above the 4-GB limit. This approach has associated overhead because the memory beyond 4 GB is swapped in and out of an AWE “window,” which exists in the first 4 GB of memory. Such software memory management schemes are expensive and are not as straightforward as 64-bit addressing.
Celeron HT Dual Core Extreme Edition EMT64 Intel® Pentium® 4 Processor Intel® Pentium® 4 Processor supporting Hyper-Threading Technology ANO (ANO) Intel® Pentium® 4 Processor Extreme Edition supporting Hyper-Threading Technology Intel® Pentium® D Processor Intel® Pentium® Processor Extreme Edition Intel® Celeron® Processor Intel® Celeron® D Processor
XEON procesory Větší CACHE Podpora více procesorů
Zatím nepříliš výhodné – drahé! Není HW kompatibilní s x86!!! 64 bitové procsory ITANIUM Jádro Merced, 0.18 733 - 800 MHz, FSB 266MHz 2001 PAC418 patice IA-64 architektura ITANIUM2 1.3 – 1.5 GHz, FSB 400MHz 2002 Jádro McKinney, 0.18 Cache 3MB na chipu Nová architektura od 386! Zatím nepříliš výhodné – drahé! Není HW kompatibilní s x86!!!
Ale nebude EM64T konkurence?
Here is a comparison of the Intel Architecture-based 64-bit platform benefits at a glance: Intel Xeon Processor with Intel EM64T Larger address space (40-bits physical / 64-bits virtual) = larger applications can run in-memory = increased performance More general-purpose and SSE registers (than Intel Xeon without Intel EM64T) allow software to inter-schedule instructions for multiple independent expressions, effectively hiding much stall latency = increased performance Double-precision integer support = increased numerical processing accuracy Stepping stone to the Intel Itanium Architecture—not a replacement for it Intel Itanium Architecture Larger address space (50-bits physical / 64-bit virtual addressing) Improved branching/procedure call performance = Decreased cache misses and lower procedure call overhead = increased performance Memory latency hiding = Significant performance improvements memory intensive applications (databases, modeling, etc) Increased parallelism via parallel instruction streams = Superior multimedia and FP support
INTEL už dost !