Vývoj architektury procesoru

Slides:



Advertisements
Podobné prezentace
Procesory Křemíkový čip, který řídí všechno dění v počítači
Advertisements

Tato prezentace byla vytvořena
Počítačová skříň Základní deska Procesor Operační paměť Zdroj napětí
Mikroprocesory Intel Obr. 1.
Tato prezentace byla vytvořena
Mikroprocesory Procesory. Procesor je synchronní zařízení provádí operace s daty je programovatelný pomocí mikroinstrukcí je více rodin procesorů (jednočipy.
Czech Technical University in Prague Faculty of Transportation Sciences Department of Control and Telematics Skládaní PC Ing. Roman Piekník.
Procesory Filip Skulník.
Úvod. Základní úrovně: hardwarová (procesory, jádra) programová (procesy, vlákna) algoritmická (uf... ) Motivace: zvýšení výkonu redundance jiné cíle,
Programování v asembleru - prostředí
Principy překladačů Architektury procesorů Jakub Yaghob.
Systémové sběrnice PC Kateřina Pásková 4.Z1.
Informatika 1_6 6. Týden 11. A 12. hodina.
Co přinese nového. Nanometr nm10 -9 mikrometr µm Milimetr mm Co platí pro všechny Volitelný počet jader Charakteristika.
Informatika akademický rok 2013/2014 Základní deska, rozhraní, sběrnice.
Sběrnice I. Sběrnice v počítačích. Sběrnice I. Sběrnice v počítačích.
PROCESORY Základní přehled.
Václav Bartoněk, 6. G MěVG Klobouky u Brna
DIGITÁLNÍ UČEBNÍ MATERIÁL Číslo projektuCZ.1.07/1.5.00/ Název projektuEU peníze středním školám Masarykova OA Jičín Název školyMASARYKOVA OBCHODNÍ.
Procesor Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Lenka Čižmárová. Dostupné z Metodického portálu ISSN: , financovaného.
Procesor.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_02A13 Autor Ing. Jiří Kalousek Období vytvoření duben 2014.
Základy mikroprocesorové techniky
Procesory.
David Klíma- 1 - Opáčko Celkové schéma základní desky Co je to čipová sada IRQ DMA Slot, patice Domácí úkol: zákl. deska pro P4.
Tato prezentace byla vytvořena
Výrok „Počítač je pouze tak inteligentní jako jeho uživatel.“ (Radek Lochman, dnes)
= monolitický integrovaný obvod obsahující kompletní mikropočítač
Procesory. Co je procesor?  Procesor je jedna ze základních součástí počítače (laicky nazýván mozkem počítače). Probíhají v něm všechny hlavní operace.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Jiří Šperl. Dostupné z Metodického portálu ISSN: , financovaného z.
Zdroj Parametry – napájení všech komponent PC
Procesory.
Tento výukový materiál vznikl v rámci Operačního programu Vzdělávání pro konkurenceschopnost 1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,
Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou I NFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE Ing. Jan Roubíček.
Přehled a vývoj mikroprocesorů
Výrok „Já bych všechny ty internety a počítače zakázala.“
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
CZ.1.07/1.4.00/ VY_32_INOVACE_152_IT7 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
Marek Malík a František Černý, ME4A, 2012
Architektura počítače
Intel Pentium D (1) Založen na mikroarchitektuře NetBurst
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Výrok „Vypadá to, že jsme narazili na hranici toho, čeho je možné dosáhnout s počítačovými technologiemi. Člověk by si ale měl dávat pozor na takováto.
18/07/20151 Intel (1) Vyroben v roce 1989 Prodáván pod oficiálním názvem 80486DX Plně 32bitový procesor Na svém čipu má integrován: -zmodernizovaný.
Hardware osobních počítačů
Univerzita třetího věku kurz Znalci Hardware 1.
Mikroprocesor.
Procesory CPU Dříve MIKROPROCESORY.  elektronická souč. která rychle provádí výpočty (operace). Miliony aktivních prvků (tranzistorů)  časovač - vytváří.
23/04/20151 Základní deska (1) Označována také jako mainboard, mother- board Deska plošného spoje tvořící základ celého počítače Zpravidla obsahuje: –procesor.
Pokročilé architektury počítačů (PAP_05.ppt)
Procesory.
Vícejádrové procesory. Úvod Firma Intel reagovala na poptávku trhu po vyšším výkonu a rychlejší práci procesorů technologii nazvanou Hyper- Threading.
Číslo projektu CZ.1.07/1.5.00/ Název školy Gymnázium Česká a Olympijských nadějí, České Budějovice, Česká 64 Název materiálu VY_32_INOVACE_IVT_1_KOT_04_PROCESOR.
Uvedení autoři, není-li uvedeno jinak, jsou autory tohoto výukového materiálu a všech jeho částí. Tento projekt je spolufinancován ESF a státním rozpočtem.
NÁZEV ŠKOLY: Základní škola, Uherský Ostroh, okres Uherské Hradiště, příspěvková organizace AUTOR: Mgr. Marcel Bednařík NÁZEV: VY_32_INOVACE_09_INF_09.
Prioritní osa: 1 − Počáteční vzdělávání Oblast podpory: 1.4 − Zlepšení podmínek pro vzdělávání na základních školách Registrační číslo projektu: CZ.1.07/1.4.00/
Technika počítačů 3. Mikroprocesory © Milan Keršlágerhttp:// Obsah: ●
Překladače Optimalizace © Milan Keršláger
NOTEBOOK někdy také laptop, Anglicky na klíně (počítač, s kterým lze pracovat na klíně)) je označení pro přenosný počítač. Notebooky používáme na stejné.
Název školy: Základní škola Městec Králové Autor: Mgr. Petr Novák Název: VY_32_INOVACE_01_F9 Číslo projektu: CZ.1.07/1.4.00/ Téma: Složení PC Anotace:
ZŠ Brno, Řehořova 3 S počítačem snadno a rychle Informatika 7. ročník III
PC základní jednotka.
Intel Pentium D (1) Založen na mikroarchitektuře NetBurst
Číslo projektu OP VK Název projektu Moderní škola Název školy
Výukový materiál zpracován v rámci projektu
Hardware číslicové techniky
Centrální procesorová jednotka
Segmentace Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Libor Otáhalík. Dostupné z Metodického portálu ISSN: 
Intel Pentium (1) 32-bitová vnitřní architektura s 64-bitovou datovou sběrnicí Superskalární procesor: obsahuje více než jednu (dvě) frontu pro zřetěze-né.
Intel Pentium D (1) Vyráběn s frekvencemi 2,80 GHz – 3,20 GHz
Transkript prezentace:

Vývoj architektury procesoru © 2011 Ing. Pavel Chmiel, Ph.D.

Úvod do problematiky Architektura = stavba procesoru, tedy obvody uvnitř procesoru podporující nové technologie. - zvýšení výkonu při zpracování instrukcí a dat - snížení spotřeby elektrické energie Základní obvody architektury procesoru - řadič procesoru - výpočetní jednotka (ALU) - paměťové registry (adresové, instrukční, datové)

Vývoj architektury procesorů INTEL Skalární architektura (8088, 8086, 80286, 80386, 80486) Superskalární architektura (Pentium, Pentium Pro, Pentium MMX, Pentium II a III, Celeron) NetBurst (Pentium 4, Pentium D, Xeon) Core (Core Duo, Core 2 Duo, Core 2 Extreme, Core 2 Quad, Celeron) Atom (optimalizována na co nejnižší spotřebu elektrické energie) Nehalem (řada procesorů Core i7, Core i5, Core i3) Sandy Bridge (2. generace procesorů řady Core i7, Core i5, Core i3)

Vývoj architektury procesorů AMD Am286, Am386, Am486 K5 K6, AMD K6-II, K6-III K7 (Athlon, Athlon XP, Athlon MP + Duron, Sempron) K8 (Athlon 64, athlon 64 X2, Turion 64, Turion 64 X2, Sempron) K10 (Phenom, Opteron) K11 (architektura vícejádrových APU s označením „Buldozer“)

Skalární architektura

Skalární architektura CPU Během 1 hodinového taktu dokáží dokončit zpracování pouze 1 instrukce. Pipelining = zřetězené zpracování instrukci. Procesor je složen z více funkčních bloků, které jsou vzájemně propojeny (pipeline, datovod). Dokáže si tedy rozpracovat více instrukcí najednou.

Skalární architektura CPU Zpracování instrukce se zjednodušeně sestává z těchto kroků (stupeň pipeline): výpočet adresy místa v operační paměti načtení instrukce z dané adresy v operační paměti dekódování instrukce (nalezení mikrokódu reprezentující instrukci v paměti ROM) provedení výpočetních operací v ALU / FPU zápis výsledku do registru

Skalární architektura CPU Zpracovávání vždy jedné instrukce Pipelining – zřetězené zpracování instrukcí

Skalární architektura CPU FPU = Floating Point Unit, matematický koprocesor Výpočetní jednotka integrovaná přímo v jádře procesoru, specializující se na operace s reálnými čísly s plovoucí řádovou čárkou. (součást CPU - architektura 80486 a vyšší) CACHE = velmi rychlá, statická paměť typu RAM, umístěná blízko jádra procesoru. Slouží k uložení části operační paměti (instrukce, data), se kterou procesor momentálně pracuje

Superskalární architektura

Superskalární architektura CPU Paralelní pipelining Obsahují více prováděcích jednotek (především ALU), umožňují paralelní zřetězení – dokončení více instrukcí během jednoho hodinového taktu (pouze na sobě nezávislé instrukce) Předvídání (predikce) skoku v programu Vyrovnávací paměť CACHE L1 (instrukční, datová) L2 (urychlení komunikace mezi CPU a OP)

Superskalární architektura CPU SIMD (Single Instruction Multiple Data) Rozšíření instrukční sady o instrukce, které za určitých podmínek dokáží zpracovat více celých (resp. reálných) čísel najednou - Vhodné pro multimediální a matematické aplikace (2D/3D grafika, zvuk, video, komprese, atd.) - Implementace 64 bitových resp. 128 bitových registrů - Technologie MMX, 3DNow!, SSE, SSE2, SSE3, SSE4, SSE5, AVX, AltiVec, atd.

Superskalární architektura CPU Příklad použití SIMD instrukce Skalární způsob výpočtu (SISD instrukce): 1. mikroinstrukce: 5 * 2 = 10 2. mikroinstrukce: 5 * 3 = 15 3. mikroinstrukce: 5 * 1 = 5 4. mikroinstrukce: 5 * 8 = 40 Vektorový způsob výpočtu (SIMD instrukce): 1. mikroinstrukce: 5 * (2; 3; 1; 8) = (10; 15; 5; 40)

NetBurst architektura

NetBurst architektura CPU Taktovací kmitočet Rapidní zvýšení rychlosti provádění instrukcí a výpočtů je zde docíleno především zvýšením taktovací frekvence jádra procesoru. - nutnost použití napájecích zdrojů s min. 400 W výkonem - přidán 12V napájecí konektor pro CPU - velká hodnota TDP ( masivní a hlučné chladiče) - nevhodné pro přenosné počítače

NetBurst architektura CPU Hyperskalární architektura - rozpracování až 20 instrukcí v pipeline - zdokonalená predikce (odhadování) skoku v programu: zdvojením některých jednotek zpracovává obě varianty kódu bez ohledu na výsledek skoku v programu, nepoužitou jednoduše odstraní. Procesorová sběrnice FSB s technologií QPB - až 4 přenosy na sběrnici během 1 hodinového taktu

NetBurst architektura CPU Zpracování instrukcí mimo pořadí Řadič procesoru analyzuje program a na základě zjištěné závislosti mezi jednotlivými instrukcemi provede jejich seřazení do optimálního pořadí. Rapid execution engine Procesor obsahuje více jednotek ALU, dvě pro jednoduché výpočty pracují na dvojnásobné frekvenci procesoru

NetBurst architektura CPU HyperThreading (HT) Thread (Vlákno): sekvence instrukcí, provádějících např. výpočet s načtenými operandy. Při zpracování vlákna nejsou vždy plně efektivně využity výpočetní jednotky procesoru. - Jeden procesor (procesorové jádro) pracuje jako dva logické (virtuální) procesory, avšak se sdílenými prostředky (ALU/FPU, řadič, prediktory, dekodér). - Dosáhne se toho duplikováním té části CPU, která obsahuje registry pro uchovávání stavu výpočtů.

NetBurst architektura CPU Intel 64 - Rozšíření instrukční sady o instrukce pro práci s 64 bitovými čísly. - Implementace 64 bitových registrů pro uložení instrukcí a dat. - Zvýšení adresového prostoru operační paměti nad rámec 4 GB (232 = 4 GB) díky tomuto rozšíření instrukční sady (technologie EM64T)

NetBurst architektura CPU Tepelná ochrana procesoru Tepelný monitor Procesor má integrované přesné teplotní čidlo neustále snímající teplotu. V případě selhání chlazení obvody tepelné ochrany sníží taktovací kmitočet CPU, čímž sníží tepelné vyzařování. Aplikace běží dále, avšak pomaleji. http://www.youtube.com/watch?v=06MYYB9bl70 V případě nárůstu teploty nad kritickou mez (kolem 135oC), obvody tepelné ochrany odstaví CPU od napájení.

NetBurst architektura CPU SpeedStep Úprava taktovacího kmitočtu jádra procesoru dle potřeb aplikace → snížení spotřeby el. energie + zahřívání Další technologie - Virtualizační technologie - Rozšíření instrukční sady (SSE2 a SSE3) o nové SIMD instrukce pro práci s čísly (celá, reálná) - XD bit

Core architektura

Core architektura CPU Více fyzických procesorových jader - paralelní zpracování více aplikací najednou - rozložení zpracování jedné aplikace na více jader Podpora 64-bitových operačních systémů - plně 64 bitové výpočetní jednotky + registry

Core architektura CPU Advanced Smart Cache L2 cache je sdílená mezi oběma jádry procesoru. Kapacitu je možné dynamicky přidělovat (alokovat) pro každé jádro (např. je-li jedno jádro nečinné, může druhé jádro využívat celou kapacitu L2 cache).

Core architektura CPU Wide Dynamic Execution Během jednoho hodinového taktu lze zpracovat více instrukcí – implementace 4 dekodérů instrukcí. počet mikroinstrukcí

Core architektura CPU Slučování instrukcí (Macro Fusion) Dekódování dvou úzce spjatých instrukcí na jednu mikroinstrukci, která je vystihne obě. Příklad: Sloučení instrukce pro porovnání operandů CMP (compare = porovnání) a instrukce skoku v programu v případě splnění JMP či nesplnění JNE podmínky. (JMP = z angl. JUMP, tedy skok)

Načtení 4 instrukcí z instrukčního registru. Každá instrukce se zpracovává samostatně. 5 instrukcí = 2 hodinové takty Načtení 5 instrukcí z instrukčního registru. Sloučení 2 instrukcí → 1 dekodér 1 mikroinstrukce reprezentuje 2 instrukce. 5 instrukcí = 1 hodinový takt

Core architektura CPU Slučování mikroinstrukcí (MicroOps Fusion) Sloučení dvou mikroinstrukcí, které jsou těsně spjaty do jedné. Příklad: adresace místa v operační paměti + uložení čísla na toto místo.

Core architektura CPU Správa napájení částí procesoru - řízení otáček ventilátoru v závislosti na zatížení CPU - odpojení od napájení nepoužívaných obvodů CPU Rozšíření instrukční sady - nové SIMD instrukce pro práci se 128 bitovými čísly - registry pro uložení 128 bitového čísla

Nehalem architektura

Nehalem architektura CPU Více fyzických procesorových jader - typicky 2 jádra (i3), 4 jádra (i5, i7), 6 jader (Xeon) QPI procesorová sběrnice Severní most (MCH)

Nehalem architektura CPU Integrace obvodů severního mostu do CPU - integrace řadiče OP (DDR 3) - integrace řadiče OP + řadiče grafické sběrnice (PCI-E x16) - integrace řadiče OP + GPU (oddělený čip od CPU)

Nehalem architektura CPU L3 Cache paměť - oddělená L2 cache = 256 kB - sdílená L3 cache = 8 MB, 4 MB HyperThreading Vícekanálový řadič operační paměti - procesory řady i7: 3 kanálový (tripple channel) - procesory řady i3, i5: 2 kanálový (dual channel)

Nehalem architektura CPU TurboBoost - obvody sledují vytížení jednotlivých jader CPU - pokud je jádro neaktivní, dojde k jejich odpojení od napájení - sníží se spotřeba elektrické energie a tím také TDP CPU - následně se přetaktují aktivní jádra CPU změnou násobitele frekvence

Nehalem architektura CPU TurboBoost

Sandy Bridge architektura

Sandy Bridge architektura CPU Plná integrace severního mostu do CPU (Core i7, i5, i3) - integrace jader CPU + řadič OP + rozhraní grafické sběrnice PCI-Express (s podporou Multi-GPU) + GPU na jednom polovodičovém čipu

Sandy Bridge architektura CPU Grafický procesor (GPU) v CPU - Intel HD Graphics 2000 (resp. 3000) - součást polovodičového čipu procesoru - přímý přístup do paměti L3 cache - možnost změny frekvence a výkonu dle potřeby programové aplikace - vlastní napájení, možnost vypnutí Sandy Brigde Nehalem

Sandy Bridge architektura CPU System Agent - Jedná se v podstatě o obvody severního mostu: řadič operační paměti DDR3 řadič sběrnice PCI-Express x16 verze 2.0 (lze rozdělit na dvě linky x8), podpora Multi-GPU PCU (Power Control Unit) = obvod řízení napájení, frekvence a tepelného monitoringu procesoru Media Engine - obvod pro dekódování videa a převod do jiných formátů

Sandy Bridge architektura CPU Oddělené napájení CPU, GPU, System Agent (SA) - vlastní napájení a kmitočet - efektivnější řízení spotřeby - nižší tepelné vyzařování - delší čas práce na akumulátory - širší možnosti přetaktování

Sandy Bridge architektura CPU Vnitřní kruhová sběrnice (ring bus) - Přímé propojení jader CPU, GPU a obvodů SA pomocí kruhové sběrnice (ring bus) - CPU, GPU i obvody SA sdílejí L3 Cache (LLC = Last Level Cache) - velká přenosová rychlost

Sandy Bridge architektura CPU Turbo Boost 2.0 - není implementováno u CPU řady Core i3 - obvod PCU (Power Control Unit) dokáže krátkodobě přetaktovat procesor nad rámec maximální hodnoty TDP (např. při spouštění programu, náročný výpočet). Poté klesne na základní frekvenci s maximálním Turbo násobičem  urychlení startu náročných programů, urychlení výpočtu, apod. - Myšlenka: chladič má určitou setrvačnost při zahřívání

Sandy Bridge architektura CPU Rozšíření instrukční sady (AVX) AVX = Advanced Vector Extension - implementace nových 256 bitových registrů - instrukce pracují s 256 bitovými operandy v 1 taktu - využití v náročných matematických aplikacích u výpočtů s čísly v plovoucí řádové čárce, u šifrovacích algoritmů, atd.