Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Třináctá přednáška (20. 12. - 24. 12. 2004) - procesory – dokončení - měření výkonu procesoru - chlazení - externí média - pevné disky - rozhraní disků.

Podobné prezentace


Prezentace na téma: "Třináctá přednáška (20. 12. - 24. 12. 2004) - procesory – dokončení - měření výkonu procesoru - chlazení - externí média - pevné disky - rozhraní disků."— Transkript prezentace:

1 Třináctá přednáška ( ) - procesory – dokončení - měření výkonu procesoru - chlazení - externí média - pevné disky - rozhraní disků

2 - Pentium II (1997, 7.5 mil., podpora 16 b., MMX, L , L2 na společné desce, Slot 1, Visual Computing, důraz na multimediální aplikace), Celeron změny v L2 - Pentium III (1999, Katmai, 500 MHz, 512 KB L2, Dynamic Execution, MMX, 0.25 mikro, rozšíření o 70 instrukcí proti PII, MMX o 12 instrukcí, 8 instrukcí k ovlivnění L1, L2, 3D grafika, rozpoznávání hlasu, formát MPEG2, rychlejší komprese, stejné změny i v Xeon, L2 není na čipu (složitost, zmetkovitost)) -Pentium III Xeon, konec roku 1999, 733 MHz, 0,18 mikronů, podpora sběrnice 133 MHz, L2 (256 KB) on-die s frekvencí procesoru, nová čipová sada Intel 840, podpora SDRAM do kapacity 8 GB, také DRDRAM, ATA/66, AGP 4x, AGP Pro, 64 bitové sloty PCI - také Intel se vrací k socketovému provedení, Pentium III Coopermine stále používá hliník, s mědí se počítá až pro technologii 0.13 mikronů. - Pentium 4 (Willamette), arabské číslování, podpora DRD RAM, později i DDR SDRAM, první P4 s technologií 0,18 mikronů, později přechod na 0,13, Rapid Execution Engine (ALU pracuje na 2x frekvenci), optimalizováno na vyšší frekvence, propustnost sběrnice je 3,3 GB/s (1,06 GB/s u P3), L1 (8 KB) L2 (256 KB), obě rychlejší než u předešlých typů, přidána ETC (Execution Trace Cache) - 12 KB na dekódované instrukce, počet tranzistorů 42 mil., na jeden křemíkový plátek se vejde pouze 100 čipů (u P3 až 250), Hyper Threading

3 Intel Xeon založen na jádře Pentium 4, architektura NetBurst, FSB 400 MHz (výkon 3,2 GB/s), paticové provedení (603 pinů), 1,4 GHz, 1,5 GHz, 1,7 GHz, 2,2 GHz, 0,18 μm (0,03 μm - Prestonia), cache on-die, přechod na 0,13 μm, v některých případech překonání P4 při stejné taktovací frekvenci, virtuální obraz více procesorů – hyper-threading Intel Itanium (Merced), 733 MHz (L3 2 MB), 800 MHz (L3 4 MB), L KB, L2 96 KB, 25 mil mil. tranzistorů, čipová sada s podporou 4 procesorů, 64 GB paměti, architektura IA-64, propojení se systémem pomocí sběrnice 133 MHz, 6 instrukcí v jednom taktu, 6,4 mld. operací/s. Zachovaná zpětná kompatibilita, problémy s 32 bitovými operacemi. Riscové procesory Alpha, PowerPC, PA-RISC, UltraSparc již od konce 90. let. Naskýtá se otázka, jak rychle se dokáží výrobci operačních systémů adaptovat na změnu platformy. Počítá se s Irixem, Digital Unixem, Modestem (Novell), Windows Whistlerem, Linuxem, podpora pouze SDRAM PC100 Itanium 2 (McKinley), až 100% nárůst výkonu, 1 GHz, 3 MB cache on-die, čipset E8870, DDR, PCI-X sběrnice, nové výpočetní jádro, FSB 400 MHz/128 b., 6,4 GB/s, 0,18 μm, 400 mm, srovnatelný výkon s RISC procesory, AMD – SledgeHammer (Opteron), Claw-Hammer (Athlon 64), technologie x86-64, 754 (940) pinů, Athlon XP ,5 GFLOPS, Itanium/800 – 13 GFLOPS, Windows XP, SUSE Linux, Madison, Deerfield (0,18, 2003), Intel - Nocona

4 AMD K6 3DNow!, největší konkurent,, L2 až 256 KB (K6-3) K7 Athlon, lepší v benchmarkových testech než PIII, lepší cena, L1 64 KB, L2 256 KB, L3 2MB, 184 mm2, 22 mil., 0.25, nekompatibilita instrukčních sad AMD Athlon Thunderbird oproti staršímu procesoru Athlon se zmenšila L2 na velikost 256 KB, je však on-die a může běžet na kmitočtu procesoru, zlepšil se tedy výkon, počet tranzistorů se zvýšil na 37 mil., vrací se k socketovému provedení Socket A (Socket 462), v provozu v Drážďanech se používá jako u prvního procesoru AMD měděná technologie (6 vrstev, pomoc firmy Motorola, která v mědi vyrábí PowerPC pro Apple), produkce Athlonů je ve 12 typech, Výroba starších procesorů K6-2 a K6-III utlumována, uvedení mobilní verze Athlonu (Corvete) konec roku AMD Advanced Micro Devices

5 AMD Duron určen pro levnější počítačové sestavy, je levnější variantou Athlonu, má menší L2 (64 KB), první verze 600 MHz, říjen 2000 ve verzi 750 MHz, výkonově příliš nezaostává za Athlonem, snaží se jej dohnat frekvenčně, je stavěn především proti procesorům Celeron, Duron je výkonnější, i když má menší L2, L2 u Celeronu není exkluzivní, data z L1 (32 KB) jsou tedy obsažena i v L2, jsou tedy duplicitní, Celeron podporuje jen 66 MHz sběrnici, cena základní desky pro Duron je stále vysoká, socket A, L KB, L KB, 25 mil. tranzistorů, 0.18 mikronů, nové procesory jsou zatím známé pod svými kódovými jmény (jména slavných letadel z II. světové války) Mustang - konkurent Pentium III Xeon s 4 MB L2 Polomino - konkurent Pentia 4, je považován za nástupce Athlonu. Nástupcem Duronu - procesor Morgan s větší pamětí L2 SledgeHammer (Opteron) duben 2003, odlišný přístup k 64 bitovým procesorům, Claw- Hammer (Athlon 64), technologie x86-64, 754 (940) pinů. Porovnání výkonu: Athlon XP ,5 GFLOPS, Itanium/800 – 13 GFLOPS AMD Advanced Micro Devices Intel – třetí generace Pentia 4 (Prescott), 90 nm, 1 MB L2, až 3,6 GHz, extrémní Pentium 4 s jádrem Northwood, 3,4 GHz, 2 MB L3, nová patice (kontaktní plošky), pipeline 31 stupňů

6 Intel Pentium II AMD Athlon Celeron

7

8

9 Technologie Hyper Threading - využití procesoru P4 na 35 %, pipelining 20 stupňů, první paralelizace u superskalárních procesorů (několik pipeline), u P procesní jednotky - v případě potřeby (serverové aplikace) pracují dva (DP) nebo více (MP) procesorů - vyšší cena víceprocesorových řešení - paralelní zpracování souběžně probíhajících nebo vzájemně nezávislých procesů - multi threading vyžaduje hardwarovou podporu (několik sad registrů, řídicí jednotka) - hyper threading využívá souběžné zpracování různých pipeline jednoho procesu, v jednom fyzickém procesoru je vidět několik logických - snaha o zachování plochy čipu (větší o 5 %), cenově výhodnější než DP, MP -lépe vychází pouze monolitické multiprocesorové čipy, dvě procesorová jádra se dělí o společnou vyrovnávací paměť (velká část plochy), zvětšení plochy o 30%

10 Asynchronní procesory - oscilátor určující rychlost procesoru - v počátcích byly používány synchronní i asynchronní obvody, synchronní převládly z důvodu jednoduchosti návrhu, testování a ladění - taktování je stále náročnější, pulsy se dostávají obtížně k některým částem - neustále složitější a dražší řešení nastavující taktování v různých místech obvodu (hierarchie sběrnic) - synchronní obvody pracují podle své nejpomalejší části (samy hodiny) - logické obvody mohou trávit 95 % času čekáním na další takt - experimenty s mikroprocesory bez hodin, plně asynchronní nebo s lokálně taktovanými komponentami - firma Self – Timed Solution (Furber), prototypy kombinovaných čipů self – timed interconnects - asynchronní obvody jsou rychlejší, menší spotřeba, méně tepla - méně infrastruktury pro vývoj, méně znalostí - Ultra Sparc III (Sun)

11 Jeden z mnoha druhů lží, různé techniky a metody měření, každá je zkreslující nebo diskriminující, před diverzifikací doby provádění instrukcí - MIPS (Million Instructions Per Second), nehodí se pro různé instrukční soubory, použití programu ve vyšším programovacím jazyku (nezávislost na konkrétním procesoru) - počet operací v plovoucí řádové čárce, MFLOPS (Million Floating Point Operations Per Second), velký rozdíl v operacích v pohyblivé čárce (od neexistujících instrukcí (Cray - 2 nemá dělení v FP) až po goniometrické funkce (Motorola 68882)), testovací programy ve vyšším jazyku, nezávislé na použitém procesoru, benchmark programy, Whetstone , na základě analýzy programů pro vědecko technické výpočty v Algolu, Fortranu, pohyblivá čárka, Dhrystone , ADA, C, systémové programy, syntetické programy jsou zjednodušenou abstrakcí reálných aplikací, celočíselné operace a práce s řetězci, velký prostor pro manipulaci s výsledky, velké množství testovacích programů s rozličným zaměřením, problémy s optimalizujícími překladači (rychlost, velikost), snaha o získání co nejuniverzálnějšího benchmarku - SPEC (spolupráce velkého množství uznávaných firem (HP, DEC, IBM, Intel, Sun, …) Měření výkonu procesoru

12 1988, nevýdělečná společnost pro výrobu a podporu standardizovaných benchmarků, analýza zdrojových textů používaných aplikací, zvlášť pro pevnou a plovoucí řádovou čárku, SPEC89, SPEC92, SPEC95, SPEC WEB99, SPEC CPU2003, SPEC MAIL2003, celkový výsledek dán statistickými metodami z jednotlivých měření, systém je charakterizován jediným číslem, zjišťování hodnot SPECratio i při multitaskingu, 6x pro int, 14x pro float, velký přínos pro určování výkonu, politikaření se neubránilo ani SPEC, výsledky jsou vázány na procesor, při použití speciálních algoritmů se používají vlastní testy (celočíselné dělení - komprimace MPEG), vliv přepínačů pro nastavení optimalizační strategie, základem benchmarků SPEC jsou reálné aplikace - realistický obrázek o výkonnosti, prestižně uznávané výsledky - minimalizace booleovských funkcí - komprese souborů - výpočty v tabulkovém procesoru - simulace analogových obvodů - řešení pohybové rovnice - průchod světelných paprsků optickým prostředím SPEC =    SPECratio i n n i=1 SPECratio = K / doba provádění K - doba provádění na VAX - 11/780 SPEC - System Performance Evaluation Cooperative

13

14 Chlazení dnešní tepelná hustota je 35 W/cm 2, dá se počítat s 200 W/cm 2, chlazení kapalinou, chladící kanály (i uvnitř čipu), chlazení postřikem, speciální antikorozní nátěry, ochrana proti zkratu

15 ZIP disky - firma Iomega, 3 1/2”, 100, 250 MB, kontaktní hlavy, externí a interní Disky LS120 - podobné ZIP, 120 MB, v mechanice je možné použít i diskety 3 1/2” JAZZ disky - obdobný princip jako HD, kapacita 2 GB, plovoucí hlavy nad magnetickou vrstvou, interní, externí SyJet disky - reakce firmy SyQuest na JAZZ disk (Iomega), 1,5 GB Externí paměťová média Streamer (pásková jednotka), kazety DAT, 4 mm, kapacita 20 GB SyQuest disk - výměnný kotouč pevného disku, přechod mezi pevnými a pružnými disky, 270 MB, připojení pomocí SCSI, IDE, paralelního portu, vzájemná nekompatibilita Bernoulliho disk - firma Iomega, pružný kotouč v proudu vzduchu, 200 MB

16 Pevné disky

17 magnetická indukce [B] intenzita magnetického pole [H] nelineární závislost vyskytující se v magnetických obvodech s feromagne- tickými materiály (intenzivně zesilují magnetické pole, Fe a jeho slitiny, Co, Ni, vysoká magnetická hystereze (remanentní magnetizmus), Hysterezní křivka

18 Pevné disky - počátek 70. let: 10 Mb/palec 2, dnes: 30 GB/palec 2 (100 GB HD) - prognóza IBM: v roce 2004 bude hustota 100 GB/palec 2 - superparamagnetické síly, TB/palec 2 - hlavy MR (3 %), GMR (1997, 15 %): oddělené zapisovací a čtecí elementy, optimalizace, senzor mezi dvěma mg. štíty, malé rozměry, citlivější, lépe přijímají signály malých mg. struktur, změna odporu při změně magnetizace, GMR využívají také změny odporu, které se zakládají na kvantových efektech elektronů, vztahují se na jejich spin, jsou citlivější než MR - AFC (Antiferromagnetically Coupled Media) - technologie OAW (Optically Assisted Winchester), 250 GB/i 2 ovlivnění zápisu a čtení pomocí laserového paprsku - holografické záznamy

19 Technologie OAW

20 AFC (Antiferromagnetically Coupled Media) 1990, antiferomagneticky spojená média, mezi magnetickými vrstvami je tenká vrstva (několik atomů) ruthenia (vzácný kov), tradiční magnetická vrstva je tvořena slitinou CoPtCrB, vrstvy u AFC mají rozdílnou magnetickou orientaci, větší stabilita dat, hustota 45 GB/palec 2, technologie AFC je plánovaná pro všechny disky IBM

21 Základní princip , Dennis Gabor, z řeckých slov holo (celé) a gram (zpráva), rozvoj optických komunikací a parelelních počítačových systémů, kapacity v TB, PB, rychlosti přístupu kolem 10 GB/s, holografický materiál na bázi niobit, stroncium, barium, lithium, interference dvou koherentních laserových paprsků (fáze, vlnová délka), referenčního a signálového, výsledkem interference je indexová mřížka (hologram), 60. léta v Rusku, paralelní zápis a snímání dat, HRAM

22 Multiplexování v holografické paměti SLM - prostorový světelný modulátor

23 Pevné disky , IBM, RAMAC (Random Access Method of Accounting and Control), 5 MB, 50 x 24“, 35 tis. USD/rok, technologie Winchester (1973) - diskový substrát (nemagnetický, lehký, mechanické a chemické vlastnosti (Al slitina, sklo), elektrolyticky nebo vakuově napařený magnetický materiál, pevná hliníková pouzdra HDA (Hard Disk Assembly) - stejnosměrné motory, hydrodynamická (fluidní) ložiska ot./min., (4500, 5400, 7200, 10000, 12000, 15000), při vyšších otáčkách již nastávají mechanické problémy, vyšší otáčky nemusí znamenat vyšší přenosové rychlosti - vzdálenost hlav 0,3 - 0,6 mikronů - autodiagnostické systémy, otevřený standard S.M.A.R.T. (Self - Monitoring Analysis and Reporting Technology) - IBM, WD, Maxtor, Seagate, Quantum, Fujitsu

24 10 GB 5 GB 1,6 GB

25 Pevné disky - stopa, sektor, cylindr, sektory sdruženy v tzv. clustery, různý počet sektorů na stopě (ZBR Zone Bit Recording), složitější přístup k datům, data se ukládají po cylindrech - možnost paralelního čtení všemi hlavami, nutnost parkování hlav - zóna pro parkování na nejvnitřnější stopě - velikost disku, rychlost disku - 3 úrovně formátování:low level (fyzické) tabulka rozdělení high level (logické)

26

27 Pevné disky - vnitřní přenosová rychlost (na samotném disku) - vnější přenosová rychlost (přes rozhraní ven, x menší) - aplikační přenosová rychlost (po sběrnici na místo určení) - vyhledávací doba (Seek Time), přemístění hlaviček, mezi stopami, ms, průměrná hodnota, mechanické vlastnosti, v rámci sektoru 0 zpoždění - přístupová doba (Access Time), Seek Time + doba zpracování řadičem, cache techniky, cca 10 ms - hustota stop (Track Density), track per inch - rotační prodleva (Rotational Latency), ms, čekání na požadovaný sektor, polovina doby rotace disku - komprimace statická, dynamická

28 1 : 1 1 : 61 : 3 Prokládání pevných disků interleaving, vzhledem k poměrně vysoké rychlosti otáčení disku se nedá zaručit čtení dalšího sektoru během jedné otáčky, docházelo by ke zpomalování přístupových časů k datům, zavádí se faktor prokládání pevného disku, data jsou zapisována do každého n-tého sektoru (1 : n)

29 Pevné disky FAT16, FAT32, NTFS (vysoký stupeň zabezpečení, řízení přístupu k souborům) FAT16 DiskCluster MB512 B MB1 K MB2 KB MB4 KB MB8 KB MB16 KB MB32 KB FAT32 DiskCluster < 260 MB512 B 260 MB - 8 GB4 KB GB8 KB GB16 KB > 32 GB32 KB

30 RAID (Redundant Array of Inexpensive Disks) - kapacitní řešení - bezpečnostní řešení - část kapacity oběto- vána na redundanci - stejné parametry - důraz na výkon, spo- lehlivost, bezporu- chovost, opravu chyb RAID 0 - data striping, minimálně dvě diskové mechaniky, data ukládá po segmentech postupně na všechny mechaniky, zvýšení výkonu, neexistuje žádná ochrana dat RAID 3 - data striping s vyčleněním jednoho disku na paritní informace, určitá odolnost RAID 5 - nejvíce používaný typ diskového pole, místo rozdělování dat do bloků rozkládá na několik disků bity každého bajtu, redundantní paritní informace ukládá na všechny disky, data jsou rekonstruovatelná, vyžaduje minimálně 3 disky

31 - ST 506 (MFM) 2 kabely, náchylné na rušení, 5 Mb/s - ESDI (Enhanced Small Device Interface), 24 Mb/s, pro velko- kapacitní disky a pásky, větší odolnost proti rušení, cache - IDE (Integrated Drive Electronics), 1986 firma WD, standard rozhraní on board, AT bus ATA (Advanced Technology Attachment), řídící jednotka na disku, vyšší počet sektorů na stopu, 40 žilový kabel, 4 MB/s, 2 zařízení - EIDE (Enhanced), 4 zařízení, dovoluje i CD-ROM (ATAPI AT Atachment Pack Interface), páskové jednotky, 20 MB/s, může komunikovat prostřednictvím režimu PIO (Processor Input Output) nebo DMA - Ultra ATA/33 (66, 100), MB/s, zabezpečení CRC, 80 žilový kabel (45 cm) - Serial ATA (SATA), 150 MB/s, (600 MB/s ), tenký kabel, m, hvězdicová topologie připojených zařízení, zachovává kompatibilitu komunikačních protokolů ATA, SATA II – 300 MB/s Rozhraní disků

32 - paralelní (8 a 16 datových linek), možnost připojit až 8 (16) externích i interních zařízení, komunikace po sběrnici, není vázáno na počítače PC, adresace, nutnost zakončení, odlehčení procesoru, řešení pro servery, celková délka sběrnice v prvních specifikacích max 25 m (klesá s rostoucí rychlostí) SCSI Small Computer System Interface

33 Propojení SCSI zařízení

34 SCSI (Small Computer System Interface) - šířka sběrnice, taktovací frekvence, typ signalizace (kvalita signálu klesá s rostoucí délkou a zvyšujícím se kmitočtem, jednoduchá, diferenciální, LVD - Low Voltage Differential), udává napětí mezi spárovanými vodiči SCSI I - 8 bitová sběrnice, asynchronní, 3 MB/s, synchronní 5 MB/s SCSI II - příkazy a seznamy parametrů jasně definovány, rychlost stejná, 50 žilový kabel Fast SCSI - vylepšení na 10 MB/s Wide SCSI - 16 bitová sběrnice Fast SCSI, 68 žilový kabel, 20 MB/s Ultra SCSI - (Fast 20 SCSI), pracuje s 50 žilovým kabelem s vyšší frekvencí, 20 MB/s, 16 bitová varianta má 40 MB/s (Ultra Wide SCSI) SCSI Ultra 160 – 15 zařízení, délka 12 m, 160 MB/s, automatická úprava přenosových rychlostí, CRC kontrola chyb SCSI Ultra 320 – 320 MB/s (640 MB/s se očekává v roce 2003) - zajištění zpětné kompatibility (konektorové redukce) Fibre Channel - optický přenos, 200 MB/s, lze spojovat až na vzdálenosti 10 km


Stáhnout ppt "Třináctá přednáška (20. 12. - 24. 12. 2004) - procesory – dokončení - měření výkonu procesoru - chlazení - externí média - pevné disky - rozhraní disků."

Podobné prezentace


Reklamy Google