Diagnostika počítačů DGP_06 Prof. Ing. Karel Vlček, CSc. karel.vlcek@vsb.cz Katedra Informatiky, FEI, VŠB - TUO
Zabezpečení proti poruchám Bezpečnost provozu systému je pravděpodobnost, že se na výstupu neobjeví nedetekovaná chyba Zvyšování bezpečnosti se děje dvěma způsoby: 1. snižováním pravděpodobnosti výskytu chyb 2. zvyšováním pravděpodobnosti detekce chyby K. Vlček: Diagnostika počítačů
Zabezpečení hlídačem Hlídač je tvořen technickými i programovými prostředky Funkční jednotka Výstup dat Vstup dat Chyba Hlídač K. Vlček: Diagnostika počítačů
Realizace hlídače v čase Hlídač může být realizován ze součástek, u nichž je výskyt poruchy vyjádřen v čase Z toho důvodu je počítat s možností výskytu poruchy, která se může projevit jako chyba jeho funkce Aby hlídač byl schopen kontrolovat správnost funkce, musí mít k dispozici určitou redundanci K. Vlček: Diagnostika počítačů
Obvody bezpečné proti poruchám Nechť obvod realizuje logickou funkci Z = Z(X), kde X je vstupní a Z výstupní vektor Množina vstupních vektorů je X a množina výstupních vektorů je Z Při použití kódového zabezpečení platí, že Z patří do prostoru Bn, n je počet bitů vektoru z a Bn je množina všech vektorů délky n K. Vlček: Diagnostika počítačů
Zdvojení (poprvé použito firmou Hitachi pro zabezpečení železnice) Nejjednodušší realizace je zdvojení Funkční jednotka Vstupy Výstupy =1 Funkční jednotka Chyba 1 =1 K. Vlček: Diagnostika počítačů
Kontrola inverzní funkcí Funkční jednotka realizuje zobrazení prosté a druhá realizuje zobrazení inverzní Vstupy Funkční jednotka F Výstupy Funkční jednotka F-1 =1 1 Chyba K. Vlček: Diagnostika počítačů
Dvojdrátová logika Logický součin & 1 a a AND b non a b non (a AND b) non b & 1 a non a b a AND b non (a AND b) K. Vlček: Diagnostika počítačů
Dvojdrátová logika Logický součet 1 & a a OR b non a b non (a OR b) non b & a non a b a OR b non (a OR b) 1 K. Vlček: Diagnostika počítačů
Dvojdrátová logika Negace a non a non a a K. Vlček: Diagnostika počítačů
Použití detekčních kódů Lze použít například při kontrole aritmetických funkcí tím, že je generován zbytek po operaci sčítání Často je kontrolována platnost kódu výstupu například u dekodéru pomocí bloku součtu modulo2 Nejčastější aplikací je hlídač parity, který provádí detekci chyb K. Vlček: Diagnostika počítačů
Hlídače kódu k z 2k Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané Výhodou je snadná realizace samočinně kontrolovaného hlídače Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu K. Vlček: Diagnostika počítačů
Úplně samočinně kontrolované obvody Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané Výhodou je snadná realizace samočinně kontrolovaného hlídače Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu K. Vlček: Diagnostika počítačů
Hlídací časovač - princip Pro kontrolu složitějších obvodů je možné použít tzv. hlídacího časovače (watchdog timer) Hlídací časovač bývá aplikován u mikroprocesorů, kde využívá komplexní funkce přerušení Tento obvod kontroluje, zda je procesor schopen periodicky reagovat na přerušení K. Vlček: Diagnostika počítačů
Hlídací časovač – způsob aplikace Realizace hlídacího časovače Nastavení Žádost o přerušení C1 Procesor Start Inicializace Hodiny C2 Výstražný obvod Signalizace Hodiny K. Vlček: Diagnostika počítačů
Hlídací časovač – popis bloků Funkce dvou čítačů C1 a C2 v zapojení hlídacího časovače je k tomu, aby bylo kontrolováno, zda je procesor schopen periodicky reagovat na přerušení C1 začne odměřovat čas a vyšle procesoru žádost o přerušení Současně s tím se spustí C2, který odměřuje, kdy má být žádost spuštěna znovu Pokud nenastane přerušení, je aktivován výstražný obvod K. Vlček: Diagnostika počítačů
Architektura systémů odolných proti poruchám Požadavky na vysokou spolehlivost číslicových systémů dokumentují systémy zaměřené na zvýšení odolnosti proti poruchám Bylo nalezeno mnoho dílčích řešení subsystémů, ale dosud chybí ucelená teorie odolnosti proti poruchám, která by byla obecně použitelná pro konstrukci systémů počítačů K. Vlček: Diagnostika počítačů
Architektura systému SAPO K prvním počítačům, který byl k této úloze vybaven, byl počítač SAPO československé výroby z VÚMS Praha (doc. A. Svoboda) Počítač SAPO měl tři aritmetické jednotky pracující systémem TMR (Triple Modular Redundant) Poruchy mohly být maskovány na základě majoritního vyhodnocení bezporuchové činnosti K. Vlček: Diagnostika počítačů
TMR (Triple Modular Redundant) Struktura systému TMR F1 F2 F3 ≥2 X f1 f2 f3 M f K. Vlček: Diagnostika počítačů
Zobecnění: TMR → NMR Zobecněním systému TMR na systém NMR spočívá ve zvětšení počtu modulů Všechny jednotky opět zpracovávají stejná vstupní data podle stejného programu Výstupy všech N jednotek jsou přivedeny do majoritního členu, jehož práh je M = (N+1)/2 Majorita je definovaná jako funkce pro lichý počet argumentů, proto je N liché číslo K. Vlček: Diagnostika počítačů
NMR (N-Modular Redundant) Struktura systému NMR F1 F2 F3 ≥M X f1 f2 fN f ׃׃ K. Vlček: Diagnostika počítačů
FTMP (Fault Tolerant Multiprocessor) Základní typ zálohy využitý při práci systému FTMP je konfigurace GMR (General Modular Redundant) GMR systém pracuje s tzv. dynamickou zálohou, při které jsou zálohovací moduly v činnosti, aby byly ihned připraveny k činnosti FTMP sestával z ze 14 procesorů, 7 modulů pamětí a dvou modulů vstupů a výstupů, byl použit pro simulaci řízení letounu Boeing 707 K. Vlček: Diagnostika počítačů
Počítač raketoplánu NASA Základním modulem je počítač GPC (General Purpose Computer) doplněný o procesorem vstupů a výstupů Počítačů GPC bylo zapojeno pět Každý počítač je vybaven čtyřmi zobrazovacími jednotkami z nichž tři jsou v pilotní kabině a jedna na zádi Kromě 24 sběrnicových spojení bylo použito i přímé spojení mezi vstupními / výstupními procesory a pamětí K. Vlček: Diagnostika počítačů
Počítač raketoplánu NASA Přímé spojení mezi vstupními / výstupními moduly a pamětí GPC 1 GPC 2 GPC 3 GPC 4 GPC 5 Vnější paměť Zobrazovací jednotky a klávesnice Telemetrické přístroje Ovládací panely Navigace a styk s pohonnou jednotkou Řízení manipulace s nákladem Příprava a řízení startu 24 sběrnic IOP 1 IOP 2 IOP 3 IOP 4 IOP 5 K. Vlček: Diagnostika počítačů
Systémy pro řízení kolejové dopravy Systémy s vysokými požadavky na spolehlivost jsou systémy kolejové dopravy Nejstarší počítačový systém COMTRAC (Computer-Aided Traffic Control) byl nasazen v Japonsku v roce 1975 Sloužil na trati dlouhé 160 km, na které se pohybovalo současně až 200 vlaků Systém je rozdělen do sekce plánování provozu a sekce řízení trati K. Vlček: Diagnostika počítačů
Systémy pro řízení kolejové dopravy Systém pro plánování provozu měl dva počítače H-8450, které se dělily o výpočetní úlohy a v případě poruchy zastal práci i jeden, ale se sníženým výkonem Systém pro řízení trati byl osazen třemi počítači H-700, z nichž řešily úlohu dva a porovnáním výsledků se zjišťovalo, zda pracují bez poruchy V případě neshody je využit třetí počítač pro rozhodnutí o správnosti jednoho nebo druhého výsledku výpočtu K. Vlček: Diagnostika počítačů
Systémy pro řízení telefonních ústředen Při návrhu architektury počítačových systémů ESS (Electronic Switching System) byl důraz kladen na vysokou hodnotu součinitele pohotovosti za celou dobu provozu Řešení si vyžádalo použití metody zálohování založené na zdvojení všech důležitých bloků (ESS 2 a ESS 3) U následujících typů počítačů pro telefonní ústředny (ESS 4) bylo použito substituční zálohování „M z N“ K. Vlček: Diagnostika počítačů
Systémy pro řízení telefonních ústředen Počítače 3B20D pro ústředny ESS 5 důsledně využívají pro ukládání dat kódu celkové parity Hlavní paměť je vybavena rozšířeným Hammingovým kódem pro opravu jedné a detekci dvou chyb v jednom slově Schopnosti rozšířeného Hammingova kódu nejsou tedy využity úplně K. Vlček: Diagnostika počítačů
Další aplikace vysoce spolehlivých systémů počítačů Těsně vázaná duplexní architektura počítače IBM AN/UYK-43 je určena pro řízení lodí Počítač pro řízení příjmu z družice ARMURE (ARchitecteur MUltiprocesseur REdondante) byl vyvinut ve francouzském městě Toulouse V bankovnictví jsou používány systémy pro zpracování transakcí do osmdesátých let tyto systémy využívaly zdvojení a od začátku devadesátých let zavedly systém TMR Častější je také využití kódového zabezpečení K. Vlček: Diagnostika počítačů
Literatura Hlavička J.: Diagnostika a spolehlivost, Vydavatelství ČVUT, Praha (1990), ISBN 80-01-01846-6 Hlavička J., Racek S., Golan S., Blažek T.: Číslicové systémy odolné proti poruchám, Vydavatelství ČVUT Praha (1992), ISBN 80-01-00852-5 Musil, V., Vlček, K.: Diagnostika elektronických obvodů, TEMPUS Equator S_JEP-09468-95, ÚMEL, FEI VUT v Brně (1998) Hlavička, J., Kottek, E., Zelený, J.: Diagnostika Elektronických číslicových obvodů, Praha SNTL (1982) Drábek, V.: Spolehlivost a diagnostika, VUT Brno, (1983) Hławiczka, A.: P1149, Warszawa (1993), ISBN 83-204-1518-7 K. Vlček: Diagnostika počítačů