Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

MTTF a MTTR u dnešních systémů

Podobné prezentace


Prezentace na téma: "MTTF a MTTR u dnešních systémů"— Transkript prezentace:

1 MTTF a MTTR u dnešních systémů
Petr Čečil

2 Motivace – MTTF = 113 letů / havárie
Zdroj: +

3 Motivace (2) Report of the PRESIDENTIAL COMMISSION on the Space Shuttle Challenger Accident Zdroj:

4 Odolnost proti chybám (opakování)
Spolehlivost a dostupnost MTTF (mean time to failure) – průměrný čas do příští chyby MTTR (mean time to repair) - průměrný čas zotavení Dostupnost modulu = MTTF / (MTTF + MTTR)  , FR (failure rate) – poruchovost, počet selhání např. za hodinu, rok atd…  = 1 / MTTF MTBF = MTTF + MTTR Zdroj:

5 Typické MTTF (Gray 1992) konektory kabely 1000y MTTF
logické obvody 3-20y MTTF soft/hard=1/1 až10/1 disky u PC 1y MTTF dražší 5-20y MTTF (ale hodně záleží na typu chyb soft read error je častější některé chyby jednou za milion let) workstations 3-5y MTTF software 1w MTTF SW: 3 chyby ve 100 řádcích kódu 100/1 soft/hard datové spoje v USA 10-9 BER (bit error rate) - optika LAN: většina chyb kvůli protokolům 3w MTTF Zdroj:

6 Příklad Předpokládejme, že stáří komponent neovlivňuje pravděpodobnost vzniku chyb a komponenty selhávají nezávisle. Pak celková poruchovost je suma poruchovosti modulů. Spočítejte MTTF diskového subsystému: 10 disků každý má h MTTF 1 SCSI controller h MTTF 1 zdroj napájení h MTTF 1 aktivní chlazení h MTTF 1 SCSI kabel h MTTF Failure Rate = 10*1/ / / / / = ( )/ = 23/ MTTF=1/Failure Rate = /23 = h

7 Case Studies SYSTEM 8 20 21 Years Hlášená MTTF podle komponent systému
Výsledky: Hardware a Maintenance mají výborné MTTF Software maskuje většinu selhání HW Operations skrývají chyby SW (nový SW, …) Systematicky se nehlásí všechny chyby SOFTWARE Years HARDWARE Years MAINTENANCE Years OPERATIONS Years ENVIRONMENT Years SYSTEM Years

8 Zdroje prof. Lawrence Rauchwerger; I/O 2: Failure Terminology Examples Gray Paper and a little Queueing Theory Jim Gray; Talk at UC Berkeley on Fault Tolerance

9 Pevné disky HDD SSD

10 Vývoj spolehlivosti v MTTF
1992 (Transaction Processing: Concepts and Techniques - Grey) disky u PC 1y MTTF dražší 5-20y MTTF 1993 (Campbell et al. *): – hodin 2002 (Center for Magnetic Recording Research - Hughes et. al.): hodin 2012 (StorageReview.com - Andrew Baxter): HDD: 1,5 milionů hodin SSD: 2 miliony hodin – 10 milionů hodin 2013: Tape Drive: hodin

11 Důvody selhání Nejvíce selhání pochází z interakce čtecí hlavy s diskem. Způsob vzniku: Nárazy Dočasné přerušení/rušení přenosu Poškození povrchu media Selhání termo-mechanické stability struktur na disku Chybou uživatele Mechanické nárazy Vnější kontaminace kondenzace Výrobní vady Kontaminace (i částicemi) při výrobě Servo chyby Zvětšení tloušťky maziva Výkyvy v tloušťce uhlíkového potahu Kontakt hlavy s diskem (z výroby)

12 Co to znamená doopravdy?
Otázka není jestli disky selžou ale kdy. Spolehlivost je velmi závislá na teplotě v jaké se disk provozuje. Hodnotou MTTF nám výrobce říká jak dlouho by měl disk pracovat a že po jejím překročení roste pravděpodobnost selhání. Reálnější hodnotou MTTF oproštěné od marketingu je délka záruční doby od výrobce.

13 Zdroje Charles M. Kozierok: The PC Guide (2001)
Dr. Craig Hillman: Reliability of Hard Disk Drives (2003) Andrew Ku: MTTF? MTBF? "My Drive Lasts Longer" 2011 html LTO-4 Tape Drive

14 Konektory kabely Elektromechanické komponenty

15 Obecně Gray (1992): konektory kabely 1000y MTTF
Hodnoty se stále pohybují v tisících let. MTTF je složité získat pro konektory a kabely. Vyžaduje to: Selhání při testech Znát čas každého selhání Bohužel jen velmi málo selhání se doopravdy stane při typických testech. Takže se používají drsnější testy => nerealistické výsledky Nebo delší testy => drahé testy Kvůli těmto důvodům se MTTF u konektorů a kabelů v praxi nepoužívá. Místo něj se zkoumá fyzikální princip poškození.

16 Zdroje Vincent C. Pascucci: A Brief Overview of Reliability in General and for Electrical Connectors in Particular or_Electrical_Connectors_in_Particular.pdf Nějaké příklady (ne)používání MTTF u elektro-mechanických komponent: ontent&lang=en&siteid=cseus&aktprim=0&objaction=csview&extranet=standard&viewreg=WW MTTF = 10^9 / FIT electric.com/resources/sites/SCHNEIDER_ELECTRIC/content/live/FAQS/28000/FA28376/es_ES/STB_MT BF.xls

17 Software

18 Windows MTTF V roce 2000 zveřejnil MS porovnání 3 desktopových operačních systémů. Je založená na počítačích v akademické sféře soukromé a NSTL laboratořích. Firma eTesting Labs vydala v roce i pro Windows XP Windows XP hodin Windows 2000 hodin Windows NT 4.0 hodin Windows 98 hodin

19 Linux – Debian pkgs V roce 2011 na Technické univerzitě v Darmstadtu vytvořili aplikaci pro počítání MTTF Debian balíčků podle počtu bezpečnostních problémů a jejich dopadu Hodnoty MTTF jsou ve dnech

20 Zdroje Microsoft: Comparison of the Reliability of Desktop Operating Systems 2000 eTesting Labs: Microsoft: Windows XP Reliability Study 2001 TrustMiner

21 Ostatní Integrované obvody procesory síťové prvky…

22 Procesory integrované obvody
Copley Controls – firma vyrábějící řídící moduly pro roboty a serva Jejich IC (Integrované obvody) mají MTTF okolo 175 mil. Hodin Všimněme si ale keramických kondenzátorů mají sice malé MTTF jako jednotky. Pokud jich je ale na desce 186 dostáváme MTTF už hodin Všude vycházejí obrovská čísla a firmy MTTF už prakticky nezveřejňují (Intel, AMD) „Assume we have an industry grade (-40°C to 85°C) standard microcontroller. “ … „Below 90 nanometer things start becoming increasingly statistical and the MTTF could be as low as less than 10 years (if no precautionary measures were taken).“ * *Zdroj:

23 Procesory MTTF - ilustrace

24 Síťové prvky Cisco přepínače (switch) ~ hodin

25 Zdroje ml


Stáhnout ppt "MTTF a MTTR u dnešních systémů"

Podobné prezentace


Reklamy Google