Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

MTTF a MTTR u dnešních systémů PETR ČEČIL. Motivace – MTTF = 113 letů / havárie Zdroj: +

Podobné prezentace


Prezentace na téma: "MTTF a MTTR u dnešních systémů PETR ČEČIL. Motivace – MTTF = 113 letů / havárie Zdroj: +"— Transkript prezentace:

1 MTTF a MTTR u dnešních systémů PETR ČEČIL

2 Motivace – MTTF = 113 letů / havárie Zdroj: +

3 Motivace (2) Report of the PRESIDENTIAL COMMISSION on the Space Shuttle Challenger Accident Zdroj:

4 Odolnost proti chybám (opakování) Spolehlivost a dostupnost MTTF (mean time to failure) – průměrný čas do příští chyby MTTR (mean time to repair) - průměrný čas zotavení Dostupnost modulu = MTTF / (MTTF + MTTR), FR (failure rate) – poruchovost, počet selhání např. za hodinu, rok atd… = 1 / MTTF MTBF = MTTF + MTTR Zdroj:

5 Typické MTTF (Gray 1992) konektory kabely 1000y MTTF logické obvody 3-20y MTTF soft/hard=1/1 až10/1 disky u PC 1y MTTF dražší 5-20y MTTF (ale hodně záleží na typu chyb soft read error je častější některé chyby jednou za milion let) workstations 3-5y MTTF software 1w MTTF SW: 3 chyby ve 100 řádcích kódu 100/1 soft/hard datové spoje v USA 10-9 BER (bit error rate) - optika LAN: většina chyb kvůli protokolům 3w MTTF Zdroj:

6 Příklad Předpokládejme, že stáří komponent neovlivňuje pravděpodobnost vzniku chyb a komponenty selhávají nezávisle. Pak celková poruchovost je suma poruchovosti modulů. Spočítejte MTTF diskového subsystému: 10 disků každý má h MTTF 1 SCSI controller h MTTF 1 zdroj napájení h MTTF 1 aktivní chlazení h MTTF 1 SCSI kabel h MTTF Failure Rate = 10*1/ / / / / = ( )/ = 23/ MTTF=1/Failure Rate = /23 = h

7 Case Studies Hlášená MTTF podle komponent systému Výsledky: Hardware a Maintenance mají výborné MTTF Software maskuje většinu selhání HW Operations skrývají chyby SW (nový SW, …) Systematicky se nehlásí všechny chyby SOFTWARE Years HARDWARE Years MAINTENANCE Years OPERATIONS Years ENVIRONMENT Years SYSTEM 82021Years

8 Zdroje prof. Lawrence Rauchwerger; I/O 2: Failure Terminology Examples Gray Paper and a little Queueing Theory https://parasol.tamu.edu/~rwerger/Courses/614/lec/Lec06-IO2.ppt Jim Gray; Talk at UC Berkeley on Fault Tolerance

9 Pevné disky HDD SSD

10 Vývoj spolehlivosti v MTTF 1992 (Transaction Processing: Concepts and Techniques - Grey) disky u PC 1y MTTF dražší 5-20y MTTF 1993 (Campbell et al. *): – hodin 2002 (Center for Magnetic Recording Research - Hughes et. al.): hodin 2012 (StorageReview.com - Andrew Baxter): HDD: 1,5 milionů hodin SSD: 2 miliony hodin – 10 milionů hodin 2013: Tape Drive: hodin

11 Důvody selhání Nejvíce selhání pochází z interakce čtecí hlavy s diskem. Způsob vzniku: Nárazy Dočasné přerušení/rušení přenosu Poškození povrchu media Selhání termo-mechanické stability struktur na disku Chybou uživatele Mechanické nárazy Vnější kontaminace kondenzace Výrobní vady Kontaminace (i částicemi) při výrobě Servo chyby Zvětšení tloušťky maziva Výkyvy v tloušťce uhlíkového potahu Kontakt hlavy s diskem (z výroby)

12 Co to znamená doopravdy? Otázka není jestli disky selžou ale kdy. Spolehlivost je velmi závislá na teplotě v jaké se disk provozuje. Hodnotou MTTF nám výrobce říká jak dlouho by měl disk pracovat a že po jejím překročení roste pravděpodobnost selhání. Reálnější hodnotou MTTF oproštěné od marketingu je délka záruční doby od výrobce.

13 Zdroje Charles M. Kozierok: The PC Guide (2001) Dr. Craig Hillman: Reliability of Hard Disk Drives (2003) Andrew Ku: MTTF? MTBF? "My Drive Lasts Longer" html LTO-4 Tape Drive

14 Konektory kabely ELEKTROMECHANICKÉ KOMPONENTY

15 Obecně Gray (1992): konektory kabely 1000y MTTF Hodnoty se stále pohybují v tisících let. MTTF je složité získat pro konektory a kabely. Vyžaduje to: Selhání při testech Znát čas každého selhání Bohužel jen velmi málo selhání se doopravdy stane při typických testech. Takže se používají drsnější testy => nerealistické výsledky Nebo delší testy => drahé testy Kvůli těmto důvodům se MTTF u konektorů a kabelů v praxi nepoužívá. Místo něj se zkoumá fyzikální princip poškození.

16 Zdroje Vincent C. Pascucci: A Brief Overview of Reliability in General and for Electrical Connectors in Particular or_Electrical_Connectors_in_Particular.pdf or_Electrical_Connectors_in_Particular.pdf Nějaké příklady (ne)používání MTTF u elektro-mechanických komponent: ontent&lang=en&siteid=cseus&aktprim=0&objaction=csview&extranet=standard&viewreg=WW ontent&lang=en&siteid=cseus&aktprim=0&objaction=csview&extranet=standard&viewreg=WW MTTF = 10^9 / FIT electric.com/resources/sites/SCHNEIDER_ELECTRIC/content/live/FAQS/28000/FA28376/es_ES/STB_MT BF.xls electric.com/resources/sites/SCHNEIDER_ELECTRIC/content/live/FAQS/28000/FA28376/es_ES/STB_MT BF.xls

17 Software

18 Windows MTTF V roce 2000 zveřejnil MS porovnání 3 desktopových operačních systémů. Je založená na počítačích v akademické sféře soukromé a NSTL laboratořích. Firma eTesting Labs vydala v roce 2001 i pro Windows XP Windows XP hodin Windows hodin Windows NT hodin Windows hodin

19 Linux – Debian pkgs V roce 2011 na Technické univerzitě v Darmstadtu vytvořili aplikaci pro počítání MTTF Debian balíčků podle počtu bezpečnostních problémů a jejich dopadu Hodnoty MTTF jsou ve dnech

20 Zdroje Microsoft: Comparison of the Reliability of Desktop Operating Systems eTesting Labs: Microsoft: Windows XP Reliability Study TrustMiner https://freeside.trust.cased.de/apt-sec/hits

21 Ostatní INTEGROVANÉ OBVODY PROCESORY SÍŤOVÉ PRVKY…

22 Procesory integrované obvody Copley Controls – firma vyrábějící řídící moduly pro roboty a serva Jejich IC (Integrované obvody) mají MTTF okolo 175 mil. Hodin Všimněme si ale keramických kondenzátorů mají sice malé MTTF jako jednotky. Pokud jich je ale na desce 186 dostáváme MTTF už hodin Všude vycházejí obrovská čísla a firmy MTTF už prakticky nezveřejňují (Intel, AMD) „Assume we have an industry grade (-40°C to 85°C) standard microcontroller. “ … „Below 90 nanometer things start becoming increasingly statistical and the MTTF could be as low as less than 10 years (if no precautionary measures were taken).“ * *Zdroj:

23 Procesory MTTF - ilustrace

24 Síťové prvky Cisco přepínače (switch) ~ hodin

25 Zdroje ◦http://www.cisco.com/en/US/products/hw/switches/ps628/products_data_sheet09186a008033a436.ht mlhttp://www.cisco.com/en/US/products/hw/switches/ps628/products_data_sheet09186a008033a436.ht ml ◦http://www.copleycontrols.com/motion/pdf/AEM-APM-mtbf.pdfhttp://www.copleycontrols.com/motion/pdf/AEM-APM-mtbf.pdf ◦http://www.youtube.com/watch?v=y39D4529FM4http://www.youtube.com/watch?v=y39D4529FM4


Stáhnout ppt "MTTF a MTTR u dnešních systémů PETR ČEČIL. Motivace – MTTF = 113 letů / havárie Zdroj: +"

Podobné prezentace


Reklamy Google