Vybraná rozdělení spojité náhodné veličiny Přednáška 4 – druhá část Vybraná rozdělení spojité náhodné veličiny Rovnoměrné Exponenciální Weibullovo Normální
Opakování – hustota pravděpodobnosti f(x) Funkce f(x) je hustotou pravděpodobností (na intervalu a ≤ x ≤ b), jestliže splňuje následující podmínky: f(x) ≥ 0 , 𝑥∈ℝ plocha pod křivkou hustoty je rovna 1 −∞ ∞ 𝑓 𝑥 𝑑𝑥 =1 f(x) x b a plocha=1
Vztah mezi pravděpodobností, hustotou pravděpodobností a distribuční f-cí 𝐹 𝑥 = −∞ 𝑥 𝑓 𝑡 𝑑𝑡
Vztah mezi pravděpodobností, hustotou pravděpodobností a distribuční f-cí 𝐹 𝑥 = −∞ 𝑥 𝑓 𝑡 𝑑𝑡
Vztah mezi pravděpodobností, hustotou pravděpodobností a distribuční f-cí 𝐹 𝑥 = −∞ 𝑥 𝑓 𝑡 𝑑𝑡
Rovnoměrné spojité rozdělení Jde o rozdělení, jehož hustota pravděpodobnosti je konstantní na nějakém intervalu 𝑎;𝑏 a všude jinde je nulová. 𝑋→𝑅𝑜 𝑎;𝑏 Vliv parametrů 𝑎;𝑏 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). Odvoďte vztahy pro 𝑓(𝑥) a 𝐹(𝑥). X … náhodná veličina s rovnoměrným rozdělením na intervalu 𝑎;𝑏
Rovnoměrné spojité rozdělení Jde o rozdělení, jehož hustota pravděpodobnosti je konstantní na nějakém intervalu 𝑎;𝑏 a všude jinde je nulová. 𝑋→𝑅𝑜 𝑎;𝑏 X … náhodná veličina s rovnoměrným rozdělením na intervalu 𝑎;𝑏 f(x) 𝑓 𝑥 = 1 𝑏−𝑎 𝑥∈ 𝑎;𝑏 0 𝑥∉ 𝑎;𝑏 a b x plocha = 𝑏−𝑎 ∙ 1 𝑏−𝑎 =1
Rovnoměrné spojité rozdělení Jde o rozdělení, jehož hustota pravděpodobnosti je konstantní na nějakém intervalu 𝑎;𝑏 a všude jinde je nulová. 𝑋→𝑅𝑜 𝑎;𝑏 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝑏−𝑎 𝑥∈ 𝑎;𝑏 0 𝑥∉ 𝑎;𝑏 Distribuční funkce: 𝐹 𝑥 = 0 𝑥∈ −∞; 𝑎 𝑥−𝑎 𝑏−𝑎 𝑥∈ 𝑎;𝑏 1 𝑥∈ 𝑏 ; ∞ Střední hodnota: 𝐸 𝑋 = 𝑎+𝑏 2 , Rozptyl: 𝐷 𝑋 = 𝑎−𝑏 2 12 X … náhodná veličina s rovnoměrným rozdělením na intervalu 𝑎;𝑏
X … doba čekání na tramvaj Tramvajová linka číslo 8 odjíždí v dopoledních hodinách ze zastávky každých 10 minut. Vypočtěte pravděpodobnost, že na ni budete dopoledne čekat déle než 7 minut. 𝑋→𝑅𝑜 0;10 X … doba čekání na tramvaj f(x) 𝑓 𝑥 = 1 10 𝑥∈ 0;10 0 𝑥∉ 0;10 1 10 7 10 x 𝑃 𝑋>7 = 3 10
Exponenciální rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋→𝐸𝑥𝑝 𝜆 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝜆∙ 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Střední hodnota: 𝐸 𝑋 = 1 𝜆 Rozptyl: 𝐷 𝑋 = 𝐸 𝑋 2 = 1 𝜆 2 Příklady: doba do výskytu poruchy zařízení; doba mezi 3. a 4. poruchou, …
Exponenciální rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋→𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní intenzitu poruch 𝜆 𝑡 - rozdělení „bez paměti“
Intenzita poruch Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 intenzitu poruch jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Období stabilního života Období dětských nemocí Období stárnutí
Intenzita poruch Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 intenzitu poruch jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Co udává hodnota 𝜆 𝑡 ? Představuje-li náhodná veličina X dobu do poruchy nějakého zařízení, pak pravděpodobnost, že pokud do času t nedošlo k žádné poruše, tak k ní dojde v následujícím krátkém úseku délky ∆𝑡, je přibližně 𝑃 𝑡≤𝑋<𝑡+∆𝑡|𝑋>𝑡 ≅ 𝑃 𝑡<𝑋<𝑡+∆𝑡 𝑃 𝑋>𝑡 = 𝑓 𝑡 ∙∆𝑡 1−𝐹 𝑡 =𝜆 𝑡 ∙∆𝑡.
Exponenciální rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋→𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní intenzitu poruch 𝜆 𝑡 - rozdělení „bez paměti“ 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 = 𝜆 𝑒 −𝜆𝑡 1− 1− 𝑒 −𝜆𝑡 =𝜆
Exponenciální rozdělení Příklad Výrobce žárovek XX ví, že průměrná životnost žárovek XX je 10.000 h. V rámci své propagační kampaně chce garantovat dobu t, do níž se nespálí více než 3% žárovek. Určete tuto dobu. (Pro modelování doby života žárovek použijte exponenciální rozdělení.) Řešení: X ... životnost žárovky (doba do poruchy) 𝑋→𝐸𝑥𝑝 1 10000 ℎ −1 (𝐸 𝑋 =10000ℎ= 1 𝜆 ) 𝑃 𝑋<𝑡 ≤0,03 𝐹 𝑡 ≤0,03 𝑡≤ 𝐹 −1 0,03 𝑡≤ 𝑥 0,03 𝑡≤304,6ℎ Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.
X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systému, které jsou v období dětských nemocí, resp. v období stárnutí 𝑋→𝑊 𝜃;𝛽 parametr měřítka (angl. scale) 𝜃= 1 𝜆 ; 𝜃>0 parametr tvaru (angl. shape); 𝛽>0
X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systému, které jsou v období dětských nemocí, resp. v období stárnutí 𝑋→𝑊 𝜃;𝛽 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Intenzita poruch: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. Proč se 𝛽 označuje jako parametr tvaru?
X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systému, které jsou v období dětských nemocí, resp. v období stárnutí 𝑋→𝑊 𝜃;𝛽 Intenzita poruch: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. V appletu Spojitá rozdělení (excel) sledujte vliv parametru 𝛽 na tvar 𝜆 𝑡 .
X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systému, které jsou v období dětských nemocí, resp. v období stárnutí 𝑋→𝑊 𝜃;𝛽 Intenzita poruch: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0.
Weibullovo rozdělení Příklad Předpokládejme, že doba do poruchy určitého systému je modelována Weibullovým rozdělením s lineární rostoucí intenzitou poruch a parametrem měřítka θ =50. Jaká je intenzita poruch systému po deseti hodinách bezporuchové funkce? Řešení: X ... doba do poruchy systému 𝑋→𝑊 𝜃=50; 𝛽=2 (lineární rostoucí intenzita poruch ⇒ 𝛽=2) 𝜆 10 = 𝑓 10 1−𝐹 10 ≅ 0,0077 0,9608 ≅0,008 Pro výpočet lze použít applet Vybraná rozdělení pravděpodobnosti.
Normální rozdělení bývá vhodné k popisu náhodných veličin, které lze interpretovat jako aditivní výsledek mnoha nepatrných a vzájemně nezávislých vlivů (např. chyba měření, odchylka rozměru výrobku od požadované hodnoty, biometrické veličiny …) zákon chyb 𝑋→𝑁 𝜇; 𝜎 2 Pro zájemce: Quincunx (nazývan také: Bean machine, Galton box) – zařízení, které umožňuje generovat realizace náhodné veličiny s normálním rozdělením (autor: Francis Galton (1822-1911) střední hodnota rozptyl
Normální rozdělení 𝑋→𝑁 𝜇; 𝜎 2 𝑋→𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 V appletu Spojitá rozdělení (excel) sledujte vliv parametrů 𝜇 a 𝜎 2 na tvar 𝑓 𝑥 .
Normální rozdělení 𝑋→𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Distribuční funkce: 𝐹 𝑥 = 1 𝜎 2𝜋 −∞ 𝑥 𝑒 − 1 2 𝑡−𝜇 𝜎 2 𝑑𝑡 (integrál nelze řešit analyticky)
Normované (standardizované) normální rozdělení 𝑍→𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 Vlastnosti normovaného normálního rozdělení: Φ 𝑧 =1−Φ −𝑧 𝑧 𝑝 =− 𝑧 1−𝑝 , kde 𝑧 𝑝 je p-kvantil std. norm. rozdělení
Normované (standardizované) normální rozdělení 𝑍→𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 (Φ 𝑧 je tabelována pro 𝑥>0) Jakákoliv NV s normálním rozdělením může být transformována na NV s normovaným normálním rozdělením.
Standardizace normálního rozdělení Nechť 𝑋→𝑁 𝜇; 𝜎 2 . Definujme náhodnou veličinu Z, mnohdy nazývanou z-skóre, jako 𝑍= 𝑋−𝜇 𝜎 . Náhodná veličina Z má normované normální rozdělení, 𝑍→𝑁 0;1 . Mezi distribuční funkci normální náhodné veličiny X a normované normální náhodné veličiny Z platí převodní vztah 𝐹 𝑥 =Φ 𝑥−𝜇 𝜎 . Důkaz: 𝐹 𝑥 =𝑃 𝑋<𝑥 =𝑃 𝑍𝜎+𝜇<𝑥 =𝑃 𝑍< 𝑥−𝜇 𝜎 =Φ 𝑥−𝜇 𝜎
Standardizace normálního rozdělení Příklad Nechť náhodná veličina X modelující odchylku šířky výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 10 mm a směrodatnou odchylkou 5 mm. Určete 𝐹 7 , Řešení: 𝑋→𝑁 𝜇=10; 𝜎 2 =25 𝐹 7 =Φ 7−10 5 = Φ −0,6 = 1−Φ 0,6 =1−0,726=0,274
Standardizace normálního rozdělení Příklad Nechť náhodná veličina X modelující odchylku šířky výrobku od požadované hodnoty má normální rozdělení se střední hodnotou 10 mm a směrodatnou odchylkou 5 mm. Určete 𝑥 0,7 . Řešení: 𝑋→𝑁 𝜇=10; 𝜎 2 =25 𝑃(𝑋<𝑥 0,7 )=0,7 𝐹(𝑥 0,7 )=0,7 Φ 𝑥 0,7 −10 5 =0,7 substituce: 𝑦= 𝑥 0,7 −10 5 Φ 𝑦 =0,7 ⇒𝑦≅0,525 𝑥 0,7 =5𝑦+10≅12,625
Pravidlo 3𝜎 Pro NV s normálním rozdělením lze vyčíslit pravděpodobnost, že náhodná veličina se bude vyskytovat v intervalu 𝜇−𝑘𝜎;𝜇+𝑘𝜎 . k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 0,682 2 0,954 3 0,998 Srovnejte s představou, kterou jsme měli na základě Čebyševovy nerovnosti!
Nástroje pro grafické ověření normality Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Q-Q graf Na ose x jsou vyneseny teoretické kvantily normálního rozdělení, na ose y jsou výběrové kvantily konstruované přímo z dat. Jsou-li analyzovaná data realizacemi NV s norm. rozdělením, má graf tvar přímky (podrobněji ve skriptech, str. 167)
Nástroje pro grafické ověření normality Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Odhad hustoty
Děkuji za pozornost!