Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Vybraná rozdělení pravděpodobnosti
Martina Litschmannová
2
Opakování Základní pojmy z teorie pravděpodobnosti
Co je to náhodná veličina (dále NV)? Číselné vyjádření výsledku náhodného pokusu. Jaké základní typy náhodných veličin známe? Diskrétní NV (dále DNV) a spojité NV (dále SNV). Co je to rozdělení pravděpodobnosti? Předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ).
3
Opakování Základní pojmy z teorie pravděpodobnosti
Jak lze popsat rozdělení pravděpodobnosti DNV? Distribuční funkcí 𝐹 𝑥 =𝑃 𝑋<𝑥 , resp. pravděpodobnostní funkcí 𝑃 𝑥 𝑖 . Jak lze popsat rozdělení pravděpodobnosti SNV? Distribuční funkcí 𝐹 𝑥 =𝑃 𝑋<𝑥 , resp. hustotou pravděpodobností 𝑓 𝑥 . Jaké základní číselné charakteristiky používáme pro popis NV? Střední hodnota 𝐸 𝑋 , rozptyl 𝐷 𝑋 , směrodatná odchylka 𝜎 𝑋 , p-kvantily 𝑥 𝑝 .
4
Opakování Základní pojmy z teorie pravděpodobnosti
Co nám říká Čebyševova nerovnost? ∀𝑘>0: 𝑃 𝜇−𝑘𝜎≤𝑋≤𝜇+𝑘𝜎 >1− 1 𝑘 2 Např.: 𝑃 𝜇−𝜎≤𝑋≤𝜇+𝜎 >0 𝑃 𝜇−2𝜎≤𝑋≤𝜇+2𝜎 >0,75 𝑃 𝜇−3𝜎≤𝑋≤𝜇+3𝜎 >0,89
5
Vybraná rozdělení náhodné veličiny
Rozdělení diskrétní náhodné veličiny Binomické rozdělení Poissonovo rozdělení Rozdělení spojité náhodné veličiny ¨Rovnoměrné rozdělení Exponenciální rozdělení Weibullovo rozdělení Normální rozdělení Log-normální rozdělení
6
Vybraná rozdělení diskrétní náhodné veličiny
7
Binomické rozdělení - 𝐵𝑖 𝑛;𝜋
X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋 počet pokusů pravděpodobnost úspěchu Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝜋 𝑘 1−𝜋 𝑛−𝑘 Střední hodnota: 𝐸 𝑋 =𝑛π Rozptyl: 𝐷 𝑋 =𝑛𝜋 1−𝜋
8
Binomické rozdělení - 𝐵𝑖 𝑛;𝜋
X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋 Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝜋 𝑘 1−𝜋 𝑛−𝑘 Střední hodnota: 𝐸 𝑋 =𝑛π Rozptyl: 𝐷 𝑋 =𝑛𝜋 1−𝜋 Příklady: počet chlapců mezi 10 000 novorozenci, počet vadných výrobků mezi 30 testovanými, počet nevzrostlých rostlin ze 100 zasazených cibulek…
9
Binomické rozdělení - 𝐵𝑖 𝑛;𝜋
X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋
10
Binomické rozdělení - 𝐵𝑖 𝑛;𝜋
X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋
11
1 Předpokládejme, že pravděpodobnost narození dívky je 0,49. Jaká je pravděpodobnost toho, že mezi čtyřmi dětmi v rodině je je právě jedna dívka? jsou méně než dvě dívky? je více než jedna dívka? Online calculator:
12
Poissonovo rozdělení - 𝑃𝑜 𝜆𝑡
X … počet výskytů sledovaného znaku nebo události na danou jednotku času, plochy, případně objemu 𝜆𝑡 s tím, že se tyto události vyskytují vzájemně nezávisle a s konstantní intenzitou 𝜆. 𝑋~𝑃𝑜 𝜆𝑡 Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝜆𝑡 𝑘 𝑘! 𝑒 −𝜆𝑡 Střední hodnota: 𝐸 𝑋 =𝜆𝑡 Rozptyl: 𝐷 𝑋 =𝜆𝑡 Příklady: počet komplikací během určitého časového intervalu po operaci, počet žížal vyskytujících se na 1 m2 pole, počet krvinek v poli mikroskopu…
13
Poissonovo rozdělení - 𝑃𝑜 𝜆𝑡
X … počet výskytů sledovaného znaku nebo události na danou jednotku času, plochy, případně objemu 𝜆𝑡 s tím, že se tyto události vyskytují vzájemně nezávisle a s konstantní intenzitou 𝜆. 𝑋~𝑃𝑜 𝜆𝑡
14
2 Telefonní ústředna zapojí během hodiny průměrně 15 hovorů. Jaká je pravděpodobnost, že během 4 minut zapojí ústředna právě jeden hovor? alespoň dva hovory? Online calculator:
15
Vybraná rozdělení spojité náhodné veličiny
16
Rovnoměrné rozdělení - 𝑅𝑜 𝑎;𝑏
X má rovnoměrné rozdělení 𝑅𝑜 𝑎;𝑏 , jestliže má pro všechna 𝑥∈ 𝑎;𝑏 konstantní hustotu pravděpodobnosti. 𝑋~𝑅𝑜 𝑎;𝑏 𝑓 𝑥 = 𝑏−𝑎 𝑥∈ 𝑎;𝑏 𝑥∉ 𝑎;𝑏 f(x) x plocha = 𝑏−𝑎 ∙ 1 𝑏−𝑎 =1
17
Rovnoměrné rozdělení - 𝑅𝑜 𝑎;𝑏
X má rovnoměrné rozdělení 𝑅𝑜 𝑎;𝑏 , jestliže má pro všechna 𝑥∈ 𝑎;𝑏 konstantní hustotu pravděpodobnosti. 𝑋~𝑅𝑜 𝑎;𝑏 Hustota pravděpodobnosti: 𝑓 𝑥 = 𝑏−𝑎 𝑥∈ 𝑎;𝑏 𝑥∉ 𝑎;𝑏 Střední hodnota: 𝐸 𝑋 = 𝑎+𝑏 2 , Rozptyl: 𝐷 𝑋 = 𝑎−𝑏 Příklady: chyba při odečítání údajů z lineárních měřicích přístrojů, doba čekání na uskutečnění jevu opakujícího se v pravidelných intervalech
18
3 Rentgenové vyšetření pacienta trvá 10 minut. V čekárně v současné chvíli není žádný pacient, 1 pacient je ve vyšetřovně. Vypočtěte pravděpodobnost, že pacient, který právě přišel do čekárny, bude na vyšetření čekat déle než 7 minut. Online calculator:
19
Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆)
X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Poissonův proces: události se vyskytují nezávisle s konstantní intenzitou Příklady: doba do remise onemocnění (nejjednodušší modelové rozdělení pro délku doby do výskytu sledované události), doba do poruchy zařízení, doba mezi 3. a 4. poruchou zařízení, …
20
Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆)
X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝜆∙ 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Střední hodnota: 𝐸 𝑋 = 1 𝜆 Rozptyl: 𝐷 𝑋 = 𝐸 𝑋 2 = 1 𝜆 2
21
Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆)
X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní intenzitu události 𝜆 𝑡 - rozdělení „bez paměti“
22
Riziková funkce (intenzita poruch) - 𝜆 𝑡
Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 rizikovou funkci jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Období stabilního života Období dětských nemocí Období stárnutí
23
Riziková funkce (intenzita poruch) - 𝜆 𝑡
Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 rizikovou funkci jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Co udává hodnota 𝜆 𝑡 ? Představuje-li náhodná veličina X dobu do poruchy nějakého zařízení, pak pravděpodobnost, že pokud do času t nedošlo k žádné poruše, tak k ní dojde v následujícím krátkém úseku délky ∆𝑡, je přibližně 𝑃 𝑡≤𝑋<𝑡+∆𝑡|𝑋>𝑡 ≅ 𝑃 𝑡<𝑋<𝑡+∆𝑡 𝑃 𝑋>𝑡 = 𝑓 𝑡 ∙∆𝑡 1−𝐹 𝑡 =𝜆 𝑡 ∙∆𝑡.
24
Exponenciální rozdělení
X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní rizikovou funkci 𝜆 𝑡 - rozdělení „bez paměti“ 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 = 𝜆 𝑒 −𝜆𝑡 1− 1− 𝑒 −𝜆𝑡 =𝜆
25
4 Doba přežití pacienta má exponenciální rozdělení se střední hodnotou 48 měsíců. S jakou pravděpodobností pacient bude žít déle než 4 roky (resp. déle než 6 let)? Online calculator: Poznámka: Použití exponenciálního rozdělení při řešení klinických experimentů je z důvodu konstantní a tudíž neflexibilní rizikové funkce omezené.
26
X … délka časových intervalů mezi událostmi v Poissonově procesu
Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋~𝑊 𝜃;𝛽 parametr měřítka (angl. scale) 𝜃= 1 𝜆 ; 𝜃>0 parametr tvaru (angl. shape); 𝛽>0
27
X … délka časových intervalů mezi událostmi v Poissonově procesu
Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. Proč se 𝛽 označuje jako parametr tvaru?
28
X … délka časových intervalů mezi událostmi v Poissonově procesu
Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. V appletu Spojitá rozdělení (excel) sledujte vliv parametru 𝛽 na tvar 𝜆 𝑡 a vliv parametru 𝜃 na škálu hodnot studované náhodné veličiny.
29
X … délka časových intervalů mezi událostmi v Poissonově procesu
Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0.
30
X … délka časových intervalů mezi událostmi v Poissonově procesu
Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 𝜃;𝛽 Vliv parametru tvaru 𝛽 na tvar rizikové funkce Vliv parametru měřítka 𝜃 na škálu hodnot NV
31
S jakou pravděpodobností bude doba přežití pacienta delší než 1 rok?
5 Doba přežití (měsíce) pacienta má Weibulovo rozdělení s lineárně rostoucí rizikovou funkcí a parametrem měřítka 10. V jakém rozmezí očekáváte dobu přežití pacientů? (Posuďte na základě grafu hustoty pravděpodobnosti.) S jakou pravděpodobností bude doba přežití pacienta delší než 1 rok? Jakou dobu přežije alespoň polovina pacientů? Jaká je hodnota rizikové funkce v 10 měsících? Jaká je pravděpodobnost, že pacient, který přežil 10 měsíců, zemře v následujících 14 dnech? Online calculator:
32
Normální rozdělení - 𝑁 𝜇; 𝜎 2
Bývá vhodné k popisu náhodných veličin, které lze interpretovat jako aditivní výsledek mnoha nepatrných a vzájemně nezávislých faktorů (např. výška člověka, IQ, délky končetin …). Popisuje náhodné veličiny, jejichž hodnoty se symetricky shlukují kolem střední hodnoty a vytvářejí tak charakteristický tvar hustoty pravděpodobnosti známý pod názvem Gaussova křivka. 𝑋~𝑁 𝜇; 𝜎 2 střední hodnota rozptyl
33
Normální rozdělení - 𝑁 𝜇; 𝜎 2
𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2
34
Normální rozdělení - 𝑁 𝜇; 𝜎 2
𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Vliv s𝑡ř𝑒𝑑𝑛í ℎ𝑜𝑑𝑛𝑜𝑡𝑦 𝜇 na pozici Gaussovy křivky Vliv směrodatné odchylky 𝜎 na tvar Gaussovy křivky
35
Normální rozdělení - 𝑁 𝜇; 𝜎 2
𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Distribuční funkce: 𝐹 𝑥 = 1 𝜎 2𝜋 −∞ 𝑥 𝑒 − 1 2 𝑡−𝜇 𝜎 2 𝑑𝑡 (integrál nelze řešit analyticky)
36
Normované (standardizované) normální rozdělení - 𝑁 0;1
𝑍~𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 Vlastnosti normovaného normálního rozdělení: Φ 𝑧 =1−Φ −𝑧 𝑧 𝑝 =− 𝑧 1−𝑝 , kde 𝑧 𝑝 je p-kvantil std. norm. rozdělení
37
Normované (standardizované) normální rozdělení
𝑍~𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 (Φ 𝑧 je tabelována pro 𝑥>0)
38
Standardizace normálního rozdělení
Nechť 𝑋→𝑁 𝜇; 𝜎 2 . Definujme náhodnou veličinu Z, mnohdy nazývanou z-skóre, jako 𝑍= 𝑋−𝜇 𝜎 . Náhodná veličina Z má normované normální rozdělení, 𝑍→𝑁 0;1 . Mezi distribuční funkci normální náhodné veličiny X a normované normální náhodné veličiny Z platí převodní vztah 𝐹 𝑥 =Φ 𝑥−𝜇 𝜎 . Důkaz: 𝐹 𝑥 =𝑃 𝑋<𝑥 =𝑃 𝑍𝜎+𝜇<𝑥 =𝑃 𝑍< 𝑥−𝜇 𝜎 =Φ 𝑥−𝜇 𝜎
39
6 Nechť náhodná veličina modelující IQ (inteligenční kvocient) evropské populace má normální rozdělení se střední hodnotou 100 bodů a směrodatnou odchylkou 15 bodů. V jakém rozmezí očekáváte IQ evropské populace? (Posuďte na základě grafu hustoty pravděpodobnosti.) Kolik procent Evropanů má IQ v rozmezí bodů? Kolik procent Evropanů má IQ vyšší než 115 bodů? Jakou hodnotu IQ překračuje maximálně 5% evropské populace? Tabulky: Online calculator:
40
7 Nechť náhodná veličina X má normální rozdělení se střední hodnotou 𝜇 a směrodatnou odchylkou 𝜎. Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±𝜎? Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±2𝜎? Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±3𝜎? Tabulky:
41
Pravidlo 3𝜎 Pro NV s normálním rozdělením lze vyčíslit pravděpodobnost, že náhodná veličina se bude vyskytovat v intervalu 𝜇−𝑘𝜎;𝜇+𝑘𝜎 . k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 0,682 2 0,954 3 0,998 Srovnejte s představou, kterou jsme měli na základě Čebyševovy nerovnosti!
42
Čebyševova nerovnost: ∀𝑘>0: 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2
Pravidlo 3 𝜎 Čebyševova nerovnost: ∀𝑘>0: 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89 Empirické pravidlo 3𝜎 k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 0,682 2 0,954 3 0,998
43
Nástroje pro grafické ověření normality
Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Q-Q graf Na ose x jsou vyneseny teoretické kvantily normálního rozdělení, na ose y jsou výběrové kvantily konstruované přímo z dat. Jsou-li analyzovaná data realizacemi NV s normálním rozdělením, má graf tvar přímky (podrobněji ve skriptech, str. 167)
44
Nástroje pro grafické ověření normality
Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Odhad hustoty
45
Logaritmicko - normální rozdělení - ln𝑁 𝜇; 𝜎 2
𝑋~𝑙𝑛𝑁 𝜇; 𝜎 2 X … kladná náhodná veličina X … má logaritmicko – normální rozdělení, právě když 𝑌= ln 𝑋 má rozdělení normální. Jsou-li data, která analyzujeme výběrem z logaritmicko-normálního rozdělení, logaritmováním je transformujeme na data, která jsou výběrem z normálního rozdělení a následně na ně můžeme aplikovat řadu standardně používaných statistických metod, které mají jako předpoklad použití normalitu dat. V appletu Spojitá rozdělení (excel) sledujte vliv parametrů 𝜇 a 𝜎 2 na tvar 𝑓 𝑥 .
46
Logaritmicko - normální rozdělení - ln𝑁 𝜇; 𝜎 2
𝑋~𝑙𝑛𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝑥𝜎 2𝜋 𝑒 − ln 𝑥 −𝜇 𝜎 2 Příklad: délka inkubační doby infekčního onemocnění, tělesná hmotnost, … V appletu Spojitá rozdělení (excel) sledujte vliv parametrů 𝜇 a 𝜎 2 na tvar 𝑓 𝑥 . Vliv s𝑡ř𝑒𝑑𝑛í ℎ𝑜𝑑𝑛𝑜𝑡𝑦 𝜇 na hustotu 𝑓(𝑥) Vliv směrodatné odchylky 𝜎 na hustotu 𝑓(𝑥)
47
Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitoly Diskrétní rozdělení pravděpodobnosti a Spojitá rozdělení pravděpodobnosti) Zvárová, J. (1999), Základy statistiky pro biomedicínské obory, dostupné on-line: (kapitola 4) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN (kapitola 4)
48
Děkuji za pozornost!
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.