Vybraná rozdělení pravděpodobnosti

Slides:



Advertisements
Podobné prezentace
Vybraná rozdělení spojité náhodné veličiny
Advertisements

Vybraná rozdělení spojité náhodné veličiny
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Ekonomicko-matematické metody č. 11 Prof. RNDr. Jaroslav Ramík, CSc.
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
F YZIKÁLNÍ VELIČINY - TEPLOTA Ing. Jan Havel. Gymnázium a Jazyková škola s právem státní jazykové zkoušky Svitavy Materiál je určen pro bezplatné používání.
Význam diferenciálních rovnic převzato od Doc. Rapanta.
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně AUTOR: Ing. Oldřich Vavříček NÁZEV: Podpora výuky v technických oborech TEMA: Základy elektrotechniky.
Náhodné signály Honza Černocký, ÚPGM. Signály ve škole a v reálném světě Deterministické Rovnice Obrázek Algoritmus Kus kódu 2 } Můžeme vypočítat Málo.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Induktivní statistika
POČET PRAVDĚPODOBNOSTI
Testování hypotéz Testování hypotéz o rozdílu průměrů
Náhodná veličina je veličina, která při opakování náhodného pokusu mění své hodnoty v závislosti na náhodě Náhodné veličiny označujeme X, Y, Z, ... hodnoty.
Jak modelovat výsledky náh. pokusů?
Interpolace funkčních závislostí
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
Řešení nerovnic Lineární nerovnice
ČÍSLO PROJEKTU CZ.1.07/1.5.00/ ČÍSLO MATERIÁLU 1 – Množiny – teorie
„Svět se skládá z atomů“
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
FUNKCE. Závislost délky vegetační sezóny na nadmořské výšce
SIMULAČNÍ MODELY.
Funkce Funkce (píšeme f (x) ) je každé zobrazení množiny A do množiny R, kde A je libovolná podmnožina množiny R. Zobrazované množině A říkáme definiční.
Základy statistické indukce
Molekulová fyzika 3. prezentace.
Obchodní akademie, Střední odborná škola a Jazyková škola s právem státní jazykové zkoušky, Hradec Králové Autor: Mgr. Lubomíra Moravcová Název materiálu:
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
GENEROVÁNÍ HODNOT NÁHODNÝCH VELICIN PSEUDONÁHODNÁ ČÍSLA
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
Kvadratické nerovnice
V.a1 Teoretické pozadí statistické analýzy
Řešení nerovnic Lineární nerovnice
BIBS Informatika pro ekonomy přednáška 2
Spojité VELIČINY Vyšetřování normality dat
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Pravděpodobnost a statistika
Jevy a náhodná veličina
XII. Binomické rozložení
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
Primitivní funkce Přednáška č.3.
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Cauchyho rozdělení spojité náhodné veličiny
Náhodný proces Funkce f(t), kde f(t) je náhodná veličina.
* Funkce Matematika – 9. ročník *.
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Modely obnovy stárnoucího zařízení
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Více náhodných veličin
Grafy kvadratických funkcí
V praxi je výhodné znát základní typy rozdělení náhodných veličin.
Teorie chyb a vyrovnávací počet 2
Pravděpodobnost a matematická statistika I.
Transkript prezentace:

Vybraná rozdělení pravděpodobnosti Martina Litschmannová

Opakování Základní pojmy z teorie pravděpodobnosti Co je to náhodná veličina (dále NV)? Číselné vyjádření výsledku náhodného pokusu. Jaké základní typy náhodných veličin známe? Diskrétní NV (dále DNV) a spojité NV (dále SNV). Co je to rozdělení pravděpodobnosti? Předpis, který jednoznačně určuje všechny pravděpodobnosti typu 𝑃 𝑋∈𝑀 , kde 𝑀⊂ℝ (tj. 𝑃 𝑋=𝑎 , 𝑃 𝑋<𝑎 , 𝑃 𝑋>𝑎 , 𝑃 𝑎<𝑋<𝑏 , …, kde 𝑎,𝑏 ∈ℝ).

Opakování Základní pojmy z teorie pravděpodobnosti Jak lze popsat rozdělení pravděpodobnosti DNV? Distribuční funkcí 𝐹 𝑥 =𝑃 𝑋<𝑥 , resp. pravděpodobnostní funkcí 𝑃 𝑥 𝑖 . Jak lze popsat rozdělení pravděpodobnosti SNV? Distribuční funkcí 𝐹 𝑥 =𝑃 𝑋<𝑥 , resp. hustotou pravděpodobností 𝑓 𝑥 . Jaké základní číselné charakteristiky používáme pro popis NV? Střední hodnota 𝐸 𝑋 , rozptyl 𝐷 𝑋 , směrodatná odchylka 𝜎 𝑋 , p-kvantily 𝑥 𝑝 .

Opakování Základní pojmy z teorie pravděpodobnosti Co nám říká Čebyševova nerovnost? ∀𝑘>0: 𝑃 𝜇−𝑘𝜎≤𝑋≤𝜇+𝑘𝜎 >1− 1 𝑘 2 Např.: 𝑃 𝜇−𝜎≤𝑋≤𝜇+𝜎 >0 𝑃 𝜇−2𝜎≤𝑋≤𝜇+2𝜎 >0,75 𝑃 𝜇−3𝜎≤𝑋≤𝜇+3𝜎 >0,89

Vybraná rozdělení náhodné veličiny Rozdělení diskrétní náhodné veličiny Binomické rozdělení Poissonovo rozdělení Rozdělení spojité náhodné veličiny ¨Rovnoměrné rozdělení Exponenciální rozdělení Weibullovo rozdělení Normální rozdělení Log-normální rozdělení

Vybraná rozdělení diskrétní náhodné veličiny

Binomické rozdělení - 𝐵𝑖 𝑛;𝜋 X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋 počet pokusů pravděpodobnost úspěchu Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝜋 𝑘 1−𝜋 𝑛−𝑘 Střední hodnota: 𝐸 𝑋 =𝑛π Rozptyl: 𝐷 𝑋 =𝑛𝜋 1−𝜋

Binomické rozdělení - 𝐵𝑖 𝑛;𝜋 X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋 Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝜋 𝑘 1−𝜋 𝑛−𝑘 Střední hodnota: 𝐸 𝑋 =𝑛π Rozptyl: 𝐷 𝑋 =𝑛𝜋 1−𝜋 Příklady: počet chlapců mezi 10 000 novorozenci, počet vadných výrobků mezi 30 testovanými, počet nevzrostlých rostlin ze 100 zasazených cibulek…

Binomické rozdělení - 𝐵𝑖 𝑛;𝜋 X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋

Binomické rozdělení - 𝐵𝑖 𝑛;𝜋 X … počet úspěchů v n nezávislých pokusech, které mají pouze dva možné výsledky (úspěch, neúspěch) 𝑋~𝐵𝑖 𝑛;𝜋

1 Předpokládejme, že pravděpodobnost narození dívky je 0,49. Jaká je pravděpodobnost toho, že mezi čtyřmi dětmi v rodině je je právě jedna dívka? jsou méně než dvě dívky? je více než jedna dívka? Online calculator: http://keisan.casio.com/menu/system/000000000540

Poissonovo rozdělení - 𝑃𝑜 𝜆𝑡 X … počet výskytů sledovaného znaku nebo události na danou jednotku času, plochy, případně objemu 𝜆𝑡 s tím, že se tyto události vyskytují vzájemně nezávisle a s konstantní intenzitou 𝜆. 𝑋~𝑃𝑜 𝜆𝑡 Pravděpodobnostní funkce: 𝑃 𝑋=𝑘 = 𝜆𝑡 𝑘 𝑘! 𝑒 −𝜆𝑡 Střední hodnota: 𝐸 𝑋 =𝜆𝑡 Rozptyl: 𝐷 𝑋 =𝜆𝑡 Příklady: počet komplikací během určitého časového intervalu po operaci, počet žížal vyskytujících se na 1 m2 pole, počet krvinek v poli mikroskopu…

Poissonovo rozdělení - 𝑃𝑜 𝜆𝑡 X … počet výskytů sledovaného znaku nebo události na danou jednotku času, plochy, případně objemu 𝜆𝑡 s tím, že se tyto události vyskytují vzájemně nezávisle a s konstantní intenzitou 𝜆. 𝑋~𝑃𝑜 𝜆𝑡

2 Telefonní ústředna zapojí během hodiny průměrně 15 hovorů. Jaká je pravděpodobnost, že během 4 minut zapojí ústředna právě jeden hovor? alespoň dva hovory? Online calculator: http://keisan.casio.com/menu/system/000000000540

Vybraná rozdělení spojité náhodné veličiny

Rovnoměrné rozdělení - 𝑅𝑜 𝑎;𝑏 X má rovnoměrné rozdělení 𝑅𝑜 𝑎;𝑏 , jestliže má pro všechna 𝑥∈ 𝑎;𝑏 konstantní hustotu pravděpodobnosti. 𝑋~𝑅𝑜 𝑎;𝑏 𝑓 𝑥 = 1 𝑏−𝑎 𝑥∈ 𝑎;𝑏 0 𝑥∉ 𝑎;𝑏 f(x) x plocha = 𝑏−𝑎 ∙ 1 𝑏−𝑎 =1

Rovnoměrné rozdělení - 𝑅𝑜 𝑎;𝑏 X má rovnoměrné rozdělení 𝑅𝑜 𝑎;𝑏 , jestliže má pro všechna 𝑥∈ 𝑎;𝑏 konstantní hustotu pravděpodobnosti. 𝑋~𝑅𝑜 𝑎;𝑏 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝑏−𝑎 𝑥∈ 𝑎;𝑏 0 𝑥∉ 𝑎;𝑏   Střední hodnota: 𝐸 𝑋 = 𝑎+𝑏 2 , Rozptyl: 𝐷 𝑋 = 𝑎−𝑏 2 12 Příklady: chyba při odečítání údajů z lineárních měřicích přístrojů, doba čekání na uskutečnění jevu opakujícího se v pravidelných intervalech

3 Rentgenové vyšetření pacienta trvá 10 minut. V čekárně v současné chvíli není žádný pacient, 1 pacient je ve vyšetřovně. Vypočtěte pravděpodobnost, že pacient, který právě přišel do čekárny, bude na vyšetření čekat déle než 7 minut. Online calculator: http://keisan.casio.com/menu/system/000000000540

Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆) X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Poissonův proces: události se vyskytují nezávisle s konstantní intenzitou Příklady: doba do remise onemocnění (nejjednodušší modelové rozdělení pro délku doby do výskytu sledované události), doba do poruchy zařízení, doba mezi 3. a 4. poruchou zařízení, …

Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆) X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝜆∙ 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 −𝜆𝑡 , 𝑡>0 0, 𝑡≤0. Střední hodnota: 𝐸 𝑋 = 1 𝜆 Rozptyl: 𝐷 𝑋 = 𝐸 𝑋 2 = 1 𝜆 2

Exponenciální rozdělení - 𝐸𝑥𝑝(𝜆) X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní intenzitu události 𝜆 𝑡 - rozdělení „bez paměti“

Riziková funkce (intenzita poruch) - 𝜆 𝑡 Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 rizikovou funkci jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Období stabilního života Období dětských nemocí Období stárnutí

Riziková funkce (intenzita poruch) - 𝜆 𝑡 Pro nezápornou náhodnou veličinu X se spojitým rozdělením popsaným distribuční funkcí 𝐹(𝑡) definujeme pro 𝐹(𝑡)≠1 rizikovou funkci jako 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 . Co udává hodnota 𝜆 𝑡 ? Představuje-li náhodná veličina X dobu do poruchy nějakého zařízení, pak pravděpodobnost, že pokud do času t nedošlo k žádné poruše, tak k ní dojde v následujícím krátkém úseku délky ∆𝑡, je přibližně 𝑃 𝑡≤𝑋<𝑡+∆𝑡|𝑋>𝑡 ≅ 𝑃 𝑡<𝑋<𝑡+∆𝑡 𝑃 𝑋>𝑡 = 𝑓 𝑡 ∙∆𝑡 1−𝐹 𝑡 =𝜆 𝑡 ∙∆𝑡.

Exponenciální rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu 𝑋~𝐸𝑥𝑝 𝜆 Vliv parametru 𝜆 na tvar hustoty pravděpodobnosti a distribuční funkce sledujte v appletu Spojitá rozdělení (excel). POZOR!!! Předpokládá konstantní rizikovou funkci 𝜆 𝑡 - rozdělení „bez paměti“ 𝜆 𝑡 = 𝑓 𝑡 1−𝐹 𝑡 = 𝜆 𝑒 −𝜆𝑡 1− 1− 𝑒 −𝜆𝑡 =𝜆

4 Doba přežití pacienta má exponenciální rozdělení se střední hodnotou 48 měsíců. S jakou pravděpodobností pacient bude žít déle než 4 roky (resp. déle než 6 let)? Online calculator: http://keisan.casio.com/menu/system/000000000540 Poznámka: Použití exponenciálního rozdělení při řešení klinických experimentů je z důvodu konstantní a tudíž neflexibilní rizikové funkce omezené.

X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋~𝑊 𝜃;𝛽 parametr měřítka (angl. scale) 𝜃= 1 𝜆 ; 𝜃>0 parametr tvaru (angl. shape); 𝛽>0

X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Hustota pravděpodobnosti: 𝑓 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Distribuční funkce: 𝐹 𝑡 = 1− 𝑒 − 𝜆𝑡 𝛽 , 𝑡>0 0, 𝑡≤0. Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. Proč se 𝛽 označuje jako parametr tvaru?

X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0. V appletu Spojitá rozdělení (excel) sledujte vliv parametru 𝛽 na tvar 𝜆 𝑡 a vliv parametru 𝜃 na škálu hodnot studované náhodné veličiny.

X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 1 𝜆 ;𝛽 Riziková funkce: 𝜆 𝑡 = 𝛽 𝜆 𝛽 𝑡 𝛽−1 , 𝑡>0 0, 𝑡≤0.

X … délka časových intervalů mezi událostmi v Poissonově procesu Weibullovo rozdělení X … délka časových intervalů mezi událostmi v Poissonově procesu Zobecnění exponenciálního rozdělení Tímto rozdělením lze modelovat i dobu do výskytu události u systémů (jedinců), které jsou v období dětských nemocí, resp. v období stárnutí. 𝑋→𝑊 𝜃;𝛽 Vliv parametru tvaru 𝛽 na tvar rizikové funkce Vliv parametru měřítka 𝜃 na škálu hodnot NV

S jakou pravděpodobností bude doba přežití pacienta delší než 1 rok? 5 Doba přežití (měsíce) pacienta má Weibulovo rozdělení s lineárně rostoucí rizikovou funkcí a parametrem měřítka 10. V jakém rozmezí očekáváte dobu přežití pacientů? (Posuďte na základě grafu hustoty pravděpodobnosti.) S jakou pravděpodobností bude doba přežití pacienta delší než 1 rok? Jakou dobu přežije alespoň polovina pacientů? Jaká je hodnota rizikové funkce v 10 měsících? Jaká je pravděpodobnost, že pacient, který přežil 10 měsíců, zemře v následujících 14 dnech? Online calculator: http://keisan.casio.com/menu/system/000000000540

Normální rozdělení - 𝑁 𝜇; 𝜎 2 Bývá vhodné k popisu náhodných veličin, které lze interpretovat jako aditivní výsledek mnoha nepatrných a vzájemně nezávislých faktorů (např. výška člověka, IQ, délky končetin …). Popisuje náhodné veličiny, jejichž hodnoty se symetricky shlukují kolem střední hodnoty a vytvářejí tak charakteristický tvar hustoty pravděpodobnosti známý pod názvem Gaussova křivka. 𝑋~𝑁 𝜇; 𝜎 2 střední hodnota rozptyl

Normální rozdělení - 𝑁 𝜇; 𝜎 2 𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2

Normální rozdělení - 𝑁 𝜇; 𝜎 2 𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Vliv s𝑡ř𝑒𝑑𝑛í ℎ𝑜𝑑𝑛𝑜𝑡𝑦 𝜇 na pozici Gaussovy křivky Vliv směrodatné odchylky 𝜎 na tvar Gaussovy křivky

Normální rozdělení - 𝑁 𝜇; 𝜎 2 𝑋~𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝜎 2𝜋 𝑒 − 1 2 𝑥−𝜇 𝜎 2 Distribuční funkce: 𝐹 𝑥 = 1 𝜎 2𝜋 −∞ 𝑥 𝑒 − 1 2 𝑡−𝜇 𝜎 2 𝑑𝑡 (integrál nelze řešit analyticky)

Normované (standardizované) normální rozdělení - 𝑁 0;1 𝑍~𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 Vlastnosti normovaného normálního rozdělení: Φ 𝑧 =1−Φ −𝑧 𝑧 𝑝 =− 𝑧 1−𝑝 , kde 𝑧 𝑝 je p-kvantil std. norm. rozdělení

Normované (standardizované) normální rozdělení 𝑍~𝑁 0;1 Hustota pravděpodobnosti: 𝜑 𝑧 = 1 2𝜋 𝑒 − 1 2 𝑧 2 Distribuční funkce: Φ 𝑧 = 1 2𝜋 −∞ 𝑧 𝑒 − 1 2 𝑡 2 𝑑𝑡 (Φ 𝑧 je tabelována pro 𝑥>0)

Standardizace normálního rozdělení Nechť 𝑋→𝑁 𝜇; 𝜎 2 . Definujme náhodnou veličinu Z, mnohdy nazývanou z-skóre, jako 𝑍= 𝑋−𝜇 𝜎 . Náhodná veličina Z má normované normální rozdělení, 𝑍→𝑁 0;1 . Mezi distribuční funkci normální náhodné veličiny X a normované normální náhodné veličiny Z platí převodní vztah 𝐹 𝑥 =Φ 𝑥−𝜇 𝜎 . Důkaz: 𝐹 𝑥 =𝑃 𝑋<𝑥 =𝑃 𝑍𝜎+𝜇<𝑥 =𝑃 𝑍< 𝑥−𝜇 𝜎 =Φ 𝑥−𝜇 𝜎

6 Nechť náhodná veličina modelující IQ (inteligenční kvocient) evropské populace má normální rozdělení se střední hodnotou 100 bodů a směrodatnou odchylkou 15 bodů. V jakém rozmezí očekáváte IQ evropské populace? (Posuďte na základě grafu hustoty pravděpodobnosti.) Kolik procent Evropanů má IQ v rozmezí 85-115 bodů? Kolik procent Evropanů má IQ vyšší než 115 bodů? Jakou hodnotu IQ překračuje maximálně 5% evropské populace? Tabulky: http://homel.vsb.cz/%7Elit40/STA1/Materialy/Vzorce-a-tabulky.pdf Online calculator: http://keisan.casio.com/menu/system/000000000540

7 Nechť náhodná veličina X má normální rozdělení se střední hodnotou 𝜇 a směrodatnou odchylkou 𝜎. Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±𝜎? Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±2𝜎? Kolik procent hodnot náhodné veličiny leží v rozmezí 𝜇±3𝜎? Tabulky: http://homel.vsb.cz/%7Elit40/STA1/Materialy/Vzorce-a-tabulky.pdf

Pravidlo 3𝜎 Pro NV s normálním rozdělením lze vyčíslit pravděpodobnost, že náhodná veličina se bude vyskytovat v intervalu 𝜇−𝑘𝜎;𝜇+𝑘𝜎 . k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 0,682 2 0,954 3 0,998 Srovnejte s představou, kterou jsme měli na základě Čebyševovy nerovnosti!

Čebyševova nerovnost: ∀𝑘>0: 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 Pravidlo 3 𝜎 Čebyševova nerovnost: ∀𝑘>0: 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 >1− 1 𝑘 2 k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 >0 2 >0,75 3 >0,89 Empirické pravidlo 3𝜎 k 𝑃 𝜇−𝑘𝜎<𝑋<𝜇+𝑘𝜎 1 0,682 2 0,954 3 0,998

Nástroje pro grafické ověření normality Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Q-Q graf Na ose x jsou vyneseny teoretické kvantily normálního rozdělení, na ose y jsou výběrové kvantily konstruované přímo z dat. Jsou-li analyzovaná data realizacemi NV s normálním rozdělením, má graf tvar přímky (podrobněji ve skriptech, str. 167)

Nástroje pro grafické ověření normality Normalita je v drtivé většině analýz a testů hlavním předpokladem o datech. (Jde o předpoklad, že data pocházejí z procesu s normálním rozdělením.) Odhad hustoty

Logaritmicko - normální rozdělení - ln𝑁 𝜇; 𝜎 2 𝑋~𝑙𝑛𝑁 𝜇; 𝜎 2 X … kladná náhodná veličina X … má logaritmicko – normální rozdělení, právě když 𝑌= ln 𝑋 má rozdělení normální. Jsou-li data, která analyzujeme výběrem z logaritmicko-normálního rozdělení, logaritmováním je transformujeme na data, která jsou výběrem z normálního rozdělení a následně na ně můžeme aplikovat řadu standardně používaných statistických metod, které mají jako předpoklad použití normalitu dat. V appletu Spojitá rozdělení (excel) sledujte vliv parametrů 𝜇 a 𝜎 2 na tvar 𝑓 𝑥 .

Logaritmicko - normální rozdělení - ln𝑁 𝜇; 𝜎 2 𝑋~𝑙𝑛𝑁 𝜇; 𝜎 2 Hustota pravděpodobnosti: 𝑓 𝑥 = 1 𝑥𝜎 2𝜋 𝑒 − 1 2 ln 𝑥 −𝜇 𝜎 2 Příklad: délka inkubační doby infekčního onemocnění, tělesná hmotnost, … V appletu Spojitá rozdělení (excel) sledujte vliv parametrů 𝜇 a 𝜎 2 na tvar 𝑓 𝑥 . Vliv s𝑡ř𝑒𝑑𝑛í ℎ𝑜𝑑𝑛𝑜𝑡𝑦 𝜇 na hustotu 𝑓(𝑥) Vliv směrodatné odchylky 𝜎 na hustotu 𝑓(𝑥)

Literatura Litschmannová, M. (2012), Vybrané kapitoly z pravděpodobnosti, elektronická skripta a doplňkové interaktivní materiály (kapitoly Diskrétní rozdělení pravděpodobnosti a Spojitá rozdělení pravděpodobnosti) Zvárová, J. (1999), Základy statistiky pro biomedicínské obory, dostupné on-line: http://new.euromise.org/czech/tajne/ucebnice/html/html/statist.html (kapitola 4) Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN 978- 80-7204-782-6 (kapitola 4)

Děkuji za pozornost!