Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistika Ing. Jan Popelka, Ph.D. odborný asistent

Podobné prezentace


Prezentace na téma: "Statistika Ing. Jan Popelka, Ph.D. odborný asistent"— Transkript prezentace:

1 Statistika Ing. Jan Popelka, Ph.D. odborný asistent
Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem WWW:

2 Pravděpodobnost

3 Statistika – 3.hodina Základní pojmy
Základní pravidla pro počítání s pravděpodobnostmi Definice pravděpodobnosti Diskrétní náhodná veličina Vybraná diskrétní rozdělení Spojitá náhodná veličina Vybraná spojitá rozdělení

4 Pravděpodobný = podobný pravdě
Pravděpodobnost PRAVDA a PODOBNOST Pravděpodobný = podobný pravdě = podobný skutečnosti = do jaké míry je pravdivý

5 Pravděpodobnost - jevy
Hromadné náhodné jevy (stochastické jevy) Jsou hromadné – opakují se. I když probíhají ve stejných podmínkách, nemají stejný průběh. Výsledek nemůžeme s jistotou předpovědět, lze jen vyjmenovat množinu očekávaných výsledků. Lze vyčíslit pravděpodobnost, s jakou lze očekávat výsledek z výše uvedené množiny. Biologické jevy, ekonomické jevy, sociální jevy, výskyt poruch. Chemické, fyzikální, nebo astronomické jevy! ! Příklad: hod kostkou – jeden hod je náhodným pokusem, pokud hod opakuji vícekrát, jde o hromadný jev. Výsledkem je počet ok na kostce (podmínky pokusu musejí být vždy stejné = stejná kostka).

6 Pravděpodobnost - jevy
Hromadné nenáhodné jevy (deterministické jevy) Mají stejný průběh, pokud probíhají ve stejných podmínkách. Výsledek jevu můžeme s jistotou předpovědět. Fyzikální jevy, astronomické jevy, chemické procesy. Příklad: Hod kostkou – hod je deterministickým pokusem, pokud sleduji, zda padne směrem k zemi (podmínky pokusu musejí být vždy stejné). !

7 Pravděpodobnost - jevy
Hromadné náhodné a nenáhodné jevy Rozvoj vědy a lidského myšlení vede k předefinování řady jevů z kategorie náhodných do kategorie nenáhodných. Příklad: Nemoc – dříve mohlo být infekční onemocnění bráno jako náhoda (někdo onemocní a někdo ne), dnes umíme určit podmínky, kdy člověk onemocní a kdy ne (vliv imunitního systému). Příklad: Pohyb planet – dříve byl pohyb planet po obloze považován náhodný, již od starověkých civilizací víme, že se řídí přesnými pravidly. Příklad: Hod kostkou – dnes jej považujeme za ideální příklad náhodného jevu, v budoucnu třeba bude znám přesný model, který předpoví výsledek hodu. ! ! !

8 Pravděpodobnost - jevy
Náhodný (stochastický) jev je výsledkem náhodného pokusu (značí se A, B, C, … ) Hod kostkou je náhodným pokusem a počet ok na kostce je výsledek neboli náhodný jev. Jednoduché (elementární) jevy – jsou všechny možné výsledky, náhodného pokusu, nelze je rozložit na jevy jednodušší. Příklad: Na kostce padne číslo 2. Složené jevy – lze je rozložit na jevy jednoduché. Příklad: Na kostce padne číslo sudé. Jev lze rozložit na jednoduché jevy - padne číslo 2, 4 nebo 6. ! !

9 Pravděpodobnost - jevy
Prostor elementárních jevů (E) je množina všech výsledků náhodného pokusu, tedy všech elementárních jevů. Prostor může být konečný, spočetný nebo nespočetný. Příklad: Na šestistěnné kostce jsou elementární jevy hodnoty 1,2,3,4,5,6. Prostor elementárních jevů lze zapsat E = {(1),(2),(3),(4),(5),(6)}. Příklad: Hod dvěma mincemi E={(orel,orel),(panna,panna),(orel,panna), (panna,orel)}. Příklad: Ve Sportce je elementárních jevů. Pokud vsadíme takovýto počet různých tiketů, vyhrajeme první cenu! ! ! !

10 Pravděpodobnost - jevy
Jistý jev - za daných podmínek nastane vždy. Příklad: Na šestistěnné kostce vždy padne nějaké číslo od 1 do 6. Příklad: Na šestistěnné kostce vždy padne buď číslo sudé nebo číslo liché. Nemožný jev - za daných podmínek nenastane nikdy. Příklad Na šestistěnné kostce nikdy nepadne číslo 0. ! ! !

11 Pravděpodobnost - operace s jevy
Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden, nebo druhý) Příklad: Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost. !

12 Pravděpodobnost - operace s jevy
Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. Pravidla: sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden nebo druhý) Např. Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost.

13 Pravděpodobnost - definice
Klasická definice (Laplaceova) Příklad: Jaká je pravděpodobnost hlavní výhry ve Sportce? Ve Sportce je možných případů (možných kombinací šesti čísel ze 49 možných). Hlavní výhra je jen jediná šestice (počet příznivých kombinací šesti čísel je jedna jediná). Pravděpodobnost hlavní výhry je podle klasické definice pravděpodobnosti P(A) = příznivé / možné. P(A) = 1/ = 0, tj. 0, % !

14 Pravděpodobnost - definice
Klasická definice (Laplaceova) Náhodný pokus má konečný počet n elementárních jevů, které mohou nastat se stejnou možností (n tzv. možných případů). Sledovaný náhodný jev A je určen jako sjednocení určitého počtu (m) z těchto možných el. jevů, tedy jev A nastává při m případech z n možných (m je počet tzv. příznivých případů). Za těchto okolností pravděpodobnost jevu A je rovna: P(A) = m/n

15 Pravděpodobnost - definice
Matematická definice (Kolmogorovova) Pravděpodobnost je definována jako funkce, která přiřazuje náhodnému jevu reálné číslo, a pro toto přiřazení platí tři axiomy: 1. Pravděpodobnost náhodného jevu A je nezáporné číslo: P(A) ≥ 0. 2. Pravděpodobnost jistého jevu E je jedna: P(E) = 1. 3. Pravděpodobnost sjednocení dvou vzájemně neslučitelných (disjunktivních) jevů A a B je rovna součtu jejich pravděpodobností: platí-li , pak

16 Pravděpodobnost - definice
Statistická definice (von Misessova) Příklad: Jaká je pravděpodobnost narození holčičky? ! Statistická definice odvozuje pravděpodobnost na základě pokusu. Pokusem mohou být porody na území České republiky za uplynulý rok, kdy se narodilo chlapců a dívek. Pravděpodobnost narození holčičky je přibližně / = 0,486, tedy 48,69 %. Pro porovnání za rok 2003: / = 0,486, tedy 48,64 %. S rostoucím počtem sledovaných náhodných pokusů se zjištěná relativní četnost bude přibližovat odhadované pravděpodobnosti.

17 Pravděpodobnost - definice
Statistická definice (von Misessova) Provedli jsme n-krát náhodný pokus. V této sérii pokusů nastal náhodný jev A m-krát. Relativní četnost pokusu A (tj. poměr m/n) se přibližuje (konverguje) k pravděpodobnosti tohoto jevu pro velký počet náhodných pokusů:

18 Pravděpodobnost - definice
Statistická definice (von Misessova) Pravděpodobnost jistého jevu E je jedna: P(E) = 1. Pravděpodobnost nemožného jevu Ø je nula: P(Ø) = 0. Pravděpodobnost libovolného náhodného jevu A je: 0 ≤ P(A) ≤ 1.

19 Pravděpodobnost - definice
! Statistická definice (von Misessova) Pravděpodobnost úmrtí v Ústeckém kraji podle věku ( ) Věk Muži Ženy 0,44 % 10 0,03 % 0,01 % 20 0,08 % 0,02 % 30 0,09 % 40 0,22 % 50 0,63 % 0,30 % 60 1,87 % 0,84 % 70 4,24 % 2,14 % 80 9,54 % 6,36 % 90 23,71 % 22,12 % 100 53,54 % 62,53 % 105 100,00 %

20 Pravděpodobnost - definice
! Statistická definice (von Misessova) Pravděpodobnost smrti úrazem Pravděpodobnost smrti sebevraždou Pravděpodobnost smrti vraždou Pravděpodobnost smrti úrazem, sebevraždou a vraždou (konec 18. století) Pravděpodobnost smrti úrazem, sebevraždou a vraždou (normalizace) 4 % 1,3 % 0,1 % 1 %, 1%, 0,1 % 5 %, 1,6%, 0,1 %

21 Náhodná veličina Náhodná veličina je kvantitativní zobrazení výsledků náhodného pokusu. Náhodná veličina se značí X (velké X) a konkrétní hodnoty, kterých může nabývat xi. počet ok na kostce, počet poruch stroje za rok, počet zákazníků na pokladně za hodinu, počet mrtvých stromů na 1 ha lesa. Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot. Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu. Výška člověka ve 20 letech, porodní váha, výrobní odchylka, doba životnosti výrobku, cena akcie.

22 Diskrétní Rozdělení Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot.

23 Diskrétní rozdělení Pravděpodobnost, že náhodná veličina nabyla konkrétní hodnoty xi zapisujeme: P(X = xi) = P(xi) = pi Rozdělení pravděpodobností je vztah mezi hodnotami resp. intervaly náhodné veličiny X a jejich pravděpodobnostmi pi.

24 Diskrétní rozdělení ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Pravděpodobnost narození chlapce je 0,52. Popis rozdělení prostřednictvím tabulky: Náhodná veličina X nabývá hodnot 0,1,2,3 (kolik chlapců může být mezi třemi novorozenci). Počet chlapců (xi) Pravděpodobnost P(X=xi) Pravděpodobnost P(X= xi) 0 (tři dívky) = 0,48∙0,48∙0,48 = 0,11 1 (chlapec, dvě dívky) = 0,52∙0,48∙0,48∙3 = 0,12∙3 = 0,36 2 (dva chlapci a dívka) = 0,52∙0,52∙0,48∙3 = 0,13∙3 = 0,39 3 (tři chlapci) = 0,52∙0,52∙0,52 = 0,14 Celkem 1,00

25 Pravděpodobnostní Funkce P(x)
Pravděpodobnostní funkce pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty x. P(x) = P(X = x) Vlastnosti pravděpodobnostní funkce: funkce je omezená 0 ≤ P(x) ≤ 1 pravděpodobnostní funkce diskrétní náhodné veličiny je nespojitá!

26 Pravděpodobnostní Funkce P(x)
! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu pravděpodobnostní fce P(x):

27 Pravděpodobnostní Funkce P(x)
! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení funkčním zápisem pravděpodobnostní fce P(x): Počet chlapců (x) Pravděpodobnost P(X=x) Funkční zápis 0 (tři dívky) = 0,48∙0,48∙0,48 = 1∙0,520∙(1-0,52)3 1 (chlapec, dvě dívky) = 0,52∙0,48∙0,48∙3 = 3∙0,521∙(1-0,52)2 2 (dva chlapci a dívka) = 0,52∙0,52∙0,48∙3 = 3∙0,522∙(1-0,52)1 3 (tři chlapci) = 0,52∙0,52∙0,52 = 1∙0,523∙(1-0,52)0 Celkem 1,00 Pravděpodobnostní funkci příkladu lze obecně zapsat:

28 Distribuční Funkce F(x)
Distribuční funkce (někdy také kumulativní distribuční funkce) pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké. F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce pro a < b platí F(a) ≤ F(b) neklesající funkce P(a < X ≤ b) = F(b) - F(a) distribuční funkce diskrétní náhodné veličiny je nespojitá F(x) = P(X ≤ x) = ΣP(x)

29 Distribuční Funkce F(x)
! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím tabulky: (bude doplněn sloupec distribuční funkce). Hodnoty F(x) vyjadřují pravděpodobnost, že se narodí x nebo méně chlapců! Počet chlapců (x) P(x) = P(X=x) F(x) = P(X≤x) 0 (tři dívky) 0,11 1 (chlapec, dvě dívky) 0,36 0,11+0,36 = 0,47 2 (dva chlapci a dívka) 0,39 0,11+0,36+0,39 = 0,86 3 (tři chlapci) 0,14 0,11+0,36+0,39+0,14 = 1 Celkem 1,00 -

30 Distribuční Funkce F(x)
! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu distribuční funkce F(x):

31 Binomické Bi(n,) Graf pravděpodobnostní funkce P(x)
Graf distribuční funkce F(x)

32 Binomické Bi(n,) Aplikace: Náhodný výběr s vracením prvků. Pravděpodobnost, že se v sérii n nezávislých náhodných pokusů objeví sledovaný jev právě x krát. Např: „hod více kostkami“. Pravděpodobnostní funkce: , x = 0,1,2,...,n, , 0<π<1 Parametry: π ... pravděpodobnost náhodného jevu n ... počet opakování Střední hodnota: Rozptyl: MS Excel = BINOMDIST(počet úspěšných pokusů - x ; celkový počet pokusů - n; pravděpodobnost úspěchu – π ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)

33 Binomické Bi(n,) ! Příklad: Jaká je pravděpodobnost, že při hodu pěti kostkami padne třikrát číslo sudé? Parametry: π = 0,5 (pravděpodobnost náhodného jevu – padne sudé číslo) n = 5 (počet opakování – počet hodů), x = 3 (úspěšné pokusy) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(3; 5; 0,5; 0)

34 Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Parametry: π = 0,3 (pravděpodobnost náhodného jevu = zaspí) n = 4 (počet opakování = počet dnů), x = 2 (úspěšné pokusy = zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(2; 4; 0,3; 0)

35 Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Graf pravděpodobnostní funkce P(x) P(2) = 0,264

36 Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí alespoň 1x? Parametry: π = 0,3 (pravděpodobnost náhodného jevu – zaspí) n = 4 (počet opakování – počet dnů), alespoň 1x tzn. x ≥ 1(zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = 1-BINOMDIST(0; 4; 0,3; 0)

37 Poissonovo Po() Graf pravděpodobnostní funkce P(x)
Graf distribuční funkce F(x) λ = 10 λ = 4 λ = 10 λ = 4

38 Poissonovo Po() Aplikace: Počet událostí v časové jednotce, počet částic v jednotce plochy nebo objemu. Např: „doba obsluhy“; „chybovost výrobků“. Pravděpodobnostní funkce: , k = 0,1,2,... Parametry:  ... střední počet událostí v časové jednotce, jednotce plochy nebo objemu Střední hodnota: Rozptyl: MS Excel = POISSON (počet událostí - k ; průměrný počet událostí - ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)

39 Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Parametry:  = 10 = (30/60)·20 (počet aut za 20 minut) Výpočet: Střední hodnota: Rozptyl: MS Excel = POISSON (15; 10; 0)

40 Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Graf pravděpodobnostní funkce P(x) P(15) = 0,035

41 Hypergeometrické Hy(N,M,n)
Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Pravděpodobnostní funkce: , max(0,n-N+M) ≤ x ≤ min(M, n) Parametry: N ... počet jednotek v základním souboru M ... počet jednotek se sledovanou vlastností n ... počet náhodně vybraných jednotek (výběr)

42 Hypergeometrické Hy(N,M,n)
Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Střední hodnota, rozptyl: MS Excel = HYPGEOMDIST (počet úspěšných pokusů - k ; počet náhodně vybraných jednotek - n; počet jednotek se sledovanou vlastností – M ; počet jednotek v souboru - N)

43 Hypergeometrické Hy(N,M,n)
! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Parametry: N = 12 (studentů ve třídě); M = 4 (se připravují); n = 2 (vybraní) Výpočet: Střední hodnota: Rozptyl: MS Excel =HYPGEOMDIST(2;2;4;12)

44 Hypergeometrické Hy(N,M,n)
! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Graf pravděpodobnostní funkce P(x) P(2) = 0,091

45 Charakteristiky Rozdělení
Obecný způsob výpočtu střední hodnoty diskrétní náhodné veličiny: Obecný způsob výpočtu rozptylu diskrétní náhodné veličiny:

46 Spojitá Rozdělení Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu.

47 Diskrétní rozdělení Spojité rozdělení

48 Distribuční Funkce F(x)
Distribuční funkce (někdy také kumulativní distribuční funkce) pro spojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké: F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce, pro a < b platí F(a) ≤ F(b) neklesající funkce, P (a < X ≤ b) = F(b) - F(a), distribuční funkce spojité náhodné veličiny je spojitá.

49 Hustota Pravděpodobnosti f(x)
Pravděpodobnostní funkce pro spojitou náhodnou veličinu neexistuje! Pravděpodobnost, že se trefíme právě do určité hodnoty z nekonečného počtu možných hodnot spojité veličiny, je nulová. Paradox nulové pravděpodobnosti: P(X = x) = 0.

50 Hustota Pravděpodobnosti f(x)
Kvůli paradoxu nulové pravděpodobnosti je zavedena nová funkce hustota pravděpodobnosti – f(x). f(x) ≥ 0 pro všechna x v oblasti - ∞ a + ∞ se její hodnota blíží nule Příklady hustoty pravď.

51 Hustota Pravděpodobnosti f(x)
obsah plochy pod křivkou hustoty pravděpodobnosti je 1: a jde o pravděpodobnost Příklady hustoty pravď. Obsah = 1 Obsah = 1 Obsah = 1

52 Hustota Pravděpodobnosti f(x)
obsah plochy mezi hodnotami a, b se vypočte pomocí určitého integrálu: a jde o pravděpodobnost Příklady hustoty pravď. a b a b

53 Hustota Pravděpodobnosti f(x)
Vztah mezi hustotou f(x) a distribuční funkcí F(x): Distribuční funkce F(x) je integrálem hustoty f(x). Hustota f(x) je derivací distribuční funkce F(x). Hustota pravděpodobnosti a distribuční funkce

54 (Gauss-Laplaceovo) Normální rozdělení N(,2)
Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x)

55 (Gauss-Laplaceovo) Normální N(,2)
Aplikace: V případech, kdy na kolísání náhodné veličiny působí velký počet nepatrných a vzájemně nezávislých jevů. Např: „výška a váha v populaci“; „chyby měření“. Distribuční funkce F(x): Hustotní funkce f(x): Parametry: μ ... střední hodnota σ2 ... rozptyl Střední hodnota: Rozptyl: MS Excel = NORMDIST (hodnota sledovaného jevu – x; střední hodnota – μ; směrodatná odchylka – σ; hustota pravď. – 0 nebo distribuční funkce – 1)

56 (Gauss-Laplaceovo) Normální N(,2)
Vlastnosti normálního rozdělení Pravidlo tří sigma: v rozmezí  ± 1 leží 68,3% všech možných hodnot, v rozmezí  ± 2 leží 95,5% všech možných hodnot, v rozmezí  ± 3 leží 99,7% všech možných hodnot.

57 (Gauss-Laplaceovo) Normální N(,2)
! Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaká je pravděpodobnost získání více jak 125 bodů? Parametry: μ = 100 σ2 = 152 = 225 Náhodná veličina má normální rozdělení N(100; 225). Řešení: P(X>125) = 1- P(X≤125) = 1 – F(125) MS Excel: = 1 - NORMDIST (125; 100; 15; 1) Výsledek: P(X>125) = 1 – 0,952 = 0,048 Pravděpodobnost získání více než 125 bodů je 4,8 %. Pozn. Protože P(X=125) = 0, pak P(X>125) = 1- P(X≤125) =1- P(X<125).

58 (Gauss-Laplaceovo) Normální N(,2)
! Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaký je medián rozdělení? Známe pravděpodobnost, ale neznáme hodnotu. Počítáme medián, tedy 50 % kvantil rozdělení. Řešení: P(X ≤ x) = F(x) = 0,5 kolik je x? MS Excel: = NORMINV(0,5; 100; 15) Výsledek: N(100; 225)0,5 = = 100 Polovina osob dosáhne nejvýše 100 bodů. Pozn. Excel má vlastní funkce pro počítání kvantilů spojitých rozdělení MS Excel = NORMINV (kvantil – p; střední hodnota – μ; směrodatná odchylka – σ)

59 Normované Normální U Graf hustoty pravděpodobnosti f(x)
Graf distribuční funkce F(x) Pozn. Normované normální rozdělení je zelené (μ = 0, σ2 = 1).

60 Normované Normální U Aplikace: Usnadnění výpočtů pravděpodobnosti a kvantilů normálního rozdělení. Statistická indukce. Libovolné normální rozdělení lze převést na normované pomocí vzorce: Parametry: μ = 0 σ2 = 1 Střední hodnota: Rozptyl: MS Excel = NORMSDIST (hodnota sledovaného jevu – x)

61 Normované Normální U Výpočet kvantilů normovaného normálního rozdělení up u0,95 … je 95% kvantil normovaného normálního rozdělení. Tedy hodnota, která je větší nebo rovna jak 95 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou uvedeny ve statistických tabulkách. MS Excel = NORMSINV (kvantil – p) 1,64 u0,95 = 1,64

62 (Pearsonovo) Chí-kvadrát χ2(n)
Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x) Pozn. V grafu je parametr n značen jako k.

63 (Pearsonovo) Chí-kvadrát χ2(n)
Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako: S = X12 + X22 + X12 + … + Xn2 , kde X1,X2 , … ,Xn ~ N(0;1) Parametry: n … počet stupňů volnosti Střední hodnota: Rozptyl: MS Excel = CHIDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

64 (Pearsonovo) Chí-kvadrát χ2(n)
Výpočet kvantilů chí-kvadrát rozdělení χ2p (n) χ20,90 (12) … je 90% kvantil chí-kvadrát rozdělení. Tedy hodnota, která je větší nebo rovna jak 90 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a pro různé stupně volnosti n jsou uvedeny ve statistických tabulkách. MS Excel = CHIINV (upravený kvantil – 1-p, počet stupňů volnosti – n) 18,55 χ20,90 (12) = 18,55

65 Studentovo t(n) Graf hustoty pravděpodobnosti f(x)

66 Studentovo t(n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako , kde X1~ N(0;1) a X2 ~ χ2(n) Parametry: n … počet stupňů volnosti MS Excel = TDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

67 Studentovo t(n) Výpočet kvantilů rozdělení t(n)
t0,99 (9) … je 99% kvantil Studentova t rozdělení. Tedy hodnota, která je větší nebo rovna jak 99 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti n uvedeny ve statistických tabulkách. MS Excel = TINV (upravený kvantil – 2(1-p), počet stupňů volnosti – n) pokud p >0,5 = -1*TINV (upravený kvantil – 1-p, počet stupňů volnosti – n) pokud p <0,5. 2,82 t0,99(9) = 2,82

68 Fisher-Snedecor F-rozdělení F(m,n)
Graf hustoty pravděpodobnosti f(x)

69 Fisher-Snedecor F-rozdělení F(m,n)
Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z chí-kvadrát rozdělení jako , kde X1 ~ χ2(n) a X2 ~ χ2(m) Parametry: n … počet stupňů volnosti m … počet stupňů volnosti MS Excel = FDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

70 Fisher-Snedecor F-rozdělení F(m,n)
Výpočet kvantilů rozdělení F(m,n) F0,6 (10,12) … je 60% kvantil F rozdělení. Tedy hodnota, která je větší nebo rovna jak 60 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti m a n uvedeny ve statistických tabulkách. MS Excel = FINV (upravený kvantil – 1-p, počet stupňů volnosti – n) 1,15 F0,6 (10;12) = 1,15

71 Beta rozdělení B(α,β) Graf hustoty pravděpodobnosti f(x)

72 Spojitá rozdělení v MS Excel
Distribuční funkce Kvantil Funkce kvantilu Normální N(μ;σ2) =NORMDIST (x;μ;σ;1) 1 1pro výpočet hustotní funkce se zadá parametr 0 Np(μ;σ2) =NORMINV(p;μ;σ) Normované normální N(0;1) =NORMSDIST(x) up =NORMSINV(p) Chí-kvadrát 2(v) =CHIDIST(x;v) p2(v) =CHIINV(1-p;v) Studentovo t(v) =TDIST(x;v) tp(v) =TINV(2*(1-p);v) pro p >0,5 =-1*TINV(2*p;v) pro p < 0,5 F rozdělení F(v1; v2) =FDIST(x;v1;v2) Fp(v1;v2) =FINV(1-p;v1;v2)

73 Kvantily rozdělení v Online kalkulátorech
Výpočty kvantilů základních i řady další rozdělení lze provádět i pomocí online kalkulátorů. Výpočet může být i jednodušší než pomocí funkcí MS Excel. Quantile Calculator (www.solvemymath.com) 13 spojitých a 4 nespojitá rozdělení SOCR Distributome (socr.ucla.edu) přes 70 spojitých a nespojitých rozdělení s grafickým rozhraním pro zobrazení pravděpodobnostních funkcí a hustot pravděpodobností a výpočet kvantilů

74 Pravděpodobnost Důležité pojmy – 3. přednáška
Náhodný jev a nenáhodný jev Klasická definice pravděpodobnosti Statistická definice pravděpodobnosti Diskrétní náhodná veličina Pravděpodobnostní funkce Distribuční funkce Spojitá náhodná veličina Hustota pravděpodobnosti Normální rozdělení Kvantily


Stáhnout ppt "Statistika Ing. Jan Popelka, Ph.D. odborný asistent"

Podobné prezentace


Reklamy Google