Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem

Podobné prezentace


Prezentace na téma: "S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem"— Transkript prezentace:

1 S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem WWW:

2 P RAVDĚPODOBNOST

3 S TATISTIKA – 3. HODINA Základní pojmy Základní pravidla pro počítání s pravděpodobnostmi Definice pravděpodobnosti Diskrétní náhodná veličina Vybraná diskrétní rozdělení Spojitá náhodná veličina Vybraná spojitá rozdělení 3

4 P RAVDĚPODOBNOST PRAVDA a PODOBNOST Pravděpodobný = podobný pravdě = podobný skutečnosti = do jaké míry je pravdivý 4

5 P RAVDĚPODOBNOST - JEVY Hromadné náhodné jevy (stochastické jevy) Jsou hromadné – opakují se. I když probíhají ve stejných podmínkách, nemají stejný průběh. Výsledek nemůžeme s jistotou předpovědět, lze jen vyjmenovat množinu očekávaných výsledků. Lze vyčíslit pravděpodobnost, s jakou lze očekávat výsledek z výše uvedené množiny. 5 Příklad: hod kostkou – jeden hod je náhodným pokusem, pokud hod opakuji vícekrát, jde o hromadný jev. Výsledkem je počet ok na kostce (podmínky pokusu musejí být vždy stejné = stejná kostka).

6 P RAVDĚPODOBNOST - JEVY Hromadné nenáhodné jevy (deterministické jevy) Mají stejný průběh, pokud probíhají ve stejných podmínkách. Výsledek jevu můžeme s jistotou předpovědět. Fyzikální jevy, astronomické jevy, chemické procesy. Příklad: Hod kostkou – hod je deterministickým pokusem, pokud sleduji, zda padne směrem k zemi (podmínky pokusu musejí být vždy stejné). 6

7 P RAVDĚPODOBNOST - JEVY Hromadné náhodné a nenáhodné jevy Rozvoj vědy a lidského myšlení vede k předefinování řady jevů z kategorie náhodných do kategorie nenáhodných. Příklad: Nemoc – dříve mohlo být infekční onemocnění bráno jako náhoda (někdo onemocní a někdo ne), dnes umíme určit podmínky, kdy člověk onemocní a kdy ne (vliv imunitního systému). Příklad: Pohyb planet – dříve byl pohyb planet po obloze považován náhodný, již od starověkých civilizací víme, že se řídí přesnými pravidly. Příklad: Hod kostkou – dnes jej považujeme za ideální příklad náhodného jevu, v budoucnu třeba bude znám přesný model, který předpoví výsledek hodu. 7

8 P RAVDĚPODOBNOST - JEVY Náhodný (stochastický) jev je výsledkem náhodného pokusu (značí se A, B, C, … ) Hod kostkou je náhodným pokusem a počet ok na kostce je výsledek neboli náhodný jev. Jednoduché (elementární) jevy – jsou všechny možné výsledky, náhodného pokusu, nelze je rozložit na jevy jednodušší. Příklad: Na kostce padne číslo 2. Složené jevy – lze je rozložit na jevy jednoduché. Příklad: Na kostce padne číslo sudé. Jev lze rozložit na jednoduché jevy - padne číslo 2, 4 nebo 6. 8

9 P RAVDĚPODOBNOST - JEVY Prostor elementárních jevů (E) je množina všech výsledků náhodného pokusu, tedy všech elementárních jevů. Prostor může být konečný, spočetný nebo nespočetný. Příklad: Na šestistěnné kostce jsou elementární jevy hodnoty 1,2,3,4,5,6. Prostor elementárních jevů lze zapsat E = {(1),(2),(3),(4),(5),(6)}. Příklad: Hod dvěma mincemi E={(orel,orel),(panna,panna),(orel,panna), (panna,orel)}. Příklad: Ve Sportce je elementárních jevů. Pokud vsadíme takovýto počet různých tiketů, vyhrajeme první cenu! 9

10 P RAVDĚPODOBNOST - JEVY Jistý jev - za daných podmínek nastane vždy. Příklad: Na šestistěnné kostce vždy padne nějaké číslo od 1 do 6. Příklad: Na šestistěnné kostce vždy padne buď číslo sudé nebo číslo liché. Nemožný jev - za daných podmínek nenastane nikdy. Příklad Na šestistěnné kostce nikdy nepadne číslo 0. 10

11 P RAVDĚPODOBNOST - OPERACE S JEVY Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden, nebo druhý) Příklad: Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost. 11

12 P RAVDĚPODOBNOST - OPERACE S JEVY Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. Pravidla: sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden nebo druhý) Např. Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost. 12

13 P RAVDĚPODOBNOST - DEFINICE Klasická definice (Laplaceova) Příklad: Jaká je pravděpodobnost hlavní výhry ve Sportce? Ve Sportce je možných případů (možných kombinací šesti čísel ze 49 možných). Hlavní výhra je jen jediná šestice (počet příznivých kombinací šesti čísel je jedna jediná). Pravděpodobnost hlavní výhry je podle klasické definice pravděpodobnosti P(A) = příznivé / možné. P(A) = 1/ = 0, tj. 0, % 13

14 P RAVDĚPODOBNOST - DEFINICE Klasická definice (Laplaceova) Náhodný pokus má konečný počet n elementárních jevů, které mohou nastat se stejnou možností (n tzv. možných případů). Sledovaný náhodný jev A je určen jako sjednocení určitého počtu (m) z těchto možných el. jevů, tedy jev A nastává při m případech z n možných (m je počet tzv. příznivých případů). Za těchto okolností pravděpodobnost jevu A je rovna: P(A) = m/n 14

15 P RAVDĚPODOBNOST - DEFINICE Matematická definice (Kolmogorovova) Pravděpodobnost je definována jako funkce, která přiřazuje náhodnému jevu reálné číslo, a pro toto přiřazení platí tři axiomy: 1.Pravděpodobnost náhodného jevu A je nezáporné číslo: P(A) ≥ 0. 2.Pravděpodobnost jistého jevu E je jedna: P(E) = 1. 3.Pravděpodobnost sjednocení dvou vzájemně neslučitelných (disjunktivních) jevů A a B je rovna součtu jejich pravděpodobností: platí-li, pak. 15

16 P RAVDĚPODOBNOST - DEFINICE Statistická definice (von Misessova) Příklad: Jaká je pravděpodobnost narození holčičky? Statistická definice odvozuje pravděpodobnost na základě pokusu. Pokusem mohou být porody na území České republiky za uplynulý rok, kdy se narodilo chlapců a dívek. Pravděpodobnost narození holčičky je přibližně / = 0,486, tedy 48,69 %. Pro porovnání za rok 2003: / = 0,486, tedy 48,64 %. S rostoucím počtem sledovaných náhodných pokusů se zjištěná relativní četnost bude přibližovat odhadované pravděpodobnosti. 16

17 P RAVDĚPODOBNOST - DEFINICE Statistická definice (von Misessova) Provedli jsme n-krát náhodný pokus. V této sérii pokusů nastal náhodný jev A m-krát. Relativní četnost pokusu A (tj. poměr m/n) se přibližuje (konverguje) k pravděpodobnosti tohoto jevu pro velký počet náhodných pokusů: 17

18 P RAVDĚPODOBNOST - DEFINICE Statistická definice (von Misessova) Pravděpodobnost jistého jevu E je jedna: P(E) = 1. Pravděpodobnost nemožného jevu Ø je nula: P(Ø) = 0. Pravděpodobnost libovolného náhodného jevu A je: 0 ≤ P(A) ≤ 1. 18

19 P RAVDĚPODOBNOST - DEFINICE 19 Statistická definice (von Misessova) Pravděpodobnost úmrtí v Ústeckém kraji podle věku ( ) VěkMužiŽeny 00,44 % 100,03 %0,01 % 200,08 %0,02 % 300,09 %0,03 % 400,22 %0,09 % 500,63 %0,30 % 601,87 %0,84 % 704,24 %2,14 % 809,54 %6,36 % 9023,71 %22,12 % 10053,54 %62,53 % ,00 %

20 P RAVDĚPODOBNOST - DEFINICE Statistická definice (von Misessova) Pravděpodobnost smrti úrazem Pravděpodobnost smrti sebevraždou Pravděpodobnost smrti vraždou Pravděpodobnost smrti úrazem, sebevraždou a vraždou (konec 18. století) Pravděpodobnost smrti úrazem, sebevraždou a vraždou (normalizace) 20 4 % 1,3 % 0,1 % 1 %, 1%, 0,1 % 5 %, 1,6%, 0,1 %

21 N ÁHODNÁ VELIČINA Náhodná veličina je kvantitativní zobrazení výsledků náhodného pokusu. Náhodná veličina se značí X (velké X) a konkrétní hodnoty, kterých může nabývat x i. 21 Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot. Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu.

22 D ISKRÉTNÍ R OZDĚLENÍ Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot. 22

23 D ISKRÉTNÍ ROZDĚLENÍ Pravděpodobnost, že náhodná veličina nabyla konkrétní hodnoty x i zapisujeme: P(X = x i ) = P(x i ) = p i Rozdělení pravděpodobností je vztah mezi hodnotami resp. intervaly náhodné veličiny X a jejich pravděpodobnostmi p i. 23

24 D ISKRÉTNÍ ROZDĚLENÍ Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Pravděpodobnost narození chlapce je 0,52. Popis rozdělení prostřednictvím tabulky: Náhodná veličina X nabývá hodnot 0,1,2,3 (kolik chlapců může být mezi třemi novorozenci). Počet chlapců (x i )Pravděpodobnost P(X=x i ) 0 (tři dívky)= 0,48∙0,48∙0,48 =0,11 1 (chlapec, dvě dívky)= 0,52∙0,48∙0,48∙3 = 0,12∙3 =0,36 2 (dva chlapci a dívka)= 0,52∙0,52∙0,48∙3 = 0,13∙3 =0,39 3 (tři chlapci)= 0,52∙0,52∙0,52 =0,14 Celkem1,00 24

25 P RAVDĚPODOBNOSTNÍ F UNKCE P(x) Pravděpodobnostní funkce pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty x. P(x) = P(X = x) Vlastnosti pravděpodobnostní funkce: funkce je omezená 0 ≤ P(x) ≤ 1 pravděpodobnostní funkce diskrétní náhodné veličiny je nespojitá! 25

26 P RAVDĚPODOBNOSTNÍ F UNKCE P(x) Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu pravděpodobnostní fce P(x): 26 Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci.

27 P RAVDĚPODOBNOSTNÍ F UNKCE P(x) Popis rozdělení funkčním zápisem pravděpodobnostní fce P(x): Počet chlapců (x)Pravděpodobnost P(X=x)Funkční zápis 0 (tři dívky)= 0,48∙0,48∙0,48 =1∙0,52 0 ∙(1-0,52) 3 1 (chlapec, dvě dívky)= 0,52∙0,48∙0,48∙3 =3∙0,52 1 ∙(1-0,52) 2 2 (dva chlapci a dívka)= 0,52∙0,52∙0,48∙3 =3∙0,52 2 ∙(1-0,52) 1 3 (tři chlapci)= 0,52∙0,52∙0,52 =1∙0,52 3 ∙(1-0,52) 0 Celkem1,00 Pravděpodobnostní funkci příkladu lze obecně zapsat: 27 Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci.

28 D ISTRIBUČNÍ F UNKCE F(x) Distribuční funkce (někdy také kumulativní distribuční funkce) pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké. F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce pro a < b platí F(a) ≤ F(b) neklesající funkce P(a < X ≤ b) = F(b) - F(a) distribuční funkce diskrétní náhodné veličiny je nespojitá F(x) = P(X ≤ x) = ΣP(x) 28

29 D ISTRIBUČNÍ F UNKCE F(x) Popis rozdělení prostřednictvím tabulky: (bude doplněn sloupec distribuční funkce). Hodnoty F(x) vyjadřují pravděpodobnost, že se narodí x nebo méně chlapců! Počet chlapců (x)P(x) = P(X=x)F(x) = P(X≤x) 0 (tři dívky)0,11 1 (chlapec, dvě dívky)0,360,11+0,36 = 0,47 2 (dva chlapci a dívka)0,390,11+0,36+0,39 = 0,86 3 (tři chlapci)0,140,11+0,36+0,39+0,14 = 1 Celkem1, Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci.

30 D ISTRIBUČNÍ F UNKCE F(x) Popis rozdělení prostřednictvím grafu distribuční funkce F(x): 30 Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci.

31 B INOMICKÉ B I (n,  ) Graf pravděpodobnostní funkce P(x)Graf distribuční funkce F(x) 31

32 B INOMICKÉ B I (n,  ) Aplikace: Náhodný výběr s vracením prvků. Pravděpodobnost, že se v sérii n nezávislých náhodných pokusů objeví sledovaný jev právě x krát. Např: „hod více kostkami“. Pravděpodobnostní funkce:, x = 0,1,2,...,n,, 0<π<1 Parametry: π... pravděpodobnost náhodného jevu n... počet opakování Střední hodnota: Rozptyl: MS Excel = BINOMDIST(počet úspěšných pokusů - x ; celkový počet pokusů - n; pravděpodobnost úspěchu – π ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1) 32

33 B INOMICKÉ B I (n,  ) Příklad: Jaká je pravděpodobnost, že při hodu pěti kostkami padne třikrát číslo sudé? Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(3; 5; 0,5; 0) Parametry: π = 0,5 (pravděpodobnost náhodného jevu – padne sudé číslo) n = 5 (počet opakování – počet hodů), x = 3 (úspěšné pokusy) 33

34 B INOMICKÉ B I (n,  ) Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(2; 4; 0,3; 0) Parametry: π = 0,3 (pravděpodobnost náhodného jevu = zaspí) n = 4 (počet opakování = počet dnů), x = 2 (úspěšné pokusy = zaspání) 34

35 B INOMICKÉ B I (n,  ) Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? 35 Graf pravděpodobnostní funkce P(x) P(2) = 0,264

36 B INOMICKÉ B I (n,  ) Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí alespoň 1x? Výpočet: Střední hodnota: Rozptyl: MS Excel = 1-BINOMDIST(0; 4; 0,3; 0) Parametry: π = 0,3 (pravděpodobnost náhodného jevu – zaspí) n = 4 (počet opakování – počet dnů), alespoň 1x tzn. x ≥ 1(zaspání) 36

37 P OISSONOVO P O ( ) Graf pravděpodobnostní funkce P(x)Graf distribuční funkce F(x) λ = 10 λ = 4 λ = 10 λ = 4 37

38 P OISSONOVO P O ( ) Aplikace: Počet událostí v časové jednotce, počet částic v jednotce plochy nebo objemu. Např: „doba obsluhy“; „chybovost výrobků“. Pravděpodobnostní funkce:, k = 0,1,2,... Parametry:... střední počet událostí v časové jednotce, jednotce plochy nebo objemu Střední hodnota: Rozptyl: MS Excel = POISSON (počet událostí - k ; průměrný počet událostí - ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1) 38

39 P OISSONOVO P O ( ) Výpočet: Střední hodnota: Rozptyl: MS Excel = POISSON (15; 10; 0) Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Parametry: = 10 = (30/60)·20 (počet aut za 20 minut) 39

40 P OISSONOVO P O ( ) Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? P(15) = 0, Graf pravděpodobnostní funkce P(x)

41 H YPERGEOMETRICKÉ H Y (N,M,n) Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Pravděpodobnostní funkce:, max(0,n-N+M) ≤ x ≤ min(M, n) Parametry: N... počet jednotek v základním souboru M... počet jednotek se sledovanou vlastností n... počet náhodně vybraných jednotek (výběr) 41

42 H YPERGEOMETRICKÉ H Y (N,M,n) Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Střední hodnota, rozptyl: MS Excel = HYPGEOMDIST (počet úspěšných pokusů - k ; počet náhodně vybraných jednotek - n; počet jednotek se sledovanou vlastností – M ; počet jednotek v souboru - N) 42

43 H YPERGEOMETRICKÉ H Y (N,M,n) Výpočet: Střední hodnota: Rozptyl: MS Excel =HYPGEOMDIST(2;2;4;12) Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Parametry: N = 12 (studentů ve třídě); M = 4 (se připravují); n = 2 (vybraní) 43

44 H YPERGEOMETRICKÉ H Y (N,M,n) Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. 44 P(2) = 0,091 Graf pravděpodobnostní funkce P(x)

45 C HARAKTERISTIKY R OZDĚLENÍ Obecný způsob výpočtu střední hodnoty diskrétní náhodné veličiny: Obecný způsob výpočtu rozptylu diskrétní náhodné veličiny: 45

46 S POJITÁ R OZDĚLENÍ Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu. 46

47 47

48 D ISTRIBUČNÍ F UNKCE F(x) Distribuční funkce (někdy také kumulativní distribuční funkce) pro spojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké: F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce, pro a < b platí F(a) ≤ F(b) neklesající funkce, P (a < X ≤ b) = F(b) - F(a), distribuční funkce spojité náhodné veličiny je spojitá. 48

49 H USTOTA P RAVDĚPODOBNOSTI f(x) Pravděpodobnostní funkce pro spojitou náhodnou veličinu neexistuje ! Pravděpodobnost, že se trefíme právě do určité hodnoty z nekonečného počtu možných hodnot spojité veličiny, je nulová. Paradox nulové pravděpodobnosti: P(X = x) = 0. 49

50 H USTOTA P RAVDĚPODOBNOSTI f(x) Kvůli paradoxu nulové pravděpodobnosti je zavedena nová funkce hustota pravděpodobnosti – f(x). f(x) ≥ 0 pro všechna x v oblasti - ∞ a + ∞ se její hodnota blíží nule 50 Příklady hustoty pravď

51 H USTOTA P RAVDĚPODOBNOSTI f(x) Hustota pravděpodobnosti – f(x). obsah plochy pod křivkou hustoty pravděpodobnosti je 1: a jde o pravděpodobnost 51 Příklady hustoty pravď. Obsah = 1

52 H USTOTA P RAVDĚPODOBNOSTI f(x) Hustota pravděpodobnosti – f(x). obsah plochy mezi hodnotami a, b se vypočte pomocí určitého integrálu: a jde o pravděpodobnost 52 Příklady hustoty pravď. ab ab

53 H USTOTA P RAVDĚPODOBNOSTI f(x) Vztah mezi hustotou f(x) a distribuční funkcí F(x): Distribuční funkce F(x) je integrálem hustoty f(x). Hustota f(x) je derivací distribuční funkce F(x). 53 Hustota pravděpodobnosti a distribuční funkce

54 (G AUSS -L APLACEOVO ) N ORMÁLNÍ ROZDĚLENÍ N( ,  2 ) Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x) 54

55 (G AUSS -L APLACEOVO ) N ORMÁLNÍ N( ,  2 ) Aplikace: V případech, kdy na kolísání náhodné veličiny působí velký počet nepatrných a vzájemně nezávislých jevů. Např: „výška a váha v populaci“; „chyby měření“. Distribuční funkce F(x): Hustotní funkce f(x): Parametry: μ... střední hodnota σ 2... rozptyl Střední hodnota: Rozptyl: MS Excel = NORMDIST (hodnota sledovaného jevu – x; střední hodnota – μ; směrodatná odchylka – σ; hustota pravď. – 0 nebo distribuční funkce – 1) 55

56 (G AUSS -L APLACEOVO ) N ORMÁLNÍ N( ,  2 ) Vlastnosti normálního rozdělení Pravidlo tří sigma: v rozmezí  ± 1  leží 68,3% všech možných hodnot, v rozmezí  ± 2  leží 95,5% všech možných hodnot, v rozmezí  ± 3  leží 99,7% všech možných hodnot. 56

57 (G AUSS -L APLACEOVO ) N ORMÁLNÍ N( ,  2 ) Řešení: P(X>125) = 1- P(X≤125) = 1 – F(125) MS Excel: = 1 - NORMDIST (125; 100; 15; 1) Výsledek: P(X>125) = 1 – 0,952 = 0,048 Pravděpodobnost získání více než 125 bodů je 4,8 %. Pozn. Protože P(X=125) = 0, pak P(X>125) = 1- P(X≤125) =1- P(X<125). Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaká je pravděpodobnost získání více jak 125 bodů? Parametry: μ = 100 σ 2 = 15 2 = 225Náhodná veličina má normální rozdělení N(100; 225). 57

58 (G AUSS -L APLACEOVO ) N ORMÁLNÍ N( ,  2 ) Řešení: P(X ≤ x) = F(x) = 0,5 kolik je x? MS Excel: = NORMINV(0,5; 100; 15) Výsledek: N(100; 225) 0,5 = = 100 Polovina osob dosáhne nejvýše 100 bodů. Pozn. Excel má vlastní funkce pro počítání kvantilů spojitých rozdělení MS Excel = NORMINV (kvantil – p; střední hodnota – μ; směrodatná odchylka – σ) Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaký je medián rozdělení? Známe pravděpodobnost, ale neznáme hodnotu. Počítáme medián, tedy 50 % kvantil rozdělení. 58

59 N ORMOVANÉ N ORMÁLNÍ U Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x) Pozn. Normované normální rozdělení je zelené (μ = 0, σ 2 = 1). 59

60 N ORMOVANÉ N ORMÁLNÍ U Aplikace: Usnadnění výpočtů pravděpodobnosti a kvantilů normálního rozdělení. Statistická indukce. Libovolné normální rozdělení lze převést na normované pomocí vzorce: Parametry: μ = 0 σ 2 = 1 Střední hodnota: Rozptyl: MS Excel = NORMSDIST (hodnota sledovaného jevu – x) 60

61 Výpočet kvantilů normovaného normálního rozdělení u p u 0,95 … je 95% kvantil normovaného normálního rozdělení. Tedy hodnota, která je větší nebo rovna jak 95 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou uvedeny ve statistických tabulkách. MS Excel = NORMSINV (kvantil – p) N ORMOVANÉ N ORMÁLNÍ U 1,64 u 0,95 = 1,64 61

62 (P EARSONOVO ) C HÍ - KVADRÁT χ 2 (n) Pozn. V grafu je parametr n značen jako k. 62 Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x)

63 (P EARSONOVO ) C HÍ - KVADRÁT χ 2 (n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako: S = X X X … + X n 2, kde X 1,X 2, …,X n ~ N(0;1) Parametry: n … počet stupňů volnosti Střední hodnota: Rozptyl: MS Excel = CHIDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n) 63

64 Výpočet kvantilů chí-kvadrát rozdělení χ 2 p (n) χ 2 0,90 (12) … je 90% kvantil chí-kvadrát rozdělení. Tedy hodnota, která je větší nebo rovna jak 90 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a pro různé stupně volnosti n jsou uvedeny ve statistických tabulkách. MS Excel = CHIINV (upravený kvantil – 1-p, počet stupňů volnosti – n) (P EARSONOVO ) C HÍ - KVADRÁT χ 2 (n) χ 2 0,90 (12) = 18,55 18,55

65 S TUDENTOVO t(n) 65 Graf hustoty pravděpodobnosti f(x)

66 S TUDENTOVO t(n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako, kde X 1 ~ N(0;1) a X 2 ~ χ 2 (n) Parametry: n … počet stupňů volnosti MS Excel = TDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n) 66

67 Výpočet kvantilů rozdělení t(n) t 0,99 (9) … je 99% kvantil Studentova t rozdělení. Tedy hodnota, která je větší nebo rovna jak 99 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti n uvedeny ve statistických tabulkách. MS Excel = TINV (upravený kvantil – 2(1-p), počet stupňů volnosti – n) pokud p >0,5 = -1*TINV (upravený kvantil – 1-p, počet stupňů volnosti – n) pokud p <0,5. S TUDENTOVO t(n) t 0,99 (9) = 2,82 2,82 67

68 F ISHER -S NEDECOR F- ROZDĚLENÍ F(m,n) 68 Graf hustoty pravděpodobnosti f(x)

69 F ISHER -S NEDECOR F- ROZDĚLENÍ F(m,n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z chí-kvadrát rozdělení jako, kde X 1 ~ χ 2 (n) a X 2 ~ χ 2 (m) Parametry: n … počet stupňů volnosti m … počet stupňů volnosti MS Excel = FDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

70 Výpočet kvantilů rozdělení F(m,n) F 0,6 (10,12) … je 60% kvantil F rozdělení. Tedy hodnota, která je větší nebo rovna jak 60 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti m a n uvedeny ve statistických tabulkách. MS Excel = FINV (upravený kvantil – 1-p, počet stupňů volnosti – n) F ISHER -S NEDECOR F- ROZDĚLENÍ F(m,n) 1,15 F 0,6 (10;12) = 1,15 70

71 B ETA ROZDĚLENÍ B(α,β) 71 Graf hustoty pravděpodobnosti f(x)

72 S POJITÁ ROZDĚLENÍ V MS E XCEL RozděleníDistribuční funkceKvantilFunkce kvantilu Normální N(μ;σ 2 ) =NORMDIST (x;μ;σ;1) 1 1 pro výpočet hustotní funkce se zadá parametr 0 Np(μ;σ2)Np(μ;σ2)=NORMINV(p;μ;σ) Normované normální N(0;1) =NORMSDIST(x)upup =NORMSINV(p) Chí-kvadrát  2 (v) =CHIDIST(x;v) p2(v)p2(v) =CHIINV(1-p;v) Studentovo t(v) =TDIST(x;v)tp(v)tp(v) =TINV(2*(1-p);v) pro p >0,5 =-1*TINV(2*p;v) pro p < 0,5 F rozdělení F(v 1 ; v 2 ) =FDIST(x;v 1 ;v 2 )Fp(v1;v2)Fp(v1;v2)=FINV(1-p;v 1 ;v 2 ) 72

73 K VANTILY ROZDĚLENÍ V O NLINE KALKULÁTORECH 73 Výpočty kvantilů základních i řady další rozdělení lze provádět i pomocí online kalkulátorů. Výpočet může být i jednodušší než pomocí funkcí MS Excel. Quantile Calculator (www.solvemymath.com) 13 spojitých a 4 nespojitá rozděleníwww.solvemymath.com SOCR Distributome (socr.ucla.edu) přes 70 spojitých a nespojitých rozdělení s grafickým rozhraním pro zobrazení pravděpodobnostních funkcí a hustot pravděpodobností a výpočet kvantilůsocr.ucla.edu

74 Náhodný jev a nenáhodný jev Klasická definice pravděpodobnosti Statistická definice pravděpodobnosti Diskrétní náhodná veličina Pravděpodobnostní funkce Distribuční funkce Spojitá náhodná veličina Hustota pravděpodobnosti Normální rozdělení Kvantily 74 P RAVDĚPODOBNOST D ŮLEŽITÉ POJMY – 3. PŘEDNÁŠKA


Stáhnout ppt "S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem"

Podobné prezentace


Reklamy Google