Statistika Ing. Jan Popelka, Ph.D. odborný asistent

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

DESETINNÁ ČÍSLA.
TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM
Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
ZÁKLADY PRAVDĚPODOBNOSTI
Statistická indukce Teorie odhadu.
TEORIE ROZHODOVÁNÍ A TEORIE HER
ROZDĚLENÍ NÁHODNÝCH VELIČIN
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Zabývá se různými způsoby výběru prvků z daného souboru.
AutorMgr. Lenka Závrská Anotace Očekávaný přínos Tematická oblastOperace s reálnými čísly Téma PředmětMatematika RočníkPrvní Obor vzděláváníUčební obory.
Ing. Jan Popelka, Ph.D. odborný asistent katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Výzkumy volebních preferencí za ČR a kraje od
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.
Bayesův teorém – cesta k lepší náladě
Získávání informací Získání informací o reálném systému
Zábavná matematika.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Vlastnosti sčítání a odčítání
Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.
Pravděpodobnost a statistika opakování základních pojmů
Obsah prezentace Náhodná proměnná Rozdělení náhodné proměnné.
Náhodná veličina.
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
VY_32_INOVACE_21-01 PRAVDĚPODOBNOST 1 Úvod, základní pojmy.
Únorové počítání.
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Náhodná proměnná Rozdělení.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Náhoda, generátory náhodných čísel
Binomická distribuce Při zjišťování p je nutné znát:  a) celkový počet možných jednoduchých jevů  b) počet jednoduchých jevů který spadá do jevu/třídy.
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
Matematický aparát v teorii informace Základy teorie pravděpodobnosti
Pojmy a interpretace.
Nechť (, , P) je pravděpodobnostní prostor:
Pravděpodobnost a genetická prognóza
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Pravděpodobnost (pracovní verze). 1. Definice pojmů Jednoduchý/náhodný pokus (simple experiment)  Akt vedoucí k jednomu výsledku - např. hod kostkou,
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Přednost početních operací
Slovní úlohy řešené soustavou rovnic
Predikce chemických posunů
KONTROLNÍ PRÁCE.
Náhoda, generátory náhodných čísel
Porovnání výroby a prodejů vozidel ve světě
POČET PRAVDĚPODOBNOSTI
Pravděpodobnost. Náhodný pokus.
PRAVDĚPODOBNOST NEZÁVISLÉ JEVY Jevy A,B nazýváme nezávislými, jestliže
ZÁKLADY TEORIE PRAVDĚPODOBNOSTI
Základy zpracování geologických dat
2. Vybrané základní pojmy matematické statistiky
(Popis náhodné veličiny)
Molekulová fyzika 3. přednáška „Statistický přístup jako jediná funkční strategie kinetické teorie“
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM
Některá rozdělení náhodných veličin
Spojitá náhodná veličina
Pravděpodobnost. Náhodný pokus.
Transkript prezentace:

Statistika Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem email: jan.popelka@ujep.cz WWW: http://most.ujep.cz/~popelka

Pravděpodobnost

Statistika – 3.hodina Základní pojmy Základní pravidla pro počítání s pravděpodobnostmi Definice pravděpodobnosti Diskrétní náhodná veličina Vybraná diskrétní rozdělení Spojitá náhodná veličina Vybraná spojitá rozdělení

Pravděpodobný = podobný pravdě Pravděpodobnost PRAVDA a PODOBNOST Pravděpodobný = podobný pravdě = podobný skutečnosti = do jaké míry je pravdivý

Pravděpodobnost - jevy Hromadné náhodné jevy (stochastické jevy) Jsou hromadné – opakují se. I když probíhají ve stejných podmínkách, nemají stejný průběh. Výsledek nemůžeme s jistotou předpovědět, lze jen vyjmenovat množinu očekávaných výsledků. Lze vyčíslit pravděpodobnost, s jakou lze očekávat výsledek z výše uvedené množiny. Biologické jevy, ekonomické jevy, sociální jevy, výskyt poruch. Chemické, fyzikální, nebo astronomické jevy! ! Příklad: hod kostkou – jeden hod je náhodným pokusem, pokud hod opakuji vícekrát, jde o hromadný jev. Výsledkem je počet ok na kostce (podmínky pokusu musejí být vždy stejné = stejná kostka).

Pravděpodobnost - jevy Hromadné nenáhodné jevy (deterministické jevy) Mají stejný průběh, pokud probíhají ve stejných podmínkách. Výsledek jevu můžeme s jistotou předpovědět. Fyzikální jevy, astronomické jevy, chemické procesy. Příklad: Hod kostkou – hod je deterministickým pokusem, pokud sleduji, zda padne směrem k zemi (podmínky pokusu musejí být vždy stejné). !

Pravděpodobnost - jevy Hromadné náhodné a nenáhodné jevy Rozvoj vědy a lidského myšlení vede k předefinování řady jevů z kategorie náhodných do kategorie nenáhodných. Příklad: Nemoc – dříve mohlo být infekční onemocnění bráno jako náhoda (někdo onemocní a někdo ne), dnes umíme určit podmínky, kdy člověk onemocní a kdy ne (vliv imunitního systému). Příklad: Pohyb planet – dříve byl pohyb planet po obloze považován náhodný, již od starověkých civilizací víme, že se řídí přesnými pravidly. Příklad: Hod kostkou – dnes jej považujeme za ideální příklad náhodného jevu, v budoucnu třeba bude znám přesný model, který předpoví výsledek hodu. ! ! !

Pravděpodobnost - jevy Náhodný (stochastický) jev je výsledkem náhodného pokusu (značí se A, B, C, … ) Hod kostkou je náhodným pokusem a počet ok na kostce je výsledek neboli náhodný jev. Jednoduché (elementární) jevy – jsou všechny možné výsledky, náhodného pokusu, nelze je rozložit na jevy jednodušší. Příklad: Na kostce padne číslo 2. Složené jevy – lze je rozložit na jevy jednoduché. Příklad: Na kostce padne číslo sudé. Jev lze rozložit na jednoduché jevy - padne číslo 2, 4 nebo 6. ! !

Pravděpodobnost - jevy Prostor elementárních jevů (E) je množina všech výsledků náhodného pokusu, tedy všech elementárních jevů. Prostor může být konečný, spočetný nebo nespočetný. Příklad: Na šestistěnné kostce jsou elementární jevy hodnoty 1,2,3,4,5,6. Prostor elementárních jevů lze zapsat E = {(1),(2),(3),(4),(5),(6)}. Příklad: Hod dvěma mincemi E={(orel,orel),(panna,panna),(orel,panna), (panna,orel)}. Příklad: Ve Sportce je 13 983 816 elementárních jevů. Pokud vsadíme takovýto počet různých tiketů, vyhrajeme první cenu! ! ! !

Pravděpodobnost - jevy Jistý jev - za daných podmínek nastane vždy. Příklad: Na šestistěnné kostce vždy padne nějaké číslo od 1 do 6. Příklad: Na šestistěnné kostce vždy padne buď číslo sudé nebo číslo liché. Nemožný jev - za daných podmínek nenastane nikdy. Příklad Na šestistěnné kostce nikdy nepadne číslo 0. ! ! !

Pravděpodobnost - operace s jevy Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden, nebo druhý) Příklad: Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost. !

Pravděpodobnost - operace s jevy Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane jev A. Pravidla: sjednocení opačných jevů je jistý jev. opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou nastat zároveň (buď nastane jeden nebo druhý) Např. Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy padne jen jedna možnost.

Pravděpodobnost - definice Klasická definice (Laplaceova) Příklad: Jaká je pravděpodobnost hlavní výhry ve Sportce? Ve Sportce je 13 983 816 možných případů (možných kombinací šesti čísel ze 49 možných). Hlavní výhra je jen jediná šestice (počet příznivých kombinací šesti čísel je jedna jediná). Pravděpodobnost hlavní výhry je podle klasické definice pravděpodobnosti P(A) = příznivé / možné. P(A) = 1/13 983 816 = 0,000 000 072 tj. 0,000 007 2 % !

Pravděpodobnost - definice Klasická definice (Laplaceova) Náhodný pokus má konečný počet n elementárních jevů, které mohou nastat se stejnou možností (n tzv. možných případů). Sledovaný náhodný jev A je určen jako sjednocení určitého počtu (m) z těchto možných el. jevů, tedy jev A nastává při m případech z n možných (m je počet tzv. příznivých případů). Za těchto okolností pravděpodobnost jevu A je rovna: P(A) = m/n

Pravděpodobnost - definice Matematická definice (Kolmogorovova) Pravděpodobnost je definována jako funkce, která přiřazuje náhodnému jevu reálné číslo, a pro toto přiřazení platí tři axiomy: 1. Pravděpodobnost náhodného jevu A je nezáporné číslo: P(A) ≥ 0. 2. Pravděpodobnost jistého jevu E je jedna: P(E) = 1. 3. Pravděpodobnost sjednocení dvou vzájemně neslučitelných (disjunktivních) jevů A a B je rovna součtu jejich pravděpodobností: platí-li , pak .

Pravděpodobnost - definice Statistická definice (von Misessova) Příklad: Jaká je pravděpodobnost narození holčičky? ! Statistická definice odvozuje pravděpodobnost na základě pokusu. Pokusem mohou být porody na území České republiky za uplynulý rok, kdy se narodilo 61 483 chlapců a 58 359 dívek. Pravděpodobnost narození holčičky je přibližně 58 359 /119 842 = 0,486, tedy 48,69 %. Pro porovnání za rok 2003: 45 554/93 658 = 0,486, tedy 48,64 %. S rostoucím počtem sledovaných náhodných pokusů se zjištěná relativní četnost bude přibližovat odhadované pravděpodobnosti.

Pravděpodobnost - definice Statistická definice (von Misessova) Provedli jsme n-krát náhodný pokus. V této sérii pokusů nastal náhodný jev A m-krát. Relativní četnost pokusu A (tj. poměr m/n) se přibližuje (konverguje) k pravděpodobnosti tohoto jevu pro velký počet náhodných pokusů:

Pravděpodobnost - definice Statistická definice (von Misessova) Pravděpodobnost jistého jevu E je jedna: P(E) = 1. Pravděpodobnost nemožného jevu Ø je nula: P(Ø) = 0. Pravděpodobnost libovolného náhodného jevu A je: 0 ≤ P(A) ≤ 1.

Pravděpodobnost - definice ! Statistická definice (von Misessova) Pravděpodobnost úmrtí v Ústeckém kraji podle věku (2009-2010) Věk Muži Ženy 0,44 % 10 0,03 % 0,01 % 20 0,08 % 0,02 % 30 0,09 % 40 0,22 % 50 0,63 % 0,30 % 60 1,87 % 0,84 % 70 4,24 % 2,14 % 80 9,54 % 6,36 % 90 23,71 % 22,12 % 100 53,54 % 62,53 % 105 100,00 %

Pravděpodobnost - definice ! Statistická definice (von Misessova) Pravděpodobnost smrti úrazem Pravděpodobnost smrti sebevraždou Pravděpodobnost smrti vraždou Pravděpodobnost smrti úrazem, sebevraždou a vraždou (konec 18. století) Pravděpodobnost smrti úrazem, sebevraždou a vraždou (normalizace) 4 % 1,3 % 0,1 % 1 %, 1%, 0,1 % 5 %, 1,6%, 0,1 %

Náhodná veličina Náhodná veličina je kvantitativní zobrazení výsledků náhodného pokusu. Náhodná veličina se značí X (velké X) a konkrétní hodnoty, kterých může nabývat xi. počet ok na kostce, počet poruch stroje za rok, počet zákazníků na pokladně za hodinu, počet mrtvých stromů na 1 ha lesa. Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot. Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu. Výška člověka ve 20 letech, porodní váha, výrobní odchylka, doba životnosti výrobku, cena akcie.

Diskrétní Rozdělení Diskrétní náhodná veličina nabývá konečného nebo spočetného počtu hodnot.

Diskrétní rozdělení Pravděpodobnost, že náhodná veličina nabyla konkrétní hodnoty xi zapisujeme: P(X = xi) = P(xi) = pi Rozdělení pravděpodobností je vztah mezi hodnotami resp. intervaly náhodné veličiny X a jejich pravděpodobnostmi pi.

Diskrétní rozdělení ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Pravděpodobnost narození chlapce je 0,52. Popis rozdělení prostřednictvím tabulky: Náhodná veličina X nabývá hodnot 0,1,2,3 (kolik chlapců může být mezi třemi novorozenci). Počet chlapců (xi) Pravděpodobnost P(X=xi) Pravděpodobnost P(X= xi) 0 (tři dívky) = 0,48∙0,48∙0,48 = 0,11 1 (chlapec, dvě dívky) = 0,52∙0,48∙0,48∙3 = 0,12∙3 = 0,36 2 (dva chlapci a dívka) = 0,52∙0,52∙0,48∙3 = 0,13∙3 = 0,39 3 (tři chlapci) = 0,52∙0,52∙0,52 = 0,14 Celkem 1,00

Pravděpodobnostní Funkce P(x) Pravděpodobnostní funkce pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty x. P(x) = P(X = x) Vlastnosti pravděpodobnostní funkce: funkce je omezená 0 ≤ P(x) ≤ 1 pravděpodobnostní funkce diskrétní náhodné veličiny je nespojitá!

Pravděpodobnostní Funkce P(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu pravděpodobnostní fce P(x):

Pravděpodobnostní Funkce P(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení funkčním zápisem pravděpodobnostní fce P(x): Počet chlapců (x) Pravděpodobnost P(X=x) Funkční zápis 0 (tři dívky) = 0,48∙0,48∙0,48 = 1∙0,520∙(1-0,52)3 1 (chlapec, dvě dívky) = 0,52∙0,48∙0,48∙3 = 3∙0,521∙(1-0,52)2 2 (dva chlapci a dívka) = 0,52∙0,52∙0,48∙3 = 3∙0,522∙(1-0,52)1 3 (tři chlapci) = 0,52∙0,52∙0,52 = 1∙0,523∙(1-0,52)0 Celkem 1,00 Pravděpodobnostní funkci příkladu lze obecně zapsat:

Distribuční Funkce F(x) Distribuční funkce (někdy také kumulativní distribuční funkce) pro nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké. F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce pro a < b platí F(a) ≤ F(b) neklesající funkce P(a < X ≤ b) = F(b) - F(a) distribuční funkce diskrétní náhodné veličiny je nespojitá F(x) = P(X ≤ x) = ΣP(x)

Distribuční Funkce F(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím tabulky: (bude doplněn sloupec distribuční funkce). Hodnoty F(x) vyjadřují pravděpodobnost, že se narodí x nebo méně chlapců! Počet chlapců (x) P(x) = P(X=x) F(x) = P(X≤x) 0 (tři dívky) 0,11 1 (chlapec, dvě dívky) 0,36 0,11+0,36 = 0,47 2 (dva chlapci a dívka) 0,39 0,11+0,36+0,39 = 0,86 3 (tři chlapci) 0,14 0,11+0,36+0,39+0,14 = 1 Celkem 1,00 -

Distribuční Funkce F(x) ! Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet narozených chlapců mezi třemi novorozenci. Popis rozdělení prostřednictvím grafu distribuční funkce F(x):

Binomické Bi(n,) Graf pravděpodobnostní funkce P(x) Graf distribuční funkce F(x)

Binomické Bi(n,) Aplikace: Náhodný výběr s vracením prvků. Pravděpodobnost, že se v sérii n nezávislých náhodných pokusů objeví sledovaný jev právě x krát. Např: „hod více kostkami“. Pravděpodobnostní funkce: , x = 0,1,2,...,n, , 0<π<1 Parametry: π ... pravděpodobnost náhodného jevu n ... počet opakování Střední hodnota: Rozptyl: MS Excel = BINOMDIST(počet úspěšných pokusů - x ; celkový počet pokusů - n; pravděpodobnost úspěchu – π ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)

Binomické Bi(n,) ! Příklad: Jaká je pravděpodobnost, že při hodu pěti kostkami padne třikrát číslo sudé? Parametry: π = 0,5 (pravděpodobnost náhodného jevu – padne sudé číslo) n = 5 (počet opakování – počet hodů), x = 3 (úspěšné pokusy) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(3; 5; 0,5; 0)

Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Parametry: π = 0,3 (pravděpodobnost náhodného jevu = zaspí) n = 4 (počet opakování = počet dnů), x = 2 (úspěšné pokusy = zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = BINOMDIST(2; 4; 0,3; 0)

Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu? Graf pravděpodobnostní funkce P(x) P(2) = 0,264

Binomické Bi(n,) ! Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3. 4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí alespoň 1x? Parametry: π = 0,3 (pravděpodobnost náhodného jevu – zaspí) n = 4 (počet opakování – počet dnů), alespoň 1x tzn. x ≥ 1(zaspání) Výpočet: Střední hodnota: Rozptyl: MS Excel = 1-BINOMDIST(0; 4; 0,3; 0)

Poissonovo Po() Graf pravděpodobnostní funkce P(x) Graf distribuční funkce F(x) λ = 10 λ = 4 λ = 10 λ = 4

Poissonovo Po() Aplikace: Počet událostí v časové jednotce, počet částic v jednotce plochy nebo objemu. Např: „doba obsluhy“; „chybovost výrobků“. Pravděpodobnostní funkce: , k = 0,1,2,... Parametry:  ... střední počet událostí v časové jednotce, jednotce plochy nebo objemu Střední hodnota: Rozptyl: MS Excel = POISSON (počet událostí - k ; průměrný počet událostí - ; pravděpodobnostní fce - 0 nebo distribuční funkce - 1)

Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Parametry:  = 10 = (30/60)·20 (počet aut za 20 minut) Výpočet: Střední hodnota: Rozptyl: MS Excel = POISSON (15; 10; 0)

Poissonovo Po() ! Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je pravděpodobnost, že za 20 minut jich přijede 15? Graf pravděpodobnostní funkce P(x) P(15) = 0,035

Hypergeometrické Hy(N,M,n) Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Pravděpodobnostní funkce: , max(0,n-N+M) ≤ x ≤ min(M, n) Parametry: N ... počet jednotek v základním souboru M ... počet jednotek se sledovanou vlastností n ... počet náhodně vybraných jednotek (výběr)

Hypergeometrické Hy(N,M,n) Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných výrobků při přejímce zboží“. Střední hodnota, rozptyl: MS Excel = HYPGEOMDIST (počet úspěšných pokusů - k ; počet náhodně vybraných jednotek - n; počet jednotek se sledovanou vlastností – M ; počet jednotek v souboru - N)

Hypergeometrické Hy(N,M,n) ! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Parametry: N = 12 (studentů ve třídě); M = 4 (se připravují); n = 2 (vybraní) Výpočet: Střední hodnota: Rozptyl: MS Excel =HYPGEOMDIST(2;2;4;12)

Hypergeometrické Hy(N,M,n) ! Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při dotázání 2 náhodně vybraných studentů, budou oba vědět. Graf pravděpodobnostní funkce P(x) P(2) = 0,091

Charakteristiky Rozdělení Obecný způsob výpočtu střední hodnoty diskrétní náhodné veličiny: Obecný způsob výpočtu rozptylu diskrétní náhodné veličiny:

Spojitá Rozdělení Spojitá náhodná veličina nabývá libovolných hodnot z konečného nebo nekonečného intervalu.

Diskrétní rozdělení Spojité rozdělení

Distribuční Funkce F(x) Distribuční funkce (někdy také kumulativní distribuční funkce) pro spojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké: F(x) = P(X ≤ x) Vlastnosti distribuční funkce: 0 ≤ F(x) ≤ 1 omezená funkce, pro a < b platí F(a) ≤ F(b) neklesající funkce, P (a < X ≤ b) = F(b) - F(a), distribuční funkce spojité náhodné veličiny je spojitá.

Hustota Pravděpodobnosti f(x) Pravděpodobnostní funkce pro spojitou náhodnou veličinu neexistuje! Pravděpodobnost, že se trefíme právě do určité hodnoty z nekonečného počtu možných hodnot spojité veličiny, je nulová. Paradox nulové pravděpodobnosti: P(X = x) = 0.

Hustota Pravděpodobnosti f(x) Kvůli paradoxu nulové pravděpodobnosti je zavedena nová funkce hustota pravděpodobnosti – f(x). f(x) ≥ 0 pro všechna x v oblasti - ∞ a + ∞ se její hodnota blíží nule Příklady hustoty pravď.

Hustota Pravděpodobnosti f(x) obsah plochy pod křivkou hustoty pravděpodobnosti je 1: a jde o pravděpodobnost Příklady hustoty pravď. Obsah = 1 Obsah = 1 Obsah = 1

Hustota Pravděpodobnosti f(x) obsah plochy mezi hodnotami a, b se vypočte pomocí určitého integrálu: a jde o pravděpodobnost Příklady hustoty pravď. a b a b

Hustota Pravděpodobnosti f(x) Vztah mezi hustotou f(x) a distribuční funkcí F(x): Distribuční funkce F(x) je integrálem hustoty f(x). Hustota f(x) je derivací distribuční funkce F(x). Hustota pravděpodobnosti a distribuční funkce

(Gauss-Laplaceovo) Normální rozdělení N(,2) Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x)

(Gauss-Laplaceovo) Normální N(,2) Aplikace: V případech, kdy na kolísání náhodné veličiny působí velký počet nepatrných a vzájemně nezávislých jevů. Např: „výška a váha v populaci“; „chyby měření“. Distribuční funkce F(x): Hustotní funkce f(x): Parametry: μ ... střední hodnota σ2 ... rozptyl Střední hodnota: Rozptyl: MS Excel = NORMDIST (hodnota sledovaného jevu – x; střední hodnota – μ; směrodatná odchylka – σ; hustota pravď. – 0 nebo distribuční funkce – 1)

(Gauss-Laplaceovo) Normální N(,2) Vlastnosti normálního rozdělení Pravidlo tří sigma: v rozmezí  ± 1 leží 68,3% všech možných hodnot, v rozmezí  ± 2 leží 95,5% všech možných hodnot, v rozmezí  ± 3 leží 99,7% všech možných hodnot.

(Gauss-Laplaceovo) Normální N(,2) ! Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaká je pravděpodobnost získání více jak 125 bodů? Parametry: μ = 100 σ2 = 152 = 225 Náhodná veličina má normální rozdělení N(100; 225). Řešení: P(X>125) = 1- P(X≤125) = 1 – F(125) MS Excel: = 1 - NORMDIST (125; 100; 15; 1) Výsledek: P(X>125) = 1 – 0,952 = 0,048 Pravděpodobnost získání více než 125 bodů je 4,8 %. Pozn. Protože P(X=125) = 0, pak P(X>125) = 1- P(X≤125) =1- P(X<125).

(Gauss-Laplaceovo) Normální N(,2) ! Počet bodů z testu inteligence má normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Jaký je medián rozdělení? Známe pravděpodobnost, ale neznáme hodnotu. Počítáme medián, tedy 50 % kvantil rozdělení. Řešení: P(X ≤ x) = F(x) = 0,5 kolik je x? MS Excel: = NORMINV(0,5; 100; 15) Výsledek: N(100; 225)0,5 = = 100 Polovina osob dosáhne nejvýše 100 bodů. Pozn. Excel má vlastní funkce pro počítání kvantilů spojitých rozdělení MS Excel = NORMINV (kvantil – p; střední hodnota – μ; směrodatná odchylka – σ)

Normované Normální U Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x) Pozn. Normované normální rozdělení je zelené (μ = 0, σ2 = 1).

Normované Normální U Aplikace: Usnadnění výpočtů pravděpodobnosti a kvantilů normálního rozdělení. Statistická indukce. Libovolné normální rozdělení lze převést na normované pomocí vzorce: Parametry: μ = 0 σ2 = 1 Střední hodnota: Rozptyl: MS Excel = NORMSDIST (hodnota sledovaného jevu – x)

Normované Normální U Výpočet kvantilů normovaného normálního rozdělení up u0,95 … je 95% kvantil normovaného normálního rozdělení. Tedy hodnota, která je větší nebo rovna jak 95 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou uvedeny ve statistických tabulkách. MS Excel = NORMSINV (kvantil – p) 1,64 u0,95 = 1,64

(Pearsonovo) Chí-kvadrát χ2(n) Graf hustoty pravděpodobnosti f(x) Graf distribuční funkce F(x) Pozn. V grafu je parametr n značen jako k.

(Pearsonovo) Chí-kvadrát χ2(n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako: S = X12 + X22 + X12 + … + Xn2 , kde X1,X2 , … ,Xn ~ N(0;1) Parametry: n … počet stupňů volnosti Střední hodnota: Rozptyl: MS Excel = CHIDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

(Pearsonovo) Chí-kvadrát χ2(n) Výpočet kvantilů chí-kvadrát rozdělení χ2p (n) χ20,90 (12) … je 90% kvantil chí-kvadrát rozdělení. Tedy hodnota, která je větší nebo rovna jak 90 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a pro různé stupně volnosti n jsou uvedeny ve statistických tabulkách. MS Excel = CHIINV (upravený kvantil – 1-p, počet stupňů volnosti – n) 18,55 χ20,90 (12) = 18,55

Studentovo t(n) Graf hustoty pravděpodobnosti f(x)

Studentovo t(n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z normovaného normálního rozdělení jako , kde X1~ N(0;1) a X2 ~ χ2(n) Parametry: n … počet stupňů volnosti MS Excel = TDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

Studentovo t(n) Výpočet kvantilů rozdělení t(n) t0,99 (9) … je 99% kvantil Studentova t rozdělení. Tedy hodnota, která je větší nebo rovna jak 99 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti n uvedeny ve statistických tabulkách. MS Excel = TINV (upravený kvantil – 2(1-p), počet stupňů volnosti – n) pokud p >0,5 = -1*TINV (upravený kvantil – 1-p, počet stupňů volnosti – n) pokud p <0,5. 2,82 t0,99(9) = 2,82

Fisher-Snedecor F-rozdělení F(m,n) Graf hustoty pravděpodobnosti f(x)

Fisher-Snedecor F-rozdělení F(m,n) Aplikace: Kvantily se velmi často využívají ve statistické indukci. Odvozené z chí-kvadrát rozdělení jako , kde X1 ~ χ2(n) a X2 ~ χ2(m) Parametry: n … počet stupňů volnosti m … počet stupňů volnosti MS Excel = FDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)

Fisher-Snedecor F-rozdělení F(m,n) Výpočet kvantilů rozdělení F(m,n) F0,6 (10,12) … je 60% kvantil F rozdělení. Tedy hodnota, která je větší nebo rovna jak 60 % hodnot rozdělení. Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro různé stupně volnosti m a n uvedeny ve statistických tabulkách. MS Excel = FINV (upravený kvantil – 1-p, počet stupňů volnosti – n) 1,15 F0,6 (10;12) = 1,15

Beta rozdělení B(α,β) Graf hustoty pravděpodobnosti f(x)

Spojitá rozdělení v MS Excel Distribuční funkce Kvantil Funkce kvantilu Normální N(μ;σ2) =NORMDIST (x;μ;σ;1) 1 1pro výpočet hustotní funkce se zadá parametr 0 Np(μ;σ2) =NORMINV(p;μ;σ) Normované normální N(0;1) =NORMSDIST(x) up =NORMSINV(p) Chí-kvadrát 2(v) =CHIDIST(x;v) p2(v) =CHIINV(1-p;v) Studentovo t(v) =TDIST(x;v) tp(v) =TINV(2*(1-p);v) pro p >0,5 =-1*TINV(2*p;v) pro p < 0,5 F rozdělení F(v1; v2) =FDIST(x;v1;v2) Fp(v1;v2) =FINV(1-p;v1;v2)

Kvantily rozdělení v Online kalkulátorech Výpočty kvantilů základních i řady další rozdělení lze provádět i pomocí online kalkulátorů. Výpočet může být i jednodušší než pomocí funkcí MS Excel. Quantile Calculator (www.solvemymath.com) 13 spojitých a 4 nespojitá rozdělení SOCR Distributome (socr.ucla.edu) přes 70 spojitých a nespojitých rozdělení s grafickým rozhraním pro zobrazení pravděpodobnostních funkcí a hustot pravděpodobností a výpočet kvantilů

Pravděpodobnost Důležité pojmy – 3. přednáška Náhodný jev a nenáhodný jev Klasická definice pravděpodobnosti Statistická definice pravděpodobnosti Diskrétní náhodná veličina Pravděpodobnostní funkce Distribuční funkce Spojitá náhodná veličina Hustota pravděpodobnosti Normální rozdělení Kvantily