Diskrétní rozdělení Karel Zvára 1
Populace - výběr populace: idealizovaná situace, jako bychom znali všechny možné výsledky pokusu i s jejich pstmi, všechny možné prvky populace i s jejich vlastnostmi číselný výsledek pokusu – náhodná veličina n. v. charakterizována populačními parametry náhodný výběr: vzorek populace, který můžeme měřit ... charakterizován výběrovými parametry z náhodného výběru soudíme na populaci
Populace - výběr populační charakteristiky (populační) průměr, (populační) rozptyl, pravděpodobnost náhodného jevu výběrové charakteristiky (výběrový) průměr, (výběrový) rozptyl, relativní četnost náhodného jevu testovaná hypotéza – tvrzení o populaci, rozhodujeme na základě náhodného výběru, rozhodnutí je náhodné (náhodný jev)
Náhodná veličina číselně vyjádřený výsledek náhodného pokusu rozdělení NV – idealizovaná představa o možných hodnotách NV a frekvenci jejich výskytu spojité rozdělení (např. normální) – v principu může nabývat všech hodnot z daného rozmezí (intervalu), např. hmotnost, délka, koncentrace . diskrétní rozdělení – nabývá jen od sebe oddělených hodnot
Diskrétní rozdělení zpravidla počty případů, kolikrát nastal sledovaný jev – četnosti popsáno (určeno, definováno): seznam možných hodnot x1, x2, ... pravděpodobnosti těchto hodnot P(X = x1), ... střední hodnota, též populační průměr (protějšek výběrového průměru): vážený průměr možných hodnot
Alternativní rozdělení též Bernoulliovo (nula-jedničkové) rozdělení: náhodný pokus se dvěma možnými výsledky P(zdar)= , P(nezdar) = Bernoulliův pokus náhodná veličina X = počet zdarů v pokusu obecný zápis
Alternativní rozdělení - parametry (populační) průměr, střední hodnota: vážený průměr možných hodnot (populační) rozptyl: vážený průměr čtverců odchylek od (populačního) průměru příklad: počet chlapců při jednočetném porodu
Binomické rozdělení n nezávislých opakování Bernoulliova pokusu v každém zjišťujeme, zda sledovaný jev nastal či nikoliv pravděpodobnost p zdaru vždy stejná X = počet pokusů, kdy jev (zdar) nastal příklady: počet děvčat v rodině se třemi dětmi, nikoliv např. počet potratů u ženy po třech těhotenstvích
binomické rozdělení Bi(n,): X lze chápat jako součet n nezávislých veličin s alternativním rozdělením (počty výskytů v jednotlivých pokusech) (populační) průměr roven nπ , (populační) rozptyl n π (1- π), n-násobek charakteristiky alternat. rozdělení příklad pst, že ve 12 hodech symetrickou kostkou padne šestka přesně dvakrát:
pro velká n lze použít aproximaci normálním rozdělením se stejným průměrem a rozptylem (pokud n dost velké, např. np (1- p) aspoň 9) příklad pst, že v 60 hodech kostkou padne nejvýš 15krát šestka přesně 0,966, z aproximace normálním rozdělením 0,958
binomické rozdělení: odhad pravděpodobnosti p pomocí relativní četnosti přesnost je dána odmocninou z rozptylu směrodatná (střední) chyba nahradíme-li neznámý parametr jeho odhadem p, dostaneme 95% interval spolehlivosti
binomické rozdělení: šířka intervalu spol. závisí na p a na n například pro n = 1200 a p=15 % vyjde pro n = 1200/4 = 300 a p = 15 % vyjde
Poissonovo rozdělení: není dán počet pokusů, v nichž zjišťujeme, zda sledovaný jev (událost) nastal či nikoliv, čekáme na jeho výskyt danou dobu, hledáme jej na dané ploše ... hustotu (intenzitu) výskytu charakterizuje l (průměrný počet na jednotce plochy, v jednotkovém čase) pravděpodobnost výskytu je úměrná délce intervalu, velikosti plochy ... počty událostí v disjunktních intervalech (plochách) jsou nezávislé pst současného výskytu dvou událostí zanedbatelná X = počet událostí, kdy jev nastal
Poissonovo rozdělení: (populační) průměr i rozptyl jsou l (totožné) lze použít jako aproximaci binomického rozdělení, je-li pravděpodobnost p malá, pak je np téměř stejné jako np (1-p), volí se l = n p příklad albínů u krys: n=100, p = 0,001 => l = 100 • 0,001 = 0,1
příklad: počty kolonií (72, 69, 63, 59, 59, 53, 51) interval spolehlivosti zde 95% interval pro l hrubá normální aproximace (l aspoň 100)
multinomické rozdělení: zobecnění binomického rozdělení m možných výsledků pokusu (nastává právě jeden z nich), binomické mělo m = 2 n nezávislých opakování pokusu p1, …, pm pravděpodobnosti možných výsledků X1, …, Xm četnosti možných výsledků příklady krevní skupiny (počty skupin A, B, AB, 0), hrací kostka (počty jedniček, …, šestek)
multinomické rozdělení: protože jednotlivé složky mají binomické rozdělení, je (popul.) průměr Xj roven n pj a rozptyl n pj (1 - pj ) nejpoužívanější vlastnost má asymptoticky rozdělení chí-kvadrát s m-1 stupni volnosti (mělo by být vždy npj aspoň 5) příklad je hrací kostka symetrická? (15,5,12,8,14,6)
Příklad počet alel Se v genotypu 639 potomků heterozygotních rodičů 159,75 319,50 očekávané četnosti 159 321 empirické četnosti celkem 0 (se, se) 1 (Se, se) 2 (Se, Se) počet alel Se H0: pravděpodobnosti genotypů jsou v poměru 1:2:1
Příklad (Paulingova studie) 279 231 48 celkem 140 109 31 placebo 139 122 17 C nenastydli nastydli léčba Pauling (1961): vliv kyseliny askorbové na nachlazení (1 g vitaminu resp. placebo) kdyby na vitaminu nezáleželo (H0), poměr nastydli/nenastydli, tj. 48/231 se zachová v obou skupinách 140·231/279=115,9 140·48/279=24,1 139·231/279=115,1 139·48/279=23,9