Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
příklad: hody hrací kostkou
odhadujeme pravděpodobnost šestky kostka A: n = 100, nA = 17, fA = 0,17 kostka B: n = 100, nB = 41, fB = 0,41 důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv Statistika (D360P03Z) 7. předn.
2
proč testování hypotéz
nelze bezpečně poznat, že kostka B je falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí, kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti? musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka Statistika (D360P03Z) 7. předn.
3
Statistika (D360P03Z) 7. předn.
testování hypotéz (1) (nulová) hypotéza H0– zjednodušuje situaci, zpravidla se ji snažíme vyvrátit, abychom věcně něco prokázali alternativa H1 (alternativní hypotéza) – opak nulové hypotézy, zpravidla to, co chceme dokázat možná rozhodnutí: zamítnout H0 pokud naše data svědčí proti H0 nezamítnout H1 (přijmout H0) pokud není dost důvodů H0 zamítnout nelze zaručit bezchybnost rozhodnutí Statistika (D360P03Z) 7. předn.
4
Statistika (D360P03Z) 7. předn.
testování hypotéz (2) protože nelze zaručit bezchybnost rozhodnutí, mohou nastat chyby: chyba 1. druhu, když zamítneme platnou H0 chyba 2. druhu, když nepoznáme, že H0 neplatí a nezamítneme ji nechceme často chybně zamítat H0 (falešně něco věcně prokazovat), proto zvolíme nízkou hladinu testu (nejčastěji = 5 %) hladina testu - maximální přípustná pravděpodobnost chyby 1. druhu síla testu – pst správného zamítnutí neplatné hypotézy Statistika (D360P03Z) 7. předn.
5
schéma testování hypotéz
rozhodnutí H0 platí H0 neplatí H0 zamítnout chyba 1. druhu (pst ) správné rozhodnutí (pst 1-) H0 nezamítnout (přijmout) (pst 1-) chyba 2. druhu (pst ) Statistika (D360P03Z) 7. předn.
6
postup při testování hypotéz
zvolit hypotézu H0, alternativu H1 zvolit hladinu zvolit metodu rozhodování (testování) z dat spočítat testovou statistiku T a porovnat ji s tabelovanou kritickou hodnotou když T padne do kritického oboru, pak H0 zamítneme (zpravidla když T > t0) kritický obor: množina všech výsledků pokusu, kdy budeme zamítat hypotézu Statistika (D360P03Z) 7. předn.
7
hrací kostka: šestka příliš často?
chci prokázat, že pst šestky velká (>1/6) H0: P(padne šestka) = 1/6 H1: P(padne šestka) > 1/6 co svědčí pro neplatnost H0 a současně pro platnost H1? šestka příliš často provést n = 100 pokusů, Y počet šestek, zamítat H0, když Y > y0 za platnosti H0 je Y ~ bi(100, 1/6), y0 zvolit tak, aby za H0 bylo P(Y > y0) =0,05 Statistika (D360P03Z) 7. předn.
8
volba kritického oboru (přesně)
podmínku P(Y > y0) 0,05 splňuje y0 = 23 padne-li ve 100 nezávislých hodech kostkou více než 23 šestek, budeme na 5% hladině zamítat hypotézu, že pst šestky je 1/6 ve prospěch alternativy, že pst šestky je větší než 1/6 nám padlo Y = 17, hypotézu nezamítneme, což neznamená, že bychom ji prokázali 0,038 23 0,063 22 0,100 21 0,152 20 0,220 19 P(Y > y0) y0 Statistika (D360P03Z) 7. předn.
9
volba kritického oboru (přibližně)
použijme Y ~ N(n , n (1-)) (přibližně) tabulka z() dá přibližný kritický obor: Y > 23 Statistika (D360P03Z) 7. předn.
10
Statistika (D360P03Z) 7. předn.
p-hodnota p-hodnota p = nejmenší , při kterém H0 z daných dat ještě zamítáme p-hodnota je pravděpodobnost, že v pokusu mohl vyjít výsledek pro hypotézu ještě méně (nebo stejně) příznivý (za platnosti H0) zamítnout H0, když p takto zpravidla moderní programy existují úlohy, kdy se rozhoduje pouze podle p-hodnoty (např. Fisherův exaktní test ve čtyřpolní tabulce) Statistika (D360P03Z) 7. předn.
11
rozhodování o kostce – p-hodnota
opět se snažíme prokázat, že šestka padá příliš často padlo nám Y = 17, proto protože 50,6 % > 5 %, hypotézu nemůžeme zamítnout, neprokázali jsme, že pst šestky je větší než 1/6 Statistika (D360P03Z) 7. předn.
12
oboustranná alternativa
jiná úloha: chceme ověřit, zda je kostka v pořádku (tj. pokusit se prokázat, že šestka příliš často nebo příliš zřídka H0: pst šestky = 1/6 (=0) H1: pst šestky není 1/6 (je menší nebo větší) oboustranná alternativa (na rozdíl od jednostranné) proti hypotéze svědčí malé nebo velké Y pst chyby 1. druhu rozdělíme na dvě poloviny: pro příliš malé a příliš velké Y Statistika (D360P03Z) 7. předn.
13
rozhodování o kostce – p-hodnota
y0 P(Y < y0) P(Y > y0) 9 0,010 0,979 10 0,021 0,957 11 0,042 0,922 23 0,937 0,038 24 0,962 0,022 25 0,978 0,012 H0 zamítneme, když bude Y < 10 nebo když bude Y > 24 skutečná pst chyby 1. druhu bude 0,021+0,022=0,043 hodnoty v rozmezí 10 až 24 (včetně obou mezí) nesvědčí proti H0 Statistika (D360P03Z) 7. předn.
14
oboustranná alternativa přibližně
H0: pst šestky = 1/6 H1: pst šestky není 1/6 (je menší nebo větší) proti alternativě svědčí Y hodně daleko od EY, tj. rel. četnost f = Y / n daleko od 0 tedy zamítneme když nebo Statistika (D360P03Z) 7. předn.
15
znovu hodnocení četností
23 11 34 30 17 47 1 18 70 29 99 24,0 9,9 34 33,3 13,8 47 12,7 5,3 18 70 29 99 statistikou je tu 2 (chí-kvadrát), porovnává skutečné četnosti s očekávanými za hypotézy tabelováno závislost prokázána na 5% hladině Statistika (D360P03Z) 7. předn.
16
chí-kvadrát u kontingenční tabulky
musí být dost velké očekávané četnosti (aspoň 5) Statistika (D360P03Z) 7. předn.
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.