příklad: hody hrací kostkou odhadujeme pravděpodobnost šestky kostka A: n = 100, nA = 17, fA = 0,17 kostka B: n = 100, nB = 41, fB = 0,41 důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv 12.1.2019 Statistika (D360P03Z) 7. předn.
proč testování hypotéz nelze bezpečně poznat, že kostka B je falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí, kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti? musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka 12.1.2019 Statistika (D360P03Z) 7. předn.
Statistika (D360P03Z) 7. předn. testování hypotéz (1) (nulová) hypotéza H0– zjednodušuje situaci, zpravidla se ji snažíme vyvrátit, abychom věcně něco prokázali alternativa H1 (alternativní hypotéza) – opak nulové hypotézy, zpravidla to, co chceme dokázat možná rozhodnutí: zamítnout H0 pokud naše data svědčí proti H0 nezamítnout H1 (přijmout H0) pokud není dost důvodů H0 zamítnout nelze zaručit bezchybnost rozhodnutí 12.1.2019 Statistika (D360P03Z) 7. předn.
Statistika (D360P03Z) 7. předn. testování hypotéz (2) protože nelze zaručit bezchybnost rozhodnutí, mohou nastat chyby: chyba 1. druhu, když zamítneme platnou H0 chyba 2. druhu, když nepoznáme, že H0 neplatí a nezamítneme ji nechceme často chybně zamítat H0 (falešně něco věcně prokazovat), proto zvolíme nízkou hladinu testu (nejčastěji = 5 %) hladina testu - maximální přípustná pravděpodobnost chyby 1. druhu síla testu – pst správného zamítnutí neplatné hypotézy 12.1.2019 Statistika (D360P03Z) 7. předn.
schéma testování hypotéz rozhodnutí H0 platí H0 neplatí H0 zamítnout chyba 1. druhu (pst ) správné rozhodnutí (pst 1-) H0 nezamítnout (přijmout) (pst 1-) chyba 2. druhu (pst ) 12.1.2019 Statistika (D360P03Z) 7. předn.
postup při testování hypotéz zvolit hypotézu H0, alternativu H1 zvolit hladinu zvolit metodu rozhodování (testování) z dat spočítat testovou statistiku T a porovnat ji s tabelovanou kritickou hodnotou když T padne do kritického oboru, pak H0 zamítneme (zpravidla když T > t0) kritický obor: množina všech výsledků pokusu, kdy budeme zamítat hypotézu 12.1.2019 Statistika (D360P03Z) 7. předn.
hrací kostka: šestka příliš často? chci prokázat, že pst šestky velká (>1/6) H0: P(padne šestka) = 1/6 H1: P(padne šestka) > 1/6 co svědčí pro neplatnost H0 a současně pro platnost H1? šestka příliš často provést n = 100 pokusů, Y počet šestek, zamítat H0, když Y > y0 za platnosti H0 je Y ~ bi(100, 1/6), y0 zvolit tak, aby za H0 bylo P(Y > y0) =0,05 12.1.2019 Statistika (D360P03Z) 7. předn.
volba kritického oboru (přesně) podmínku P(Y > y0) 0,05 splňuje y0 = 23 padne-li ve 100 nezávislých hodech kostkou více než 23 šestek, budeme na 5% hladině zamítat hypotézu, že pst šestky je 1/6 ve prospěch alternativy, že pst šestky je větší než 1/6 nám padlo Y = 17, hypotézu nezamítneme, což neznamená, že bychom ji prokázali 0,038 23 0,063 22 0,100 21 0,152 20 0,220 19 P(Y > y0) y0 12.1.2019 Statistika (D360P03Z) 7. předn.
volba kritického oboru (přibližně) použijme Y ~ N(n , n (1-)) (přibližně) tabulka z() dá přibližný kritický obor: Y > 23 12.1.2019 Statistika (D360P03Z) 7. předn.
Statistika (D360P03Z) 7. předn. p-hodnota p-hodnota p = nejmenší , při kterém H0 z daných dat ještě zamítáme p-hodnota je pravděpodobnost, že v pokusu mohl vyjít výsledek pro hypotézu ještě méně (nebo stejně) příznivý (za platnosti H0) zamítnout H0, když p takto zpravidla moderní programy existují úlohy, kdy se rozhoduje pouze podle p-hodnoty (např. Fisherův exaktní test ve čtyřpolní tabulce) 12.1.2019 Statistika (D360P03Z) 7. předn.
rozhodování o kostce – p-hodnota opět se snažíme prokázat, že šestka padá příliš často padlo nám Y = 17, proto protože 50,6 % > 5 %, hypotézu nemůžeme zamítnout, neprokázali jsme, že pst šestky je větší než 1/6 12.1.2019 Statistika (D360P03Z) 7. předn.
oboustranná alternativa jiná úloha: chceme ověřit, zda je kostka v pořádku (tj. pokusit se prokázat, že šestka příliš často nebo příliš zřídka H0: pst šestky = 1/6 (=0) H1: pst šestky není 1/6 (je menší nebo větší) oboustranná alternativa (na rozdíl od jednostranné) proti hypotéze svědčí malé nebo velké Y pst chyby 1. druhu rozdělíme na dvě poloviny: pro příliš malé a příliš velké Y 12.1.2019 Statistika (D360P03Z) 7. předn.
rozhodování o kostce – p-hodnota y0 P(Y < y0) P(Y > y0) 9 0,010 0,979 10 0,021 0,957 11 0,042 0,922 23 0,937 0,038 24 0,962 0,022 25 0,978 0,012 H0 zamítneme, když bude Y < 10 nebo když bude Y > 24 skutečná pst chyby 1. druhu bude 0,021+0,022=0,043 hodnoty v rozmezí 10 až 24 (včetně obou mezí) nesvědčí proti H0 12.1.2019 Statistika (D360P03Z) 7. předn.
oboustranná alternativa přibližně H0: pst šestky = 1/6 H1: pst šestky není 1/6 (je menší nebo větší) proti alternativě svědčí Y hodně daleko od EY, tj. rel. četnost f = Y / n daleko od 0 tedy zamítneme když nebo 12.1.2019 Statistika (D360P03Z) 7. předn.
znovu hodnocení četností 23 11 34 30 17 47 1 18 70 29 99 24,0 9,9 34 33,3 13,8 47 12,7 5,3 18 70 29 99 statistikou je tu 2 (chí-kvadrát), porovnává skutečné četnosti s očekávanými za hypotézy tabelováno závislost prokázána na 5% hladině 12.1.2019 Statistika (D360P03Z) 7. předn.
chí-kvadrát u kontingenční tabulky musí být dost velké očekávané četnosti (aspoň 5) 12.1.2019 Statistika (D360P03Z) 7. předn.