příklad: hody hrací kostkou

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
A5M33IZS – Informační a znalostní systémy Testování modelů.
Náhodné veličiny, náhodné chyby
Testování hypotéz Distribuce náhodných proměnných
Testování hypotéz.
Testování statistických hypotéz
Náhodné veličiny, náhodné chyby
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Testování hypotéz přednáška.
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Diskrétní rozdělení Karel Zvára 1.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Test dobré shody Fisherův přesný test McNemar test
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
PRAVDĚPODOBNOST NEZÁVISLÉ JEVY Jevy A,B nazýváme nezávislými, jestliže
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
8. Kontingenční tabulky a χ2 test
Statistická významnost a její problémy
Pearsonův test dobré shody chí kvadrát
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
Základy testování hypotéz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
HYPOTÉZY „Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v.
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Interpolace funkčních závislostí
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Základy statistické indukce
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Úvod do induktivní statistiky
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
7. Kontingenční tabulky a χ2 test
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

příklad: hody hrací kostkou odhadujeme pravděpodobnost šestky kostka A: n = 100, nA = 17, fA = 0,17 kostka B: n = 100, nB = 41, fB = 0,41 důležitý rozdíl: v prvním případě patří 1/6=0,167 do intervalu spolehlivosti, ve druhém případě nikoliv 12.1.2019 Statistika (D360P03Z) 7. předn.

proč testování hypotéz nelze bezpečně poznat, že kostka B je falešná nebo že kostka A není falešná intervaly spolehlivosti vymezily rozmezí, kde by skutečná pravděpodobnost šestky měla být, jejich spolehlivost je velká, ale omezená znamená něco, když 1/6 neleží v 95% intervalu spolehlivosti? musíme připustit, že jsme mohli mít smůlu, že se v našich pokusech náhodou realizovaly málo pravděpodobné možnosti, přestože k takové smůle dochází jen zřídka 12.1.2019 Statistika (D360P03Z) 7. předn.

Statistika (D360P03Z) 7. předn. testování hypotéz (1) (nulová) hypotéza H0– zjednodušuje situaci, zpravidla se ji snažíme vyvrátit, abychom věcně něco prokázali alternativa H1 (alternativní hypotéza) – opak nulové hypotézy, zpravidla to, co chceme dokázat možná rozhodnutí: zamítnout H0 pokud naše data svědčí proti H0 nezamítnout H1 (přijmout H0) pokud není dost důvodů H0 zamítnout nelze zaručit bezchybnost rozhodnutí 12.1.2019 Statistika (D360P03Z) 7. předn.

Statistika (D360P03Z) 7. předn. testování hypotéz (2) protože nelze zaručit bezchybnost rozhodnutí, mohou nastat chyby: chyba 1. druhu, když zamítneme platnou H0 chyba 2. druhu, když nepoznáme, že H0 neplatí a nezamítneme ji nechceme často chybně zamítat H0 (falešně něco věcně prokazovat), proto zvolíme nízkou hladinu testu  (nejčastěji  = 5 %) hladina testu  - maximální přípustná pravděpodobnost chyby 1. druhu síla testu – pst správného zamítnutí neplatné hypotézy 12.1.2019 Statistika (D360P03Z) 7. předn.

schéma testování hypotéz rozhodnutí H0 platí H0 neplatí H0 zamítnout chyba 1. druhu (pst  ) správné rozhodnutí (pst 1-) H0 nezamítnout (přijmout) (pst  1-) chyba 2. druhu (pst ) 12.1.2019 Statistika (D360P03Z) 7. předn.

postup při testování hypotéz zvolit hypotézu H0, alternativu H1 zvolit hladinu  zvolit metodu rozhodování (testování) z dat spočítat testovou statistiku T a porovnat ji s tabelovanou kritickou hodnotou když T padne do kritického oboru, pak H0 zamítneme (zpravidla když T > t0) kritický obor: množina všech výsledků pokusu, kdy budeme zamítat hypotézu 12.1.2019 Statistika (D360P03Z) 7. předn.

hrací kostka: šestka příliš často? chci prokázat, že pst šestky velká (>1/6) H0: P(padne šestka) = 1/6 H1: P(padne šestka) > 1/6 co svědčí pro neplatnost H0 a současně pro platnost H1? šestka příliš často provést n = 100 pokusů, Y počet šestek, zamítat H0, když Y > y0 za platnosti H0 je Y ~ bi(100, 1/6), y0 zvolit tak, aby za H0 bylo P(Y > y0)   =0,05 12.1.2019 Statistika (D360P03Z) 7. předn.

volba kritického oboru (přesně) podmínku P(Y > y0)  0,05 splňuje y0 = 23 padne-li ve 100 nezávislých hodech kostkou více než 23 šestek, budeme na 5% hladině zamítat hypotézu, že pst šestky je 1/6 ve prospěch alternativy, že pst šestky je větší než 1/6 nám padlo Y = 17, hypotézu nezamítneme, což neznamená, že bychom ji prokázali 0,038 23 0,063 22 0,100 21 0,152 20 0,220 19 P(Y > y0) y0 12.1.2019 Statistika (D360P03Z) 7. předn.

volba kritického oboru (přibližně) použijme Y ~ N(n , n  (1-)) (přibližně) tabulka z() dá přibližný kritický obor: Y > 23 12.1.2019 Statistika (D360P03Z) 7. předn.

Statistika (D360P03Z) 7. předn. p-hodnota p-hodnota p = nejmenší , při kterém H0 z daných dat ještě zamítáme p-hodnota je pravděpodobnost, že v pokusu mohl vyjít výsledek pro hypotézu ještě méně (nebo stejně) příznivý (za platnosti H0) zamítnout H0, když p   takto zpravidla moderní programy existují úlohy, kdy se rozhoduje pouze podle p-hodnoty (např. Fisherův exaktní test ve čtyřpolní tabulce) 12.1.2019 Statistika (D360P03Z) 7. předn.

rozhodování o kostce – p-hodnota opět se snažíme prokázat, že šestka padá příliš často padlo nám Y = 17, proto protože 50,6 % > 5 %, hypotézu nemůžeme zamítnout, neprokázali jsme, že pst šestky je větší než 1/6 12.1.2019 Statistika (D360P03Z) 7. předn.

oboustranná alternativa jiná úloha: chceme ověřit, zda je kostka v pořádku (tj. pokusit se prokázat, že šestka příliš často nebo příliš zřídka H0: pst šestky = 1/6 (=0) H1: pst šestky není 1/6 (je menší nebo větší) oboustranná alternativa (na rozdíl od jednostranné) proti hypotéze svědčí malé nebo velké Y pst chyby 1. druhu  rozdělíme na dvě poloviny: pro příliš malé a příliš velké Y 12.1.2019 Statistika (D360P03Z) 7. předn.

rozhodování o kostce – p-hodnota y0 P(Y < y0) P(Y > y0) 9 0,010 0,979 10 0,021 0,957 11 0,042 0,922 23 0,937 0,038 24 0,962 0,022 25 0,978 0,012 H0 zamítneme, když bude Y < 10 nebo když bude Y > 24 skutečná pst chyby 1. druhu bude 0,021+0,022=0,043 hodnoty v rozmezí 10 až 24 (včetně obou mezí) nesvědčí proti H0 12.1.2019 Statistika (D360P03Z) 7. předn.

oboustranná alternativa přibližně H0: pst šestky = 1/6 H1: pst šestky není 1/6 (je menší nebo větší) proti alternativě svědčí Y hodně daleko od EY, tj. rel. četnost f = Y / n daleko od 0 tedy zamítneme když nebo 12.1.2019 Statistika (D360P03Z) 7. předn.

znovu hodnocení četností 23 11 34 30 17 47 1 18 70 29 99 24,0 9,9 34 33,3 13,8 47 12,7 5,3 18 70 29 99 statistikou je tu 2 (chí-kvadrát), porovnává skutečné četnosti s očekávanými za hypotézy tabelováno závislost prokázána na 5% hladině 12.1.2019 Statistika (D360P03Z) 7. předn.

chí-kvadrát u kontingenční tabulky musí být dost velké očekávané četnosti (aspoň 5) 12.1.2019 Statistika (D360P03Z) 7. předn.