Testování neparametrických hypotéz

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování hypotéz Distribuce náhodných proměnných
Testování hypotéz.
Testování statistických hypotéz
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Test dobré shody 2 test.
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK211 Základy ekonometrie Autokorelace Cvičení /
Testování závislosti kvalitativních znaků
Regresní analýza a korelační analýza
Analýza dat.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Řízení a supervize v sociálních a zdravotnických organizacích
Odhady parametrů základního souboru
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Odhady odhady bodové a intervalové odhady
9. Analýza kategorických dat
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Náhodný vektor Litschmannová, 2007.
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
1. cvičení
Jiří Šafr jiri.safr(zavináč)seznam.cz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Odhady parametrů základního souboru
Proč statistika ? Dva důvody Popis Inference
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Testování neparametrických hypotéz

Neparemetrické hypotézy Hypotézy o vlastnostech populace (typ rozdělení, závislosti, …)

Testy dobré shody (testy o shodě mezi výb. a teoret. rozdělením) Χ2 – test dobré shody Kolmogorovův – Smirnovův test pro jeden výběr

Χ2 – test dobré shody Volba H0 H0: Výběr pochází z populace, v níž jsou relativní četnosti jednotlivých variant rovny číslům, populace musí být roztříditelná podle nějakého znaku do k skupin. H0: Výběr pochází z rozdělení určitého typu, jehož parametry jsou dány (úplně specifikovaný model). H0: Výběr pochází z rozdělení určitého typu, přičemž neověřujeme informace o parametrech rozdělení, parametry modelu odhadujeme (neúplně specifikovaný model).

Χ2 – test dobré shody Volba testové statistiky n … rozsah výběru k … počet variant h … počet odhadovaných parametrů modelu ni … empirické četnosti jednotlivých variant π0,i … očekávané rel. četnosti jednotlivých variant

Χ2 – test dobré shody Předpoklad testu Očekávané četnosti musí být větší než 5 (alespoň 80% očekávaných četností musí být větších než 5)

Χ2 – test dobré shody Výpočet p – value

Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.1 -12.3

Kolmogorovův-Smirnovův test pro jeden výběr Používá se pro ověření hypotézy, zda pořízený výběr pochází z rozdělení se spojitou distribuční funkcí F(x). F(x) musí být úplně specifikovaná.

Kolmogorovův-Smirnovův test pro jeden výběr Výhody oproti X2 -testu dobré shody: větší síla testu nemá omezující podmínky (lze použít při výběrech malého rozsahu) vychází z jednotlivých pozorování a nikoliv z údajů setříděných do skupin

Kolmogorovův-Smirnovův test pro jeden výběr H0 a HA: H0: HA: Testová statistika:

Kolmogorovův-Smirnovův test pro jeden výběr Dn

Kolmogorovův-Smirnovův test pro jeden výběr Nulové rozdělení: Speciální rozdělení pro tento test, kvantily tabelovány – viz. Tab. 5 Výpočet p-value

Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.4

Testy v kontingenční tabulce

X2 -test nezávislosti v kontingenční tabulce (Testování závislosti dvou kategoriálních proměnných)

Co je to kontingenční tabulka? Dvourozměrná tabulka četností, z jejichž hodnot můžeme usoudit na závislost či nezávislost mezi dvěma kategoriálními proměnnými

Grafický výstup pro analýzu závislosti dvou kategoriálních proměnných Shlukový sloupcový graf Kumulativní sloupcový graf Mozaikový graf 100% skládaný pruhový graf (Lze použít k explorační analýze závislosti)

Shlukový sloupcový graf (Statgraphics)

Shlukový sloupcový graf (Excel)

Kumulativní sloupcový graf (Excel)

Mozaikový graf (Statgraphics)

100% skládaný pruhový graf (Excel)

Pojmy: Pozorované (empirické) četnosti Oij (Observed frequency) – zjištěné sdružené četnosti Očekávané (teoretické) četnosti Eij (Expected frequency) – sdružené četnosti očekávané za předpokladu nezávislosti proměnných (aneb platí-li H0) Odchylky, rezidua (Deviation) – rozdíly mezi očekávanými a pozorovanými četnostmi = Eij-Oij

Chí-kvadrát test nezávislosti v kontingenční tabulce Ideální případ nezávislosti Oij=Eij aneb Oij-Eij=0 i=1, …, m; j=1, …, n

Chí-kvadrát test nezávislosti v kontingenční tabulce H0 a HA: H0: Proměnné v kontingenční tabulce jsou nezávislé. HA: Proměnné v kontingenční tabulce jsou závislé. Testová statistika (Pearsonova statistika chí-kvadrát): m … počet řádků kont. tabulky n … počet sloupců kont. tabulky

Chí-kvadrát test nezávislosti v kontingenční tabulce Předpoklady testu: Žádná očekávaná četnost nesmí klesnout pod 2 Alespoň 80% četností musí být větších než 5 Výpočet p-value

Rozšířená kontingenční tabulka Intenzivní Standardní Celkem Vysvětlivky Nezletilý 177 64% 63% 155,5 21,5 3,0 99 36% 46% 120,5 -21,5 3,8 276 Empirické četnosti Eij Řádkové rel. četnosti Sloupcové rel. četnosti Očekávané četnosti Oij Odchylky (Eij-Oij) (Eij-Oij)2/Oij Zletilý 103 47% 37% 124,5 3,7 118 53% 54% 96,5 4,8 221 Řádkové rel.četnosti 280 217 497

Příklady Litschmannová M. , Statistika I. – cvičení, Testování neparam Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.5

m, n … počet řádků (sloupců) kont. tabulky Yatesova korekce Lze provést v případě, kdy nejsou splněny předpoklady chí-kvadrát testu nezávislosti (extrémně nízké očekávané četnosti). Snižuje pravděpodobnost chyby I. druhu, tím však snižuje sílu testu. Testová statistika (Pearsonova statistika chí-kvadrát): m, n … počet řádků (sloupců) kont. tabulky Výpočet p-value:

Fisherův exaktní test Užívá se v případě extrémně nízkých očekávaných četností. Lze použít pouze pro čtyřpolní tabulky. Určují se pravděpodobnosti výskytu všech možných obměn četností v kontingenční tabulce, které dávají stejné marginální četnosti jako tabulka zjištěných četností…

McNemarův test Pouze pro čtyřpolní tabulky. Test shody rozdělení pro závislé alternativní proměnné se stejnými kódy. Nulová a alternativní hypotéza: H0: Procenta „úspěšností“ jsou u obou veličin stejná. HA: Procenta „úspěšností“ nejsou u obou veličin stejná. Testové kritérium: Předpoklad testu: Výpočet p-value:

Příklady Litschmannová M. , Statistika I. – cvičení, Testování neparam Příklady Litschmannová M., Statistika I. – cvičení, Testování neparam. hypotéz: 12.6