7. Kontingenční tabulky a χ2 test

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Úvod do analýzy rozptylu
Testování parametrických hypotéz
Testování neparametrických hypotéz
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Testování hypotéz (ordinální data)
Obecný postup při testování souborů
Testování hypotéz přednáška.
Testování hypotéz vymezení důležitých pojmů
Biostatistika 9. přednáška Aneta Hybšová
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Dvouvýběrové testy parametrickch hypotéz
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
1. cvičení
7. Statistické testování
Základy testování hypotéz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednovýběrový t-test Jednovýběrový test rozptylu V.d1 Statistické.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Stručný přehled modelových rozložení I.
7. Statistické testování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
8. Modelová rozdělení pravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky
Parametrická analýza rozptylu Kruskal-Wallisův test
Normální rozdělení a ověření normality dat Modelová rozdělení
Opakování Shrnutí statistických testů Neparametrické testy
Bi8600: Vícerozměrné metody – cvičení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

7. Kontingenční tabulky a χ2 test Znaménkový test a χ2 test Shrnutí statistických testů Kontingenční tabulky Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Statistické testování – základní pojmy Nulová hypotéza HO HO: sledovaný efekt je nulový Alternativní hypotéza HA HA: sledovaný efekt je různý mezi skupinami Testová statistika Pozorovaná hodnota – Očekávaná hodnota Variabilita dat Testová statistika = * Velikost vzorku Kritický obor testové statistiky Statistické testování odpovídá na otázku zda je pozorovaný rozdíl náhodný či nikoliv. K odpovědi na otázku je využit statistický model – testová statistika. T Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 2

P-hodnota Významnost hypotézy hodnotíme dle získané tzv. p-hodnoty, která vyjadřuje pravděpodobnost, s jakou číselné realizace výběru podporují H0, je-li pravdivá. P-hodnotu porovnáme s α (hladina významnosti, stanovujeme ji na 0,05, tzn., že připouštíme 5% chybu testu, tedy, že zamítneme H0, ačkoliv ve skutečnosti platí). P-hodnotu získáme při testování hypotéz ve statistickém softwaru. Je-li p-hodnota ≤ α, pak H0 zamítáme na hladině významnosti α a přijímáme HA Je-li p-hodnota > α, pak H0 nezamítáme na hladině významnosti α P-hodnota vyjadřuje pravděpodobnost za platnosti H0, s níž bychom získali stejnou nebo extrémnější hodnotu testové statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová

Test dobré shody - základní teorie Testuje shodu reálné distribuce hodnot do n skupin s teoretickou distribucí. Předpokladem je, že velikost rozdílu mezi očekávaným a skutečným počtem hodnot v každé skupině je náhodně rozdělená → multinomické rozdělení. Součet druhých mocnin relativních rozdílů očekávaného a skutečného počtu hodnot má přibližně χ2 rozdělení. χ2 rozdělení pro kladné hodnoty (suma čtverců) se liší podle počtu stupňů volnosti k (počtu skupin) - se zvyšujícím se k přechází v normální rozdělení. 2 pozorovaná četnost - očekávaná četnost ∑ = očekávaná četnost Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Test dobré shody - základní teorie 2 2 pozorovaná četnost - očekávaná četnost pozorovaná četnost - očekávaná četnost = + + očekávaná četnost očekávaná četnost … 1. jev 2. jev Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Znaménkový test Zjednodušení neparametrického párového Wilcoxonova testu. Namísto velikosti rozdílů se počítá pouze jejich orientace (signum). Případy, kde sgn(d) = 0 se z analýzy vylučují. Sečou se kladné a záporné rozdíly a menší ze součtů je hledaná statistika m. Statistika m se porovná s tabulkovou hodnotou pro danou hladinu pravděpodobnosti:

Shrnutí statistických testů Typ srovnání Nulová hypotéza Parametrický test Neparametrický test 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu. jednovýběrový t-test Mann-Whitneyův test 2 skupiny dat nepárově Obě skupiny hodnot pochází ze stejného rozdělení. nepárový t-test 2 skupiny dat párově Zkoumaný efekt mezi páry hodnot je nulový. Párový t-test Wilcoxonův test; znaménkový test shoda rozdělení rozdělení dat ve skupině odpovídá teoretickému (vybranému) rozdělení. Shapiro-Wilksův test; Kolmogorovův-Smirnovův test; test dobré shody homoskedasticita (shoda rozptylů) rozptyl obou (všech) skupin je shodný. Levenův test - více skupin nepárově Zkoumaný efekt mezi skupinami hodnot je nulový. ANOVA Kruskal- Wallisův test korelace Neexistuje (příčinná, důsledková) vazba mezi skupinami hodnot. Pearsonův koeficient Spearmanův koeficient; Kendallův koeficient

Kontingenční tabulky H0 :Nezávislost dvou jevů A a B + - S a b c d suma sum A B Kontingenční tabulka 2 x 2 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Kontingenční tabulky: příklad … Ano Ne S 20 82 102 10 54 64 30 136 166 gen Kontingenční tabulka v obrázku Gen: ANO Gen: NE Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Příklad – závislost pohlaví na onemocnění Zdraví Nemocní Celkem Muži 50 100 Ženy 200 Zdraví Nemocní Celkem Muži 45 55 100 Ženy 200 Zdraví Nemocní Celkem Muži 35 65 100 Ženy 200 Zdraví Nemocní Celkem Muži 5 95 100 Ženy 200 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová

Příklad – závislost pohlaví na onemocnění Pozorované hodnoty Zdraví Nemocní Celkem Muži 50 100 Ženy 200 Očekávané hodnoty pro všechny tabulky vlevo Zdraví Nemocní Celkem Muži 50 100 Ženy 200 Zdraví Nemocní Celkem Muži 45 55 100 Ženy 200 pozorovaná četnost očekávaná očekávaná četnost = 2 - Zdraví Nemocní Celkem Muži 35 65 100 Ženy 200 Zdraví Nemocní Celkem Muži 5 95 100 Ženy 200 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová

Příklad – závislost pohlaví na onemocnění Zdraví Nemocní Celkem Muži 50 100 Ženy 200 Χ2 = 0,0 p = 1,000 Zdraví Nemocní Celkem Muži 45 55 100 Ženy 200 Χ2 =2,0 p = 0,157 Zdraví Nemocní Celkem Muži 35 65 100 Ženy 200 Χ2 = 18,0 p < 0,0001 Zdraví Nemocní Celkem Muži 5 95 100 Ženy 200 Χ2 = 162,0 p < 0,0001 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita M. Cvanová