Pearsonův test dobré shody chí kvadrát

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

kvantitativních znaků
Testování parametrických hypotéz
Testování neparametrických hypotéz
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Regresní analýza a korelační analýza
Testování hypotéz (ordinální data)
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Analýza kategoriálních dat
MUDr. Michal Jurajda, PhD. ÚPF LF MU
ÚVOD DO STATISTIKY „Jsou tři druhy lží: lži, odsouze-níhodné lži a statistiky“ (Swoboda 1977) Význam statistiky ve vědě Základní pojmy statistiky Statistická.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Ringier ČR - Výzkumné oddělení
Biostatistika 5. přednáška Aneta Hybšová
základní principy a použití
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Biostatistika 4. přednáška
Kontingenční tabulky.
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Jak statistika dokazuje závislost
Hustota pravděpodobnosti – případ dvou proměnných
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Míry asociace obecná definice – síla a směr vztahu
Jiří Šafr jiri.safr(zavináč)seznam.cz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Základy zpracování geologických dat R. Čopjaková.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Neparametrické testy parametrické a neparametrické testy
INDUKTIVNÍ STATISTIKA
Normální rozdělení a ověření normality dat Modelová rozdělení
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
7. Kontingenční tabulky a χ2 test
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Pearsonův test dobré shody chí kvadrát nei četnosti experimentální noi četnosti očekávané (teoretické) Test se nehodí pro soubory s velmi malými četnosti v jednotlivých kategoriích!!! Zde je vhodnější Kolmogorovův test.

Pearsonův i Smirnovův a Kolmogorovův test lze použít i pro diskrétní, ordinální i nominální data. Pozor!!! Všimněte si analogie mezi párovým testem (t-test, Wilcoxon) a testy shody (Smirnov, test dobré shody): v obou případech se sledují rozdíly mezi párovými hodnotami.

III.

Závislost Funkční Stochastická Korelační Regresní Lineární Nelineární

Závislost dvou proměnných Grafické nebo tabelární zobrazení dat Hledání základních konfigurací a tendencí v datech Výpočet numerických charakteristik

Závislost dvou proměnných rozptylový graf (scatter plot) kvadranty

Závislost dvou proměnných Konfidenční elipsa pro danou hl. významnosti

Závislost dvou proměnných Konfidenční elipsa pro danou hl. významnosti Střed elipsy: Osa x svírá s delší osou elipsy úhel Plocha elipsy:

Pearsonův koeficient korelace kovariance Standardizované hodnoty

Pearsonův koeficient korelace Vyjadřuje pouze sílu lineárního vztahu. Je velmi ovlivněn odlehlými hodnotami. Nerozlišuje mezi závisle a nezávisle proměnnou. Obě proměnné musí mít náhodný charakter. Korelace sama o sobě neznamená přítonmost příčinného vztahu!!!

Odhad a testování Pearsonova k. k. H0: r = 0 -1 ≤ r ≤ 1 Síla asociace /r/ Malá 0,1 – 0,3 Střední 0,3 – 0,7 Silná 0,7 – 1,0 r2 = koeficient determinace

Odhad a testování Pearsonova k. k. H0: r = ρ0 z – tsz ≤ μz ≤ z + tsz

Odhad a testování Pearsonova k. k. H0: r1 = r2

Pořadová korelace Spearmanův Kendallův Hodí se spíše pro zařazovací ordinální data, pro zařazovací ordinální data se však běžně používá. Di jsou rozdíly v pořadí hodnot xi a yi vzhledem k ostatním hodnotám výběru. Kendallův Sleduje počet a charakter rozdílů v pořadí - pro j > i: yj > yi konkordance (kladná asociace) P yj < yi diskordance (kladná asociace) Q Hodí se spíše pro porovnávací ordinální data

Druhy korelace Formální korelace: u percentuálních dat Korelace způsobená společnou příčinou Korelace způsobená nehomogenitou

Závislost a asociace nominálních dat

Kontingenční tabulky čtyřpolní tabulka – pro dichotomická data Marginální četnosti

Asociace v kontingenčních tabulkách Chí kvadrát test nezávislosti Yatesova korekce na nespojitost Je formálně shodný s Pearsonovým k. k.

Asociace v kontingenčních tabulkách Fisherův exaktní (kombinatorický) test – pro malé četnosti Zjišťujeme pravděpodobnost, že se vyskytne daná konfigurace četností a, b, c, d nebo jakákoli jiná, nulové hypotéze ještě nepříznivější(sloupcové a řádkové součty jsou stejné). Pokud je součet nižší než zvolená hladina významnosti – H0 se zamítá.

Asociace v kontingenčních tabulkách Woolfův G test nezávislosti G = 2[a.ln(a) + b.ln(b) + c.ln(c) + d.ln(d) – (a + b).ln(a + b) – (a + c).ln(a + c) – (b + d).ln(b + d) – (c + d).ln(c + d)] Pro výběry malého rozsahu se použije korekce na nespojitost dle Yatese: je-li empirická četnost menší než teoretická přičteme 0,5 je-li empirická četnost větší než teoretická odečteme 0,5 Získaná hodnota se srovná s kritickou hodnotou rozdělení chí kvadrát pro (r-1)(s-1) stupně volnosti.

Koeficienty asociace Yule: Simple matching (pozorovaná shoda): Rusell – Rao: Rogers – Tanimoto: Sneath:

Koeficienty asociace Jaccard: Kulczynski 1: Sorensen – Dice: Anderberg: Ochiai – Otsuka:

Kontingenční tabulky

Asociace nominálních dat Chí kvadrát test nezávislosti

Asociace v kontingenčních tabulkách Koeficienty kontingence - odvozené od koeficientu χ 2, pro čtyřpolní tabulky jsou shodné s koeficientem Φ. Cramerův koeficient kontingence Čuprovův koeficient kontingence

Asociace ordinálních kategorií Goodmanův – Kruskalův koeficient Kendallovo tau-c kde m je menší z obou dimenzí v kontingenční tabulce.

Testy shody pro párová dichotomická data

Dichotomická data: Mc Nemarův test H0: p12 = p21 Pro malé četnosti (b + c < 30): Yatesova korekce na nespojitost

Dichotomická data: srovnání 2 metod Kappa koeficient shody

Nominální data: Bowkerův test symetrie Zobecnění McNemarova testu pro nominální znak s r úrovněmi: Kritérium má přibližně chí kvadrát rozdělení s r(r-1)/2 stupni volnosti.