Quantitative Data Analysis II.

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Testování parametrických hypotéz
Testování neparametrických hypotéz
Analýza kvantitativních dat II.
Testování statistických hypotéz
Analýza variance (Analysis of variance)
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz vymezení důležitých pojmů
Řízení a supervize v sociálních a zdravotnických organizacích
Inference jako statistický proces 1
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regrese.
Lineární regresní analýza
Biostatistika 6. přednáška
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis.
Pohled z ptačí perspektivy
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Statistická významnost a její problémy
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Analýza kvantitativních dat II.
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Základy testování hypotéz
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Inferenční statistika - úvod
Jiří Šafr jiri.safr(zavináč)seznam.cz
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Statistické testování – základní pojmy
Testování hypotéz párový test
Neparametrické testy parametrické a neparametrické testy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
- váhy jednotlivých studií
Neparametrické testy parametrické a neparametrické testy
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
Úvod do induktivní statistiky
příklad: hody hrací kostkou
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Statistika a výpočetní technika
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Quantitative Data Analysis II. UK FHS Historical sociology (2014+) Quantitative Data Analysis II. Statistical hypothesis testing (2): Categorical variables (Chi-square tests of goodness of fit) Jiří Šafr jiri.safr(AT)seznam.cz Last modified 10/12/2014 ® Jiří Šafr, 2014

CONTENT 1. Reminder of Principles of statistical hypothesis testing 3. Categorical data → Chi-square-tests of goodness of fit: Homogeneity of frequencies of categories of one variable (One-dimensional "goodness of fit" test) Association of two variables in contingency table 4. Association within contingency table: Adjusted residual a sign scheme (for more details see adequate presentation)

Principles of statistical hypothesis testing see presentation http://metodykv.wz.cz/QDA2_hypotheses1.ppt

Why do we test hypotheses? (statistical induction) Because we (mostly) operate only with sample data (data from sample surveys) → we need to know, whether (and to which extent) results (parameter estimates) we have measured in the sample are valid in whole population, i.e. whether results from the sample can be generalised to the population. Sourse: [Příručka pro sociology 1980: 218-220]

Statistická kritéria a ověřování hypotéz We assume, that the null hypothesis is true when, probability of the fact that, criterion K will have higher value* than Kkr (i.e. it will be within the critical region) equals to chosen probability → level of statistical significance * for Two-tailed tests in absolute terms Zdroj: [Příručka pro sociology 1980: 218-220]

General principle of acceptance/ rejection of the null hypothesis We select adequate criterion (according the type of variable), We compute observed value KH (from observed empirical data), We choose level of statistical significance (mostly 0,05 or more strict 0,01) In 0the statistical tables we find values of criterion K for chosen level of significance we find critical point KKR If: KH > Kkr → we can‘t confirm (we „reject“) H0 KH < Kkr → we can‘t reject H0 (it is „true“). Alternatively suing statistical software we can compute p-value (see later). We cant use this procedure automaticaly and mechanicaly, because …

H0 rejection: Observed and Critical Value If the calculated value from the statistical test is less than the critical value, then you fail to reject the null hypothesis. Obtained (observed) test statistic < critical (tabulated) value → we can‘t reject H0 → „there are no differences within the population“ (at chosen significance level) K testování hypotéz podrobněji viz [Hendl 2006: 176-188]

Testování hypotéz Statistical hypothesis H0: „no difference“ (variability in sample data is merely random) → via test we assess power of úroof against this assumption H1: alternative, is true, when H0 is rejected „there exist differences / dependencies“ Level of significance α = probability that we will reject H0, when it is in fact true. → „level of our willingness to reconcile with presence of error in our results“. Usually it is arbitrary set to 0,05 or 0,01, which is only convention. Hodnota významnosti p - pravděpodobnost realizace hodnoty testovací statistiky, pokud platí H0. Dosažená hladina hodnoty p < α ukazuje na neplatnost H0. Hodnota p-value vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1 (alternativní hypotézu).

Normální rozložení ukazující hladinu významnosti α = 0,05 Hladinou významnosti rozumíme pravděpodobnost zamítnutí nulové hypotézy, pakliže ve skutečnosti (v základním souboru-populaci) platí. Pokládat hodnotu za významnou na hladině 0,05 znamená, že má pravděpodobnost 0,05 nebo menší, že se vyskytne na jednom z konců normálního rozložení. Poněvadž je rozložení symetrické, jsou oba konce rozložení stejné a hladina významnosti 0,05 znamená useknutí konců ukázané v grafu → vyšrafovaná plocha je pravděpodobnost 0,05/2 = 0,025. Hladina významnosti 0,05 znamená, že u 100 výběrů bude mít 5 z nich větší než očekávanou hodnotu pozorovaného rozdílu způsobenou náhodně. [Köniová a kol. 1988: 140]

Limits of statistical hypothesis testing p-values do not give evidence of the strength of the evidence → apart from other things they are dependent on the sample size! Not rejecting the H0 doesn't imply its proof.

Categorical data Testování rozložení kategorií u jedné proměnné a asociací v kontingenční tabulce

Kontingenční tabulka a statistické testování Statistické míry a testování Nezávislost = oba znaky navzájem neovlivňují v tom, jakých konkrétních hodnot nabývají Homogenita (shodnost struktury) = očekávané četnosti jsou v políčcích každého řádku ve stejném vzájemném poměru bez ohledu na konkrétní volbu řádku → test dobré shody = porovnání očekávaných četností v jednotlivých polích tabulky - za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí - a skutečných četností. Pokud hypotéza nezávislosti (resp. homogenity) platí, má testová statistika přibližně rozdělení Chíkvadrát o (r-1)(s-1) stupních volnosti. Hodnota testové statistiky se tedy porovná s kritickou hodnotou (kvantilem) příslušné hladiny významnosti.

Chí-kvadrát testy: test dobré shody Test pro homogenitu distribucí mezi kategoriemi znaku/ů Pro nominální znaky (i ordinální a kardinální) Nevyžaduje znalost předchozího rozdělení znaku Očekávané-teoretické frekvence lze získat buď z našich dat (u kontingenční tabulky) nebo od jinud, např. z výsledků jiného výzkumu (publikované jako tabulka). Odpovídá na otázku, zda jsou rozdíly mezi empirickými (pozorovanými - fO) četnostmi a teoretickými (očekávanými -fE) četnostmi náhodné nebo ne. Počet stupňů volnosti: df = K -1 K =počet kategorií pro kontingenční tabulku df = (r-1) (s-1) r = počet řádků s = počet sloupců v tabulce

Try it at: http://www.stat.tamu.edu/~west/applets/chisqdemo1.html Test criterion χ2 has the distribution according to the degrees of freedom Try it at: http://www.stat.tamu.edu/~west/applets/chisqdemo1.html

V zásadě existují dvě aplikace Chíkvadrát testu Test dobré shody = Homogenita četností kategorií v rámci jedné proměnné (nebo obecněji odchylka od očekávané/teoretické četnosti) → One-dimensional "goodness of fit" test Na tom si dále vysvětlíme princip 2. Test nezávislosti 2 znaků → Asociace dvou znaků v kontingenční tabulce (3.) Aplikace One-dimensional "goodness of fit" testu s teoretickými četnostmi „od jinud“ (z jiného výzkumu / teorie) → varianta na 1.

Chíkvadrát test odpovídá na otázku, jsou-li rozdíly mezi empirickými a teoretickými četnostmi (ve výběrových datech) náhodné nebo ne.

Chí-kvadrát testy: test dobré shody Test pro homogenitu distribucí mezi kategoriemi znaku/ů test dobré shody = shody relativních četností ni/n a hypotetických pravděpodobností. Pro nominální znaky (i ordinální a kategorizované kardinální) Nevyžaduje znalost předchozího rozdělení znaku Očekávané frekvence: dle rozložení kategorií 1 znaku nebo v kontingenční tabulce vztah 2 znaků Odpovídá na otázku, zda jsou rozdíly mezi empirickými (pozorovanými - fO) četnostmi a teoretickými (očekávanými -fE) četnostmi náhodné nebo ne. (Pozor na to v jakém jazyce vzorec je, anglické a české zkratky znamenají opak: fo může být očekávaná i observed a fe empirická=pozorovaná i expected) Počet stupňů volnosti df = (r-1) (s-1) nebo K - 1 pro jednodim.test r = počet řádků s = počet sloupců v tabulce Nebo také se lze setkat s určením stupňů volnosti df = k - 1 – r, kde k - počet kategorií r - počet parametrů předpokládaného rozdělní, kdy v tabulce třídění 1. stupně je r =2

Obecně: ověřujeme odchylku od očekávané/teoretické četnosti 1. Chí-kvadrát test dobré shody homogenity četností kategorií v rámci jedné proměnné Obecně: ověřujeme odchylku od očekávané/teoretické četnosti Očekávané-teoretické četnosti určujeme buď na základě rozložení v datovém souboru nebo dle „teorie“, např. porovnání s hodnotou z jiného výzkumu

Například: shodné zastoupení kategorií věku 1. Test dobré shody - jednodimenzionální Chí-kvadrát test: Shoda s teoretickými četnostmi Hypotéza o rovnoměrném zastoupení kategorií 1. znaku. Například: shodné zastoupení kategorií věku Pozorované absolutní četnosti kategorií věku (tabulka třídění 1.stupně, absolutní četnosti): 1. Velmi nízký 5 2. Střední 10 3. Vysoký 9 Celkem 24 H0: počet respondentů je ve všech kategoriích stejný Očekávané (teoretické) četnosti = 24 : 3 = 8. Zdroj: [Příručka pro sociology 1980: 221-222]

1. Chí-kvadrát test pro homogenitu kategorií uvnitř jednoho znaku H0: Počet respondentů je ve všech kategoriích stejný. → Ověřujeme model stejných pravděpodobností (equal probabibilities) Příklad. pozorované absolutní četnosti kategorií: Očekávané (teoretické) četnosti = 24 : 3 = 8 → Stejná proporce zastoupení kategorií (33,3 % / 33,3 % / 33,3 %) Pozorované: Očekávané: Vypočítanou hodnotu χ2 porovnáme s kritickou hodnotou z tabulek (viz dále) Zdroj: [Příručka pro sociology 1980: 221-222]

Jednodimenzionální Chí-kvadrát test dobré shody Nulová hypotéza vyjadřuje očekávání, že pozorované a očekávané četnosti se neliší. Určení stupňů volnosti df = k - 1 k - počet kategorií Kritický bod z tabulky statistické významnosti pro hladinu statistické významnosti Alpha 0,05 Pokud vypočítaná χ2 < χ2 kritická hodnota→ nelze zamítnout H0 (= četnosti jsou mezi kategoriemi stejné).

Zpět do příkladu Kritickou hodnotu χ2 najdeme pro v tabulkách pro zvolenou hladinu významnosti α a počtu stupňů volnosti df zde: df = k – 1 kde k počet kategorií znaku a r je počet parametrů předpokládaného rozdělení, které hodnotíme na základě výběrového souboru (např. pro normální rozdělení dva parametry: μ a s2) Zde je to 3 kategorie znaku a 1 parametr (relativ. podíl): df = 3 – 1 = 2 Najdeme tabulkovou kritickou hodnotu χ2krit = 5,991 (viz dále) Protože ta je vyšší než námi naměřená χ2 = 1,74 → rozložení četností odpovídá H0 → nemůžeme H0 zamítnout, tj. rozdíly mezi skupinami v populaci nejsou. Obecně v kontingenční tabulce (pro dva znaky) je počet stupňů volnosti df = (r-1) (s-1) (viz dále) r = počet řádků s = počet sloupců v tabulce

Určení kritické hodnoty χ2 v tabulce Hladina významnosti (α) Stupeň volnosti

a nebo vyhodnocení podle hodnoty významnosti p-value Spočítali jsme: Chisq = 1,74 df =2 Při převodu testovací statistiky (zde Chisq) na p-hodnotu hledáme plochu pod normální křivkou pro hodnoty nad námi naměřenou hodnotou (zde 1,74). V grafu tak odečteme: Plochy pod hustotou na obou stranách rozdělení - každá má velikost 0,2095 násobíme 2x, protože jde o dvoustranný test (musíme brát v úvahu oba konce statistiky) p-hodnota = 0,2095 x 2 = 0,419 Ta je vyšší než 0,05 proto nulovou hypotézu nemůžeme zamítnout. Výpočet lze znázornit na: http://www.stat.tamu.edu/~west/applets/chisqdemo.html P-hodnotu nám spočítá většina statistických programů (včetně aplikací pro mobilní telefony). p-hodnota je pravděpodobnost výskytu námi spočtené hodnoty testové statistiky, za předpokladu, že platí nulová hypotéza. Vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1. Více k principu hladiny významnosti při testování hypotéz viz [Hendl 2009: 181-191], pro Chíkvadrát test [314-323].

Chí-kvadrát test → test nezávislosti polí v tabulce Nulová hypotéza „o nezávislosti“ odpovídá na otázku, zda jsou rozdíly mezi empirickými-pozorovanými a teoretickými četnostmi náhodné nebo ne. Očekávané četnosti lze získat z hodnot v populaci nebo porovnávat s teoretickou hodnotou, např. z jiného výzkumu. Nejčastěji třídíme údaje podle dvou nebo více znaků v kontingenční tabulce. (viz dále) Lze aplikovat na již existující agregovaná data (publikované tabulky apod.) Výpočet v SPSS pomocí NPar Tests (viz dále příklady) Příklad: porovnání vzdělanostní struktury v kohortě 50-64letých a 65-79letých (data ISSP 2007)

2. Chí-kvadrát test pro asociaci dvou znaků v kontingenční tabulce Testování rozdílu 2 či více empirických četností → hypotéza homogenity (nezávislost mezi zkoumanými znaky) Očekávané-teoretické četnosti → předpoklad nezávislosti četností znaku A a B, určujeme je na základě rozložení v datovém souboru: jsou dány marginálními distribucemi sledovaných znaků Řešíme podobný problém jako v analýze rozptylu (porovnání shody průměrů v podskupinách).

Testem porovnáváme 2 či více skupin empirických četností mezi sebou Testem porovnáváme 2 či více skupin empirických četností mezi sebou. Cílem je zjistit, zda se skupiny (hodnoty nezávislého znaku) ve svých četnostech výskytu sledovaného kategoriálního - závislého znaku liší.

Příklad: Čtení knih a vzdělání Očekávaná četnost pro dané políčko = násobek odpovídajících marginálních četností vydělíme celkovou sumou četností Např. pro fE11 je 645*173/1202 = 92,8 Postup pro ruční výpočet CROSSTABS q1_d BY vzd3 /CELLS COUNT EXPECTED / STATIST CHISQ. Zdroj: data ISSP 2007, ČR (neváženo)

V SPSS: Očekávané četnosti (Expected count) a empirické (=absolutní) četnosti (Count) Příklad: Čtení knih a vzdělání Zdroj: data ISSP 2007, ČR (neváženo)

Příklad: Čtení knih a vzdělání df = (5-1)(3-1) = 8 při Alpha 0,05 naměřená hodnota χ2 = 112,17 > χ2krit = 15,507 → nemůžeme přijmout (zamítáme) H0 „o nezávislosti“, tj., že ve čtení nejsou rozdíly mezi vzdělanostními kategoriemi → alespoň u jedné kategorie (buňce v tabulce) v porovnání s ostatními kategoriemi tabulky se liší očekávané od empirických četností (Test říká, že tuto skutečnost nalezneme s 95 % jistotou v celé populaci.) Místo porovnání hodnoty testovacího kritéria s kritickými – tabulkovými hodnotami se pro rozhodování o nulové hypotéze používá také p-hodnota, či significance kterou zjistíme pomocí statistického software (princip viz dále). p < α zamítáme H0 p > α nelze zamítnout H0

P-value – úroveň statistické významnosti (level of significance) Hodnota p-value vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1 (alternativní hypotézu). Ve výstupech SPSS: Asymp. Sig. (2-sided) Formálně tedy stačí porovnat zvolené α s vypočtenou hodnotou p a zamítnout H0, pokud α > p, a naopak α < p. Výstupy z počítačových programů bohužel svádí k tomu, abychom hladinu α předem nevolili a hodnotili věrohodnost hypotéz až podle vypočtené hodnoty p. [Hebák 1995: 84-85] Hladina významnosti α = pravděpodobnost, že zamítneme H0, ačkoliv ona platí. → „míra naší ochoty smířit se s výskytem chyby“.

Zpět do příkladu p-value – úroveň statistické významnosti Chis = 112.2 df = 8

Kontingenční tabulka a testy dobré shody – pozor na: Pro použití testů založených na testu dobré shody (test nezávislosti nebo homogenity) je třeba, aby se v tabulce nevyskytlo méně než 20 % políček, v nichž by očekávané četnosti byly menší než 5. V případě, že se tak stane, můžeme zvážit transformaci — sloučení některých méně obsazených kategorií (např. "ano" a "spíše ano"). Testování hypotéz můžeme provádět pouze na výběrovém souboru, tj. ne na celé populaci (census), navíc data musí být pořízena náhodným výběrem.

Kontingenční tabulka - vyjádření vztahů kategorií Statistika Chíkvadrát nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa. Pro zjištění síly vztahu → - koeficienty asociace (obdobné korelaci, např. CC), - znaménkové schéma – adjustovaná residua - podíl šancí (OR), - u ordinálních veličin korelační koef. dle pořadí. Odlišné testy pro nominální a ordinální proměnné (jedna / obě).

viz presentaci http://metodykv.wz.cz/AKD2_kontg_tab2.ppt Pro zjištění síly vztahu v kontingenční tabulce – míry asociace (příp. pořadové korelace) viz presentaci http://metodykv.wz.cz/AKD2_kontg_tab2.ppt

Vícerozměrná analýza & statistické testování hypotéz Vztahy mezi dvěma a více proměnnými

Úkoly k procvičení v SPSS Data ISSP 2007 Souvisí čtení knih (q1_d) s věkem (vekkat)? Liší se pocit, že je člověk uspěchaný ve volném čase (q5a_b) v závislosti na typu lokality, kde bydlí (S21)?

Další příklady výpočtu Chíkvadrátu pro vztah dvou proměnných

příklad Chí-kvadrát testu (2-dim) Kouření marihuany u žáků 9 a 12 třídy Zdroj: [Thyer, B. A. 2001.The Handbook of SOCIAL WORK RESEARCH METHODS.]

Příklad Chí-kvadrát test: pozorované a teoretické četnosti, stupně volnosti

Příklad Chí-kvadrát test: Výpočet 2x2 tabulka je rozepsána jako „had“ v řádcích Chíkvadrát kritický z tabulek > Chíkvadrát dosažený (naměřený) → Ho nelze zamítnout = homogenita mezi kategoriemi

Pouhý celkový test homogenity polí kontingenční tabulky sociologovi ovšem nestačí. A tedy co dál? U kterých kategorií je v kontingenční tabulce souvislost silnější a u kterých slabší? Viz presentace Kontingenční tabulka: vztahy mezi kategorizovanými znaky http://metodykv.wz.cz/AKD2_kontg_tab2.ppt

Adjustovaná residua Znaménkové schéma CROSSTABS: Adj. standardised (v SPSS / PSPP) Adjustovaná residua Residuum v daném políčku tabulky (=pozorovaná (observed) minus očekávaná (expected) hodnota) dělený odhadem vlastní standardní chyby. Odpovídající standardizovaný residuál je vyjádřen v jednotkách směrodatné odchylky nad nebo pod průměrem. Znaménkové schéma → jednoduchá vizualizace 'kde abs(z) >= 3.29 nahradí +++ resp. ---, 'kde abs(z) >= 2.58 nahradí ++ resp. --, 'kde abs(z) >= 1.96 nahradí + resp. -. Podrobněji viz prezentaci AKD2_kontg_tab2.ppt http://metodykv.wz.cz/AKD2_kontg_tab2.ppt

Znaménkové schéma Kritérium v daném políčku tabulky (Adjustované residuum) označuje významnost rozdílu mezi empirickým zjištěnou četností a teoretickou (očekávanou) četností. Umožňuje rychlou orientaci mezi dvěma znaky.

Více viz AKD2_kontg_tab2.ppt http://metodykv.wz.cz/AKD2_kontg_tab2.ppt Test odchylky od nezávislosti v poli tabulky: Adjustovaná residua a znaménkové schéma Více viz AKD2_kontg_tab2.ppt http://metodykv.wz.cz/AKD2_kontg_tab2.ppt

Procvičit v SPSS 0. kontrola absolutních četností v jednotlivých polích → transformace (sloučení) 1. správně orientovaná procenta 2. chíkvadrát test nezávislosti (tabulky jako celku) 3. adjustovaná residua a znaménkové schéma k detekování významných odchylek Úkol: Pohlaví a volil v 2006 Náboženské vyznání x Volil 2006 Náboženské vyznání x Velikost bydliště Náboženské vyznání x Velikost bydliště x Volil 2006

Úkoly k procvičení v SPSS (data ISSP 2007) 2 x 2 tabulky: Pohlaví a Volil v 2006 Pohlaví a Vzdělání n x n tabulky: Velikost bydliště x Vzdělání → sloučení nebo pro vybraná pole tabulky

S tříděním druhého stupně bychom se neměli spokojit S tříděním druhého stupně bychom se neměli spokojit. → Třídění třetího stupně a elaborace vztahů viz prezentace: Kontingenční tabulka: vztahy mezi kategorizovanými znaky (AKD2_kontg_tab2.ppt) a Standardizace v kontingenční tabulce – kontrola vlivu 3 faktoru (AKD2_kontg_tab_standardizace.ppt) http://metodykv.wz.cz/AKD2_kontg_tab_standardizace.ppt

Vyloučení (posouzení) vlivu třetí proměnné → Třídění 3 stupně Kontingenční tabulka A x B x C Příklad pro tři proměnné: Volil (závislá) x VŠ (nezávislá-vysvětlující) x Pohlaví (nezávislá kontrolní) → Sledujeme vztah mezi A a B odděleně v kategoriích C, nejjednodušeji pomocí koeficientů asociace/korelace (kontingenční koef., Cramérovo V, Phi,… pořadové korelace Spermanovo Rho, TauB), detailněji pak klasicky % rozdíly mezi kategoriemi nebo adjustovaná residua. Parciální korelace – pro spojité proměnné Multivariační metody (např. regresní analýza, vícerozměrná analýza rozptylu ANOVA)

3. Chíkvadrát test pro četnosti kategorií v rámci jedné proměnné (One-dimensional "goodness of fit" test) aneb, když máme teoretické-očekávané hodnoty odjinud než z očekávaných hodnot z distribuce v našich datech

One-dimensional "goodness of fit" test Cílem je ověřit hypotézu o shodnosti četností kategorií u jedné proměnné od jiného určitého očekávaného-teoretického rozložení, které je dáno informací mimo naše data, kupříkladu teorií nebo předchozími výsledky z jiného výzkumu (časově / mezinárodně).

One-dimensional "goodness of fit" test Situace je stejná jako u prvního příkladu s testem rovnoměrného zastoupení kategorií jednoho znaku Ale místo očekávané četnosti dané rovnoměrným zastoupením kategorií vstupujeme s teoretickými četnostmi, např. z předchozího výzkumu. V SPSS je situace pomocí NPAR TEST složitější: vstoupit s tabelárními daty je obtížné (viz finta DATA ENTRY s pomocí vážení vyjadřujícím podíly v syntaxu) Existují ale nástroje pro analýzu tabelárních dat (tj. pro agregované výsledky) http://vassarstats.net/csfit.html

One-dim Chí-kvadrát test: v SPSS NPar Tests Příklad 1 One-dim Chí-kvadrát test: v SPSS NPar Tests Příklad 1. Očekávané četnosti reprezentují rovnoměrné zastoupení kategorií (EQUAL) Testujeme hypotézu H0: kategorie vzdělání mají stejné zastoupení. FILTER BY Fi_50_64. NPAR TESTS /CHISQUARE=vzd4 /EXPECTED=EQUAL /STATISTICS DESCRIPTIVES. Zdroj: data ISSP 2007, ČR (věk 50-64)

One-dim Chí-kvadrát test: Příklad 2 One-dim Chí-kvadrát test: Příklad 2. Změna v čase (máme pouze výsledky nikoliv data) Teoretickou četností zde hodnota z předchozí etapy (výzkumu) → změna 2007-2010 (nikoliv poměrové rozložení v jednom souboru). Testujeme nulovou hypotézu, že struktura názorů se mezi roky 2007 a 2010 nezměnila. V obou výzkumech byla velikost souboru n = 100 (tj. nejedná se o procenta). Df = k-1 = 3-1 Х2 = 1,64 (df 2) < 5,99 tabulková hodnota (pro df 2 a α 5 %) (p = 0,4404 výpočet na http://vassarstats.net/csfit.html ) Vypočítaná hodnota Chisq je menší než tabulková-kritická hodnota. H0 o "nerozdílu„ nezamítáme (rozdíl v četnostech je způsoben náhodnými faktory).

Příklad 2. Výpočet pomocí aplikace http://vassarstats.net/csfit.html

NPAR TESTS /CHISQUARE =vzd4 /EXPECTED= 67 174 93 22 One-dim Chí-kvadrát test: v SPSS NPar Tests Příklad 3a. Porovnání „v čase“ (mezi kohortami) Porovnání proměny vzdělanostní struktury mezi kohortami 50-64 a 65-79 letých. → kohorta 65-79 představuje teoretické-očekávané hodnoty (info o očekávané četnosti zde máme z jednoho výzkumu, ale pro různé podskupiny věku, i proto filtr 50-64) FILTER BY Fi_50_64. /* v tomto případě musíme filtrovat jen pro věk 50-64. NPAR TESTS /CHISQUARE =vzd4 /EXPECTED= 67 174 93 22 /STATISTICS DESCRIPTIVES /MISSING ANALYSIS. Pozor: Zadáváme absolutní četnosti a v tomto případě musíme mít vypnuté vážení (WEIGHT OFF) a hodnoty musíme mít převážené na stejnou velikost jednoho z výběrů, tj. absolutní hodnoty očekávaných a empirických hodnot musí mít stejný základ (zde je to přepočítáno pomocí váhy). V tomto příkladu máme mikrodata (jednotlivé případy=respondenty v datech) pro věkovou kategorii 50-64 let a jejich vzdělanostní zastoupení testujeme proti teoretickým hodnotám pro věkovou kategorii 65-79, které máme také z těchto dat, ale už jako agregovaný výstup (tabulka třídění 1./2. stupně FREQ / CROSST).   50 - 64 let 65 - 79 let váha 65-79 let převáženo ZŠ 48 52 1,29 67 VYUČ 165 135 174 SŠ 125 72 93 VŠ 17 22 Celkem 355 276 váha = 355/276 Zdroj: data ISSP 2007, ČR (věk 50-64)

Příklad 3a: NPar Tests – očekávané četnosti reprezentují jiný (pod)soubor - Output Porovnáváme empirickou = pozorovanou (Observed) strukturu četností (zde věková kohorta 50-54 let) s teoretickou = očekávanou (Expected), kterou zde reprezentuje věková kohorta 65-79 let (převážená na celkovou velikost kohorty 50-54). H0: struktura četností je shodná. H0 zamítáme (p < 0,05). Vzdělanostní struktura věkových kohort 50-54 let a 65-79 let není shodná. Residua ukazují, že největší rozdíl je u stupně SŠ a dále u ZŠ. Zdroj: data ISSP 2007, ČR (věk 50-64)

One-dimensional "goodness of fit" test Jiné statistické balíky mají možnost vstupu s tabelárními daty (např. kontingenční tabulka), http://vassarstats.net/csfit.html v SPSS můžeme pouze složitě načíst tabulku jako vážená data (pomocí váhy definujeme frekvence polí v tabulce) viz http://metodykv.wz.cz/syntaxy/data_input.sps Očekávané četnosti (Expected values) zde lze vkládat buď jako absolutní četnosti (Exp. Frequency) nebo i jako podíly, tj. procenta (Exp. Proportion). Pozorované (Observed) četnosti musí být zadány jako absolutní hodnoty.

Příklad 3a: výpočet pomocí aplikace http://vassarstats.net/csfit.html

One-dimensional "goodness of fit" test Příklad 3b One-dimensional "goodness of fit" test Příklad 3b. – Porovnání distribuce vzdělanostních kategorií ve dvou věkových kohortách. Vstupní data (absolutní četnosti): vzdělání v kohortě 1945-50 (= očekávaná-teoretická četnost) a kohortě 1951-56 (= empirická „námi naměřená“ četnost). Ověřujeme nulovou hypotézu H0: Vzdělanostní struktura se mezi kohortami 45-50 a 51-56 neproměnila. Jinými slovy, distribuce četností kategorií vzdělání je pro sledované kohorty stejná. Poznámka: Zde v příkladech 3a a 3b máme (retrospektivní) informaci z jednoho výzkumu, nicméně pro dvě podskupiny. Tím tak pouze simulujeme situaci, kdybychom porovnávali kohorty zkoumané v odlišných dobách resp. výzkumech (naše data tak samozřejmě nejsou zcela přesná). Zdroj: data ISSP 2007, ČR (neváženo)

Ale příkaz NPAR TESTS v SPSS pracuje i s pravděpodobnostmi (%). Příklad 3b. Pozor: Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných četností → nejprve přepočítat – převážit Ale příkaz NPAR TESTS v SPSS pracuje i s pravděpodobnostmi (%). Zdroj: data ISSP 2007, ČR

One-dimensional "goodness of fit" test. Příklad 3b One-dimensional "goodness of fit" test. Příklad 3b. Řešení v SPSS Chi-Square Test pomocí NPAR TESTS Poznámka: zde provádíme výpočet pro kohortu 1951-56 na původních individuálních datech a tu porovnáváme s očekávanými četnostmi v kohortě 1945-50 (64 18 5), které jsme si spočítali dříve pomocí např. CROSSTABS (tím vlastně simulujeme data z jiné doby - výzkumu). Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných (Observed) četností! *nejprve zapneme filtr pro kohortu 1951-56. FILTER BY vek18_1951_56. NPAR TESTS /CHISQUARE = vzd3 /EXPECTED = 64 18 5 /STATISTICS DESCRIPTIVES /MISSING ANALYSIS. Dosažená p hodnota je hraniční, tabulkový Chíkvadrát je χ2krit = 5,991 Proto raději hypotézu H0 (shoda s teoretickými četnostmi) nezamítneme.

Příklad 3b. Dtto na tabulárních datech pomocí aplikace http://vassarstats.net/csfit.html Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných (Observed) četností - musí být shodné celkové velikosti souborů, což zde není (viz další snímek).

Příklad 3b. Ale pozor: Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných četností http://vassarstats.net/csfit.html Příkaz NPAR v SPSS to přepočítá automaticky, zde musíme převážit na velikost pozorovaných četností (Observed) sami (např. v Excelu)

Neparametrické testy (Non-parametric Tests) Parametrické metody předpokládají: náhodný výběr, normální rozdělní (distribuce znaku), velké výběry z populace, známé (shodné) rozptyly v sub/populacích, z nichž byl proveden výběr Neparametrické metody: - nezávislé na rozdělní - méně citlivé na odchylky extrémních hodnot i pro výběry velmi malého rozsahu vhodné pro nominální i ordinální znaky Ale dochází častěji k chybnému nezamítnutí nepravdivé H0. Např. Chí-kvadrát testy, binomický test, testy středních hodnot (Mann-Whitney, Kruskal-Wallis atd.)

Webové nástroje pro analýzu Index of On-line Stats Calculators (rozcestí) http://www.physics.csbsju.edu/stats/Index.html Exact r×c Contingency Table: http://www.physics.csbsju.edu/stats/exact_NROW_NCOLUMN_form.html Statistical Calculations http://statpages.org/ R. Webster West applets http://www.stat.tamu.edu/~west/ http://www.stat.tamu.edu/~west/ph/ VassarStats: Website for Statistical Computation http://vassarstats.net Chi-Square "Goodness of Fit" Test http://vassarstats.net/csfit.html Učebnice: Interstat - hypertextová interaktivní učebnice statistiky pro ekonomy http://www.stahroun.me.cz/interstat/ Statnotes: Topics in Multivariate Analysis, by G. David Garson http://faculty.chass.ncsu.edu/garson/PA765/index.htm StatSoft - Elektronická učebnice statistiky (anglicky) http://www.statsoft.cz/page/index2.php?pg=navigace&nav=31 http://www.statsoft.com/textbook/