Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Quantitative Data Analysis II. Statistical hypothesis testing (2): Categorical variables (Chi-square tests of goodness of fit) Jiří Šafr jiri.safr(AT)seznam.cz.

Podobné prezentace


Prezentace na téma: "Quantitative Data Analysis II. Statistical hypothesis testing (2): Categorical variables (Chi-square tests of goodness of fit) Jiří Šafr jiri.safr(AT)seznam.cz."— Transkript prezentace:

1 Quantitative Data Analysis II. Statistical hypothesis testing (2): Categorical variables (Chi-square tests of goodness of fit) Jiří Šafr jiri.safr(AT)seznam.cz Last modified 10/12/2014 UK FHS Historical sociology (2014+) ® Jiří Šafr, 2014

2 CONTENT 1. Reminder of Principles of statistical hypothesis testing 3. Categorical data → Chi-square-tests of goodness of fit: –Homogeneity of frequencies of categories of one variable (One- dimensional "goodness of fit" test) Association of two variables in contingency table 4. Association within contingency table : Adjusted residual a sign scheme (for more details see adequate presentation)

3 Principles of statistical hypothesis testing see presentation

4 Why do we test hypotheses ? (statistical induction) Because we (mostly) operate only with sample data (data from sample surveys) → we need to know, whether (and to which extent) results (parameter estimates) we have measured in the sample are valid in whole population, i.e. whether results from the sample can be generalised to the population. Sourse: [Příručka pro sociology 1980: ]

5 Statistická kritéria a ověřování hypotéz We assume, that the null hypothesis is true when, probability of the fact that, criterion K will have higher value* than K kr (i.e. it will be within the critical region) equals to chosen probability → level of statistical significance * for Two-tailed tests in absolute terms Zdroj: [Příručka pro sociology 1980: ]

6 General principle of acceptance/ rejection of the null hypothesis 1.We select adequate criterion (according the type of variable), 2.We compute observed value K H (from observed empirical data), 3.We choose level of statistical significance (mostly 0,05 or more strict 0,01) 4.In 0the statistical tables we find values of criterion K for chosen level of significance we find critical point K KR 5.If: K H > K kr → we can‘t confirm (we „reject“) H0 K H < K kr → we can‘t reject H0 (it is „true“). Alternatively suing statistical software we can compute p-value (see later). We cant use this procedure automaticaly and mechanicaly, because …

7 H0 rejection: Observed and Critical Value If the calculated value from the statistical test is less than the critical value, then you fail to reject the null hypothesis. Obtained (observed) test statistic < critical (tabulated) value → we can‘t reject H0 → „there are no differences within the population“ (at chosen significance level) K testování hypotéz podrobněji viz [Hendl 2006: ]

8 Testování hypotéz Statistical hypothesis H0: „no difference“ (variability in sample data is merely random) → via test we assess power of úroof against this assumption H1: alternative, is true, when H0 is rejected „there exist differences / dependencies“ Level of significance α = probability that we will reject H0, when it is in fact true. → „level of our willingness to reconcile with presence of error in our results“. Usually it is arbitrary set to 0,05 or 0,01, which is only convention. Hodnota významnosti p - pravděpodobnost realizace hodnoty testovací statistiky, pokud platí H0. Dosažená hladina hodnoty p < α ukazuje na neplatnost H0. Hodnota p-value vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1 (alternativní hypotézu).

9 Normální rozložení ukazující hladinu významnosti α = 0,05 Hladinou významnosti rozumíme pravděpodobnost zamítnutí nulové hypotézy, pakliže ve skutečnosti (v základním souboru-populaci) platí. Pokládat hodnotu za významnou na hladině 0,05 znamená, že má pravděpodobnost 0,05 nebo menší, že se vyskytne na jednom z konců normálního rozložení. Poněvadž je rozložení symetrické, jsou oba konce rozložení stejné a hladina významnosti 0,05 znamená useknutí konců ukázané v grafu → vyšrafovaná plocha je pravděpodobnost 0,05/2 = 0,025. Hladina významnosti 0,05 znamená, že u 100 výběrů bude mít 5 z nich větší než očekávanou hodnotu pozorovaného rozdílu způsobenou náhodně. [Köniová a kol. 1988: 140]

10 Limits of statistical hypothesis testing p-values do not give evidence of the strength of the evidence → apart from other things they are dependent on the sample size! Not rejecting the H0 doesn't imply its proof.

11 Categorical data Testování rozložení kategorií u jedné proměnné a asociací v kontingenční tabulce

12 Kontingenční tabulka a statistické testování Statistické míry a testování Nezávislost = oba znaky navzájem neovlivňují v tom, jakých konkrétních hodnot nabývají Homogenita (shodnost struktury) = očekávané četnosti jsou v políčcích každého řádku ve stejném vzájemném poměru bez ohledu na konkrétní volbu řádku → test dobré shody = porovnání očekávaných četností v jednotlivých polích tabulky - za předpokladu, že hodnoty obou sledovaných znaků na sobě nezávisí - a skutečných četností. Pokud hypotéza nezávislosti (resp. homogenity) platí, má testová statistika přibližně rozdělení Chíkvadrát o (r- 1)(s-1) stupních volnosti. Hodnota testové statistiky se tedy porovná s kritickou hodnotou (kvantilem) příslušné hladiny významnosti.

13 Chí-kvadrát testy: test dobré shody Test pro homogenitu distribucí mezi kategoriemi znaku/ů Pro nominální znaky (i ordinální a kardinální) Nevyžaduje znalost předchozího rozdělení znaku Očekávané-teoretické frekvence lze získat buď z našich dat (u kontingenční tabulky) nebo od jinud, např. z výsledků jiného výzkumu (publikované jako tabulka). Odpovídá na otázku, zda jsou rozdíly mezi empirickými (pozorovanými - f O ) četnostmi a teoretickými (očekávanými -f E ) četnostmi náhodné nebo ne. Počet stupňů volnosti: df = K -1 K =počet kategorií pro kontingenční tabulku df = (r-1) (s-1) r = počet řádků s = počet sloupců v tabulce

14 Test criterion χ 2 has the distribution according to the degrees of freedom Try it at:

15 V zásadě existují dvě aplikace Chíkvadrát testu 1.Test dobré shody = Homogenita četností kategorií v rámci jedné proměnné (nebo obecněji odchylka od očekávané/teoretické četnosti) → One-dimensional "goodness of fit" test Na tom si dále vysvětlíme princip 2. Test nezávislosti 2 znaků → Asociace dvou znaků v kontingenční tabulce (3.) Aplikace One-dimensional "goodness of fit" testu s teoretickými četnostmi „od jinud“ (z jiného výzkumu / teorie) → varianta na 1.

16 Chíkvadrát test odpovídá na otázku, jsou-li rozdíly mezi empirickými a teoretickými četnostmi (ve výběrových datech) náhodné nebo ne.

17 Chí-kvadrát testy: test dobré shody Test pro homogenitu distribucí mezi kategoriemi znaku/ů test dobré shody = shody relativních četností ni/n a hypotetických pravděpodobností. Pro nominální znaky (i ordinální a kategorizované kardinální) Nevyžaduje znalost předchozího rozdělení znaku Očekávané frekvence: dle rozložení kategorií 1 znaku nebo v kontingenční tabulce vztah 2 znaků Odpovídá na otázku, zda jsou rozdíly mezi empirickými (pozorovanými - f O ) četnostmi a teoretickými (očekávanými -f E ) četnostmi náhodné nebo ne. (Pozor na to v jakém jazyce vzorec je, anglické a české zkratky znamenají opak: f o může být očekávaná i observed a f e empirická=pozorovaná i expected) Počet stupňů volnosti df = (r-1) (s-1) nebo K - 1 pro jednodim.test r = počet řádků s = počet sloupců v tabulce Nebo také se lze setkat s určením stupňů volnosti df = k - 1 – r, kde k - počet kategorií r - počet parametrů předpokládaného rozdělní, kdy v tabulce třídění 1. stupně je r =2

18 1. Chí-kvadrát test dobré shody homogenity četností kategorií v rámci jedné proměnné Obecně: ověřujeme odchylku od očekávané/teoretické četnosti Očekávané-teoretické četnosti určujeme buď na základě rozložení v datovém souboru nebo dle „teorie“, např. porovnání s hodnotou z jiného výzkumu

19 1. Test dobré shody - jednodimenzionální Chí-kvadrát test: Shoda s teoretickými četnostmi Hypotéza o rovnoměrném zastoupení kategorií 1. znaku. Například: shodné zastoupení kategorií věku Pozorované absolutní četnosti kategorií věku (tabulka třídění 1.stupně, absolutní četnosti): 1. Velmi nízký5 2. Střední10 3. Vysoký9 Celkem24 H0: počet respondentů je ve všech kategoriích stejný Očekávané (teoretické) četnosti = 24 : 3 = 8. Zdroj: [Příručka pro sociology 1980: ]

20 1. Chí-kvadrát test pro homogenitu kategorií uvnitř jednoho znaku H0: Počet respondentů je ve všech kategoriích stejný. → Ověřujeme model stejných pravděpodobností (equal probabibilities) Příklad. pozorované absolutní četnosti kategorií: Očekávané (teoretické) četnosti = 24 : 3 = 8 Vypočítanou hodnotu χ 2 porovnáme s kritickou hodnotou z tabulek (viz dále) Zdroj: [Příručka pro sociology 1980: ] Pozorované: Očekávané: → Stejná proporce zastoupení kategorií (33,3 % / 33,3 % / 33,3 %)

21 Jednodimenzionální Chí-kvadrát test dobré shody Nulová hypotéza vyjadřuje očekávání, že pozorované a očekávané četnosti se neliší. Určení stupňů volnosti df = k - 1 k - počet kategorií Kritický bod z tabulky statistické významnosti pro hladinu statistické významnosti Alpha 0,05 Pokud vypočítaná χ 2 < χ 2 kritická hodnota→ nelze zamítnout H0 (= četnosti jsou mezi kategoriemi stejné).

22 Zpět do příkladu Kritickou hodnotu χ 2 najdeme pro v tabulkách pro zvolenou hladinu významnosti α a počtu stupňů volnosti df zde: df = k – 1 kde k počet kategorií znaku a r je počet parametrů předpokládaného rozdělení, které hodnotíme na základě výběrového souboru (např. pro normální rozdělení dva parametry: μ a s 2 ) Zde je to 3 kategorie znaku a 1 parametr (relativ. podíl): df = 3 – 1 = 2 Najdeme tabulkovou kritickou hodnotu χ 2 krit = 5,991 (viz dále) Protože ta je vyšší než námi naměřená χ 2 = 1,74 → rozložení četností odpovídá H0 → nemůžeme H0 zamítnout, tj. rozdíly mezi skupinami v populaci nejsou. Obecně v kontingenční tabulce (pro dva znaky) je počet stupňů volnosti df = (r-1) (s-1) (viz dále) r = počet řádků s = počet sloupců v tabulce

23 Určení kritické hodnoty χ2 v tabulce Stupeň volnosti Hladina významnosti (α)

24 a nebo vyhodnocení podle hodnoty významnosti p-value Spočítali jsme: Chisq = 1,74 df =2 Při převodu testovací statistiky (zde Chisq) na p-hodnotu hledáme plochu pod normální křivkou pro hodnoty nad námi naměřenou hodnotou (zde 1,74). V grafu tak odečteme: Plochy pod hustotou na obou stranách rozdělení - každá má velikost 0,2095 násobíme 2x, protože jde o dvoustranný test (musíme brát v úvahu oba konce statistiky) p-hodnota = 0,2095 x 2 = 0,419 Ta je vyšší než 0,05 proto nulovou hypotézu nemůžeme zamítnout. Výpočet lze znázornit na: P-hodnotu nám spočítá většina statistických programů (včetně aplikací pro mobilní telefony). Více k principu hladiny významnosti při testování hypotéz viz [Hendl 2009: ], pro Chíkvadrát test [ ]. p-hodnota je pravděpodobnost výskytu námi spočtené hodnoty testové statistiky, za předpokladu, že platí nulová hypotéza. Vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1.

25 Chí-kvadrát test → test nezávislosti polí v tabulce Nulová hypotéza „o nezávislosti“ odpovídá na otázku, zda jsou rozdíly mezi empirickými- pozorovanými a teoretickými četnostmi náhodné nebo ne. Očekávané četnosti lze získat z hodnot v populaci nebo porovnávat s teoretickou hodnotou, např. z jiného výzkumu. Nejčastěji třídíme údaje podle dvou nebo více znaků v kontingenční tabulce. (viz dále) Lze aplikovat na již existující agregovaná data (publikované tabulky apod.) Výpočet v SPSS pomocí NPar Tests (viz dále příklady) Příklad: porovnání vzdělanostní struktury v kohortě letých a 65-79letých (data ISSP 2007)

26 2. Chí-kvadrát test pro asociaci dvou znaků v kontingenční tabulce Testování rozdílu 2 či více empirických četností → hypotéza homogenity (nezávislost mezi zkoumanými znaky) Očekávané-teoretické četnosti → předpoklad nezávislosti četností znaku A a B, určujeme je na základě rozložení v datovém souboru: jsou dány marginálními distribucemi sledovaných znaků Řešíme podobný problém jako v analýze rozptylu (porovnání shody průměrů v podskupinách).

27 Testem porovnáváme 2 či více skupin empirických četností mezi sebou. Cílem je zjistit, zda se skupiny (hodnoty nezávislého znaku) ve svých četnostech výskytu sledovaného kategoriálního - závislého znaku liší.

28 Příklad: Čtení knih a vzdělání Očekávaná četnost pro dané políčko = násobek odpovídajících marginálních četností vydělíme celkovou sumou četností Např. pro f E 11 je 645*173/1202 = 92,8 Postup pro ruční výpočet Zdroj: data ISSP 2007, ČR (neváženo) CROSSTABS q1_d BY vzd3 /CELLS COUNT EXPECTED / STATIST CHISQ.

29 V SPSS: Očekávané četnosti (Expected count) a empirické (=absolutní) četnosti (Count) Příklad: Čtení knih a vzdělání Zdroj: data ISSP 2007, ČR (neváženo)

30 Příklad: Čtení knih a vzdělání df = (5-1)(3-1) = 8 při Alpha 0,05 naměřená hodnota χ 2 = 112,17 > χ 2 krit = 15,507 → nemůžeme přijmout (zamítáme) H0 „o nezávislosti“, tj., že ve čtení nejsou rozdíly mezi vzdělanostními kategoriemi → alespoň u jedné kategorie (buňce v tabulce) v porovnání s ostatními kategoriemi tabulky se liší očekávané od empirických četností (Test říká, že tuto skutečnost nalezneme s 95 % jistotou v celé populaci.) Místo porovnání hodnoty testovacího kritéria s kritickými – tabulkovými hodnotami se pro rozhodování o nulové hypotéze používá také p-hodnota, či significance kterou zjistíme pomocí statistického software (princip viz dále). p α nelze zamítnout H0

31 P-value – úroveň statistické významnosti (level of significance) Hodnota p-value vyjadřuje nejmenší hodnotu α, při které ještě zamítneme H0 a přijmeme H1 (alternativní hypotézu). Ve výstupech SPSS: Asymp. Sig. (2-sided) Formálně tedy stačí porovnat zvolené α s vypočtenou hodnotou p a zamítnout H0, pokud α > p, a naopak α < p. Výstupy z počítačových programů bohužel svádí k tomu, abychom hladinu α předem nevolili a hodnotili věrohodnost hypotéz až podle vypočtené hodnoty p. [Hebák 1995: 84-85] Hladina významnosti α = pravděpodobnost, že zamítneme H0, ačkoliv ona platí. → „míra naší ochoty smířit se s výskytem chyby“.

32 Zpět do příkladu p-value – úroveň statistické významnosti Chis = df = 8

33 Kontingenční tabulka a testy dobré shody – pozor na: Pro použití testů založených na testu dobré shody (test nezávislosti nebo homogenity) je třeba, aby se v tabulce nevyskytlo méně než 20 % políček, v nichž by očekávané četnosti byly menší než 5. V případě, že se tak stane, můžeme zvážit transformaci — sloučení některých méně obsazených kategorií (např. "ano" a "spíše ano"). Testování hypotéz můžeme provádět pouze na výběrovém souboru, tj. ne na celé populaci (census), navíc data musí být pořízena náhodným výběrem.

34 Kontingenční tabulka - vyjádření vztahů kategorií Statistika Chíkvadrát nevypovídá nic o síle vztahu, pouze zamítá/nezamítá nulovou hypotézu o závislosti nebo homogenitě na dané hladině významnosti alfa. Pro zjištění síly vztahu → - koeficienty asociace (obdobné korelaci, např. CC), - znaménkové schéma – adjustovaná residua - podíl šancí (OR), - u ordinálních veličin korelační koef. dle pořadí. Odlišné testy pro nominální a ordinální proměnné (jedna / obě).

35 Pro zjištění síly vztahu v kontingenční tabulce – míry asociace (příp. pořadové korelace) viz presentaci

36 Vícerozměrná analýza & statistické testování hypotéz Vztahy mezi dvěma a více proměnnými

37 Úkoly k procvičení v SPSS Data ISSP 2007 Souvisí čtení knih (q1_d) s věkem (vekkat)? Liší se pocit, že je člověk uspěchaný ve volném čase (q5a_b) v závislosti na typu lokality, kde bydlí (S21)?

38 Další příklady výpočtu Chíkvadrátu pro vztah dvou proměnných

39 příklad Chí-kvadrát testu (2-dim) Kouření marihuany u žáků 9 a 12 třídy Zdroj: [Thyer, B. A The Handbook of SOCIAL WORK RESEARCH METHODS.]

40 Příklad Chí-kvadrát test: pozorované a teoretické četnosti, stupně volnosti

41 Příklad Chí-kvadrát test: Výpočet Chíkvadrát kritický z tabulek > Chíkvadrát dosažený (naměřený) → Ho nelze zamítnout = homogenita mezi kategoriemi 2x2 tabulka je rozepsána jako „had“ v řádcích

42 Pouhý celkový test homogenity polí kontingenční tabulky sociologovi ovšem nestačí. A tedy co dál? U kterých kategorií je v kontingenční tabulce souvislost silnější a u kterých slabší? Viz presentace Kontingenční tabulka: vztahy mezi kategorizovanými znaky

43 Adjustovaná residua Znaménkové schéma CROSSTABS: Adj. standardised (v SPSS / PSPP) Adjustovaná residua Residuum v daném políčku tabulky (=pozorovaná (observed) minus očekávaná (expected) hodnota) dělený odhadem vlastní standardní chyby. Odpovídající standardizovaný residuál je vyjádřen v jednotkách směrodatné odchylky nad nebo pod průměrem. Znaménkové schéma → jednoduchá vizualizace 'kde abs(z) >= 3.29 nahradí +++ resp. ---, 'kde abs(z) >= 2.58 nahradí ++ resp. --, 'kde abs(z) >= 1.96 nahradí + resp. -. Podrobněji viz prezentaci AKD2_kontg_tab2.ppt

44 Znaménkové schéma Kritérium v daném políčku tabulky (Adjustované residuum) označuje významnost rozdílu mezi empirickým zjištěnou četností a teoretickou (očekávanou) četností. Umožňuje rychlou orientaci mezi dvěma znaky.

45 Test odchylky od nezávislosti v poli tabulky: Adjustovaná residua a znaménkové schéma Více viz AKD2_kontg_tab2.ppt

46 Procvičit v SPSS 0. kontrola absolutních četností v jednotlivých polích → transformace (sloučení) 1. správně orientovaná procenta 2. chíkvadrát test nezávislosti (tabulky jako celku) 3. adjustovaná residua a znaménkové schéma k detekování významných odchylek Úkol: Pohlaví a volil v 2006 Náboženské vyznání x Volil 2006 Náboženské vyznání x Velikost bydliště Náboženské vyznání x Velikost bydliště x Volil 2006

47 Úkoly k procvičení v SPSS (data ISSP 2007) 2 x 2 tabulky: Pohlaví a Volil v 2006 Pohlaví a Vzdělání n x n tabulky: Velikost bydliště x Vzdělání → sloučení nebo pro vybraná pole tabulky

48 S tříděním druhého stupně bychom se neměli spokojit. → Třídění třetího stupně a elaborace vztahů viz prezentace: Kontingenční tabulka: vztahy mezi kategorizovanými znaky (AKD2_kontg_tab2.ppt) a Standardizace v kontingenční tabulce – kontrola vlivu 3 faktoru (AKD2_kontg_tab_standardizace.ppt)

49 Vyloučení (posouzení) vlivu třetí proměnné → Třídění 3 stupně Kontingenční tabulka A x B x C –Příklad pro tři proměnné: Volil (závislá) x VŠ (nezávislá-vysvětlující) x Pohlaví (nezávislá kontrolní) → Sledujeme vztah mezi A a B odděleně v kategoriích C, nejjednodušeji pomocí koeficientů asociace/korelace (kontingenční koef., Cramérovo V, Phi,… pořadové korelace Spermanovo Rho, TauB), detailněji pak klasicky % rozdíly mezi kategoriemi nebo adjustovaná residua. Parciální korelace – pro spojité proměnné Multivariační metody (např. regresní analýza, vícerozměrná analýza rozptylu ANOVA)

50 3. Chíkvadrát test pro četnosti kategorií v rámci jedné proměnné (One-dimensional "goodness of fit" test) aneb, když máme teoretické- očekávané hodnoty odjinud než z očekávaných hodnot z distribuce v našich datech

51 One-dimensional "goodness of fit" test Cílem je ověřit hypotézu o shodnosti četností kategorií u jedné proměnné od jiného určitého očekávaného-teoretického rozložení, které je dáno informací mimo naše data, kupříkladu teorií nebo předchozími výsledky z jiného výzkumu (časově / mezinárodně).

52 One-dimensional "goodness of fit" test Situace je stejná jako u prvního příkladu s testem rovnoměrného zastoupení kategorií jednoho znaku Ale místo očekávané četnosti dané rovnoměrným zastoupením kategorií vstupujeme s teoretickými četnostmi, např. z předchozího výzkumu. V SPSS je situace pomocí NPAR TEST složitější: vstoupit s tabelárními daty je obtížné (viz finta DATA ENTRY s pomocí vážení vyjadřujícím podíly v syntaxu) Existují ale nástroje pro analýzu tabelárních dat (tj. pro agregované výsledky)

53 One-dim Chí-kvadrát test: v SPSS NPar Tests Příklad 1. Očekávané četnosti reprezentují rovnoměrné zastoupení kategorií (EQUAL) Testujeme hypotézu H0: kategorie vzdělání mají stejné zastoupení. FILTER BY Fi_50_64. NPAR TESTS /CHISQUARE=vzd4 /EXPECTED=EQUAL /STATISTICS DESCRIPTIVES. Zdroj: data ISSP 2007, ČR (věk 50-64)

54 Teoretickou četností zde hodnota z předchozí etapy (výzkumu) → změna (nikoliv poměrové rozložení v jednom souboru). Testujeme nulovou hypotézu, že struktura názorů se mezi roky 2007 a 2010 nezměnila. One-dim Chí-kvadrát test: Příklad 2. Změna v čase (máme pouze výsledky nikoliv data) Vypočítaná hodnota Chisq je menší než tabulková-kritická hodnota. H0 o "nerozdílu„ nezamítáme (rozdíl v četnostech je způsoben náhodnými faktory). V obou výzkumech byla velikost souboru n = 100 (tj. nejedná se o procenta). Df = k-1 = 3-1 Х 2 = 1,64 (df 2) < 5,99 tabulková hodnota (pro df 2 a α 5 %) (p = 0,4404 výpočet na )http://vassarstats.net/csfit.html

55 Příklad 2. Výpočet pomocí aplikace

56 One-dim Chí-kvadrát test: v SPSS NPar Tests Příklad 3a. Porovnání „v čase“ (mezi kohortami) Porovnání proměny vzdělanostní struktury mezi kohortami a letých. → kohorta představuje teoretické-očekávané hodnoty (info o očekávané četnosti zde máme z jednoho výzkumu, ale pro různé podskupiny věku, i proto filtr 50-64) FILTER BY Fi_50_64. /* v tomto případě musíme filtrovat jen pro věk NPAR TESTS /CHISQUARE =vzd4 /EXPECTED= /STATISTICS DESCRIPTIVES /MISSING ANALYSIS. Pozor: Zadáváme absolutní četnosti a v tomto případě musíme mít vypnuté vážení (WEIGHT OFF) a hodnoty musíme mít převážené na stejnou velikost jednoho z výběrů, tj. absolutní hodnoty očekávaných a empirických hodnot musí mít stejný základ (zde je to přepočítáno pomocí váhy). V tomto příkladu máme mikrodata (jednotlivé případy=respondenty v datech) pro věkovou kategorii let a jejich vzdělanostní zastoupení testujeme proti teoretickým hodnotám pro věkovou kategorii 65-79, které máme také z těchto dat, ale už jako agregovaný výstup (tabulka třídění 1./2. stupně FREQ / CROSST) let letváha let převáženo ZŠ48521,2967 VYUČ ,29174 SŠ125721,2993 VŠ17 1,2922 Celkem ,29355 váha = 355/276 Zdroj: data ISSP 2007, ČR (věk 50-64)

57 Příklad 3a: NPar Tests – očekávané četnosti reprezentují jiný (pod)soubor - Output Porovnáváme empirickou = pozorovanou (Observed) strukturu četností (zde věková kohorta let) s teoretickou = očekávanou (Expected), kterou zde reprezentuje věková kohorta let (převážená na celkovou velikost kohorty 50-54). H0: struktura četností je shodná. Zdroj: data ISSP 2007, ČR (věk 50-64) H0 zamítáme (p < 0,05). Vzdělanostní struktura věkových kohort let a let není shodná. Residua ukazují, že největší rozdíl je u stupně SŠ a dále u ZŠ.

58 One-dimensional "goodness of fit" test Jiné statistické balíky mají možnost vstupu s tabelárními daty (např. kontingenční tabulka), v SPSS můžeme pouze složitě načíst tabulku jako vážená data (pomocí váhy definujeme frekvence polí v tabulce) viz Očekávané četnosti (Expected values) zde lze vkládat buď jako absolutní četnosti (Exp. Frequency) nebo i jako podíly, tj. procenta (Exp. Proportion). Pozorované (Observed) četnosti musí být zadány jako absolutní hodnoty.

59 Příklad 3a: výpočet pomocí aplikace

60 One-dimensional "goodness of fit" test Příklad 3b. – Porovnání distribuce vzdělanostních kategorií ve dvou věkových kohortách. Vstupní data (absolutní četnosti): vzdělání v kohortě (= očekávaná- teoretická četnost) a kohortě (= empirická „námi naměřená“ četnost). Ověřujeme nulovou hypotézu H0: Vzdělanostní struktura se mezi kohortami a neproměnila. Jinými slovy, distribuce četností kategorií vzdělání je pro sledované kohorty stejná. Poznámka: Zde v příkladech 3a a 3b máme (retrospektivní) informaci z jednoho výzkumu, nicméně pro dvě podskupiny. Tím tak pouze simulujeme situaci, kdybychom porovnávali kohorty zkoumané v odlišných dobách resp. výzkumech (naše data tak samozřejmě nejsou zcela přesná). Zdroj: data ISSP 2007, ČR (neváženo)

61 Příklad 3b. Pozor: Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných četností → nejprve přepočítat – převážit Ale příkaz NPAR TESTS v SPSS pracuje i s pravděpodobnostmi (%). Zdroj: data ISSP 2007, ČR

62 One-dimensional "goodness of fit" test. Příklad 3b. Řešení v SPSS Chi-Square Test pomocí NPAR TESTS Poznámka: zde provádíme výpočet pro kohortu na původních individuálních datech a tu porovnáváme s očekávanými četnostmi v kohortě ( ), které jsme si spočítali dříve pomocí např. CROSSTABS (tím vlastně simulujeme data z jiné doby - výzkumu). *nejprve zapneme filtr pro kohortu FILTER BY vek18_1951_56. NPAR TESTS /CHISQUARE = vzd3 /EXPECTED = /STATISTICS DESCRIPTIVES /MISSING ANALYSIS. Dosažená p hodnota je hraniční, tabulkový Chíkvadrát je χ 2 krit = 5,991 Proto raději hypotézu H0 (shoda s teoretickými četnostmi) nezamítneme. Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných (Observed) četností!

63 Příklad 3b. Dtto na tabulárních datech pomocí aplikace Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných (Observed) četností - musí být shodné celkové velikosti souborů, což zde není (viz další snímek).

64 Příkaz NPAR v SPSS to přepočítá automaticky, zde musíme převážit na velikost pozorovaných četností (Observed) sami (např. v Excelu) Příklad 3b. Ale pozor: Suma očekávaných (Expected) četností musí být shodná jako u pozorovaných četností

65 Neparametrické testy (Non-parametric Tests) Parametrické metody předpokládají: náhodný výběr, normální rozdělní (distribuce znaku), velké výběry z populace, známé (shodné) rozptyly v sub/populacích, z nichž byl proveden výběr Neparametrické metody: - nezávislé na rozdělní - méně citlivé na odchylky extrémních hodnot -i pro výběry velmi malého rozsahu -vhodné pro nominální i ordinální znaky Ale dochází častěji k chybnému nezamítnutí nepravdivé H0. Např. Chí-kvadrát testy, binomický test, testy středních hodnot (Mann-Whitney, Kruskal-Wallis atd.)

66 Webové nástroje pro analýzu Index of On-line Stats Calculators (rozcestí) Exact r×c Contingency Table: Statistical Calculations R. Webster West applets VassarStats: Website for Statistical Computation Chi-Square "Goodness of Fit" Test Učebnice: Interstat - hypertextová interaktivní učebnice statistiky pro ekonomy Statnotes: Topics in Multivariate Analysis, by G. David Garson StatSoft - Elektronická učebnice statistiky (anglicky)


Stáhnout ppt "Quantitative Data Analysis II. Statistical hypothesis testing (2): Categorical variables (Chi-square tests of goodness of fit) Jiří Šafr jiri.safr(AT)seznam.cz."

Podobné prezentace


Reklamy Google