Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Historická sociologie
UK FHS Historická sociologie Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod T-testy a jednoduchá One-way ANOVA - testování hypotéz pro průměry (rozptyly) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 8/3/2016 (11/3/2014)
2
Testování hypotéz pro průměry (rozptyly) v bivariátní analýze
Navazuje a doplňuje AKD II., viz Testování hypotéz (1) - Princip a testy pro číselné/kardinální znaky
3
T-test → modifikace Z-testu
Pokud neznáme směrodatnou odchylku v základním soboru (populaci), můžeme jí odhadnout pomocí výběrové směrodatné odchylky (v našem vzorku z populace), pak se k místo Z-rozložení (normální) použije tzv. Studentovo t-rozložení. Jeho tvar a rozložení závisí na počtu stupňů volnosti df, který je df = n – 1. → tabelované hodnoty (pro stupně volnosti a požadované hladiny statistické významnosti (a jednostranné a dvoustranné testy)) se kterými porovnáme výsledek Ověřovat pomocí T-testu můžeme: rozdíl naměřené hodnoty vůči určité hodnotě (teoretické, nebo naměřené v jiném souboru, např. čase/zemi) (one-sample location test) zda dva průměry jsou ve dvou (či více) sub-populacích stejné (two-sample location test) zda se průměrný rozdíl mezi dvěma proměnnými u stejných případů rovná nule (paired nebo repeated measures t-test) (v regresní analýze, zda se regresní koeficient (tj. sklon regr. přímky) lišší od nuly).
4
T-test: testy pro průměry
Jednovýběrový t-test (One-sample t-test) → rozdíl od populačního průměru μ0 nebo porovnání s jinou testovou-teoretickou hodnotou. Hypotézou je, že střední hodnota normálního rozdělení (průměr), z něhož výběr pochází, se rovná μ0. (např. H0: výběrová hodnota průměrného příjmu se neliší od hodnoty 10,5 tis.) T-TEST /TESTVAL 10.5 /VARIABLES prijem. Párový t-test (Pair-sampled t-test) porovnání dvou průměrů v závislých výběrech, tj. při uspořádání pozorování ve dvojicích (měřené proměnné jsou na sobě závislé). Nejčastěji jde o zjišťování velikosti či obměny znaku u téže osoby ve dvou časových okamžicích (např. názor před a po shlédnutí filmu nebo v panelovém výzkumu). A nebo porovnání průměrů u dvou věcně „srovnatelných“ proměnných, tj. hodnoty musí mít stejný rozsah. Např. intenzita sledování TV (q1_a) a intenzita chození do kina (q1_b) (H0: Průměry jsou shodné.) T-TEST PAIRS q1_a WITH q1_b (PAIRED). Dvouvýběrový t-test (Independent-samples t-test) → porovnání dvou průměrů v nezávislých výběrech, tj. test rozdílu průměrných hodnot znaku u dvou podskupin podle dichotomického znaku Např. Příjem (prijem) podle pohlaví (S30) (H0: Rozdíl mezi průměry v podskupinách je nulový.) Nejprve provedeme test rovnosti rozptylů (F- testem) → různý způsob výpočtu t-testu pro 1 = 2 a 1 2. T-TEST GROUPS s30(1 2)/ VARIABLES prijem.
5
Princip jednovýběrového t-testu (One-sample t-test)
Cíl: zjistit, zda se průměrná hodnota proměnné v našem výběrovém souboru liší od populační (či „teoretické“) hodnoty (např. srovnání s jinou populací či obdobím). H0: Průměry se neliší. Postup: spočítáme rozdíl hodnot průměrů, směrodatnou odchylku (SD) a z ní standardní chybu (SE) Testová t-hodnota: Vydělíme rozdíl mezi výběrovým a populačním průměrem standardní chybou. Porovnáme s tabulkovou hodnotou (nebo pomocí software získáme p-hodnotu) Z toho plyne, že pokud známe rozptyl/ směrodatnou odchylku výpočet můžeme provést bez mikro-dat, např. na základě publikovaných výsledků.
6
interval spolehlivosti pro rozdíl X a X=13 tis. neobsahuje nulu.
Jednovýběrový t-test (One-sample t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS T-TEST /TESTVAL 10.5 /VARIABLES prijem. H0: Průměrný příjem (ve výběru) je 10,5 tis. Kč. Testové kritérium t Výsledek testu (nezamítnutí H0) potvrzuje i to, že interval spolehlivosti pro rozdíl X a X=10,5 tis. obsahuje nulu. Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 nemůžeme zamítnout: dosažená hladina významnosti p je vyšší než 0,05. vypočítaná testová (0,960) < kritická-tabulková 1,644) hodnota → nelze zamítnout H0 Hodnota průměrného příjmu ve výběru Kč se statisticky významně (na p < 0,01) neliší od testované-teoretické hodnoty tis. Kč. Rozdíl 220 Kč je způsoben náhodnými vlivy, nelze ho zobecnit z výběru na populaci. T-TEST /TESTVAL 13 /VARIABLES prijem. H0: Průměrný příjem (ve výběru) je 13 tis. Kč. H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Hodnota průměrného příjmu ve výběru Kč se statisticky významně (na p < 0,01) liší od testované-teoretické hodnoty 13 tis. Kč. Rozdíl 2280 Kč je nenáhodný. vypočítaná testová (|-9,964|) > kritická-tabulková 1,644) hodnota → H0 zamítáme interval spolehlivosti pro rozdíl X a X=13 tis. neobsahuje nulu. Zdroj: data ISSP 2007, ČR
7
Párový t-test (Pair-sampled t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS
T-TEST PAIRS q1_a WITH q1_b (PAIRED). H0: Průměrná frekvence sledování TV a navštěvování kina je stejná (v jednou souboru). Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Průměrná frekvence sledování TV a chození do kina se statisticky významně (na p < 0,01) odlišuje. Rozdíl 3 bodů (na 5ti bodové škále intenzity trávení volného času) není způsoben náhodnými vlivy, lze ho tedy zobecnit z výběru na populaci. Zdroj: data ISSP 2007, ČR
8
Dvouvýběrový t-test (Independent-samples t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS
T-TEST GROUPS s30(1 2)/ VARIABLES prijem. H0: Průměrný příjem mužů a žen se neliší, tj. rozdíl v příjmech je nulový. 1. krok: Test rovnosti rozptylů (F-test) Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Výsledek testu (zamítnutí H0) potvrzuje i to, že interval spolehlivosti pro rozdíl X muži a X ženy neobsahuje nulu. Hodnota průměrného příjmu v sub-populaci mužů Kč se statisticky významně (na p < 0,01) liší od průměrného příjmu žen Kč. Rozdíl v příjmech Kč není způsoben náhodnými vlivy a lze ho zobecnit z výběru na populaci. Rozšíření pro nezávislou proměnnou s více kategoriemi je jednoduchá analýza rozptylu pomocí F-testu (v SPSS OneWay ANOVA). Zdroj: data ISSP 2007, ČR
9
Dvouvýběrový t-test (Independent-samples t-test)
T-TEST GROUPS Treat (0 1)/ VARIABLES Bloodprs. Ve výstupu máme k dispozici: 1. konvenční t-test (Equal variances assumed) 2. modifikovaný Welch's t-test (equal variances not assumed). Pokud je Levenův test statisticky signifikantní (tj. předpoklad o rovnosti rozptylů je porušen) → interpretujeme výsledek Welchova t-testu (equal variances not assumed). Jeho použití se ostatně obecně doporučuje. Output: Sig. > 0,05 → skupiny mají stejné rozptyly → čteme první řádek: konvenční t-test Výsledek t-testu: P-value < 0,05 → hypotézu o rovnosti průměrů nemůžeme přijmout. → Krevní tlak je ve skupině s novým lékem (new drug) o 26 bodů nižší než ve skupině s placebem. Naměřená statistika t = (rozdíl průměrů / S.E. rozdílu průměrů) = 6,9 / 26,1 = 3,783 Tabulková hodnota Studentova t-rozdělení: pro Alfa 5 % a 18 df je 2,101 < 3,783 → H0 zamítáme. Zdroj: [SPSS Base User's Guide 13.0: ]
10
Poznámka – parametrické vs. neparametrické testy
Pokud nejsou dodrženy předpoklady (malé výběry, normalita rozložení, ordinální závislý znak atd.) pak bychom měli pro testy střeních hodnot používat neparametrických testů (viz dále): místo Dvouvýběrového Independent-samples t-testu → Mann-Whitney U test místo One-Way ANOVA → Kruskal-Wallis one-way analysis of variance
11
Pokud má nezávislá proměnná více kategorií než dvě pak alternativou pro dvouvýběrový t-test je jednoduchá analýza rozptylu (one-way ANOVA)
12
One-Way Analysis of Variance (ANOVA)
jednoduchá (bivariátní) analýza rozptylu
13
F-test a Analýza rozptylu
F-test - alternativní metoda pro srovnání výběrů pomocí podílu jejich rozptylů. (Předchozí testy T-testy a Z-test byly založeny na rozdílech průměru a směrodatné odchylky.) (připomeňme si: rozptyl = součet čtverců rozdílů jednotlivých pozorování od průměru) Analýza rozptylu s jednoduchým tříděním (one-way ANOVA): zkoumá rozdíly průměrů závislé (kardinální-číselné) proměnné mezi několika skupinami danými jednou nezávislou kategoriální proměnnou (tzv. faktorem). Pokud má faktor jen dvě kategorie pak je test totožný s dvouvýběrovým T-testem. Jsou tyto skupiny shodné nebo průměry tvoří nějaké identifikované shluky? H0: všechny průměrné hodnoty jsou v jednotlivých (sub)populacích stejné. Princip: rozdělíme celkový rozptyl závisle proměnné (ST) na - variabilitu uvnitř skupin (SE) → jak se každá hodnota ve skupině liší od skupinového průměru; residuální variabilita a - variabilitu mezi skupinami (SA) → jak se navzájem liší skupinové průměry, tj. porovnání všech skupinových průměrů s celkovým průměrem ze všech pozorování. ST = SE + SA neboli Celkový součet čtverců = součet čtverců uvnitř skupin + součet čtverců mezi výběry Pokud skutečně neexistuje žádný rozdíl mezi skupinovými průměry, pak variabilita mezi skupinami i variabilita uvnitř skupiny reprezentují stejný jev - stejný populační rozptyl. Porovnání variability v rámci skupiny a mezi skupinami se provádí pomocí F testu. Testové kritérium F (rozklad součtu čtverců odchylek měření od společného průměru) srovnáme s tabulkovým F-rozdělením. vážený rozptyl mezi průměry skupin F = ––––––––––––––––––––––––––––––– rozptyl mezi jedinci ve stejné skupině Zdroj: podle [Königová et al. 1988: 154; Hendl 2006: ]
14
One-way ANOVA - předpoklady
Předpokladem je rovnost rozptylů v testovaných podskupinách. Vizuálně ověříme pomocí ErrorBar grafu se směrodatnými odchylkami GRAPH /ERRORBAR (STDDEV 1)=prijem BY vzd4. Zde tomu tak není: Vysokoškoláci mají větší rozptyl v příjmech než ostatní. (viz také Levenův test) Zdroj: [data ISSP 2007, ČR]
15
(číselná-kardinální)
One-way ANOVA – zadání Závislá proměnná (číselná-kardinální) Nezávislá proměnná (kategoriální) ONEWAY prijem BY vzd4 /STATISTICS DESCRIPTIVES HOMOGENEITY /PLOT MEANS /POSTHOC=BONFERRONI ALPHA(0.05). *Zde máme navíc zadány: popisné statistiky, Levenův test homogeneity rozptylů, graf průměrů, a tzv. post-hoc test pro statistický test, které skupiny se navzájem odlišují (Bonferroniho test). K zadání pouze F-testu stačí jednoduše: ONEWAY prijem BY vzd nebo v Means: MEANS prijem BY vzd4 /STATISTICS ANOVA.
16
One-way ANOVA – Output (1)
Popisné statistiky: průměry v podskupinách, STD, S.E., Intervaly spolehlivosti. Tyto výsledky posléze věcně interpretujeme (samotný F-test je až v další tabulce). Levenův test (Homogeneity of variance test) → shodnost rozptylů v podskupinách H0 (shoda rozptylů) zde nemůžeme přijmout: P value < 0,05. Homogenita je porušena. → alternativní postupy: Provedeme transformaci (např. zlogaritmování závislé proměnné) použijeme neparatmetrický test Kruskal-Wallis one-way analysis of variance - také to můžeme ignorovat. ANOVA je vůči této podmínce poměrně robustní, pokud jsou podskupiny (v nezávislé proměnné) přibližně stejně velké.
17
One-way ANOVA – Output (2): hlavní výsledek F-test
F test: Sig. < 0,05 proto zamítáme H0 (o shodě průměrů/rozptylů v podskupinách). Pozor: samotný F-test neříká, které podskupiny se liší navzájem, pouze víme, že minimálně jedna vzdělanostní skupina se liší v průměrném příjmu od ostatních. Proto dále provedeme: Post-hoc test a nebo porovnáme Intervaly spolehlivosti mezi skupinami.
18
Jednoduchá analýza rozptylu (one-way ANOVA): Simultánní porovnání mezi skupinami (post-hoc testy)
F-testem testujeme pouze globální hypotézu, podle které „průměry jsou ve skupinách dle faktoru stejné“. Ale nevíme, které ani kolik z nich se případně lišší. Většinou proto v dalším kroku provedeme mnohonásobná porovnávání, tj. porovnáme každou dvojici průměrů: většinou Post-hoc testem a nebo pomocí porovnání intervalů spolehlivosti. Post-hoc testy používají upravenou hladinu významnosti: čím více porovnání (skupin dle faktoru), tím potřebujeme hladinu α přísnější. Jejich cílem je udržet danou hladinu pravděpodobnosti chyby prvního druhu α (5 %) tak, že ji rozdělí mezi všechna porovnání. Některé z těchto testů jsou velmi konzervativní. Může se stát, že F test zamítne hypotézu o rovnosti průměrů, a přitom žádná dvojice průměrů se od sebe podle výsledků metod mnohonásobného porovnávání navzájem významně neliší! Existuje několik variant testů (většinou jde o upravený dvouvýběrový T-test): Bonferroniho (konzervativní), Fisherův LSD – least significant difference (nejliberálnější), Tukeyova, Duncanova a dal. Zdroj: podle [Hendl 2006: ; Zvárová 2009: kap. 12]
19
Jednoduchá analýza rozptylu ANOVA (F-test) (v SPSS ONEWAY ANOVA)
ONEWAY prijem BY vzd4 / STATISTICS DESCRIPTIVES /POSTHOC = BONFERRONI. H0: Průměrný příjem se mezi vzdělanostními kategoriemi neliší. 2. krok: Post Hoc Tests → Které kategorie se statisticky významně významně odlišují? Bonferroniho test je jednoduchý a konzervativní - přísný; použít lze i jiné testy (LSD, Tukey atd.). 1. krok: F-Test (test H0) Hodnota průměrného příjmu se statisticky významně (na p < 0,01) liší podle úrovně vzdělání. Minimálně jedna kategorie se liší od ostatních. Rozdíly v příjmu nejsou způsobeny náhodnými vlivy a lze je zobecnit z výběru na populaci. Následný Post-hoc test (Bonferroniho nerovnost) ukazuje, že od všech ostatních stupňů se odlišuje pouze příjem ZŠ (platí pro p < 0,05). H0 zamítáme: dosažená hladina významnosti p je nižší než 0,05 i 0,01. Znázorněno graficky (shoda průměrů): ZŠ VY SŠ VŠ Identifikovat statisticky významné rozdíly můžeme také pomocí intervalů spolehlivosti a ty zobrazit v grafu (ERRORBAR). Zdroj: data ISSP 2007, ČR
20
One-way ANOVA – Output (3) Post-hoc test (Bonferroni) → rozdíly mezi skupinami
Test porovnává každou kategorii s každou, hvězdička * nám ukazuje, kde jsou rozdíly v průměru statisticky signifikantní na Alfa min. 5 %. Výsledek si můžeme přehledně znázornit: ZŠ VY SŠ VŠ (spojnice značí shodu průměru, na hl. Alfa 0,05) Mnohem praktičtější je ale grafické zobrazení průměrů a intervalů spolehlivosti (viz dále).
21
Průměry s intervaly spolehlivosti mezi skupinami (ERROR-BAR)
GRAPH ERRORBAR (CI) prijem BY vzd4. Zde máme mnohem více informací, interval spolehlivosti v sobě zahrnuje informaci o rozptylu (standardní chybě) i počtu případů ve skupině. A nezapomeňte, že záleží, jaké je na ose Y rozpětí (SPSS v grafu „optimalizuje“ zobrazení). Na to pozor při interpretaci. Porovnejte (stejné) grafy. Pravidlo na to není, ale určitě byste měli ukázat minimálně rozpětí +/-1 StD od průměru, což pokrývá cca 68 % případů (zde x=10,7 StD 6,7 → rozsah na Y: 4-18 tis.).
22
Velikost účinku v One-way ANOVA: míra závislosti kardinální na kategoriální proměnné
Lze sílu vztahu mezi závislou a kategoriemi nezávislé proměnné vyjádřit zjednodušeně „jedním číslem“?
23
Jednoduchá analýza rozptylu (one-way ANOVA): Velikost účinku (míra závislosti) Eta2
Míru vlivu závislé proměnné na nezávislou (tj. velikost účinku – effect size) můžeme v ANOVA vyjádřit pomocí koeficientu Eta2 (Eta-squared) η2 = SA / ST neboli součet čtverců mezi výběry (poměr variability vysvětlené kategoriemi SA) / celkový součet čtverců odchylek od celkového průměru (ST) = Between-Groups Sum of Squares / Total Sum of Squares Jde o nelineární korelační koeficient (Eta), který nabývá hodnot 0–1. Eta2 vyjadřuje, kolik variability závislé proměnné je vysvětleno faktorem, tj. rozdíly mezi kategoriemi nezávislé proměnné. (~ koef. determinace R2 v lineární regresi) Umožňuje porovnání vlivu různých faktorů nebo komparaci vlivu faktoru v odlišném prostředí. Zdroj: podle [Hendl 2006: 356]
24
Eta2 = Between Groups SS / Total SS
Jednoduchá analýza rozptylu ANOVA s Eta2 v SPSS v MEANS (případně i v CROSSTABS) Eta2 v One-Way není, ale lze jednoduše dopočítat. Jednoduchou ANOVU lze získat i v rámci příkazu MEANS (STATISTICS = ANOVA), kde bude automaticky i Eta2. MEANS prijem BY vzd4 /STATISTICS ANOVA. H0: Průměrný příjem se mezi vzdělanostními kategoriemi neliší. Eta2 = Between Groups SS / Total SS = 2785,592 / 37591,231 = 0,0741 η2 = SA / ST Between / Total Zdroj: data ISSP 2007, ČR
25
Neparametrické testy NPar Tests
→ „pořadové (Rank) testy“
26
Neparametrické testy NPar Tests → „pořadové (Rank) testy“
K porovnání souborů statistických dat, u nichž není normální rozdělení pravděpodobností sledovaného znaku → náhodná veličina má neznámé rozdělení, které neumíme charakterizovat pomocí průměru a rozptylu (µ, s). nulová hypotéza, se proto vztahuje jen k obecným vlastnostem rozdělení: (shodu tvaru křivky rozdělení v porovnávaných souborech dat). Výpočty jsou založeny na pořadových číslech jednotlivých hodnot variační řady (→ pořadové testy), Můžeme je proto použít i pro ordinální proměnné (hodnoty, které nemají přesný číselný význam, odráží jen pořadí)
27
Neparametrické testy (Non-parametric Tests)
Parametrické metody předpokládají: náhodný výběr, normální rozdělní (distribuce znaku), velké výběry z populace, známé (shodné) rozptyly v sub/populacích, z nichž byl proveden výběr Neparametrické metody: - nezávislé na rozdělní - méně citlivé na odchylky extrémních hodnot i pro výběry velmi malého rozsahu vhodné pro nominální i ordinální znaky Ale dochází častěji k chybnému nezamítnutí nepravdivé H0. Např. Chí-kvadrát testy, binomický test, testy středních hodnot (Mann-Whitney, Kruskal-Wallis atd.)
28
Neparametrický test: Two-Independent-Samples Tests Mann-Whitneyův pořadový test
Ekvivalent dvouvýběrového t-testu NPAR TESTS /M-W=prijem BY s30(1 2) /STATISTICS DESCRIPTIVES. Mann-Whitney Test Sig. < 0,5 → Nulovou hypotézu o shodě rozdělení (pořadí v podskupinách) veličin zamítáme.
29
Neparametrický test: Kruskal-Wallis one-way analysis of variance
Ekvivalent jednoduché analýzy rozptylu One-Way ANOVA NPAR TESTS /K-W=prijem BY vzd4(1 4) /STATISTICS DESCRIPTIVES. Kruskal-Wallis Test Sig. < 0,5 → Nulovou hypotézu o shodě rozdělení (pořadí v podskupinách) veličin zamítáme.
30
S tříděním druhého stupně bychom se neměli spokojit
S tříděním druhého stupně bychom se neměli spokojit! → třídění třetího stupně a elaborace vztahů: statistický test provedeme nejen za celek ale také zvlášť v každé kategorii třetí - kontrolní proměnné. Principy viz prezentace: Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma (AKD2_kontg_tab2.ppt) Standardizace v kontingenční tabulce – kontrola vlivu 3 faktoru (AKD2_kontg_tab_standardizace.ppt) A nebo (lépe) použijeme multivariační analýzu, např.: Regresní analýza - lineární regrese (OLS)
31
Vyloučení (posouzení) vlivu třetí proměnné
→ Třídění 3 stupně Kontingenční tabulka A x B x C Příklad pro tři proměnné: Volil (závislá) x VŠ (nezávislá-vysvětlující) x Pohlaví (nezávislá kontrolní) → Sledujeme vztah mezi A a B odděleně v kategoriích C, nejjednodušeji pomocí koeficientů asociace/korelace (kontingenční koef., Cramérovo V, Phi,… pořadové korelace Spermanovo Rho, TauB), detailněji pak klasicky % rozdíly mezi kategoriemi nebo adjustovaná residua. Parciální korelace – pro spojité proměnné Multivariační metody (např. regresní analýza, vícerozm. analýzu rozptylu ANOVA)
32
Literatura De Vaus, D. A Surveys in Social Research. London: George Allen & Unwin (Publishers) Ltd. Hendl, J. (2006) Přehled statistických metod. Praha: Portál. Mareš, P., L. Rabušic, P. Soukup Analýza sociálněvědních dat (nejen) v SPSS. Brno: Masarykova univerzita. Zvárová, J Základy statistiky pro biomedicínské obory. [on-line] Dostupné na
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.