Historická sociologie

Slides:



Advertisements
Podobné prezentace
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Advertisements

Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
Experimentální metody oboru – Pokročilá tenzometrie – Měření vnitřního pnutí Další využití tenzometrie Měření vnitřního pnutí © doc. Ing. Zdeněk Folta,
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
Experimenty a jejich statistické vyhodnocení I Biologická technika.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Induktivní statistika
Úvod do testování hypotéz
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
Historická sociologie, Řízení a supervize
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Interpolace funkčních závislostí
7. Statistické testování
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
Testování hypotéz Testování hypotéz o rozdílu průměrů
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
2. cvičení
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Testování hypotéz o rozdílu průměrů: Analýza rozptylu
Statistická analýza dat
Párový neparametrický test
Poměr v základním tvaru.
Základy statistické indukce
ASTAc/01,03 Biostatistika 6. cvičení
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Míry asociace obecná definice – síla a směr vztahu
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
Kvadratické nerovnice
Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Spojité VELIČINY Vyšetřování normality dat
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Korelace a elaborace aneb úvod do vztahů proměnných
XII. Binomické rozložení
STATISTIKA PRO EKONOMY (kombinovaná forma)
ASTAc/03 Biostatistika 4. cvičení
Základní statistické pojmy
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Lineární regrese.
Metody sociálních výzkumů
Analýza variance (ANOVA).
Poměr v základním tvaru.
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
Teorie chyb a vyrovnávací počet 1
Jiří Šafr jiri.safr(zavináč)seznam.cz
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

Historická sociologie UK FHS Historická sociologie Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod T-testy a jednoduchá One-way ANOVA - testování hypotéz pro průměry (rozptyly) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 8/3/2016 (11/3/2014)

Testování hypotéz pro průměry (rozptyly) v bivariátní analýze Navazuje a doplňuje AKD II., viz Testování hypotéz (1) - Princip a testy pro číselné/kardinální znaky http://metodykv.wz.cz/AKD2_hypotezy1.ppt

T-test → modifikace Z-testu Pokud neznáme směrodatnou odchylku v základním soboru (populaci), můžeme jí odhadnout pomocí výběrové směrodatné odchylky (v našem vzorku z populace), pak se k místo Z-rozložení (normální) použije tzv. Studentovo t-rozložení. Jeho tvar a rozložení závisí na počtu stupňů volnosti df, který je df = n – 1. → tabelované hodnoty (pro stupně volnosti a požadované hladiny statistické významnosti (a jednostranné a dvoustranné testy)) se kterými porovnáme výsledek Ověřovat pomocí T-testu můžeme: rozdíl naměřené hodnoty vůči určité hodnotě (teoretické, nebo naměřené v jiném souboru, např. čase/zemi) (one-sample location test) zda dva průměry jsou ve dvou (či více) sub-populacích stejné (two-sample location test) zda se průměrný rozdíl mezi dvěma proměnnými u stejných případů rovná nule (paired nebo repeated measures t-test) (v regresní analýze, zda se regresní koeficient (tj. sklon regr. přímky) lišší od nuly).

T-test: testy pro průměry Jednovýběrový t-test (One-sample t-test) → rozdíl od populačního průměru μ0 nebo porovnání s jinou testovou-teoretickou hodnotou. Hypotézou je, že střední hodnota normálního rozdělení (průměr), z něhož výběr pochází, se rovná μ0. (např. H0: výběrová hodnota průměrného příjmu se neliší od hodnoty 10,5 tis.) T-TEST /TESTVAL 10.5 /VARIABLES prijem. Párový t-test (Pair-sampled t-test) porovnání dvou průměrů v závislých výběrech, tj. při uspořádání pozorování ve dvojicích (měřené proměnné jsou na sobě závislé). Nejčastěji jde o zjišťování velikosti či obměny znaku u téže osoby ve dvou časových okamžicích (např. názor před a po shlédnutí filmu nebo v panelovém výzkumu). A nebo porovnání průměrů u dvou věcně „srovnatelných“ proměnných, tj. hodnoty musí mít stejný rozsah. Např. intenzita sledování TV (q1_a) a intenzita chození do kina (q1_b) (H0: Průměry jsou shodné.) T-TEST PAIRS q1_a WITH q1_b (PAIRED). Dvouvýběrový t-test (Independent-samples t-test) → porovnání dvou průměrů v nezávislých výběrech, tj. test rozdílu průměrných hodnot znaku u dvou podskupin podle dichotomického znaku Např. Příjem (prijem) podle pohlaví (S30) (H0: Rozdíl mezi průměry v podskupinách je nulový.) Nejprve provedeme test rovnosti rozptylů (F- testem) → různý způsob výpočtu t-testu pro 1 = 2 a 1  2. T-TEST GROUPS s30(1 2)/ VARIABLES prijem.

Princip jednovýběrového t-testu (One-sample t-test) Cíl: zjistit, zda se průměrná hodnota proměnné v našem výběrovém souboru liší od populační (či „teoretické“) hodnoty (např. srovnání s jinou populací či obdobím). H0: Průměry se neliší. Postup: spočítáme rozdíl hodnot průměrů, směrodatnou odchylku (SD) a z ní standardní chybu (SE) Testová t-hodnota: Vydělíme rozdíl mezi výběrovým a populačním průměrem standardní chybou. Porovnáme s tabulkovou hodnotou (nebo pomocí software získáme p-hodnotu) Z toho plyne, že pokud známe rozptyl/ směrodatnou odchylku výpočet můžeme provést bez mikro-dat, např. na základě publikovaných výsledků.

interval spolehlivosti pro rozdíl X a X=13 tis. neobsahuje nulu. Jednovýběrový t-test (One-sample t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS T-TEST /TESTVAL 10.5 /VARIABLES prijem. H0: Průměrný příjem (ve výběru) je 10,5 tis. Kč. Testové kritérium t Výsledek testu (nezamítnutí H0) potvrzuje i to, že interval spolehlivosti pro rozdíl X a X=10,5 tis. obsahuje nulu. Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 nemůžeme zamítnout: dosažená hladina významnosti p je vyšší než 0,05. vypočítaná testová (0,960) < kritická-tabulková 1,644) hodnota → nelze zamítnout H0 Hodnota průměrného příjmu ve výběru 10 720 Kč se statisticky významně (na p < 0,01) neliší od testované-teoretické hodnoty 10 500 tis. Kč. Rozdíl 220 Kč je způsoben náhodnými vlivy, nelze ho zobecnit z výběru na populaci. T-TEST /TESTVAL 13 /VARIABLES prijem. H0: Průměrný příjem (ve výběru) je 13 tis. Kč. H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Hodnota průměrného příjmu ve výběru 10 720 Kč se statisticky významně (na p < 0,01) liší od testované-teoretické hodnoty 13 tis. Kč. Rozdíl 2280 Kč je nenáhodný. vypočítaná testová (|-9,964|) > kritická-tabulková 1,644) hodnota → H0 zamítáme interval spolehlivosti pro rozdíl X a X=13 tis. neobsahuje nulu. Zdroj: data ISSP 2007, ČR

Párový t-test (Pair-sampled t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS T-TEST PAIRS q1_a WITH q1_b (PAIRED). H0: Průměrná frekvence sledování TV a navštěvování kina je stejná (v jednou souboru). Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Průměrná frekvence sledování TV a chození do kina se statisticky významně (na p < 0,01) odlišuje. Rozdíl 3 bodů (na 5ti bodové škále intenzity trávení volného času) není způsoben náhodnými vlivy, lze ho tedy zobecnit z výběru na populaci. Zdroj: data ISSP 2007, ČR

Dvouvýběrový t-test (Independent-samples t-test) Oboustranná alternativa (2-tailed) Výstup v SPSS T-TEST GROUPS s30(1 2)/ VARIABLES prijem. H0: Průměrný příjem mužů a žen se neliší, tj. rozdíl v příjmech je nulový. 1. krok: Test rovnosti rozptylů (F-test) Alternativní postup - porovnání s kritickou tabulkovou hodnotou: Kvantily t1-α/2 (n) Studentova t rozdělení H0 zamítáme: dosažená hladina významnosti p je zde nižší než 0,05 i 0,01. Výsledek testu (zamítnutí H0) potvrzuje i to, že interval spolehlivosti pro rozdíl X muži a X ženy neobsahuje nulu. Hodnota průměrného příjmu v sub-populaci mužů 12 930 Kč se statisticky významně (na p < 0,01) liší od průměrného příjmu žen 9 060 Kč. Rozdíl v příjmech 3 870 Kč není způsoben náhodnými vlivy a lze ho zobecnit z výběru na populaci. Rozšíření pro nezávislou proměnnou s více kategoriemi je jednoduchá analýza rozptylu pomocí F-testu (v SPSS OneWay ANOVA). Zdroj: data ISSP 2007, ČR

Dvouvýběrový t-test (Independent-samples t-test) T-TEST GROUPS Treat (0 1)/ VARIABLES Bloodprs. Ve výstupu máme k dispozici: 1. konvenční t-test (Equal variances assumed) 2. modifikovaný Welch's t-test (equal variances not assumed). Pokud je Levenův test statisticky signifikantní (tj. předpoklad o rovnosti rozptylů je porušen) → interpretujeme výsledek Welchova t-testu (equal variances not assumed). Jeho použití se ostatně obecně doporučuje. Output: Sig. > 0,05 → skupiny mají stejné rozptyly → čteme první řádek: konvenční t-test Výsledek t-testu: P-value < 0,05 → hypotézu o rovnosti průměrů nemůžeme přijmout. → Krevní tlak je ve skupině s novým lékem (new drug) o 26 bodů nižší než ve skupině s placebem. Naměřená statistika t = (rozdíl průměrů / S.E. rozdílu průměrů) = 6,9 / 26,1 = 3,783 Tabulková hodnota Studentova t-rozdělení: pro Alfa 5 % a 18 df je 2,101 < 3,783 → H0 zamítáme. Zdroj: [SPSS Base User's Guide 13.0: 358-59]

Poznámka – parametrické vs. neparametrické testy Pokud nejsou dodrženy předpoklady (malé výběry, normalita rozložení, ordinální závislý znak atd.) pak bychom měli pro testy střeních hodnot používat neparametrických testů (viz dále): místo Dvouvýběrového Independent-samples t-testu → Mann-Whitney U test místo One-Way ANOVA → Kruskal-Wallis one-way analysis of variance

Pokud má nezávislá proměnná více kategorií než dvě pak alternativou pro dvouvýběrový t-test je jednoduchá analýza rozptylu (one-way ANOVA)

One-Way Analysis of Variance (ANOVA) jednoduchá (bivariátní) analýza rozptylu

F-test a Analýza rozptylu F-test - alternativní metoda pro srovnání výběrů pomocí podílu jejich rozptylů. (Předchozí testy T-testy a Z-test byly založeny na rozdílech průměru a směrodatné odchylky.) (připomeňme si: rozptyl = součet čtverců rozdílů jednotlivých pozorování od průměru) Analýza rozptylu s jednoduchým tříděním (one-way ANOVA): zkoumá rozdíly průměrů závislé (kardinální-číselné) proměnné mezi několika skupinami danými jednou nezávislou kategoriální proměnnou (tzv. faktorem). Pokud má faktor jen dvě kategorie pak je test totožný s dvouvýběrovým T-testem. Jsou tyto skupiny shodné nebo průměry tvoří nějaké identifikované shluky? H0: všechny průměrné hodnoty jsou v jednotlivých (sub)populacích stejné. Princip: rozdělíme celkový rozptyl závisle proměnné (ST) na - variabilitu uvnitř skupin (SE) → jak se každá hodnota ve skupině liší od skupinového průměru; residuální variabilita a - variabilitu mezi skupinami (SA) → jak se navzájem liší skupinové průměry, tj. porovnání všech skupinových průměrů s celkovým průměrem ze všech pozorování. ST = SE + SA neboli Celkový součet čtverců = součet čtverců uvnitř skupin + součet čtverců mezi výběry Pokud skutečně neexistuje žádný rozdíl mezi skupinovými průměry, pak variabilita mezi skupinami i variabilita uvnitř skupiny reprezentují stejný jev - stejný populační rozptyl. Porovnání variability v rámci skupiny a mezi skupinami se provádí pomocí F testu. Testové kritérium F (rozklad součtu čtverců odchylek měření od společného průměru) srovnáme s tabulkovým F-rozdělením. vážený rozptyl mezi průměry skupin F = ––––––––––––––––––––––––––––––– rozptyl mezi jedinci ve stejné skupině Zdroj: podle [Königová et al. 1988: 154; Hendl 2006: 349-353]

One-way ANOVA - předpoklady Předpokladem je rovnost rozptylů v testovaných podskupinách. Vizuálně ověříme pomocí ErrorBar grafu se směrodatnými odchylkami GRAPH /ERRORBAR (STDDEV 1)=prijem BY vzd4. Zde tomu tak není: Vysokoškoláci mají větší rozptyl v příjmech než ostatní. (viz také Levenův test) Zdroj: [data ISSP 2007, ČR]

(číselná-kardinální) One-way ANOVA – zadání Závislá proměnná (číselná-kardinální) Nezávislá proměnná (kategoriální) ONEWAY prijem BY vzd4 /STATISTICS DESCRIPTIVES HOMOGENEITY /PLOT MEANS /POSTHOC=BONFERRONI ALPHA(0.05). *Zde máme navíc zadány: popisné statistiky, Levenův test homogeneity rozptylů, graf průměrů, a tzv. post-hoc test pro statistický test, které skupiny se navzájem odlišují (Bonferroniho test). K zadání pouze F-testu stačí jednoduše: ONEWAY prijem BY vzd4. nebo v Means: MEANS prijem BY vzd4 /STATISTICS ANOVA.

One-way ANOVA – Output (1) Popisné statistiky: průměry v podskupinách, STD, S.E., Intervaly spolehlivosti. Tyto výsledky posléze věcně interpretujeme (samotný F-test je až v další tabulce). Levenův test (Homogeneity of variance test) → shodnost rozptylů v podskupinách H0 (shoda rozptylů) zde nemůžeme přijmout: P value < 0,05. Homogenita je porušena. → alternativní postupy: Provedeme transformaci (např. zlogaritmování závislé proměnné) použijeme neparatmetrický test Kruskal-Wallis one-way analysis of variance - také to můžeme ignorovat. ANOVA je vůči této podmínce poměrně robustní, pokud jsou podskupiny (v nezávislé proměnné) přibližně stejně velké.

One-way ANOVA – Output (2): hlavní výsledek F-test F test: Sig. < 0,05 proto zamítáme H0 (o shodě průměrů/rozptylů v podskupinách). Pozor: samotný F-test neříká, které podskupiny se liší navzájem, pouze víme, že minimálně jedna vzdělanostní skupina se liší v průměrném příjmu od ostatních. Proto dále provedeme: Post-hoc test a nebo porovnáme Intervaly spolehlivosti mezi skupinami.

Jednoduchá analýza rozptylu (one-way ANOVA): Simultánní porovnání mezi skupinami (post-hoc testy) F-testem testujeme pouze globální hypotézu, podle které „průměry jsou ve skupinách dle faktoru stejné“. Ale nevíme, které ani kolik z nich se případně lišší. Většinou proto v dalším kroku provedeme mnohonásobná porovnávání, tj. porovnáme každou dvojici průměrů: většinou Post-hoc testem a nebo pomocí porovnání intervalů spolehlivosti. Post-hoc testy používají upravenou hladinu významnosti: čím více porovnání (skupin dle faktoru), tím potřebujeme hladinu α přísnější. Jejich cílem je udržet danou hladinu pravděpodobnosti chyby prvního druhu α (5 %) tak, že ji rozdělí mezi všechna porovnání. Některé z těchto testů jsou velmi konzervativní. Může se stát, že F test zamítne hypotézu o rovnosti průměrů, a přitom žádná dvojice průměrů se od sebe podle výsledků metod mnohonásobného porovnávání navzájem významně neliší! Existuje několik variant testů (většinou jde o upravený dvouvýběrový T-test): Bonferroniho (konzervativní), Fisherův LSD – least significant difference (nejliberálnější), Tukeyova, Duncanova a dal. Zdroj: podle [Hendl 2006: 354-356; Zvárová 2009: kap. 12]

Jednoduchá analýza rozptylu ANOVA (F-test) (v SPSS ONEWAY ANOVA) ONEWAY prijem BY vzd4 / STATISTICS DESCRIPTIVES /POSTHOC = BONFERRONI. H0: Průměrný příjem se mezi vzdělanostními kategoriemi neliší. 2. krok: Post Hoc Tests → Které kategorie se statisticky významně významně odlišují? Bonferroniho test je jednoduchý a konzervativní - přísný; použít lze i jiné testy (LSD, Tukey atd.). 1. krok: F-Test (test H0) Hodnota průměrného příjmu se statisticky významně (na p < 0,01) liší podle úrovně vzdělání. Minimálně jedna kategorie se liší od ostatních. Rozdíly v příjmu nejsou způsobeny náhodnými vlivy a lze je zobecnit z výběru na populaci. Následný Post-hoc test (Bonferroniho nerovnost) ukazuje, že od všech ostatních stupňů se odlišuje pouze příjem ZŠ (platí pro p < 0,05). H0 zamítáme: dosažená hladina významnosti p je nižší než 0,05 i 0,01. Znázorněno graficky (shoda průměrů): ZŠ VY SŠ VŠ Identifikovat statisticky významné rozdíly můžeme také pomocí intervalů spolehlivosti a ty zobrazit v grafu (ERRORBAR). Zdroj: data ISSP 2007, ČR

One-way ANOVA – Output (3) Post-hoc test (Bonferroni) → rozdíly mezi skupinami Test porovnává každou kategorii s každou, hvězdička * nám ukazuje, kde jsou rozdíly v průměru statisticky signifikantní na Alfa min. 5 %. Výsledek si můžeme přehledně znázornit: ZŠ VY SŠ VŠ (spojnice značí shodu průměru, na hl. Alfa 0,05) Mnohem praktičtější je ale grafické zobrazení průměrů a intervalů spolehlivosti (viz dále).

Průměry s intervaly spolehlivosti mezi skupinami (ERROR-BAR) GRAPH ERRORBAR (CI) prijem BY vzd4. Zde máme mnohem více informací, interval spolehlivosti v sobě zahrnuje informaci o rozptylu (standardní chybě) i počtu případů ve skupině. A nezapomeňte, že záleží, jaké je na ose Y rozpětí (SPSS v grafu „optimalizuje“ zobrazení). Na to pozor při interpretaci. Porovnejte (stejné) grafy. Pravidlo na to není, ale určitě byste měli ukázat minimálně rozpětí +/-1 StD od průměru, což pokrývá cca 68 % případů (zde x=10,7 StD 6,7 → rozsah na Y: 4-18 tis.).

Velikost účinku v One-way ANOVA: míra závislosti kardinální na kategoriální proměnné Lze sílu vztahu mezi závislou a kategoriemi nezávislé proměnné vyjádřit zjednodušeně „jedním číslem“?

Jednoduchá analýza rozptylu (one-way ANOVA): Velikost účinku (míra závislosti) Eta2 Míru vlivu závislé proměnné na nezávislou (tj. velikost účinku – effect size) můžeme v ANOVA vyjádřit pomocí koeficientu Eta2 (Eta-squared) η2 = SA / ST neboli součet čtverců mezi výběry (poměr variability vysvětlené kategoriemi SA) / celkový součet čtverců odchylek od celkového průměru (ST) = Between-Groups Sum of Squares / Total Sum of Squares Jde o nelineární korelační koeficient (Eta), který nabývá hodnot 0–1. Eta2 vyjadřuje, kolik variability závislé proměnné je vysvětleno faktorem, tj. rozdíly mezi kategoriemi nezávislé proměnné. (~ koef. determinace R2 v lineární regresi) Umožňuje porovnání vlivu různých faktorů nebo komparaci vlivu faktoru v odlišném prostředí. Zdroj: podle [Hendl 2006: 356]

Eta2 = Between Groups SS / Total SS Jednoduchá analýza rozptylu ANOVA s Eta2 v SPSS v MEANS (případně i v CROSSTABS) Eta2 v One-Way není, ale lze jednoduše dopočítat. Jednoduchou ANOVU lze získat i v rámci příkazu MEANS (STATISTICS = ANOVA), kde bude automaticky i Eta2. MEANS prijem BY vzd4 /STATISTICS ANOVA. H0: Průměrný příjem se mezi vzdělanostními kategoriemi neliší. Eta2 = Between Groups SS / Total SS = 2785,592 / 37591,231 = 0,0741 η2 = SA / ST Between / Total Zdroj: data ISSP 2007, ČR

Neparametrické testy NPar Tests → „pořadové (Rank) testy“

Neparametrické testy NPar Tests → „pořadové (Rank) testy“ K porovnání souborů statistických dat, u nichž není normální rozdělení pravděpodobností sledovaného znaku → náhodná veličina má neznámé rozdělení, které neumíme charakterizovat pomocí průměru a rozptylu (µ, s). nulová hypotéza, se proto vztahuje jen k obecným vlastnostem rozdělení: (shodu tvaru křivky rozdělení v porovnávaných souborech dat). Výpočty jsou založeny na pořadových číslech jednotlivých hodnot variační řady (→ pořadové testy), Můžeme je proto použít i pro ordinální proměnné (hodnoty, které nemají přesný číselný význam, odráží jen pořadí)

Neparametrické testy (Non-parametric Tests) Parametrické metody předpokládají: náhodný výběr, normální rozdělní (distribuce znaku), velké výběry z populace, známé (shodné) rozptyly v sub/populacích, z nichž byl proveden výběr Neparametrické metody: - nezávislé na rozdělní - méně citlivé na odchylky extrémních hodnot i pro výběry velmi malého rozsahu vhodné pro nominální i ordinální znaky Ale dochází častěji k chybnému nezamítnutí nepravdivé H0. Např. Chí-kvadrát testy, binomický test, testy středních hodnot (Mann-Whitney, Kruskal-Wallis atd.)

Neparametrický test: Two-Independent-Samples Tests Mann-Whitneyův pořadový test Ekvivalent dvouvýběrového t-testu NPAR TESTS /M-W=prijem BY s30(1 2) /STATISTICS DESCRIPTIVES. Mann-Whitney Test Sig. < 0,5 → Nulovou hypotézu o shodě rozdělení (pořadí v podskupinách) veličin zamítáme.

Neparametrický test: Kruskal-Wallis one-way analysis of variance Ekvivalent jednoduché analýzy rozptylu One-Way ANOVA NPAR TESTS /K-W=prijem BY vzd4(1 4) /STATISTICS DESCRIPTIVES. Kruskal-Wallis Test Sig. < 0,5 → Nulovou hypotézu o shodě rozdělení (pořadí v podskupinách) veličin zamítáme.

S tříděním druhého stupně bychom se neměli spokojit S tříděním druhého stupně bychom se neměli spokojit! → třídění třetího stupně a elaborace vztahů: statistický test provedeme nejen za celek ale také zvlášť v každé kategorii třetí - kontrolní proměnné. Principy viz prezentace: Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma (AKD2_kontg_tab2.ppt) Standardizace v kontingenční tabulce – kontrola vlivu 3 faktoru (AKD2_kontg_tab_standardizace.ppt) A nebo (lépe) použijeme multivariační analýzu, např.: Regresní analýza - lineární regrese (OLS) http://metodykv.wz.cz/AKD2_regrese.ppt

Vyloučení (posouzení) vlivu třetí proměnné → Třídění 3 stupně Kontingenční tabulka A x B x C Příklad pro tři proměnné: Volil (závislá) x VŠ (nezávislá-vysvětlující) x Pohlaví (nezávislá kontrolní) → Sledujeme vztah mezi A a B odděleně v kategoriích C, nejjednodušeji pomocí koeficientů asociace/korelace (kontingenční koef., Cramérovo V, Phi,… pořadové korelace Spermanovo Rho, TauB), detailněji pak klasicky % rozdíly mezi kategoriemi nebo adjustovaná residua. Parciální korelace – pro spojité proměnné Multivariační metody (např. regresní analýza, vícerozm. analýzu rozptylu ANOVA)

Literatura De Vaus, D. A. 1986. Surveys in Social Research. London: George Allen & Unwin (Publishers) Ltd. Hendl, J. (2006) 2009. Přehled statistických metod. Praha: Portál. Mareš, P., L. Rabušic, P. Soukup. 2015. Analýza sociálněvědních dat (nejen) v SPSS. Brno: Masarykova univerzita. Zvárová, J. 1999. Základy statistiky pro biomedicínské obory. [on-line] Dostupné na http://new.euromise.org/czech/tajne/ucebnice/html/html/statist.html