Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 21/2/2018 UK FHS Historická sociologie Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod Představení kurzu a plán práce (v ZS 2018) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 21/2/2018
Webová stránka AKD → základ všeho http://metodykv.wz.cz
AKD III. – základní teze (a odlišnosti od AKD I. A II.) Kurz je pro vás – pro řešení vašich problémů → „analyticko-sociologická dílna“ Vždy krátká přednáška k tématu (obecně o metodě), následuje společně zadávaný příklad v SPSS/Stata a (ideálně) aplikace na vlastních datech. Krom „velkých metod“ také drobné užitečnosti a nezbytnosti jako složitější manipulace při transformacích či užitečné míry co SPSS / Stata neumí (např. kvalitativní variance, index nepodobnosti) (a případně něco důležitého, na co se nedostalo v AKD2 ?)
Uděláme „vše pro diplomky“ Najde-li se konsensus a vytrvalost, pak všichni budeme průběžně z hodiny na hodinu pravidelně psát text diplomky (= analytické části). A následně ostatním vysvětlovat, jak a proč jste jakou metodu použili s jakým výsledkem a interpretací. a texty si vzájemně číst. Problém ovšem je, že první část analýz většinou zahrnují popisné analýzy a na ty prostor v AKD3 nebude…(na to viz samostatnou presentaci)
Postup výkladu v AKD III. Proto ideální postup: Obecný výklad („je tady taková možnost analýzy“) Sociologický problém (otázka např. v diplomce) → metoda → její praktická aplikace A na závěr (i v průběhu): Problém → metoda/(y) Pokusíme se výklad a aplikace upravit tak, aby bylo jasno, na co se dají použít v konkrétních diplomových pracích (platí pouze pro DP u JŠ)
Dvě hlavní části kurzu (oblasti aplikace vícerozměrných metod) Kurz má mít v zásadě dvě hlavní části: Analýza latentních struktur → „asociace mezi „nezávislými“ proměnnými a redukce jejich počtu do obecnějších dimenzí (faktorů) či typů (klastrů)“(někdy jen defacto příprava závislé proměnné pro 2). Regresní analýza a její verze pro kategoriální data → kauzální usuzování ohledně vztahů mezi závislou a několika nezávislými proměnnými. Jádro kurzu je druhá část vícerozměrná regrese. Vypadá to, že začneme právě s ní. Konkrétní náplň kurzu závisí na složení a potřebách studentů + aktuálně řešené problematiky v SOÚ AV ČR, v.v.i.
Obsah kurzu (plány do r. 2015) Co jsme nestihli v AKD2 Testování hypotéz pro průměry (rozptyly), variační koeficient(y), základní transformace (agregace dat), reliabilita, konstrukce indexů…. Regresní analýza (úvod, principy) Vícerozměrná lineárně regresní analýza (OLS) a analýza moderace/interakce Regresní analýza pro kategoriální data – binomická logistická regrese (0/1) Polynomická logistická regrese (1/2/3) Multinominální logistická regrese (B/M/A) Prezentace a interpretace: predikované hodnoty, marginální efekty Analýza latentních struktur (metoda hl. komponent) Speciální transformace dat (vektor, „případo-roky“,…) Analýza časových řad a panelových/klastrovaných dat (?) Dvojné třídění - působení faktorů v kontingenční tabulce (fitting two-way table), korespondenční analýza
K tomu navíc v 2018 (základní plán) Omezíme se pouze na aktuální řešené projekty: CESDA RESEARCH (OP VVV, SOÚ AV ČR, v.v.i.) → data z: - (před)výzkumu CSDA 2017: VWT test, Výchovné styly, Čtenářské klima SES mobilita a dal. - ISSP 2017 Soc.sítě; ISSP-Občanství; EVS, a dal. Socio-prostorové znevýhodnění obyvatel periferních venkovských oblastí (GA ČR, SOÚ AV ČR, v.v.i.) → data z výzkumu Periferie ČR 2016 Workshop/integrace do výkladu(?): úvod práce v statistickém programu STATA Důraz na modelování dat (limity, testy, klastrovaná data, atd.) a příklady aplikací
K tomu navíc v 2018 (rozšířený „naivní“ plán) Moderace/interakce v regresním modelu Klastrovaná struktura dat a přístupy k jejich analýze: víceúrovňové modelování Mediační analýza (jednoduchá path analýza zprostředkovaných a přímých vlivů) Možnosti kauzální inference v observačních datech
Co máte znát z AKD1 a AKD2 (1.) základní úpravy dat: čištění, missingy, rekodování, vytváření nových proměnných, atd. Agregace dat Kontingenční tabulky: JKBM! Třídění 3. stupně (efektivně) Elaborace vztahů míry asociace pro kategoriální data (CV, CC, Gamma) kovariance a korelace Přímá standardizace intenzitních ukazatelů
Co máte znát z AKD1 a AKD2 (2) z inferenční statistiky: výpočet standardní chyby a intervalů spolehlivosti pro procenta/podíly a rozdíly (pro průměry nestačí) testování hypotéz pro číselní znaky (t-test, F-test oneway Anova) i v třídění 3. stupně (efektivně) testování hypotéz pro kategoriální znaky (chikvadrát test dobré shody: 1-way pro komparaci výsledků a 1-w pro kontingenční tabulku). Nutnost znát princip Chikvádrát testu (ruční výpočet!)
1. co jsme nestihli v AKD2 (v 2014) Testování hypotéz pro průměry (rozptyly), variační koeficient(y), základní transformace (agregace dat), reliabilita, konstrukce indexů…. Variační koeficient(y), Index nepodobnosti Testování hypotéz o rozdílu dvou průměrů a rozptylů (+ jednoduchá analýza rozptylu) Základní transformace: Agregace dat + tabelární data Co jste „nestihli“ v AKD2 v 2017?
Umíte? Agregovat data Spojovat data (merge) Vytvářet proměnné s pomocí podmínek (do if ..) X-Y scatter-plot Graf pro průměry v podskupinách s intervalem spolehlivosti (Error Bar) … ?
Jak psát empirickou část textu (nejen) v diplomce Podrobně viz samostatnou presentaci, kde jsou ukázky tabulek a další kroky
Postup jak (začít) psát … 1. závislá proměnná(é) s ní si vyhrajte, nepůjde již v hotovém textu měnit Koncept/operacionalizace/jednotky/ rekódování, deskripce (variance, rozložení,…),, zakotvení (porovnání s výsledky jiných výzkumů)
Postup jak (začít) psát … Rozpracovat si projekt (diplomovou práci) na otázky Podle těchto otázek udělat (pod)kapitoly (v1. kroku stačí nadpisy + anotace) otázky by měly být stupňovitě do sebe zapadající (→ co je třeba vyřešit nejdříve, co nelze bez jiného předchozího kroku, co naopak ano a co tedy lze odložit na později … ?)
Co bude psát JŠ? A co budete psát vy? Diference v příjmech a chudobě (materiální deprivaci) v závislosti na perifernosti území Vliv rodinného prostředí na dosažené vzdělání a socioekonomický status v kontextu perifernosti lokality A co budete psát vy?