Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 27/2/2019

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize.
Kvantitativní metody výzkumu v praxi
Jiří Šafr jiri.safr(zavináč)seznam.cz
Sociologie – metody a techniky sociologického výzkumu
Jiří Šafr jiri.safr(zavináč)seznam.cz
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Statistika II Michal Jurajda.
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Analýza kvantitativních dat I.
Kvantitativní metody výzkumu v praxi (KMVP) 0. Poučení z minulých ročníků a novinky od ZS 2013 (2011) poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz.
Sociologický výzkum.
Biostatistika 9. přednáška Aneta Hybšová
Řízení a supervize v sociálních a zdravotnických organizacích
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Poučení z AKD I., II poslední aktualizace
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
Jiří Šafr jiri.safr(zavináč)seznam.cz
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
DKV část 31 Design kvantitativního výzkumu 4. část ( ) Jiří Šafr UK FHS Historická sociologie (LS 2010)
PSY717 Statistická analýza dat 2010 První konzultace.
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
AKD VII.
Absolvované přednášky. Banálnost přednášky Pseudoreplikace Přehledová tabulka úvodní přednáška, úplný začátek, průměr rozptyl popisná statistika, asi.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Design kvantitativního výzkumu 0. Poučení z minulých ročníků a novinky od ZS 2011 poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz UK FHS.
Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace
doc. Ing. Cyril Klimeš, CSc. prof. Ing. Radim Farana, CSc.
Analýza kvantitativních dat II. TEST 1 (v LS 2012) Aktualizované verze jsou k dispozici na Jiří Šafr jiri.safr(zavináč)seznam.cz.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
ISS Úvodní informace ZS 2014/2015 Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Statistická významnost a její problémy
Biostatistika 8. přednáška
Kvantitativní metody výzkumu v praxi
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 5/6/2014
Biostatistika 1. přednáška Aneta Hybšová
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Analýza kvantitativních dat I. Vstupní test ze znalostí designu kvantitativního sociologického výzkumu Jiří Šafr jiri.safr(at)seznam.cz poslední aktualizace.
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Postup při empirickém kvantitativním výzkumu
Jiří Šafr jiri.safr(zavináč)seznam.cz
IV..
Aplikovaná statistika 2.
Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 2/3/2016.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
INDUKTIVNÍ STATISTIKA
Stratifikační výzkum Úvodní informace ke kurzu v ZS 2015
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 22/2/2017
Analytické metody výzkumu
Historická sociologie, Řízení a supervize
Úlohy o podobnosti objektů, mnohorozměrné škálování
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Lineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 21/2/2018
Metody sociologického výzkumu kvantitativní. MSV-KVANT Výuka v LS 2018
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 27/5/2014
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Transkript prezentace:

Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 27/2/2019 UK FHS Historická sociologie Analýza kvantitativních dat III. – praktické aplikace vícerozměrných statistických metod Představení kurzu a plán práce (v LS 2019) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 27/2/2019

Studijní materiály a podklady http://metodykv.wz.cz Zde najdete úplně vše! vč. organizačních aktualit (některé texty jsou zaheslované, o heslo si napište) Ale nejprve čtěte Studijní oporu ke kurzu KMVP - totální základy designu sociologického kvantitativního výzkumu… kdyby snad někdo nevěděl, tak úplný základ analýzy (AKD1): Ukázky jak prezentovat tabulky a interpretovat vztahy proměnných Studijní opora ke kurzu Praktikum EADKV (úvod do analýzy kvantitativních dat v prostředí statistického software PSPP/ SPSS) http://kmvp.wz.cz/praktikum_analyzy_kvn_dat_opora01.pdf a pak Praktické rady k presentaci dat (nejen) z regresních modelů v textu např. diplomové práce.

Varování! Kurz AKD3 není pro začátečníky! Podmínka je AKD1 a AKD2 nebo ekvivalent. Tzn. nebudeme se učit zapínat/Vypínat statistický program. Protože budeme modelovat vztahy v datech a o datech a modelech budeme (kriticky) přemýšlet! A ukážeme si také jak výsledky z modelů presentovat.

AKD III. – základní teze (a odlišnosti od AKD I. A AKD II.) Kurz je pro vás – pro řešení vašich problémů → „analyticko-sociologická dílna“ Vždy krátká přednáška k tématu (obecně o metodě), následuje společně zadávaný příklad v SPSS/Stata a (ideálně) aplikace na vlastních datech. Krom „velkých metod“ také drobné užitečnosti a nezbytnosti jako složitější manipulace při transformacích či užitečné míry co SPSS neumí (např. kvalitativní variance, index nepodobnosti) (a případně něco důležitého, na co se nedostalo v AKD2 ?)

Uděláme „vše pro diplomky“ Najde-li se konsensus a vytrvalost, pak všichni budeme průběžně z hodiny na hodinu pravidelně psát text diplomky (= analytické části). A následně ostatním vysvětlovat jak a proč jste jakou metodu použili s jakým výsledkem a interpretací. a texty si vzájemně číst. Problém ovšem je, že první část analýz většinou zahrnují popisné analýzy a na ty prostor v AKD3 nebude…(na to viz samostatnou presentaci)

Postup výkladu v AKD III. Proto ideální postup: Obecný výklad („je tady taková možnost analýzy“) Sociologický problém (otázka v diplomce) → metoda → její praktická aplikace A na závěr (i v průběhu): Problém → metoda/(y) Pokusíme se výklad a aplikace upravit tak, aby bylo jasno, na co se dají použít v konkrétních diplomových pracích (platí pouze pro DP u JŠ)

Dvě hlavní části kurzu (oblasti aplikace vícerozměrných metod) Kurz má mít v zásadě dvě hlavní části: Analýza latentních struktur → „asociace mezi „nezávislými“ proměnnými a redukce jejich počtu do obecnějších dimenzí či typů (klastrů)“(někdy jen defacto příprava závislé proměnné pro 2). Regresní analýza a její verze pro kategoriální data → kauzální usuzování ohledně vztahů mezi závislou a několika nezávislými proměnnými. Jádro kurzu je druhá část vícerozměrná regrese. Vypadá to, že začneme právě s ní. Konkrétní náplň kurzu závisí na složení a potřebách studentů + aktuálně řešené problematiky v SOÚ AV ČR, v.v.i.

Obsah kurzu (plán do 2015) Co jsme nestihli v AKD2 Testování hypotéz pro průměry (rozptyly), variační koeficient(y), základní transformace (agregace dat), reliabilita, konstrukce indexů…. Regresní analýza (úvod, principy) Vícerozměrná lineárně regresní analýza (OLS) Regresní analýza pro kategoriální data – binomická logistická regrese (0/1) Polynomická logistická regrese (1/2/3) Multinominální logistická regrese (B/M/A) Logitové modely Analýza latentních struktur (metoda hl. komponent) Speciální transformace dat (vektor, „případo-roky“,…) Analýza časových řad (?) Dvojné třídění - působení faktorů v kontingenční tabulce (fitting two-way table), korespondenční analýza

K tomu navíc v 2017-2019 (plán) Omezíme se pouze na aktuální řešené projekty: Socio-prostorové znevýhodnění obyvatel periferních venkovských oblastí (GA ČR, SOÚ AV ČR, v.v.i.) → data z výzkumu Periferie ČR 2016 v 2019 asi už ne CSDA-R RESEARCH (OP VVV, SOÚ AV ČR, v.v.i.) → data z CSDA-R 2017 a předvýzkum (VWT test), ISSP 2017- Sociální sítě, Panel ZŠ (4 a 5 vlna) Workshop: úvod práce v statistickém programu Stata Důraz na modelování dat a úskalí s tím spjatá (limity, testy, klastrovaná data, atd.)

V LS 2019s důraz na: Intuitivní porozumění → co děláte v kontextu Interpretaci Predikovane hodnoty a marginální efekty Grafické zobrazení výsledků (SPSS?) Velikost efektu (effect size) Klastrovou strukturu v datech a z ní vyplývající bias SE Hierarchická struktura jako součást modelu (ale uvidíme jestli na to dojde) Na co si dát v datech pozor: reliabilita, power-size, heteroskedasticita, …

A na úvod …: Test MSV-KVNT-SKE Rychle repete: Statistika v SPSS JKBM: 3-way crosstabs, elaborace, základní strategie testovaní hypotéz

Co máte znát z AKD1 a AKD2 (1.) základní úpravy dat: čištění, missingy, rekodování, vytváření nových proměnných, atd. Agregace dat Kontingenční tabulky: JKBM! Třídění 3. stupně (efektivně) Elaborace vztahů míry asociace pro kategoriální data (CV, CC, Gamma) kovariance a korelace Přímá standardizace intenzitních ukazatelů

Co máte znát z AKD1 a AKD2 (2) z inferenční statistiky: výpočet standardní chyby a intervalů spolehlivosti pro procenta/podíly a rozdíly (pro průměry nestačí) testování hypotéz pro číselní znaky (t-test, F-test oneway Anova) i v třídění 3. stupně (efektivně) testování hypotéz pro kategoriální znaky (chikvadrát test dobré shody: 1-way pro komparaci výsledků a 1-w pro kontingenční tabulku). Nutnost znát princip Chikvádrát testu (ruční výpočet!)

1. co jsme nestihli v AKD2 (v 2014) Testování hypotéz pro průměry (rozptyly), variační koeficient(y), základní transformace (agregace dat), reliabilita, konstrukce indexů…. Variační koeficient(y), Index nepodobnosti Testování hypotéz o rozdílu dvou průměrů a rozptylů (+ jednoduchá analýza rozptylu) Základní transformace: Agregace dat + tabelární data Co jste „nestihli“ v AKD2 v 2016?

Umíte? Agregovat data Spojovat data (merge) Vytvářet proměnné s pomocí podmínek (do if ..) X-Y scatter-plot s regresními přímkami pro podskupiny (→ interakce vlivu X a Z) Graf pro průměry v podskupinách s intervalem spolehlivosti (Error Bar) Spočítat interval spolehlivosti pro podíl (%) … ?

Jak psát empirickou část textu (nejen) v diplomce Podrobně viz samostatnou presentaci, kde jsou ukázky tabulek a další kroky

Postup jak (začít) psát … 1. závislá proměnná(é) s ní si vyhrajte, nepůjde již v hotovém textu měnit Koncept/operacionalizace/jednotky/ rekódování, deskripce (variance, rozložení,…),, zakotvení (porovnání s výsledky jiných výzkumů)

Postup jak (začít) psát … Rozpracovat si projekt (diplomovou práci) na otázky Podle těchto otázek udělat (pod)kapitoly (v1. kroku stačí nadpisy + anotace) otázky by měly být stupňovitě do sebe zapadající (→ co je třeba vyřešit nejdříve, co nelze bez jiného předchozího kroku, co naopak ano a co tedy lze odložit na později … ?)

Co bude psát JŠ? A co budete psát vy? Vliv rodinného prostředí – kulturní a sociální kapitál – na dosažené vzdělání a socioekonomický status v kontextu perifernosti lokality (multilevel?) Analýza panelových dat z panelu ZŠ: rozvoj čtenářské gramotnosti a determinant školního úspěchu A co budete psát vy?

Základní doporučená literatura Mareš, P., L. Rabušic, P. Soukup. 2017. Analýza sociálněvědních dat (nejen) v SPSS. Brno: Muni Press. https://www.press.muni.cz/knihy/projekty-nakladatelstvi/spss Treiman, D. J. 2009. Quantitative data analysis: doing social research to test ideas. San Francisco: Jossey-Bass. https://www.wiley.com/en-cz/Quantitative+Data+Analysis%3A+Doing+Social+Research+to+Test+Ideas-p-9781118512609