Jiří Šafr jiri.safr(zavináč)seznam.cz

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Testování neparametrických hypotéz
Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize.
Kvantitativní metody výzkumu v praxi
Kvantitativní metody výzkumu v praxi PRAKTIKUM 4b. část Jiří Šafr UK FHS Řízení a supervize v sociálních a zdravotnických organizacích.
Jiří Šafr jiri.safr(zavináč)seznam.cz
Jiří Šafr jiri.safr(zavináč)seznam.cz
Analýza kvantitativních dat: 1. úvod do SPSS Jiří Šafr jiri.safr(zavináč)seznam.cz vytvořeno , poslední aktualizace UK FHS Historická.
Statistika I 2. cvičení.
MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Jiří Šafr jiri.safr(zavináč)seznam.cz
Analýza kvantitativních dat I.
Analýza dat.
Řízení a supervize v sociálních a zdravotnických organizacích
Analýza kvantitativních dat II. Analýza chybějících hodnot (missing values) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 23/5/2012 UK FHS Historická.
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Analýza kvantitativních dat I./II. & Praktikum elementární analýzy dat
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
Statistika 2 Aritmetický průměr, Modus, Medián
Jiří Šafr jiri.safr(zavináč)seznam.cz
Kurz SPSS: Jednoduchá analýza dat
Jiří Šafr jiri.safr(zavináč)seznam.cz
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Pavel Najman. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace
Analýza kvantitativních dat II. TEST 1 (v LS 2012) Aktualizované verze jsou k dispozici na Jiří Šafr jiri.safr(zavináč)seznam.cz.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 5/6/2014
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Analýza kvantitativních dat AKD I. Vstupní test 22/2/2011 Jiří Šafr, FHS UK, HiSo.
Direct standardization in contingency table (adjustment for factor) Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis II.
Kombinatorika, pravděpodobnost, statistika
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Popisná analýza v programu Statistica
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
Analýza kvantitativních dat I. Vstupní test ze znalostí designu kvantitativního sociologického výzkumu Jiří Šafr jiri.safr(at)seznam.cz poslední aktualizace.
( vzdělanostní struktura obyvatel )
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Jiří Šafr jiri.safr(zavináč)seznam.cz
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
SPSS a analýza dat Grafy pro prezentaci výzkumu Chyby prezentování dat Custom tables v SPSS.
Statistika 1.cvičení. Základní informace Ing. Daniela Krbcová Materiály ze cvičení, přednášky Skripta k předmětu,
Odhady odhady bodové a intervalové odhady
Popisná statistika I tabulky četností
Induktivní statistika
Induktivní statistika
Historická sociologie, Řízení a supervize
Neparametrické testy parametrické a neparametrické testy
Statistika a evaluace.
Popisná analýza v programu Statistica
METODOLOGIE MAGISTERSKÉ PRÁCE
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Typy proměnných Kvalitativní/kategorická binární - ano/ne
PSY117 Statistická analýza dat v psychologii Přednáška
Metodologie pro ISK 2 Úvod do práce s daty
Základní zpracování dat Příklad
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Analýza kardinálních proměnných
Lineární regrese.
Autor: Honnerová Helena
Metody sociologického výzkumu kvantitativní. MSV-KVANT Výuka v LS 2018
Jiří Šafr jiri.safr(zavináč)seznam.cz
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Jiří Šafr jiri.safr(zavináč)seznam.cz UK FHS Historická sociologie, Řízení a supervize (ZS 2012 – 2015) Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 31.5. 2015 (13. 4. 2014)

Nejprve připomenutí: Grafy třídění 1. a 2.stupně

Sloupcový graf (Barchart) pro třídění 1. stupně v rámci příkazu Frequencies (pouze pro 1. stupeň) FREQUENCIES q14b /BARCHART = PERCENT. nebo přes zadání grafu (zde lze i třídění 2 a vyššího stupně) GRAPH /BAR(SIMPLE)=PCT BY q14b .

2.st.: Vstupní data grafu → kontingenční tabulka Stále platí pravidlo o orientaci procent: Sloupcová %, pokud závislá proměnná je v řádcích a nezávislá ve sloupcích. (nebo obráceně: řádková % a závislá se sloupcích a v řádcích nezávislá) Pozor, SPSS umí sloupcový graf rovnou v rámci příkazu CROSSTABS, ale pouze pro absolutní četnosti (my chceme %). CROSSTABS q14b BY s30/cel col /BARCHART.

Barchart pro třídění 2.stupně Příklad: Zájem o politiku podle pohlaví Nezávislá proměnná Součet v kategoriích = 100 % Raději si vždy zkontrolujte, zda součet %, tj. typ/orientace % je správně, buď vložením hodnot nebo pomocí CROSSTABS. Závislá proměnná Zdroj: ISSP 2007

Syntax: sloupcový graf třídění 2. stupně Příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají Chart Builder a Interactive, které je v podstatě možné zadávat pouze klikáním přes okna) Vycházíme ze základního zadání třídění 1. stupně: GRAPH /BAR(SIMPLE)=PCT BY vekkat. Přidat lze rozdělení do klastrů-rozdělených sloupců např. podle pohlaví (s30) GRAPH /BAR(SIMPLE)=PCT BY q14b BY s30. Pozor ale na orientaci procent (sloupcová vs. řádková) ! Frequency of cases in each category expressed as a percentage of the whole. Parametr: COUNT → absolutní četnosti, PCT → procenta

Grafy třídění 3. stupně

Grafy třídění 3.stupně: Závislá proměnná kardinální Problém není pokud je závislá proměnná kardinální (číselná), pak ukazujeme průměry v pod / pod skupinách (2. a 3. kategoriální proměnné). GRAPH /BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30. GRAPH /ERRORBAR(CI 95)=prijem BY vzd4 BY s30.

Grafy třídění 3.stupně: Závislá proměnná kardinální Pokud je jedna vysvětlující proměnná ordinální (na ose X), pak lze i liniový graf, který vyjadřuje trendy v podskupinách. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30. GRAPH /LINE(MULTIPLE)=MEAN(prijem) BY vzd4 BY s30 /INTERVAL CI(95.0).

Grafy třídění 3.stupně: Závislá proměnná kardinální GRAPH /BAR(GROUPED)=MEAN(prijem) BY vzd4 BY s30.

Jak v SPSS do grafu dostat třídění 3. stupně (pro %)?

Grafy třídění 3.stupně: Závislá proměnná je kategoriální Situace je komplikovanější, pokud všechny tři proměnné jsou kategoriální (tj. včetně závislé) S výhodou můžeme využít podobný princip jako pokud bychom měli kardinální proměnnou a ukazovali průměry v podskupinách. → závislou proměnnou nejprve rekódujeme na dichotomii a pak ukazujeme % pro jednu – „pozitivní“ kategorii resp. pravděpodobnost (což je vlastně průměr z dichotomie 0/1). Alternativně lze v BARCHARTu (u ordinálních znaků) nechat zobrazit % nad/pod určitou hodnotou Jenže to jde pouze tam, kde lze závislou proměnnou vyjádřit dichotomií (tedy tam kde lze kategorie slučovat, většinou, pokud je ordinální) nebo vyjádřit jako určitou (krajní) hodnotu.

Grafické znázornění interakcí, zadání v syntaxu SPSS Účast ve volbách (q34), data ISSP 2007. *PIN (1 1) → procento „inside“, zde pro kategoriie 1 až 1, tj. 1=volil nebo lze PGT = % větší než (hodnota), PLT = % menší než (hodnota). GRAPH /LINE(SIMPLE)=PIN(1 1)(volil) BY vek3. GRAPH /LINE(SIMPLE)=PIN(1 1)(volil) BY vek3 BY vzd3. GRAPH /BAR(SIMPLE)=PIN(1 1)(volil) BY vek3 BY vzd3. *Pokud máme kontrolní proměnnou dichotomickou, lze ukázat rozdíl mezi jejími kategoriemi (zde vzdělání jen s/bez VŠ). GRAPH /HILO(SIMPLE)=PIN(1 1)(volil) BY vek3 BY vzd_VS. *Vždy si sestavte také kontingenční tabulku a a kontrolujte absolutní počty případů v buňkách. CROSSTABS q34 BY vek3 BY vzd3. CROSSTABS q34 BY vek3 BY vzd3 /CEL COL /STAT Phi.

Účast ve volbách (q34), data ISSP 2007 Bivariátní vztah: volil podle věku. GRAPH /LINE(SIMPLE) =PIN(1 1)(volil) BY vek3. q34 (1=volil, 2=nevolil) → PIN(1 1) = procento pro kategoriie 1 až 1, tj. 1=volil. Volil podle věku s kontrolou vzdělání % rozdíl pro VŠ /ostatní. GRAPH /HILO(SIMPLE) =PIN(1 1)(volil) BY vek3 BY vzd_VS. GRAPH /LINE(SIMPLE) =PIN(1 1)(volil) BY vek3 BY vzd3. GRAPH /BAR(SIMPLE) =PIN(1 1)(volil) BY vek3 BY vzd3. Zdroj: [ISSP 2007]

Vstupní data = konting. tabulka třídění 3.stupně. Závislá p. dichotomická: ne/zájem o politiku Jaký rozdíl v zájmu o politiku mezi muži a ženami uvnitř vzdělanostních kategoriích? → zájem o politiku (rekód na zájem/nezájem) podle pohlaví při kontrole vlivu vzdělání Nejprve je třeba závislou proměnnou rekódovat na dichotomii (zde zájem/nezájem o politiku) GRAPH /BAR(GROUPED)=PGT(0)(ZajPolit) BY s30 BY vzd3. a odpovídající konting. tabulka: CROSSTABS ZajPolit BY s30 BY vzd3/cel col.

Graf pro závislou proměnnou (v %) a 2 vysvětlující GRAPH /BAR(GROUPED)=PGT(0)(readEnj1) BY Egp3RO BY EU_3kat. Funguje ale pouze pro dichotomickou závislou proměnnou, zde Čte pro radost kódovanou (0=nečte/ 1=čte)→ ukazujeme podíl s hodnotou vyšší než 0 → PGT(0). → zobrazí procento případů s hodnotou vyšší než 0. Nebo obráceně pro „ne-čtenáře“ PLT(1) → zobrazí procento případů s hodnotou nižší než 1.

Graf se závislou a 2 vysvětlujícími proměnnými Čtení pro radost (denně) u patnáctiletých žáků podle sociální třídy rodičů v evropských zemích. PISA 2009.

Sloupcový graf (%) pro závislou a 2 nezávislé proměnné. Názory rodičů na důležitost dalšího studia po maturitě podle vzdělání rodičů a typu studia, ČR 2003, procenta souhlasu Zdroj: PISA 2003; N = min 3468

To samé pomocí Chart Builder GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=skoly COUNT()[name="COUNT"] PA1_Vzd3[LEVEL=ORDINAL] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: skoly=col(source(s), name("skoly"), unit.category()) DATA: COUNT=col(source(s), name("COUNT")) DATA: PA1_Vzd3=col(source(s), name("PA1_Vzd3"), unit.category()) COORD: rect(dim(1,2), cluster(3,0)) GUIDE: axis(dim(3), label("Školy")) GUIDE: axis(dim(2), label("Percent")) GUIDE: legend(aesthetic(aesthetic.color.interior), label("Vzdělanostní aspirace žáků (dle ", "profese 1, přímý kód)")) SCALE: cat(dim(3), include("1", "2", "3", "4")) SCALE: linear(dim(2), include(0)) SCALE: cat(aesthetic(aesthetic.color.interior), include("1", "2", "3")) SCALE: cat(dim(1), include("1", "2", "3")) ELEMENT: interval(position(summary.percent(PA1_Vzd3*COUNT*skoly, base.coordinate(dim(3)))), color.interior(PA1_Vzd3), shape.interior(shape.square)) END GPL.

3D graf & panely: závislá proměnná a 3 nezávislé Aspirace patnáctiletých na studium na VŠ podle aspirací rodičů a jejich vzdělání, studenti ZŠ a VG, ČR 2003, procenta Zdroj: PISA 2003

Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. Zdroj: PISA 2007

Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=vekkat[LEVEL=nominal] vzd4[LEVEL=ordinal] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Heat Map"[LOCATION=LOCAL] MAPPING( "color"="prijem"[DATASET="graphdataset"] "rows"="vekkat"[DATASET="graphdataset"] "columns"="vzd4"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="Heat Map: vzd4-vekkat-prijem" DEFAULTTEMPLATE=NO.

3 D-density: vztah dvou číselných proměnných GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=isei[LEVEL=ratio] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="3-D Density"[LOCATION=LOCAL] MAPPING( "z"="prijem"[DATASET="graphdataset"] "x"="isei"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="3-D Density: prijem-isei" DEFAULTTEMPLATE=NO.