Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.

Podobné prezentace


Prezentace na téma: "Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace."— Transkript prezentace:

1 Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace UK FHS Historická sociologie, Řízení a supervize (ZS 2012, 2013, 2014)

2 Nejprve připomenutí: Grafy třídění 1. a 2.stupně

3 Sloupcový graf (Barchart) pro třídění 1. stupně v rámci příkazu Frequencies (pouze pro 1. stupeň) FREQUENCIES q14b /BARCHART = PERCENT. nebo přes zadání grafu (zde lze i třídění 2 a vyššího stupně) GRAPH /BAR(SIMPLE)=PCT BY q14b.

4 2.st.: Vstupní data grafu → kontingenční tabulka Stále platí pravidlo o orientaci procent: Sloupcová %, pokud závislá proměnná je v řádcích a nezávislá ve sloupcích. (nebo obráceně: řádková % a závislá se sloupcích a v řádcích nezávislá) Pozor, SPSS umí sloupcový graf rovnou v rámci příkazu CROSSTABS, ale pouze pro absolutní četnosti (my chceme %). CROSSTABS q14b BY s30/cel col /BARCHART.

5 Barchart pro třídění 2.stupně Příklad: Zájem o politiku podle pohlaví Zdroj: ISSP 2007 Nezávislá proměnná Součet v kategoriích = 100 % Závislá proměnná Raději si vždy zkontrolujte, zda součet %, tj. typ/orientace % je správně, buď vložením hodnot nebo pomocí CROSSTABS.

6 Syntax: sloupcový graf třídění 2. stupně Příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají Chart Builder a Interactive, které je v podstatě možné zadávat pouze klikáním přes okna) Vycházíme ze základního zadání třídění 1. stupně: GRAPH /BAR(SIMPLE)=PCT BY vekkat. Přidat lze rozdělení do klastrů-rozdělených sloupců např. podle pohlaví (s30) GRAPH /BAR(SIMPLE)=PCT BY q14b BY s30. Pozor ale na orientaci procent (sloupcová vs. řádková) ! Frequency of cases in each category expressed as a percentage of the whole. Parametr:COUNT → absolutní četnosti, PCT → procenta

7 Grafy třídění 3. stupně

8 Grafy třídění 3.stupně: Závislá proměnná kardinální Problém není pokud je závislá proměnná kardinální (číselná), pak ukazujeme průměry v pod / pod skupinách (2. a 3. kategoriální proměnné). GRAPH /BAR(GROUPED)= MEAN (prijem) BY vzd4 BY s30.GRAPH /ERRORBAR(CI 95)=prijem BY vzd4 BY s30.

9 Grafy třídění 3.stupně: Závislá proměnná kardinální Pokud je jedna vysvětlující proměnná ordinální (na ose X), pak lze i liniový graf, který vyjadřuje trendy v podskupinách. GRAPH / LINE (MULTIPLE)=MEAN(prijem) BY vzd4 BY s30. GRAPH / LINE (MULTIPLE)=MEAN(prijem) BY vzd4 BY s30 /INTERVAL CI(95.0).

10 GRAPH /BAR(GROUPED)= MEAN (prijem) BY vzd4 BY s30. Grafy třídění 3.stupně: Závislá proměnná kardinální

11 Jak v SPSS do grafu dostat třídění 3. stupně (pro %)?

12 Grafy třídění 3.stupně: Závislá proměnná je kategoriální Situace je komplikovanější, pokud všechny tři proměnné jsou kategoriální (tj. včetně závislé) S výhodou můžeme využít podobný princip jako pokud bychom měli kardinální proměnnou a ukazovali průměry v podskupinách. → závislou proměnnou nejprve rekódujeme na dichotomii a pak ukazujeme % pro jednu – „pozitivní“ kategorii resp. pravděpodobnost (což je vlastně průměr z dichotomie 0/1). Alternativně lze v BARCHARTu (u ordinálních znaků) nechat zobrazit % nad/pod určitou hodnotou Jenže to jde pouze tam, kde lze závislou proměnnou vyjádřit dichotomií (tedy tam kde lze kategorie slučovat, většinou, pokud je ordinální).

13 Vstupní data = konting. tabulka třídění 3.stupně. Závislá p. dichotomická: ne/zájem o politiku Jaký rozdíl v zájmu o politiku mezi muži a ženami uvnitř vzdělanostních kategoriích? → zájem o politiku (rekód na zájem/nezájem) podle pohlaví při kontrole vlivu vzdělání Nejprve je třeba závislou proměnnou rekódovat na dichotomii (zde zájem/nezájem o politiku) GRAPH /BAR(GROUPED)=PGT(0)(ZajPolit) BY s30 BY vzd3. a odpovídající konting. tabulka: CROSSTABS ZajPolit BY s30 BY vzd3/cel col.

14 Graf pro závislou proměnnou (v %) a 2 vysvětlující GRAPH /BAR(GROUPED)=PGT(0)(readEnj1) BY Egp3RO BY EU_3kat. Funguje ale pouze pro dichotomickou závislou proměnnou, zde Čte pro radost kódovanou (0=nečte/ 1=čte)→ ukazujeme podíl s hodnotou vyšší než 0 → PGT(0). → zobrazí procento případů s hodnotou vyšší než 0. Nebo obráceně pro „ne-čtenáře“ PLT(1) → zobrazí procento případů s hodnotou nižší než 1.

15 Graf se závislou a 2 vysvětlujícími proměnnými Čtení pro radost (denně) u patnáctiletých žáků podle sociální třídy rodičů v evropských zemích. PISA 2009.

16 Sloupcový graf (%) pro závislou a 2 nezávislé proměnné. Názory rodičů na důležitost dalšího studia po maturitě podle vzdělání rodičů a typu studia, ČR 2003, procenta souhlasu Zdroj: PISA 2003; N = min 3468

17 To samé pomocí Chart Builder * Chart Builder. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=skoly COUNT()[name="COUNT"] PA1_Vzd3[LEVEL=ORDINAL] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE. BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: skoly=col(source(s), name("skoly"), unit.category()) DATA: COUNT=col(source(s), name("COUNT")) DATA: PA1_Vzd3=col(source(s), name("PA1_Vzd3"), unit.category()) COORD: rect(dim(1,2), cluster(3,0)) GUIDE: axis(dim(3), label("Školy")) GUIDE: axis(dim(2), label("Percent")) GUIDE: legend(aesthetic(aesthetic.color.interior), label("Vzdělanostní aspirace žáků (dle ", "profese 1, přímý kód)")) SCALE: cat(dim(3), include("1", "2", "3", "4")) SCALE: linear(dim(2), include(0)) SCALE: cat(aesthetic(aesthetic.color.interior), include("1", "2", "3")) SCALE: cat(dim(1), include("1", "2", "3")) ELEMENT: interval(position(summary.percent(PA1_Vzd3*COUNT*skoly, base.coordinate(dim(3)))), color.interior(PA1_Vzd3), shape.interior(shape.square)) END GPL.

18 3D graf & panely: závislá proměnná a 3 nezávislé Aspirace patnáctiletých na studium na VŠ podle aspirací rodičů a jejich vzdělání, studenti ZŠ a VG, ČR 2003, procenta Zdroj: PISA 2003

19 Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. Zdroj: PISA 2007

20 Heat map - graf tř. 3 st.: závislá kardinální (průměr) podle dvou kategoriálních proměnných. GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=vekkat[LEVEL=nominal] vzd4[LEVEL=ordinal] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="Heat Map"[LOCATION=LOCAL] MAPPING( "color"="prijem"[DATASET="graphdataset"] "rows"="vekkat"[DATASET="graphdataset"] "columns"="vzd4"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="Heat Map: vzd4-vekkat-prijem" DEFAULTTEMPLATE=NO.

21 3 D-density: vztah dvou číselných proměnných GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=isei[LEVEL=ratio] prijem[LEVEL=ratio] MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=VIZTEMPLATE(NAME="3-D Density"[LOCATION=LOCAL] MAPPING( "z"="prijem"[DATASET="graphdataset"] "x"="isei"[DATASET="graphdataset"])) VIZSTYLESHEET="Traditional"[LOCATION=LOCAL] LABEL="3-D Density: prijem-isei" DEFAULTTEMPLATE=NO.


Stáhnout ppt "Analýza kvantitativních dat I. (II.) Popisné statistiky v grafech 2. (třídění 2. a 3. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace."

Podobné prezentace


Reklamy Google