Jiří Šafr jiri.safr(zavináč)seznam.cz UK FHS Historická sociologie, Řízení a supervize (LS 2011-2014) Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 28. 3. 2014
Lodyhový (cifrový) graf (Stem-and-Leaf Plot ) Ukazuje distribuci dat: hustotu a rozložení; identifikace outlierů (extrémů), Vhodný pouze pro data s menším počtem případů → histogram nebo boxplot Postup: hodnoty znaku vzestupně uspořádáme; určíme úroveň dle číslice: lodyha (stem) = např. desítky a listy (leafs) = např. jednotky; vek Stem-and-Leaf Plot Frequency Stem & Leaf 3,00 0 . 668 3,00 1 . 122 1,00 1 . 5 Stem width: 10,00 Each leaf: 1 case(s)
Histogram sloupcový graf, v němž každé kategorii přiřadíme její četnost (nejde procenta!). Zobrazuje distribuci kategorií numerického- kardinálního (nebo ordinálního) znaku (proto ho někdy doplňujeme o distribuční křivku normálního rozdělení). Osa Y znázorňuje počet případů (četnost) v dané kategorii. Osa X – intervaly, ty jsou stejné šířky. Pozor nesprávná šířka intervalu může zkreslovat.
Sloupcový graf – Barchart, v % Pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny).
Sloupcový graf – Barchart, absolutní četnosti Pokud ho zadáme v absolutních četnostech, dostaneme vlastně histogram (ale viz rozdíl).
Histogram a Sloupcový graf (Barchart) v SPSS Histogram není příliš vhodný pro malý počet případů.
Barchart → četnosti kategorií kategorizovaného znaku (zde nominální znak Kraj) Zdroj: ISSP2007, ČR
Barchart → četnosti kategorií kategoriálního znaku (zde ordinální kategorie věku) Zdroj: ISSP2007, ČR
Histogram → četnosti/ hustota kardinálního (numerického – spojitého) znaku (věk u dospělé populace ČR) Zdroj: ISSP2007, ČR
Stem and Leaf → četnosti/ hustota kardinálního (numerického – spojitého) znaku (věk u dospělé populace ČR) vek Stem-and-Leaf Plot Frequency Stem & Leaf 53,00 1 . 88888888888899999999999999 104,00 2 . 00000000000000011111111111122222222333333333344444 62,00 2 . 555555666667777778888888899999 89,00 3 . 0000000000111111222222222233333333334444444 76,00 3 . 5555555566666667777788888888889999999 95,00 4 . 0000000011112222222222233333333333444444444444 107,00 4 . 5555555555666666666666677777788888888888899999999999 112,00 5 . 0000000000000011111111122222222222233333333334444444444 135,00 5 . 555555555555666666666666777777777778888888888888888999999999999999 112,00 6 . 0000000000000001111111111222222222223333333333333444444 118,00 6 . 5555555555555555666666666677777777777777788888888889999999 75,00 7 . 000000000000011111122222233333444444 84,00 7 . 55555555555666666677777888888888999999999 Stem width: 10 Each leaf: 2 case(s)
Koláčový graf (Pie chart), v % Zdroj: ISSP2007, ČR
Koláčový graf (Pie chart), v % Zdroj: TV&knihy 2013, studenti FHS
Boxplot – vousaté krabičky, graf rozptýlení KVARTILY dělí statistický soubor na desetiny: dolní Q0,25 (Q1) a horní Q0,denní5 (Q3) medián, kvartily (II. a III.), přilehlá (outliers) a vzdálená (extremes) pozorování Interkvartilové rozpětí (vnitřní hradby): HH = horní kvartil + 1,5 násobku interkvartilového rozpětí DH = dolní kvartil + 1,5 násobku interkvartilového rozpětí
Syntax pro základní grafy v SPSS Jednoduše v rámci příkazu FREQUENCIES: FREQ vek / HISTO. FREQ vek / BARCHART PERCENT. FREQ vek / BARCHART FREQ. FREQ vek /PIECHART PERCENT. Samostatný příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat ze syntaxu. Novější verze SPSS mají rozhraní Chart Builder a Interactive, které je v podstatě nutné zadávat klikáním přes okna) GRAPH /HISTOGRAM=vek. GRAPH /BAR(SIMPLE)=PCT BY vekkat. GRAPH /BAR(SIMPLE)=PCT BY q14b BY s30. /*2. stupeň: AxB. GRAPH /PIE=PCT BY vekkat. Parametr COUNT → absolutní četnosti, PCT → procenta Další grafy pro třídění 2. a 3. stupně viz prezentaci 7. Grafy třídění 2.&3.st. http://metodykv.wz.cz/AKD1_Grafy2.ppt .
Stem-and-Leaf EXAMINE VARIABLES=vek /PLOT BOXPLOT HISTOGRAM STEMLEAF V rámci příkazu EXPLORE resp. EXAMINE: EXAMINE VARIABLES=vek /PLOT BOXPLOT HISTOGRAM STEMLEAF /COMPARE GROUPS /STATISTICS NONE /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. *specifikace STATISTICS=NONE vypíná zobrazení výpočtů statistik – tabulek příkazu Explore /STATISTICS=ALL naopak zobrazí všechny.
BOXPLOT (fousaté krabičky) EXAMINE VARIABLES= vek BY vzd4 /PLOT=BOXPLOT /STATISTICS=NONE /NOTOTAL. *pro třídění 2. stupně (věk podle vzdělání).
Třídění 2. stupně pro kategoriální proměnné Podrobně viz 7. Grafy třídění 2. a 3. stupně http://metodykv.wz.cz/AKD1_Grafy2.ppt
Barchart: často pro třídění 2 Barchart: často pro třídění 2.stupně Příklad: Zájem o politiku podle pohlaví