Analýza kvantitativních dat I. UK FHS Historická sociologie, Řízení a supervize (LS 2012) Analýza kvantitativních dat I. Úvod do prostředí statistického programu SPSS (PSPP) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2013
Vše je podrobně popsáno v souboru Návod na statistický software PSPP, část 1. – úvod http://metodykv.wz.cz/PSPP_navod_1_uvod.pdf
Tři typy oken v SPSS / PSPP Data editor (záložky Variable View a Data View) → správa datového souboru → soubory s koncovkou *.sav Output → výstupy analýz → soubory s koncovkou *.spv (od verze 15) Syntax → zadávání pomocí příkazového řádku → soubory s koncovkou *.sps
Data: Data Editor V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky) → v okně Data Editor záložka Data View
Správa proměnných (labely, chybějící hodnoty - missingy, formát, …) → záložka Variable View v okně Data Editor
Output: výstupy (analýz, úpravy dat)
Úprava dat (agregování, filtrování, rekódování, …) → příkazy v sekcích hlavního menu Data a Transform (nebo přímé zadání pomocí příkazového řádku v Syntaxu)
Analýzy → příkazy v sekci hlavního menu Analyze Popisné statistiky: Descriptive statistics → Frequencies / Descriptives / Explore (nebo přímé zadání pomocí příkazového řádku v Syntaxu)
Syntax: přímé zadání pomocí příkazového řádku Výhodou je, že sekvenci příkazů můžeme uložit (soubor s koncovkou *.sps) a kdykoliv se k ní vrátit, případně měnit vstupní proměnné. V případě úpravy dat poskytuje kontrolu operací a umožňuje úpravy sdílet. Syntax lze u každé operace (analýzy či úpravy dat) vygenerovat při zadávání z menu pomocí tlačítka Paste
Vkládání dat v Data editoru Variable View Zde si nejprve připravíme datovou matici: jména proměnných (Name), jejich typ/formát (Type) a případně labely Data View Zde pak ukládáme data – po řádcích (1 řádek = 1 respondent/ dotazník)
Tři informace o proměnných: (připomenutí) jméno proměnné VARIABLE NAME max. 8 znaků bez diakritiky, mezer; musí začínat písmenem (např. pohlavi) → bezpodmínečně v datech musí být a pro uživatele může přibýt užitečná nadstavba: popiska proměnné VARIABLE LABEL Delší popis názvu znaku, lze s diakritikou, např. (zkrácené) znění otázky v dotazníku, který se bude objevovat ve výstupech (např. Pohlaví respondenta) popisky kategorií VALUE LABELS Popis kategorií znaku, které se budou objevovat ve výstupech (např. 1= muž, 2 = žena)
Další úpravy dat a výstupů stručný přehled Rekódování, konstrukce nových znaků; třídění výstupů, vážení, seřazování hodnot, agregování dat, spojování více datových souborů …
Transformace dat → Transform Výpočet/vytváření nových (syntetických) znaků → COMPUTE (nebo pro „načítání“ COUNT) Rekódování → RECODE (do stejné nebo nové proměnné) Visual Binding – nástroj pro snadné rekódování (pro spojité-kardinální znaky např. dle percentilů)
Úpravy dat a výstupů → Data Uspořádání případů → SORT CASES Rozdělení na podsoubory → SPLIT FILE Výběr případů (filtrování) → SELECT CASES Vážení → WEIGHT CASES Agregace (např. průměry pro skupiny) → AGGREGATE Spojování souborů dat / přidávání proměnných → MERGE FILES
Transformace dat → Transform Úpravy dat → Data
Zadání analýz a jejich výstupy Analýzy (tabulky), grafy
Analýzy → Analyze Descriptive statistics Tables Compare means Correlate Data Reduction Nonparametric Tests Missing Value Analysis Multiple Response
Grafy → Graphs
Nastavení outputu SPSS Praktická úprava výstupů se zobrazováním hodnot a názvů proměnných (oproti továrnímu nastavení, kde jsou pouze labely)
Nastavení labelů při zobrazování tabulek v outputu SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. NEW FILE.
Nastavení labelů při zobrazování tabulek v outputu Bez názvu proměnné a hodnot kategorií (původní tovární nastavení) → vhodné pro finální prezentaci v textu S názvem proměnné a hodnotami kategorií (naše nastavení) → vhodnější pro analýzy
Zobrazování labelů/hodnot v outputu lze spustit pomocí skriptu v Syntaxu *NASTAVENI Labelů v OUTPUTU SPSS (funguje od verze 16). *vypnutí hodnot kategorii v tabulkách a grafech, tj. jen labels bez jmen proměných. SET TNumbers=Labels ONumbers=Labels CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Labels CCD='-,,,' TVars=Labels CCA='-,,,'. *zapnuti hodnot kategorii v tabulkách a grafech, tj. hodnoty+labels a jména proměnných. SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. *Zobrazování jména proměnných (místo VAR labelů) v seznamu při vstupu do analýz.