Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Praktikum: Elementární zpracování dat z kvantitativního výzkumu

Podobné prezentace


Prezentace na téma: "Praktikum: Elementární zpracování dat z kvantitativního výzkumu"— Transkript prezentace:

1 Praktikum: Elementární zpracování dat z kvantitativního výzkumu
UK FHS Historická sociologie, Řízení a supervize (LS 2012+) Praktikum: Elementární zpracování dat z kvantitativního výzkumu Úvod do prostředí statistického programu SPSS (PSPP) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 25/3/ /2/2013

2 Princip zpracování kvantitativních dat
Jak zpracovat získané odpovědi v dotaznících (nebo jinak generovaná data)? Nejprve je třeba vytvořit datovou matici. Takto pořízená data je třeba nejprve „vyčistit“ (označit uživatelsky definované chybějící hodnoty),případně dále upravit (např. rekódovat, vytvořit nové syntetické znaky, popsat hodnoty/názvy-labelovat) data-management. Teprve potom můžeme přistoupit k samotné analýze dat. K tomu všemu nám může napomoci specializovaný statistický software, například SPSS.

3 Vše je podrobně popsáno v souboru Návod na statistický software PSPP, část 1. – úvod

4 STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES (SPSS)
general-purpose interactive statistical software package available in major platforms such as Windows, Unix, and Macintosh. A brief from history: developed in 1968 as software system that allowed for the transformation of raw data into information using statistical applications. SPSS, Inc. incorporated in 1975. first mainframe statistical package to appear on a personal computer (in the mid-1980s) and, in 1992, was the first organization to release a statistical package for use with the Microsoft Windows OS. Today different products: SPSS Base provides survey researchers with a powerful and user-friendly data management and statistical analysis package. Satistics: descriptive and bivariate as well as predictive analytics such as factor and regression analyses. + add-on modules: advanced multivariate analysis of survey data: generalized linear models, hierarchical linear models, survival analysis, and categorical regression. Also stand-alone products: help with all phases of the survey process (sample selection and data collection, data management and cleaning, and data dissemination).

5 GNU PSPP Free Software Foundation
tool for statistical analysis of sampled data. It reads the data, analyzes the data according to commands provided, and writes the results to a listing file, to the standard output or to a window of the graphical display. It is a free replacement for the proprietary program SPSS, and appears very similar to it with a few exceptions. The language accepted by PSPP is similar to those accepted by SPSS statistical products. Installation from (ofted upgraded so update your instalation regularly) Current version: Master version = (as of ) MSWindows version: MSWindows XP and newer Package Size: 32 Mb Size on disk: 72 Mb Manual at

6 Tři typy oken v SPSS / PSPP
Data editor (záložky Variable View a Data View) → správa datového souboru → soubory s koncovkou *.sav Output → výstupy analýz → soubory s koncovkou *.spv (od verze 15) Syntax → zadávání pomocí příkazového řádku → soubory s koncovkou *.sps

7 Data: Data Editor V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky) → v okně Data Editor záložka Data View

8 Správa proměnných (labely, chybějící hodnoty - missingy, formát, …)
→ záložka Variable View v okně Data Editor

9 Output: výstupy (analýz, úpravy dat)

10 Úprava dat (agregování, filtrování, rekódování, …)
→ příkazy v sekcích hlavního menu Data a Transform (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

11 Analýzy → příkazy v sekci hlavního menu Analyze
Popisné statistiky: Descriptive statistics → Frequencies / Descriptives / Explore (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

12 Syntax: přímé zadání pomocí příkazového řádku
Výhodou je, že sekvenci příkazů můžeme uložit (soubor s koncovkou *.sps) a kdykoliv se k ní vrátit, případně měnit vstupní proměnné. V případě úpravy dat poskytuje kontrolu operací a umožňuje úpravy sdílet. Syntax lze u každé operace (analýzy či úpravy dat) vygenerovat při zadávání z menu pomocí tlačítka Paste

13 Vkládání dat v Data editoru
Variable View Zde si nejprve připravíme datovou matici: jména proměnných (Name), jejich typ/formát (Type) a případně labely Data View Zde pak ukládáme data – po řádcích (1 řádek = 1 respondent/ dotazník)

14 Tři základní informace o proměnných:
jméno proměnné VARIABLE NAME max. 8 znaků bez diakritiky, mezer; musí začínat písmenem (např. pohlavi) → bezpodmínečně v datech musí být pro uživatele může být dále užitečná nadstavba: popiska proměnné VARIABLE LABEL Delší popis názvu znaku, lze s diakritikou, např. (zkrácené) znění otázky v dotazníku, který se bude objevovat ve výstupech (např. Pohlaví respondenta) popisky kategorií (hodnot) proměnné VALUE LABELS Popis kategorií znaku, které se budou objevovat ve výstupech (např. 1= muž, 2 = žena)

15 Ve Variable View je toho ale více
Nejdůležitější jsou: Type: druh záznamu dat (v zásadě buď jako číslo = Numeric nebo jako slova = String). Preferujeme Numeric Decimals: počet desetinných míst, co se bude zobrazovat ve výstupech (samotný záznam dat ale zachovává více desetinných míst) Measure: typ proměnné (dříve to nevadilo, novější verze vyžadují pro určitý typ analýz) Missings: uživatelsky definované hodnoty (o tom více jinde) v novějších verzích (SPSS 22) ještě přibyla role proměnné v analýze (závislá, nezávislá, třídící atd.) Dobrá zpráva: toto vše lze nastavovat příkazovým řádkem v syntaxu.

16 Jak začít v SPSS/PSPP? Proč ne rovnou pomocí syntaxu …
Lze jednoduše pomocí grafického menu založit datovou matici (seznam a vlastnosti proměnných) a do ní postupně vkládat data (případy) či rovnou nějaký již existující datový soubor otevřít. Viz předchozí snímky. Také ale lze data vložit pomocí příkazového řádku, tj. v syntaxu. Zkuste např. následující příklad: Using your favourite editor, write a file (name it myfile.sps) containing the following: *Data input in SPSS/PSPP example. *Attention: SPSS is sensitive to decimal place delimiter (here we have ',' comma but it can be decimal point. It's dependent on local OS setting. subtitle "Countries by population, 2015". *Source: DATA LIST LIST /Country (a25) Popul (f12) Pop_pct (f8.2). BEGIN DATA. China ,9 India ,5 USA ,43 Indonesia ,53 Brazil ,82 END DATA. LIST. DESCRIPTIVES /Popul Pop_pct /STATISTICS ALL. FREQ Country. DESC /Popul Pop_pct /STATISTICS MIN MAX MEAN STDDEV SUM.

17 Další úpravy dat a výstupů stručný přehled
Rekódování, konstrukce nových znaků; třídění výstupů, vážení, seřazování hodnot, agregování dat, spojování více datových souborů …

18 Transformace dat → Transform
Výpočet/vytváření nových (syntetických) znaků → COMPUTE (nebo pro „načítání“ COUNT) Rekódování → RECODE (do stejné nebo nové proměnné) Visual Binding – nástroj pro snadné rekódování (pro spojité-kardinální znaky např. dle percentilů)

19 Úpravy dat a výstupů → Data
Uspořádání případů → SORT CASES Rozdělení na podsoubory → SPLIT FILE Výběr případů (filtrování) → SELECT CASES Vážení → WEIGHT CASES Agregace (např. průměry pro skupiny) → AGGREGATE Spojování souborů dat / přidávání proměnných → MERGE FILES

20 Transformace dat → Transform
Úpravy dat → Data

21 Zadání analýz a jejich výstupy
Analýzy (tabulky), grafy

22 Analýzy → Analyze Descriptive statistics Tables Compare means
Correlate Data Reduction Nonparametric Tests Missing Value Analysis Multiple Response

23 Grafy → Graphs

24 Nastavení outputu SPSS
Praktická úprava výstupů se zobrazováním hodnot a názvů proměnných (oproti továrnímu nastavení, kde jsou pouze labely)

25 Nastavení labelů při zobrazování tabulek v outputu
SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. NEW FILE.

26 Nastavení labelů při zobrazování tabulek v outputu
Bez názvu proměnné a hodnot kategorií (původní tovární nastavení) → vhodné pro finální prezentaci v textu S názvem proměnné a hodnotami kategorií (naše nastavení) → vhodnější pro analýzy

27 Zobrazování labelů/hodnot v outputu lze spustit pomocí skriptu v Syntaxu
*NASTAVENI Labelů v OUTPUTU SPSS (funguje od verze 16). *vypnutí hodnot kategorii v tabulkách a grafech, tj. jen labels bez jmen proměných. SET TNumbers=Labels ONumbers=Labels CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Labels CCD='-,,,' TVars=Labels CCA='-,,,'. *zapnuti hodnot kategorii v tabulkách a grafech, tj. hodnoty+labels a jména proměnných. SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. *Zobrazování jména proměnných (místo VAR labelů) v seznamu při vstupu do analýz.


Stáhnout ppt "Praktikum: Elementární zpracování dat z kvantitativního výzkumu"

Podobné prezentace


Reklamy Google