Praktikum: Elementární zpracování dat z kvantitativního výzkumu

Slides:



Advertisements
Podobné prezentace
UK FHS Historická sociologie, Řízení a supervize (LS 2012, 2013, 2014)
Advertisements

Makra v Excelu.
© 2000 VEMA počítače a projektování spol. s r. o..
MS ACCESS - DOTAZY DATABÁZOVÉ SYSTÉMY.
Zakázkově vytvořená aplikace Technologický software HTH8 s.r.o, Eimova 880, Polička, tel.: , fax: ,
Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize.
Kvantitativní metody výzkumu v praxi
Kvantitativní metody výzkumu v praxi PRAKTIKUM 4b. část Jiří Šafr UK FHS Řízení a supervize v sociálních a zdravotnických organizacích.
Typy programů operační systémy programy pro práci se soubory
Jiří Šafr jiri.safr(zavináč)seznam.cz
Analýza kvantitativních dat: 1. úvod do SPSS Jiří Šafr jiri.safr(zavináč)seznam.cz vytvořeno , poslední aktualizace UK FHS Historická.
Statistika II Základy práce s SPSS Petr Soukup
Prezentační manažer Kapitola 3.0 (Úvodní práce v programu)
Co takhle DOTAZY? OBSAH: Y 1) Co jsou to dotazy ve WinBase Y 2) Vytvoření jednoduchého dotazu Y 3) Použití dotazu.
Praha6.cz Nové trendy v e-publishingu Statické stránky, mapa stránek, menu a fulltextové vyhledávání.
17.Tabulkový procesor (filtrování a řazení dat, formuláře, podmínky a podmíněné formátování, export a import dat) Barbora Skoumalová 4.A.
Analýza kvantitativních dat I./II. Chybějící hodnoty (Missing Values) identifikace, nastavení, analýza Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace.
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Jiří Šafr jiri.safr(zavináč)seznam.cz
Analýza kvantitativních dat I.
Tabulkový procesor.
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
Referát č. 17 Tabulkový procesor
Referát č. 17 M. Novotný Tabulkový procesor (filtrování a řazení dat, formuláře, podmínky a podmíněné formátování, export a import dat) Vysvětlit pojmy.
Analýza kvantitativních dat II. Analýza chybějících hodnot (missing values) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 23/5/2012 UK FHS Historická.
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Vzorec v buňce v tabulkovém procesoru Vzorec v buňce v tabulkovém procesoru Microsoft ® Excel Zpracovala : Dana Lišková 4.B
Textový editor Vkládání obrázků ze souboru a použití schránky  Pomocí menu vložení a klepnutím na obrázek se nám otevře adresář, ze kterého vybereme.
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
7. Typ soubor Souborem dat běžně rozumíme uspořádanou množinu dat, uloženou mimo operační paměť počítače (na disku). Pascalský soubor je abstrakcí skutečného.
ODDS RATIO Relationships between categorical variables in contingency table Jiří Šafr jiri.safr(AT)seznam.cz updated 29/12/2014 Quantitative Data Analysis.
Dynamic SQL P. Částek. Dynamic SQL Embedded SQL je překládaný preprocesorem => za běhu nelze nechat uživatele rozhodovat o vzhledu samotných SQL příkazů.
Aplikační a programové vybavení
Jiří Šafr jiri.safr(zavináč)seznam.cz
Design kvantitativního výzkumu 0. Poučení z minulých ročníků a novinky od ZS 2011 poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz UK FHS.
Použití dotazu jako zdroj dat pro pohled Vypracovala: Procházková Petra.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
5. Statistica Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová.
Quantitative Data Analysis I.
READING – BRITISH LITERATURE
Analýza kvantitativních dat AKD I. Vstupní test 22/2/2011 Jiří Šafr, FHS UK, HiSo.
Kurz SPSS: Jednoduchá analýza dat 3. úvod do SPSS Jiří Šafr vytvořeno
filtrování a řazení dat, podmíněné formátování,
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
Analýza kvantitativních dat I. Vstupní test ze znalostí designu kvantitativního sociologického výzkumu Jiří Šafr jiri.safr(at)seznam.cz poslední aktualizace.
Statistika v SAS (SAS STUDIO)
Přednáška 2 Etapy výzkumu, přístup k datům
Course Outline1. Instructor: Martin Hála, PhD. Mathematics DPT, B105,  Further information and downloads on my personal website:
CZECH STATISTICAL OFFICE Na padesátém 81, CZ Praha 10, Czech Republic Blind Friendly Website Helena Koláčková Czech Statistical Office.
Import dat Access (16). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
 Program pro tvorbu tabulek.  Síť buněk, do kterých můžeme vkládat libovolné údaje  Podstatou jsou vzorce, pomocí kterých provádíme v buňce operace.
Tomáš Čížek Systém NESSTAR pro ukládání,prezentaci a analýzu sociálně-vědních dat Sociologická data a datové archivy.
Databáze MS ACCESS 2010.
Název projektu: Učíme obrazem Šablona: III/2
ZŠ Brno, Řehořova 3 S počítačem snadno a rychle Informatika 7
Příprava dat před analýzou
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 25/6/2014
R nejen v SQL Serveru Jiří Neoral BI Data Architect
Úvod do programu SPSS.
Jiří Šafr FHS UK, SOÚ AV ČR, v.v.i. jiri.safr(zavináč)seznam.cz
Vytvoření formuláře Access (11).
Kvantitativní metody výzkumu v praxi PRAKTIKUM
5. Statistica Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová.
Přednáška 9 Triggery.
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Jiří Šafr jiri.safr(zavináč)seznam.cz
Jiří Šafr jiri.safr(zavináč)seznam.cz
Účetní schémata MS Dynamics NAV RTC-základy
Analýza kvantitativních dat I./II.
Transkript prezentace:

Praktikum: Elementární zpracování dat z kvantitativního výzkumu UK FHS Historická sociologie, Řízení a supervize (LS 2012+) Praktikum: Elementární zpracování dat z kvantitativního výzkumu Úvod do prostředí statistického programu SPSS (PSPP) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 25/3/2015 26/2/2013

Princip zpracování kvantitativních dat Jak zpracovat získané odpovědi v dotaznících (nebo jinak generovaná data)? Nejprve je třeba vytvořit datovou matici. Takto pořízená data je třeba nejprve „vyčistit“ (označit uživatelsky definované chybějící hodnoty),případně dále upravit (např. rekódovat, vytvořit nové syntetické znaky, popsat hodnoty/názvy-labelovat) data-management. Teprve potom můžeme přistoupit k samotné analýze dat. K tomu všemu nám může napomoci specializovaný statistický software, například SPSS.

Vše je podrobně popsáno v souboru Návod na statistický software PSPP, část 1. – úvod http://metodykv.wz.cz/PSPP_navod_1_uvod.pdf

STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES (SPSS) general-purpose interactive statistical software package available in major platforms such as Windows, Unix, and Macintosh. A brief from history: developed in 1968 as software system that allowed for the transformation of raw data into information using statistical applications. SPSS, Inc. incorporated in 1975. first mainframe statistical package to appear on a personal computer (in the mid-1980s) and, in 1992, was the first organization to release a statistical package for use with the Microsoft Windows OS. Today different products: SPSS Base provides survey researchers with a powerful and user-friendly data management and statistical analysis package. Satistics: descriptive and bivariate as well as predictive analytics such as factor and regression analyses. + add-on modules: advanced multivariate analysis of survey data: generalized linear models, hierarchical linear models, survival analysis, and categorical regression. Also stand-alone products: help with all phases of the survey process (sample selection and data collection, data management and cleaning, and data dissemination).

GNU PSPP Free Software Foundation tool for statistical analysis of sampled data. It reads the data, analyzes the data according to commands provided, and writes the results to a listing file, to the standard output or to a window of the graphical display. It is a free replacement for the proprietary program SPSS, and appears very similar to it with a few exceptions. The language accepted by PSPP is similar to those accepted by SPSS statistical products. http://www.gnu.org/software/pspp/ Installation from http://pspp.awardspace.com/ (ofted upgraded so update your instalation regularly) Current version: Master version = 0.8.4 (as of 2015-02-10) MSWindows version: MSWindows XP and newer Package Size: 32 Mb Size on disk: 72 Mb Manual at http://pspp.benpfaff.org/~blp/pspp-master/latest/source/user-manual/pspp.html

Tři typy oken v SPSS / PSPP Data editor (záložky Variable View a Data View) → správa datového souboru → soubory s koncovkou *.sav Output → výstupy analýz → soubory s koncovkou *.spv (od verze 15) Syntax → zadávání pomocí příkazového řádku → soubory s koncovkou *.sps

Data: Data Editor V řádcích jsou případy (respondenti), ve sloupcích proměnné (otázky) → v okně Data Editor záložka Data View

Správa proměnných (labely, chybějící hodnoty - missingy, formát, …) → záložka Variable View v okně Data Editor

Output: výstupy (analýz, úpravy dat)

Úprava dat (agregování, filtrování, rekódování, …) → příkazy v sekcích hlavního menu Data a Transform (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

Analýzy → příkazy v sekci hlavního menu Analyze Popisné statistiky: Descriptive statistics → Frequencies / Descriptives / Explore (nebo přímé zadání pomocí příkazového řádku v Syntaxu)

Syntax: přímé zadání pomocí příkazového řádku Výhodou je, že sekvenci příkazů můžeme uložit (soubor s koncovkou *.sps) a kdykoliv se k ní vrátit, případně měnit vstupní proměnné. V případě úpravy dat poskytuje kontrolu operací a umožňuje úpravy sdílet. Syntax lze u každé operace (analýzy či úpravy dat) vygenerovat při zadávání z menu pomocí tlačítka Paste

Vkládání dat v Data editoru Variable View Zde si nejprve připravíme datovou matici: jména proměnných (Name), jejich typ/formát (Type) a případně labely Data View Zde pak ukládáme data – po řádcích (1 řádek = 1 respondent/ dotazník)

Tři základní informace o proměnných: jméno proměnné VARIABLE NAME max. 8 znaků bez diakritiky, mezer; musí začínat písmenem (např. pohlavi) → bezpodmínečně v datech musí být pro uživatele může být dále užitečná nadstavba: popiska proměnné VARIABLE LABEL Delší popis názvu znaku, lze s diakritikou, např. (zkrácené) znění otázky v dotazníku, který se bude objevovat ve výstupech (např. Pohlaví respondenta) popisky kategorií (hodnot) proměnné VALUE LABELS Popis kategorií znaku, které se budou objevovat ve výstupech (např. 1= muž, 2 = žena)

Ve Variable View je toho ale více Nejdůležitější jsou: Type: druh záznamu dat (v zásadě buď jako číslo = Numeric nebo jako slova = String). Preferujeme Numeric Decimals: počet desetinných míst, co se bude zobrazovat ve výstupech (samotný záznam dat ale zachovává více desetinných míst) Measure: typ proměnné (dříve to nevadilo, novější verze vyžadují pro určitý typ analýz) Missings: uživatelsky definované hodnoty (o tom více jinde) v novějších verzích (SPSS 22) ještě přibyla role proměnné v analýze (závislá, nezávislá, třídící atd.) Dobrá zpráva: toto vše lze nastavovat příkazovým řádkem v syntaxu.

Jak začít v SPSS/PSPP? Proč ne rovnou pomocí syntaxu … Lze jednoduše pomocí grafického menu založit datovou matici (seznam a vlastnosti proměnných) a do ní postupně vkládat data (případy) či rovnou nějaký již existující datový soubor otevřít. Viz předchozí snímky. Také ale lze data vložit pomocí příkazového řádku, tj. v syntaxu. Zkuste např. následující příklad: Using your favourite editor, write a file (name it myfile.sps) containing the following: *Data input in SPSS/PSPP example. *Attention: SPSS is sensitive to decimal place delimiter (here we have ',' comma but it can be decimal point. It's dependent on local OS setting. subtitle "Countries by population, 2015". *Source: http://en.wikipedia.org/wiki/List_of_countries_and_dependencies_by_population. DATA LIST LIST /Country (a25) Popul (f12) Pop_pct (f8.2). BEGIN DATA. China 1368400000 18,9 India 1267400000 17,5 USA 320469000 4,43 Indonesia 255461700 3,53 Brazil 203932000 2,82 END DATA. LIST. DESCRIPTIVES /Popul Pop_pct /STATISTICS ALL. FREQ Country. DESC /Popul Pop_pct /STATISTICS MIN MAX MEAN STDDEV SUM.

Další úpravy dat a výstupů stručný přehled Rekódování, konstrukce nových znaků; třídění výstupů, vážení, seřazování hodnot, agregování dat, spojování více datových souborů …

Transformace dat → Transform Výpočet/vytváření nových (syntetických) znaků → COMPUTE (nebo pro „načítání“ COUNT) Rekódování → RECODE (do stejné nebo nové proměnné) Visual Binding – nástroj pro snadné rekódování (pro spojité-kardinální znaky např. dle percentilů)

Úpravy dat a výstupů → Data Uspořádání případů → SORT CASES Rozdělení na podsoubory → SPLIT FILE Výběr případů (filtrování) → SELECT CASES Vážení → WEIGHT CASES Agregace (např. průměry pro skupiny) → AGGREGATE Spojování souborů dat / přidávání proměnných → MERGE FILES

Transformace dat → Transform Úpravy dat → Data

Zadání analýz a jejich výstupy Analýzy (tabulky), grafy

Analýzy → Analyze Descriptive statistics Tables Compare means Correlate Data Reduction Nonparametric Tests Missing Value Analysis Multiple Response

Grafy → Graphs

Nastavení outputu SPSS Praktická úprava výstupů se zobrazováním hodnot a názvů proměnných (oproti továrnímu nastavení, kde jsou pouze labely)

Nastavení labelů při zobrazování tabulek v outputu SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. NEW FILE.

Nastavení labelů při zobrazování tabulek v outputu Bez názvu proměnné a hodnot kategorií (původní tovární nastavení) → vhodné pro finální prezentaci v textu S názvem proměnné a hodnotami kategorií (naše nastavení) → vhodnější pro analýzy

Zobrazování labelů/hodnot v outputu lze spustit pomocí skriptu v Syntaxu *NASTAVENI Labelů v OUTPUTU SPSS (funguje od verze 16). *vypnutí hodnot kategorii v tabulkách a grafech, tj. jen labels bez jmen proměných. SET TNumbers=Labels ONumbers=Labels CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Labels CCD='-,,,' TVars=Labels CCA='-,,,'. *zapnuti hodnot kategorii v tabulkách a grafech, tj. hodnoty+labels a jména proměnných. SET TNumbers=Both ONumbers=Both CCC='-,,,' CCE='-,,,' CCB='-,,,' OVars=Both CCD='-,,,' TVars=Both CCA='-,,,'. *Zobrazování jména proměnných (místo VAR labelů) v seznamu při vstupu do analýz.