UK FHS Historická sociologie, Řízení a supervize (LS 2012, 2013, 2014)

Slides:



Advertisements
Podobné prezentace
UK FHS Historická sociologie, Řízení a supervize (LS 2012, 2013, 2014)
Advertisements

Analýza kvantitativních dat: 1. úvod do SPSS Jiří Šafr jiri.safr(zavináč)seznam.cz vytvořeno , poslední aktualizace UK FHS Historická.
Kurz SPSS: Jednoduchá analýza dat 3. úvod do SPSS Jiří Šafr vytvořeno
Tabulkový procesor Práce se souborem – otevření, tvorba a použití šablony, tisk, propojení tabulky Excel s Wordem, nastavení Excelu, uložení Autorem materiálu.
Téma: Využití Accessu pro tvorbu evidence našeho podnikání Vypracovala: Jana Wasserbauerová.
Školení MS Word 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, říjen 2011 Vzdělávání v eGON centru Třebíč Tento.
Projekt Informační a vzdělávací portál Libereckého kraje I CZ.1.07/1.1.00/ I Školení pro uživatele portálu.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
Školení MS Excel 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, listopad-prosinec 2010 Vzdělávání v eGON centru.
Tabulkový procesor Formuláře – interaktivní prvky v Excelu Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Růžena Hynková. Dostupné z Metodického.
Elektronické učební materiály - II. stupeň Informatika 8 Autor: Bc. Pavel Šiktanc Vkládání hypertextových odkazů Co se všechno naučíme??? Co je to hypertextový.
ZÁKLADNÍ ŠKOLA, MATEŘSKÁ ŠKOLA, ŠKOLNÍ JÍDELNA A ŠKOLNÍ DRUŽINA BOUZOV, PŘÍSPĚVKOVÁ ORGANIZACE Operační program Vzdělávání pro konkurenceschopnost, č.OP.
Univerzita třetího věku kurz Znalci Databáze 2.
NÁZEV ŠKOLY: Masarykova základní škola a mateřská škola Melč, okres Opava, příspěvková organizace ČÍSLO PROJEKTU:CZ.1.07/1.4.00/ AUTOR:Mgr. Vladimír.
Tabulkový procesor Základní popis pracovního prostředí Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Růžena Hynková. Dostupné z Metodického.
Autor:Ing. Pavel Brož Předmět/vzdělávací oblast:Informační a komunikační technologie Tematická oblast:Práce se standardním aplikačním programovým vybavením.
Elektronické učební materiály - II. stupeň Informatika 9 Autor: Bc. Pavel Šiktanc Export tabulky z MS Excel 2010 do jiných formátů Co se všechno naučíme???
Záhlaví a zápatí, Makro Tabulkový procesor Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Růžena Hynková. Dostupné z Metodického portálu.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_30-03 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorRNDr.
Řetězce v jazyce C ● řetězec je posloupnost znaků ● řetězcové konstanty se v C vkládají mezi uvozovky, např. "Ahoj Hugo!" ● v paměti je řetězec uložen.
Prezentace Powerpoint 1 Prezentace vznikla v rámci projektu Škola 21. století, reg. číslo: CZ.1.07/1.3.06/ , který realizuje ZŠ a MŠ Lomnice nad.
Informatika – Úvod do MS Excel Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Databáze © Mgr. Petr Loskot
Microsoft Excel verze 2010 Mgr. Přemysl Kejzlar.
Název projektu: ZŠ Háj ve Slezsku – Modernizujeme školu
Základy MS Excel Vytvoření tabulky.
NÁZEV ŠKOLY: Masarykova základní škola a mateřská škola Melč, okres Opava, příspěvková organizace ČÍSLO PROJEKTU: CZ.1.07/1.4.00/ AUTOR: Mgr. Vladimír.
Bohumil Havel MoodleMoot.cz 2016
Počet čísel Počet hodnot
Tvorba jednoduché tabulky - rozvrh
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Batové dávky Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Vojtěch Mrózek. Dostupné z Metodického portálu ISSN: ,
EU_12_sada1_19_Inf_Excel_1_Šeb
Hledání nejvyšších a nejnižších hodnot
Excel – tabulkový procesor
Tabulkový procesor Základní popis pracovního prostředí
Inf Tabulkový procesor - formátování
Databáze MS ACCESS 2010.
Procvičení vzorců a funkcí v rámci jednoho i více listů
Název: Word pokračování DUM:VY_32_INOVACE_VII_3_04
Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice,
Název: Práce s tabulátory Autor: Hokr Jan
Makro v Excelu.
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
Název školy: Základní škola a mateřská škola Dolní Bojanovice, okres Hodonín příspěvková organizace Číslo projektu: CZ.1.07/1.4.00/ Označení materiálu:
Informatika textový editor - WORD
Informační a komunikační technologie
Co se všechno naučíme??? Počítání průměru Funkce PRŮMĚR
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Dotazovací jazyk SQL I.
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
VY_32_INOVACE_VJ36.
Word Okraje WordArt Pozadí Vodoznak. Word Okraje WordArt Pozadí Vodoznak.
Tabulkový procesor Síť buněk, do kterych lze vkládat údaje – číselné, textové, datové i logické. Jeho podstatou jsou vzorce pomocí kterých zpracováváme.
A5M33IZS – Informační a znalostní systémy
MS Access Tabulka letní semestr 2013.
Název školy: Základní škola a Mateřská škola Kladno,
Průvodní list Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT   Vzdělávací materiál: Prezentace – zápis pro žáky Určen pro: 2. ročník oboru.
Úvod do programu SPSS.
Jiří Šafr jiri.safr(zavináč)seznam.cz
Informatika – Základní operace s buňkami
Algoritmizace a datové struktury (14ASD)
Slovní úlohy o společné práci − 3
Transkript prezentace:

UK FHS Historická sociologie, Řízení a supervize (LS 2012, 2013, 2014) AKD II. / III. Data management v SPSS/PSPP (2): Vybrané speciality a vychytávky Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 12/4/2014

Informace o souboru: Data File Comments Příkaz v syntaxu k vypsání dříve vložené informace o datech: DISPLAY DOCUMENTS.

Data File Comments: zápis v Syntaxu PRESERVE. SET PRINT OFF. DROP DOCUMENTS. ADD DOCUMENT 'Výzkum studentů FHS HiSo a KŘS, LS 2011, únor-březen 2011, subpopulace:' '1. HISO AKD I. - denní, n=17' '2. HISO AKD I. - kombi, n=1' '3. KŘS Praktikum - Elem. analýzy dat, n=7' 'Poslední úpravy 15/3/2011'. DISPLAY DOCUMENTS. RESTORE.

DISPLAY: Informace o proměnných DISPLAY DICTIONARY /VARIABLES=vek pohlavi. DICTIONARY → vypíše označení hodnot proměnné (Value Labels), názvy proměnných (Variable Labels), formáty a Missingové hodnoty LABELS → vypíše označení názvu proměnných (Variable Labels) DISPLAY LABELS /VARIABLES=all.

DATASET Práce s více datovými soubory otevřenými najednou (pouze v SPSS)

DATASET - Práce s více datovými soubory otevřenými najednou (pouze v SPSS) V SPSS od verze 14 lze pracovat s více soubory otevřenými najednou pomocí DATASET příkazů (DATASET NAME, DATASET ACTIVATE, DATASET DECLARE, DATASET COPY, DATASET CLOSE) Umožňují mít otevřeno vícero souborů najednou a pomocí jejich relativních jmen je ovládat – postupně aktivovat. Můžeme tak spojovat data, kopírovat případy, proměnné nebo vlastnosti proměnných mezi soubory. Pro ovládání v syntaxu nejprve definujeme jejich pracovní jméno: DATASET NAME jméno souboru. Takto můžeme otevřít a pojmenovat více souborů. Ty pak můžeme vyvolávat pro určitou operaci pomocí: DATASET ACTIVATE jméno souboru. A také je zavírat pomocí: DATASET CLOSE jméno souboru.

Po otevření souboru mu můžeme přiřadit pracovní jméno. DATASET v menu Po otevření souboru mu můžeme přiřadit pracovní jméno. Nebo v syntaxu: DATASET NAME Knihy_FHS. Mezi více otevřenými soubory lze přepínat → na aktivním budou provedeny analýzy Nebo v syntaxu: DATASET ACTIVATE Knihy_FHS.

Využití DATASET NAME při spojování souborů (MATCH FILES) GET FILE='data1.sav'. DATASET NAME Soubor1. SORT CASES BY ID. GET FILE 'data2.sav' DATASET NAME Soubor2. GET DATA /TYPE=XLS /FILE='data3excel.xls'. /* varianta otevírání dat při exportu z Excelu. MATCH FILES FILE=* /FILE=Soubor1 /FILE=Soubor2 /BY ID. /* hvězdičkou (*) je označen aktivní soubor 3 do nějž se přihrávají soubory 1 a 2. SAVE OUTFILE='data123.sav'. Princip je, že postupně otevřeme a pojmenujeme více souborů, které pak přihrajeme-spojíme do jednoho aktivního (např. posledního otevřeného). Ale propojování souborů lze provádět i pomocí jejich načítání z adresáře, tj. odkazem přímo na soubor(y) a jeho cestu v adresářích.

DATASET DECLARE DATASET DECLARE vytvoří pracovní jméno pro nový datový soubor (dataset name) v součinnosti s příkazy, které vytváří jako output nové datové soubory (PASW Statistics data files) Užitečné, tam kde nám stačí vytvoření pouze prozatímního (temporary) souboru dat (jenom v průběhu běhu programu), nejčastěji jako mezistupeň nějaké analýzy, např. matice distancí, s níž vstupujeme do MDS (tento soubor pak můžeme, ale nemusíme pojmenovat a uložit). DATASET DECLARE corrmatrix. REGRESSION /DEPENDENT=var1 /METHOD=ENTER= var2 to var10 /OUTFILE=CORB(corrmatrix).

DATASET COPY DATASET COPY vytvoří - nový datový soubor, který zkopíruje data z aktivního (otevřeného) souboru. Užitečné při vytváření vícenásobných podsouborů dat z jednoho základního - původního souboru. Příklad: DATASET NAME studenti_AKD. /*všichni (denní i kombinované studium). DATASET COPY denni. DATASET ACTIVATE denni. /*denní studium = 1. SELECT IF studium=1. /*odmaže všechny případy mimo denní studium. DATASET ACTIVATE studenti_AKD. DATASET COPY kombi. DATASET ACTIVATE kombi. /*kombinované studium = 2. SELECT IF studium=2. /*odmaže všechny případy mimo kombinované studium. Pozor, neuložíte-li je, tak po zavření SPSS soubory zmizí.

FILE LABEL FILE LABEL uvádí jméno souboru v outputech. Pokud jsou data v SPSS formátu (PASW Statistics format), tak se label uloží do Dictionary. File label se bude objevovat v outputech v „Notes tables“.

Postup pořízení dat v MS Excel s následným převodem do SPSS Vytvořit názvy proměnných v prvním řádku (jméno začíná písmenem) Vytvořit si kódový klíč → maximálně se vyvarovat záznamu pomocí slov, k čemuž Excel láká (např. místo „muž“ → 1), jinak bude v SPSS stringová proměnná (tu lze převést na numerický záznam, viz dále, ale je to obtížné) Prohlédnout celou hotovou matici v Excelu, zda někde není prázdný řádek apod. Kurzor nesmí být na konci (jinak se pak v SPSS objeví prázdné řádky plné missingů). Po uložení dat v XLS (musí být soubor XLS zavřený!), v SPSS dáme otevřít data a rozklikneme dolní roletku pro formát XLS. V průvodci exportu dat vybereme, že v prvním řádku jsou názvy proměnných a zvolíme excelovskou záložku, kde data jsou. Zkontrolujeme kraje datové matice: spodní část a pravou na konci, zda nejsou prázdné buňky pro proměnné či případy. Pokus ano, odstraníme. Alternativně lze použít formát CSV. K jeho importu viz návod PSPP/SPSS na http://metodykv.wz.cz/PSPP_navod_1_uvod.pdf (str. 19-20) Data nově uložíme ve formátu SPSS tj. *.SAV Nyní můžeme labelovat jak názvy proměnných tak jejich hodnoty.

V SPSS se tak lze setkat se 4 typy dat (připomenutí) Mikrodata – individuální data, tj. případy v řádcích (nejčastěji respondenti, ale např. také novinové články, země nebo regiony) Agregovaná data – analytické/strukturní proměnné = individuální údaje sumované za určitou jednotku (např. území jako regiony/ státy nebo časová období) Vznikají agregací mikrodat (sumování, průměrování). Kombinovaná mikrodata s kontextuálními daty buď na agregované úrovni nebo jako kontext společný určité skupině individuí. Např. individuální mikrodata: žáci a informace o jejich rodičích, kontextuální data: informace o typu školy společná pro žáky ze stejných škol a případně také analytické/strukturní data na agregované úrovni: průměrný prospěch ve třídě (agregováno z individuálních dat žáků konkrétní třídy). Tabelární data – agregovaná do tabulek (kontingenční tabulky) Např. dříve publikované výsledky mobilitní tabulky.

Odlišný typ dat (úrovně měření) vyžaduje použití odlišných přístupů k analýze, ale také odlišný způsob interpretace výsledků (a její možnosti resp. limity)!

(pro data publikovaná například v nějakém textu) Načtení dat ze syntaxu (pro menší datové soubory) & tabulární (agregovaná) data (pro data publikovaná například v nějakém textu)

Načtení (mikro)dat ze syntaxu (vhodné pro menší datové soubory nebo tabulární data) *hypotetická data: hodnoty proměnných odděleny mezerou, stringové znaky v " ". DATA LIST LIST / okres (A15) progr domduch vek obyv. BEGIN DATA. "Benešov" 1 3 52 40990 "Kladno" 0 4 61 67490 "M. Boleslav" 1 6 50 6099 "Příbram" 0 2 45 4816 "Dobříš" 1 1 49 7827 END DATA. *Labely. VAR LAB progr "Program pro seniory". VAR LAB domduch "Domovy důchodců – počet". VAR LAB vek "Průměrný věk". VAR LAB obyv "Počet obyvatel". VAL LAB progr 0 "Ne" 1 "Ano". *formát čísel (bez desetinného místa) a typ proměnné. FORMATS progr domduch vek obyv (f8). VARIABLE LEVEL domduch vek obyv (scale).

Načtení tabelárních dat z agregované existující kontingenční tabulky (→ vážení procenty) volil věk vzdělání 1 nevolil 2 volil 1 <49 1 ZŠ+VY 138 92   2 SŠ+VŠ 106 218 2 >50 143 257 56 175 ****nacteni kontingencni tabulky aneb sekundarni analyza (ČR, ISSP 2007). DATA LIST LIST/vek vzdel volil freq. VAL LAB vzdel 1 "ZŠ+VY" 2 "SŠ+VŠ" / vek 1 "<49" 2 ">50" / volil 1 "nevolil" 2 "volil". BEGIN DATA 1 1 1 138 1 1 2 92 1 2 1 106 1 2 2 218 2 1 1 143 2 1 2 257 2 2 1 56 2 2 2 175 END DATA. FORMATS vek vzdel volil freq (f8). WEIGHT by freq. CROSS vzdel by volil by vek. CROSS vzdel by volil. Viz syntax: crosstab_data_input.sps Pozice pole v tabulce např. 121 znamená: 1. panel, 2. řádek, 1. sloupec volil věk vzdělání 0 nevolil 1 volil 1 <49 0 ZŠ+VY 111 112   1 SŠ+VŠ 121 122 2 >50 211 212 221 222

Pokračování někdy příště …