Statistika II Základy práce s SPSS Petr Soukup

Slides:



Advertisements
Podobné prezentace
Statistické funkce v tabulkovém kalkulátoru Excel MS
Advertisements

Úvod do programování Malá kouzla s příkazovým řádkem
Ing. David Pejčoch Tutorial
Pascal - příklady.
Tabulkový precoser Open Office Calc ZÁKLADY PRÁCE
Vytváření, použití dávkových souborů
DATOVÝ TYP POLE.
IES – jak na to *** Základní ovládání U stránek s nadpisy různé úrovně se automaticky vytváří obsah Toto je klíčové tlačítko. Klepněte a můžete ihned.
Analýza kvantitativních dat: 1. úvod do SPSS Jiří Šafr jiri.safr(zavináč)seznam.cz vytvořeno , poslední aktualizace UK FHS Historická.
Chybějící hodnoty (item nonresponse)
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Statistika II Michal Jurajda.
Transformace dat: používání syntaxe v SPSS
Analýza kvantitativních dat I.
Tabulkový procesor.
Databáze Tabulky a typy dat VY_32_INOVACE_7B11. Proč datové typy ? Abychom mohli do tabulky vložit data, musíme jednotlivým polím (sloupcům) přiřadit.
Školení správců II. Petr Pinkas RNDr. Vít Ochozka.
A1PRG - Programování – Seminář Ing. Michal Operátory (2. část) 4 Verze
Řízení a supervize v sociálních a zdravotnických organizacích
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
TEXTOVÝ EDITOR.
Analýza kvantitativních dat II. Analýza chybějících hodnot (missing values) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 23/5/2012 UK FHS Historická.
Cvičení.
Uživatelské profily, vlastnosti uživatelského účtu
Práce se šablonami v MS Word 2007
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
7. Typ soubor Souborem dat běžně rozumíme uspořádanou množinu dat, uloženou mimo operační paměť počítače (na disku). Pascalský soubor je abstrakcí skutečného.
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Algoritmizace a programování Textové soubory - 13 Mgr. Josef Nožička IKT Algoritmizace a programování
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Bloky – tvorba a vkládání ProgeCAD. Opakování Př. Nakreslete součást dle zadání (využijte hladin – obrys, osa, kóty): 1. Okótujte součást lineární kótou,
Pohled z ptačí perspektivy
Spouštíme aplikace Spuštění aplikace Malování
Počítačová podpora konstruování I 7. přednáška František Borůvka.
SOFTware Adresář, soubor, OS Informatika – 6. třída Bc. Josef Štainer
Statistická významnost a její problémy
1. lekce SM 315 Statistika v SAS a víceúrovňové lineární modely.
JUI přednáška Vstup a výstup, cykly RNDr. Jiří Dvořák, CSc.
5. Statistica Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová.
Univerzita třetího věku kurz Znalci Databáze 1.
Kurz SPSS: Jednoduchá analýza dat 3. úvod do SPSS Jiří Šafr vytvořeno
Popisná analýza v programu Statistica
1. cvičení
Statistika v SAS (SAS STUDIO)
Programování v MATLABu © Leonard Walletzký, ESF MU, 2000.
© Institut biostatistiky a analýz Vícerozměrné metody - cvičení RNDr. Eva Janoušová Podzim 2014.
Batové dávky Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Vojtěch Mrózek. Dostupné z Metodického portálu ISSN: ,
Tomáš Čížek Systém NESSTAR pro ukládání,prezentaci a analýzu sociálně-vědních dat Sociologická data a datové archivy.
Statistika 1.cvičení. Základní informace Ing. Daniela Krbcová Materiály ze cvičení, přednášky Skripta k předmětu,
Makra v Excelu syntaxe. Zápis nahraného makra SubEnd Sub O klíčová slova Sub a End Sub – začátek a konec makra O komentáře O text za znakem ', až do konce.
NÁZEV ŠKOLY:SOŠ Net Office, spol. s r.o. Orlová Lutyně
Ukládání dat biodiverzity a jejich vizualizace
Moduly.
Zástupce Zástupce souboru (anglicky file shortcut) je v informatice typ souboru používaný v systému Microsoft Windows. Umožňuje odkazovat na data, která.
Popisná statistika I tabulky četností
Příprava dat před analýzou
Spouštíme aplikace Spuštění aplikace Malování
Inf Tabulkový procesor
Popisná analýza v programu Statistica
Úvod do programu SPSS.
Přehled kurzu seznámení se spss
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Metodologie pro ISK 2 Úvod do práce s daty
SAS a jeho výhody oproti Excelu
5. Statistica Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová.
Základní zpracování dat Příklad
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Úvod do programu SPSS.
Základy statistiky.
Transkript prezentace:

Statistika II Základy práce s SPSS Petr Soukup JSB 018 Statistika II Základy práce s SPSS Petr Soukup

Odkud pochází název SPSS? SPSS původně – the Statistical Package for the Social Sciences Název klíčového software společnosti SPSS dnes – Statistical Products and Service Solutions

Historie SPSS ve světě Založena 1968 v USA Dnes cca 60 poboček po celém světě Klíčové oblasti: nabídka software, konzultační a analytická činnost

Historie ACREA (dříve SPSS CR) plný název ACREA, s. s r. o. Založena 1995 Sídlo: Krakovská 7, Praha 1 Jednatelé: Doc.RNDr. Jan Řehák a RNDr. Irena Bártová Základní oblasti: Prodej či pronájem software Kurzy statistiky a marketingu Analytické práce a modelování Poradenství a expertní služby

Software nabízený ACREA Programy pro statistické analýzy: Systém SPSS | Amos | AnswerTree | SamplePower Programy pro komplexní proces sběru a vyhodnocení dat Platforma Dimensions Programy pro oblast Predictive Analytics a Data miningu PredictiveAnalytics | Clementine

Více o software IBM SPSS Základní software pro analýzu dat v sociálněvědní oblasti Modulová stavba: základní modul Base 15 rozšiřujících modulů: Advanced Models | Categories | Classification Trees | Complex Samples | Conjoint | Data Preparation | Exact Tests | Maps | Missing Value Analysis | Regression Models | Tables | Trends

Více o software SPSS Co umí SPSS? Většinu statistických procedur včetně specifických (logistická regrese, analýza přežití, klasifikační stromy, Box-Jenkinsova metodologie atd.) Tabulkové a grafické zobrazení výsledků Plánování designu výzkumu Pracovat s chybějícími hodnotami Tedy vše co je při kvantitativním sociálněvědním výzkumu třeba. Demo verze zdarma ke stažení viz www.acrea.cz

SPSS - Základní uživatelské dovednosti potřebné pro práci s daty (zejm SPSS - Základní uživatelské dovednosti potřebné pro práci s daty (zejm. základní příkazy) - dnes SPSS 22,0 - až do verze 6 byly výstupy v textové formě, dnes objektové a je proto možno v rámci systému WINDOWS klasicky kopírovat (do verze 6 bylo možné kopírovat sloupce výstupu, což mohlo být v určitých případech výhodné) - dvojí ovládání SPSS - přes nabídku a za pomocí příkazů (syntaxe)

SPSS - Základní uživatelské dovednosti potřebné pro práci s daty (zejm SPSS - Základní uživatelské dovednosti potřebné pro práci s daty (zejm. základní příkazy) - nabídka - poměrně přehledná, ale není v ní vše co SPSS umí (zejm. ve vícerozměrných metodách to platí) -syntaxe - umožňuje opakované spuštění procedur (ve vědecké práci by zřejmě bylo vhodné tuto syntaxi uchovávat, pro možnost prověření výsledků), umožňuje spuštění několika procedur najednou, SPSS standardně ukládá použitou syntaxi - nastavení viz Edit-Options (General)-Record syntax journal (append či overwrite)

Obecná pravidla pro práci s příkazy a přehled příkazů dělení příkazů v SPSS - 1.čekající - čekají až bude spuštěn příkaz execute či některý z příkazů (např. RECODE, COMPUTE, IF, DO IF) - 2."obsahující" příkaz execute - tedy po jejich spuštění se vykonají i ostatní označené příkazy (např. FREQUENCY, DES VAR, SAVE OUTFILE) - 3.příkazy, které se ihned vykonají, ale ostatní "neexekuční" příkazy s nimi označené se nevykonají (např. VAR LAB VAL LAB, MIS VAL, WEIGHT) -doporučení plynoucí z výše uvedeného - všude psát za příkazy EXE. (zkratka slova execute), z uvedené zkratky plyne i další doporučení-stačí psát první tři písmena příkazu, pokud jej v SPSS jednoznačně identifikují (neplatí ale např. pro příkaz RECODE, COMPUTE)

na konci příkazu se vždy píše tečka!!! komentáře je možné psát poté co na začátek řádku napíšeme hvězdičku, komentář musí být stejně jako příkaz ukončen tečkou!!! (ukázka: *toto je muj komentar. -příkaz získáme z příslušné nabídky za pomoci volby PASTE, příkazy si tedy nemusíme pamatovat (další možností je nalézt příkaz v nápovědě)

Nejdůležitější příkazy pro práci s daty (jejich syntaxe a funkce) GET FILE='D:\petr\spojdata01.sav'. - načtení (otevření) datového souboru, který se jmenuje spojdata01.sav a je uložen na disku D: v adresáři petr SAVE OUTFILE='D:\petr\spojdata01.sav'. - uložení datového souboru, který se jmenuje spojdata01.sav a je uložen na disku D: v adresáři petr Poznámka: Při práci s daty, kdy provedeme nějaké změny je vhodné uložit soubor uložit pod jiným jménem. Ideální je postupně soubory označovat jako je výše naznačeno 01,02,03 atd.

VAR LAB A1 "VZDELANI". - vytvoří popisek proměnné A1 vzdelani VAL LAB A1 1 "ZS" 2 "SS" 3 "VS". - vytvoří popisky odpovědí proměnné A1, kod 1 bude popsán ZS, kód 2 SS atd. REN VAR (A1=A2). - přejmenuje proměnnou A1 na A2 COMPUTE A1=0. vytvoří proměnnou se samými nulami či jinou námi zvolenou hodnotou Složitější výpočty provádíme pomocí mat. operací. COMPUTE VEK=107-ROKNAR. Vypočte věk z roku narození, v případě že výzkum byl prováděn v roce 2007 a rok narození je v datech jako poslední dvojčíslí roku narození respondenta

FRE A1. - vytvoří četnostní tabulku proměnné A1. DES VAR A1. vytvoří popisnou statistiku proměnné A1 (minimum, maximum, průměr, směr. odchylku a počet platných hodnot proměnné). EXAMINE A1. Provede průzkumovou analýzu proměnné A1, kromě popisné statistiky kreslí histogram, krabičkový graf, testuje normalitu proměnné, atd.

RECODE A2 (1 2=1) (3=2) INTO A3. překóduje hodnoty proměnné do námi zvolených kategorií do nové proměnné A3(viz dovětek INTO A3), tam kde byla v proměnné A2 1 nebo 2 bude v A3 1, tam kde byla v A2 3 bude v A3 kód 2. TEMP. SEL IF ROK=1998. FRE VZDELANI. - temp ve spojení se sel if zajistí, že následující příkazy až do prvního příkazu "obsahujícího“ execute nebo do příkazu execute se vykonají jen na vybraných datech (např. jen na datech z roku 1998 se vypočtou četnosti proměnné VZDELANI)

MIS VAL A2 (98). - definuje chybějící pozorování, ty poté nevstupují např. do výpočtů platných procent, ale je potřeba dát pozor jak daná procedura s chybějícími hodnotami pracuje (zjistíme to z porovnání počtu chybějících případů a případů použitých pro příslušnou analýzu) MIS VAL umožňuje definici maximálně 3 uživatelsky chybějících hodnot, při zápisu oddělujeme čárkou, např.: MIS VAL A2 (97,98,99). Je možné též nadefinovat interval uživatelsky chybějících hodnot pomocí slova thru, např. MIS VAL A2 (97 thru 200). znamená, že nechci pracovat s hodnotami mezi 98 a 200. Další užitečné pomůcky: Všechny hodnoty větší či než 100 či 100 zapíšeme: (100 thru hi), obdobně vše menší než 0 či 0 (lo thru 0) apod.

Poznámka k chybějícím hodnotám kromě uživatelsky definovaných chybějících pozorování zná SPSS i systémová chybějící pozorování (ta se utvoří sama, když nějakou buňku v datovém souboru nevyplníme). V datech jsou systémové chybějící hodnoty označeny čárkou Vážení dat WEIGHT BY VAHA. - spustí vážení souboru dle proměnné VAHA a všechny výpočty jsou prováděny s vahami (viz další kurz) WEIGHT OFF. –vypne vážení dat

Poznámky ke psaní příkazů Příkazy umožňují zpravidla spustit operaci na více proměnných najednou. Zajistíme to tak, že za příkaz napíšeme název všech proměnných pro něž se má provést. FRE A1 A2 A3 A4. Vypočítá četnostní tabulky pro proměnné A1, A1 A2 A3 A4. Pokud chceme něco provést pro všechny proměnné lze užít slovo all: FRE ALL. Vypočte četnostní tabulky pro všechny proměnné v datovém souboru.

Poznámky ke psaní příkazů Vypočte četnostní tabulky pro všechny proměnné v datovém souboru. Chceme-li něco provést pro několik proměnných, které jsou ve sloupcích vedle sebe, např. proměnné A1, A2, A3, A4 lze použít zkrácený zápis: FRE A1 to A4. –četnosti A1, A2, A3, A4 Příkaz COMPUTE není možno použít pro více proměnných najednou. Při použití příkazu VAR LAB stačí napsat příkaz jednou a poté jednotlivé proměnné oddělit lomítkem: VAR LAB A1“Věk“ / A2“Pohlaví“.