Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Základní statistické pojmy
Kvantitativní metody výzkumu v praxi
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
Statistika I 2. cvičení.
Regresní analýza a korelační analýza
Popisná statistika - pokračování
Základní statistické pojmy a postupy
Tloušťková struktura porostu
Obsah statistiky Jana Zvárová
Jiří Šafr jiri.safr(zavináč)seznam.cz
Analýza kvantitativních dat I.
Analýza dat.
Řízení a supervize v sociálních a zdravotnických organizacích
Základy pedagogické metodologie Mgr. Zdeněk Hromádka
Analýza kvantitativních dat II. Analýza chybějících hodnot (missing values) Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 23/5/2012 UK FHS Historická.
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Statistika Zkoumání závislostí
Korelace a elaborace aneb úvod do vztahů proměnných
Úvod: Vytvoření datové matice a pořízení dat Výzkum TV & knihy Jiří Šafr FHS UK, HiSo a ŘS Analýza kvantitativních dat AKD I. (II.) / Praktikum LS 2011,
Statistika 2 Aritmetický průměr, Modus, Medián
Lineární regresní analýza
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Statistika 2. přednáška Ing. Marcela Čapková.
Biostatistika 4. přednáška
Pohled z ptačí perspektivy
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Základy zpracování geologických dat
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Kombinatorika, pravděpodobnost, statistika
Popisná analýza v programu Statistica
1. cvičení
Statistika Statistika je matematická disciplína, která zpracovává výsledky hromadného pozorování (o objemu výroby, dovozu či vývozu zboží, výdajích a příjmech.
Základy pedagogické metodologie; seminář Mgr. Zdeněk Hromádka
Postup při empirickém kvantitativním výzkumu
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Tabulky Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
SPSS a analýza dat Grafy pro prezentaci výzkumu Chyby prezentování dat Custom tables v SPSS.
Statistika 1.cvičení. Základní informace Ing. Daniela Krbcová Materiály ze cvičení, přednášky Skripta k předmětu,
Ukládání dat biodiverzity a jejich vizualizace
INDUKTIVNÍ STATISTIKA
Základy analýzy kvantitativních dat Metodologie pro ISK – podzim 2015
Popisná statistika I tabulky četností
Příprava dat před analýzou
Neparametrické testy parametrické a neparametrické testy
Popisná analýza v programu Statistica
METODICKÝ LIST PRO ZŠ Pro zpracování vzdělávacích materiálů (VM)v rámci projektu EU peníze školám Operační program Vzdělávání pro konkurenceschopnost   
Výukový materiál zpracován v rámci projektu EU peníze školám
Proč statistika ? Dva důvody Popis Inference
METODOLOGIE MAGISTERSKÉ PRÁCE
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
Úvod do induktivní statistiky
Analýza kardinálních proměnných
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat

Popisná (deskriptivní) statistika Začínáme zkoumáním jednotlivých proměnných, teprve potom analyzujeme jejich vztahy Účelem analýzy je „zpřístupnit data graficky, tabulkově a výpočtem statistických charakteristik“ (Hendl 2009)

Za DÚ…

Za DÚ Vytvořte dva nové samostatné soubory: Ukol3_zeny.sav Ukol3_muzi.sav Vypracujte zprávu (.doc) popisující socio-demografické charakteristiky respondentů a jejich spokojenost s nabídkou knihoven (z původního souboru): Kolik je v souboru mužů a žen? V jakém roce se respondenti narodili? Jaké je jejich vzdělání? Jak jsou spokojeni s nabídkou v knihovnách?

Výběr případů Pokud nechceme pracovat s celým souborem Data  Select Cases Lze vybírat náhodně nebo dle kritéria – pokud např. chceme pracovat jen s muži, pak musíme použít proceduru IF

Kontrola dat: GIGO „Garbage in, garbage out!“

Kontrola dat: GIGO Chyby při zpracování Kontrola dat Posuny desetinných čárek Záměna znaků (nepoužívat „0“ pro missing values) Chyby při přepisování Kontrola dat Kontrola okem („vytisknout a řádek po řádku zkontrolovat“ Hendl, 2009) Předběžné grafické zobrazení dat

Co s missing values? Hodnota „neodpověděl/a“ Jsou výskyty rozděleny náhodně? Způsoby kontroly: rozdělit soubor na skupiny záznamů s missing values a bez nich, porovnat charakteristiky obou souborů Kontrola korelací vyplnění/nevyplnění s jinou proměnou

Co s missing values? Pokud potřebujeme pracovat jen s úplnými záznamy: Vymazání jednotky Vymazání proměnné Imputace Odhad scházející hodnoty (regresní analýza) Nahrazení průměrnou hodnotou subpopulace

Co s missing values? Transform  Replace Missing Values

Kategorizovaná a nekategorizovaná data Kategorizovaná data: nominální, ordinální i kardinální proměnné s malým počtem variant (pohlaví, vzdělání, počet dětí) Nekategorizovaná data: kardinální proměnné s velkým počtem variant (plat)

Kontrola kategorizovaných dat Analyze  Descriptive Statistics  Frequencies Chybný zápis jména

Kontrola kategorizovaných dat Analyze  Descriptive Statistics  Frequencies Co s missing values?

Kontrola kategorizovaných dat Analyze  Descriptive Statistics  Frequencies Chyba: proměnná „Pohlaví“ by neměla nabývat hodnoty 7

Kontrola kategorizovaných dat Nalezení dat: CTRL+F Edit  Find

Kontrola nekategorizovaných dat

Kontrola nekategorizovaných dat Analyze  Descriptive Statistics  Descriptives

Kontrola nekategorizovaných dat Analyze  Descriptive Statistics  Descriptives

Kontrola nekategorizovaných dat Analyze  Descriptive Statistics  Explore

Kontrola nekategorizovaných dat Analyze  Descriptive Statistics  Explore

Kontrola nekategorizovaných dat Analyze  Descriptive Statistics  Explore Je to chyba nebo ne?

Analýza kategorizovaných dat Třídění prvního stupně (univariační analýza) Analyze  Descriptive Statistics  Frequencies „Podezřele“ moc missing values Možný postup: rekódovat jako novou proměnnou (odpověděli/neodpověděli) a sledovat, zda výskyty hodnot souvisí s jinými proměnnými

Tabulka četností Analyze  Descriptive Statistics  Frequencies

Analýza kategorizovaných dat Analyze  Descriptive Statistics  Frequencies  Charts  Bar Charts

Sloupcové grafy

Koláčové grafy

Zobrazování dat Tabulka četností Graf četností První přehled výsledků měření Vhodné pro uvedení přesných čísel Absolutní / relativní / validní / kumulativní četnosti Graf četností Názornější Používají se validní četnosti Osa X: hodnoty proměnné Osa Y: četnosti

Zobrazování dat Sloupcový graf: Nezávislá proměnná na vodorovné ose Závislá proměnná na svislé ose Pozor na měřítko:

Míry centrální tendence Nominální proměnná: MODUS Ordinální proměnná: MODUS, MEDIÁN MODUS je hodnota, která se v datech vyskytuje nejčastěji. MEDIÁN dělí řadu výsledků seřazených podle velikosti na dvě stejně početné poloviny MEDIÁNOVÁ KATEGORIE je ta, ve které je dosaženo 50% všech údajů, postupujeme-li od první kategorie výše.

Míry centrální tendence Analyze  Descriptive Statistics  Frequencies  Statistics  Median, Mode

Obrázky: kevin dooley