Přednáška 2 Etapy výzkumu, přístup k datům
Několik otázek na úvod úkoly četba Tinn-R data a syntaxy v Moodlu zaheslování Moodlu: analyzadat
Model empirického výzkumu (viz Hendl kap. 1) vědecká otázka návrh teorie identifikace proměnných určení hypotéz plán výzkumu sběr dat, testování hypotéz vyhodnocení výsledků kritické shrnutí
Tvorba teoretického základu výzkumu Teorie Hypotéza Formální model Operacionalizace Empirické indikátory
Testování hypotéz a jiné možnosti Přístup k hypotézám Explorace (formulace nových hypotéz) Demonstrace (deduktivně podporujeme platnost hypotéz) Opakování (opakování výsledků výzkumu) Zamítnutí (falsifikace hypotéz vycházející z Popperova kritického realismu)
Typy vektorů číselný vektor (věk) vek<-c(12, 17, 28) logický vektor (pravda/ nepravda ~ 0/1) zletily<-vek<18 nominální vektor = faktor!!! – hodnoty mohou být číselné nebo stringové, ale jsou diskrétní příklad faktoru se stringovými hodnotami: velmi souhlasím – spíše souhlasím – spíše nesouhlasím - nesouhlasím nazor1 <- factor(c(“velmi souhlasim”, “nesouhlasim”, “velmi nesouhlasim”)) příklad faktoru s číselnými podnotami: 1, 3, 4 nazor2 <- factor(c(1,3,4)) znakový vektor (jméno města) mesto<-c("Praha", "Praha", "Brno") zkuste udělat ze znakového vektoru faktor: mesto2<-as.factor(mesto)
Jak zjistíme typ vektoru class () – informace o třídě objektu (např. vektoru) str() – podrobnější informace o objektu class(vek) [1] "numeric„ str(vek) num [1:3]
Typy vektorů class(vek) [1] "numeric„ > class(zletily) [1] "logical" class(nazor1) [1] "factor„ class(mesto) [1] "character" numerický vektor logický vektor nominální vektor stringový vektor
Datový rámce: další užitečný objekt dvourozměrné pole, matice sloupce nemusí být vektory stejného typu užitečný při zpracování dat data1<-data.frame(vek, zletily, nazor, mesto) podívejte se na svá data: edit(data1) opravte svá data data2<-edit(data1) zavolejte sloupec (proměnnou) z datového rámce: data2$vek
Import datových souborů není tak jednoduchý jako v jiných programech ale je možné naimportovat data z prakticky jakéhokoli formátu
Import: cut and paste import dat z tabulkového procesoru (například Excell) read.clipboard(psych) – tzn. musíte nainstalovat package “psych“ install.packages (“psych”) library(“psych”) ?psych() 1. zkopírujte data z tabulkového editoru do cplipboardu 2. data<-read.clipboard() 3. edit(data2)
Import: csv (comma separated value)
read.csv () ?read.csv() data4<- read.csv("\\\\ajifs01\\czphome2\\czpurban\\Deskt op\\mazat\\data.csv",header=TRUE, sep=";") ale jde to i jednodušeji: source<-file.choose() data4<-read.csv(source, header=T, sep=“;”) podívejte se i na význam dalších argumentů v read.csv!
Import z dalších formátů (STATA, SAS, SPSS...) - package „foreign“ - bohužel načítání dat např. z SPSS může dělat problémy (nefunguje ukládání jako data.frame) - proto bude pracovat s csv data oddělenými tabulátorem
Import dat Eurobarometer Natáhněte data z CD (textový soubor „data_Eurobarometer“) source<-file.choose() data<-read.csv(source, header = T, sep = "\t") prohlédněte si data edit(data) prohlédněte si jména proměnných v datovém rámci names(data)
Četnosti hodnot, míry variability a rozptýlenosti (viz Vavrčík 4.1) table() mean() median() min() max() sd() var() četnost průměr medián minimum maximum směrodatná odchylka rozptyl
Děkuji za pozornost