Zpracování dat v kvantitativním šetření

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Testování statistických hypotéz
Sociologie – metody a techniky sociologického výzkumu
Cvičení 6 – 25. října 2010 Heteroskedasticita
Analýza variance (Analysis of variance)
Etapy práce na sociologickém výzkumu. 2 I. Formulace problému II. Rozhodnutí o populaci a vzorku III. Pilotní studie IV. Rozhodnutí o technice sběru dat.
Testování hypotéz (ordinální data)
Teorie psychodiagnostiky a psychometrie
Varianty výzkumu Kroky výzkumu Výběrový soubor
Hypotézy ve výzkumu.
Analýza dat.
Název školy: Střední odborná škola stavební Karlovy Vary, Sabinovo náměstí 16, Karlovy Vary Autor: ING. JANA KOVAŘÍKOVÁ Název materiálu: VY_32_INOVACE_11_MARKETINGOVÝ.
Biostatistika 10. přednáška
Řízení a supervize v sociálních a zdravotnických organizacích
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Biostatistika 5. přednáška Aneta Hybšová
Zásady experimentální práce (především v biologii)
Korelace a elaborace aneb úvod do vztahů proměnných
Jiří Šafr jiri.safr(zavináč)seznam.cz
Biostatistika 6. přednáška
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
DKV část 31 Design kvantitativního výzkumu 4. část ( ) Jiří Šafr UK FHS Historická sociologie (LS 2010)
Pohled z ptačí perspektivy
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Teorie psychodiagnostiky a psychometrie
 Kurs: Vybrané kapitoly z výzkumu veřejného mínění  FSV UK, U Kříže 8  Středa  PhDr. Jiří Vinopal, Ph.D.  Centrum pro výzkum veřejného.
TECHNIKY SBĚRU DAT KVANTITATIVNÍ KVALITATIVNÍ VÝZKUM VÝZKUM
Statistická významnost a její problémy
Praktikum 4c: Tabulky, baterie otázek 16/5/08. Tabulky - metoda popisu dat.
Biostatistika 8. přednáška
Kvantitativní metody výzkumu v praxi
Základy pedagogické metodologie
Biostatistika 1. přednáška Aneta Hybšová
Marketingový průzkum Milan Mrázek Matematika & Business
KMVP část 31 Kvantitativní metody výzkumu v praxi 3. část ZS 2008 (2/11/08) Jiří Šafr
PSY717 – statistická analýza dat
Metody sociálního výzkumu 5. blok Denní studium LS 2007/
Základy pedagogické metodologie
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Postup při empirickém kvantitativním výzkumu
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Typy výzkumu  Kvantitativní  Kvalitativní  Smíšený  První zkoumá kolik lidí si co myslí atd …  Druhý co přesně si lidé myslí  Třetí je kombinací.
Aplikovaná statistika 2.
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Kvalita a reliabilita výzkumu Radoslav Škapa. Výzkum jako redukovaná realita Redukce počtu pozorovaných proměnných Redukce počtu analyzovaných vztahů.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Kvantitativní zpracování dat Radoslav Škapa. Typy dat Neparametrické ▫Nominální (nominal) – např. pohlaví ▫Ordinální (ordinal) – např. preference vyjádřené.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Kritéria kvality metod a výzkumného šetření
Proč statistika ? Dva důvody Popis Inference
Spojitá a kategoriální data Základní popisné statistiky
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Sociologický výzkum II.
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
Úvod do induktivní statistiky
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Statistika a výpočetní technika
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Střední škola obchodně technická s. r. o.
Transkript prezentace:

Zpracování dat v kvantitativním šetření Radoslav Škapa

Kvalita výzkumu Kvalita výzkumu je vedle použitých metod vyhodnocení, jasné definice cíle, fundované interpretace odvislá zejména kvalitě dat, která má dvě klíčové složky: reprezentativitu (externí validita) a kvalitu měření (interní validita)

Kvalita výzkumu: kvalita měření Validita (platnost) – zda test skutečně měří to, co chceme měřit Reliabilita (spolehlivost) Reliabilita je předpokladem, aby byl test validní! složky reliablity: stabilita v čase, ekvivalenci (různý postup měření – stejný výsledek) a vnitřní konzistenci (Split-Half metoda)

Kvalita výzkumu: kvalita měření Měření reliablity Měří se snadněji než validita Opakované měření v čase (v krátkém čase se jev nemění) mezi-položková reliabilita (konzistence v odpovědích na baterii otázek) alternativní forma jedné otázky (např. různé pořadí nabízených odpovědí Více hodnotitelů hodnotí jednu věc – zkoumá se shoda

Kvalita výzkumu: kvalita měření Kriteriální validita – výsledek se porovnává s validizovaným kritériem (současně, retrospektivně). Kde takové kritéria vzít? Příklad: prediktivní modely se porovnaní se skutečností, která nastane (retrospektivní hodnocení). Konstruktová validita – zjišťuje zvolený nástroj (ukazatel) to, co mě zajímá? Obsahová validita – soulad mezi tím co jsme testovali a tím co jsme testovat měli. Např. Obsahuje zkouškový test otázky na podstatné znalosti z celého učiva? (předpokladem je existence teorie, průzkumu, názory expertů).

Kvalita výzkumu: reprezentativita Míra shody mezi základním a výběrovým souborem z hlediska kvantity i kvality Předpokladem zobecnitelnosti výsledků výzkumu

Kvalita výzkumu: výběrový vzorek Zdroj: http://www.uta.fi/~tero.mamia/opetus/luennot/lecture1.pdf

Kvalita výzkumu: výběrový vzorek Míra spolehlivosti zobecňování dána kvalitou výběrového vzorku. Vždy ale existuje jistá chybovost! Větší vzorek vždy lepší než menší (Kdo to zaplatí? Čas?) Ideálně zkoumat celý základní soubor – pak netřeba provádět statistické testování testování výsledků

Kvalita výzkumu: výběrový vzorek Míra návratnosti (final sample)? Při písemném dotazování či kontaktování vybraných osob (podniků) běžně 10% Ideálně víc než 50% Nedošlo díky tomu k pokřivení výpovědí? (tzv. non- response bias) – porovnat se znaky základního souboru, které jsou známé + další postupy Více: Jindřich Krejčí: Chyba plynoucí z výpadků návratnosti výběrových šetření a statistické dokazování http://www.socioweb.cz/index.php?disp=teorie&shw=368&lst=105

Kvalita výzkumu? Jedna z cest jak eliminovat rizika je triangulace triangulace dat – použití více zdrojů dat triangulace výzkumníků – zkušenosti, intersubjektivita triangulace teorií – více způsobů jak data a jevy interpretovat triangulace metod – více metod na zkoumání jednoho jevu

Zdroje chyb Výzkumník: Tazatel: Respondenti: Chybný či nedostatečný popis základního soboru Chybný výběrový soubor (např. nereprezentativní vzorek, chybná metoda tvorby výběrového souboru). Chybně formulované otázky Tazatel: Chování vůči respondentům Nedodržení postupu dotazování/podvody Omyly Respondenti: Neschopnost odpovědět (neznalost, složitá formulace otázek Neochota odpovědět Neochota odpovědět správně

Příprava dat Editace a kódování struktura datového souboru – značení proměnných, jejich charakter i samotné dotazníky je třeba označit, aby byly dohledatelné. Přepisování dat patrně tabulkový procesor (většinou data ve sloupcích) kontrola přepisovaných dat – podezřelé hodnoty, či celý dotazník Kontrola dat Jsou hodnoty jednotlivých proměnných smysluplné? Např. extrémní hodnoty, chybějící hodnoty, podezřelé hodnoty (věk 15 let + stav: ženatý)

Typy dat Neparametrické Metrické (parametrické) Nominální (nominal) – např. pohlaví Ordinální (ordinal) – např. preference vyjádřené na škálách, sociální třídy, stupeň vzdělání, toto třídění proměnných z hlediska množství obsažené informace. Metrické (parametrické) Intervalové (interval) – např. teplota, Likertovy škály – intervaly jsou mezi stupni stejně velké. Nemá ale smysl mluvit o tom, že je např. 2x větší teplota (10 vs. 20 stupňů C). V sociálních výzkumech spíš zřídka. Poměrové (ratio) – např. věk, obrat. Existuje nula. Mnoho statistických testů nerozlišuje mezi intervalovými a poměrovými proměnnými

Analýza dat Popisná statistika Jedno- a dvourozměrná analýza Vícerozměrné analýzy Interpretace Třídění 1., 2. a 3. stupně

Ukazatelé polohy Typ proměnné Přípustné operace Nominální Modus Ordinální Modus, medián Intervalové Modus, medián, průměr Poměrové U ordinálních by se neměl počítat průměr. U Likertových škál lze. Je vhodné sledovat všechny ukazatele polohy.

Krabicový diagram http://www.physics.csbsju.edu/stats/box2.html

Vztahy mezi proměnnými Nalezení vztahů je obecným finálním cílem každého výzkumu Dvě dimenze vztahu: Velikost (síla) – hodnocení na výzkumníkovi. Obecně ve společenských vědách se za silné vazby považují už nižší koeficienty asociace (např. 0,7) něž přírodní vědy. Příklady Pearsonův produktový koeficient korelace. Spolehlivost (reliabilita, pravdivost) – pravděpodobnost, že výsledek není náhodný. Spolehlivost s jakou lze výsledek zobecnit na základní soubor. Měří se pomocí „p-value“ (statistical significance) – pravděpodobnosti chyby. Např. p- value=0,05 znamená 95% spolehlivost.

Vztahy mezi proměnnými Z jiného pohledu: p-value=0,05 znamená např. že cca při 20 měřeních korelací nesouvisejících proměnných nám jedna vyjde spolehlivá. (tzv. chyba 1. typu). Existuje vztah mezi sílou a spolehlivostí vypočteného vztahu (příklad. porodnice) Ve stejně velkém vzorku, silnější vztahy víc spolehlivé. K prokázání slabých vztahů je třeba velké vzorky. (K prokázání neexistence žádného vztahu – prozkoumat téměř celou populaci). (příklad – slabě vychýlená mince).  ve velkých vzorcích i slabé vztahy budou statisticky významné – proto při interpretaci se vždy zamyslet, zda je takový vztah dostatečně silný, aby mělo smysl o něm mluvit. http://www.statsoft.com/textbook/elementary-concepts-in-statistics/

Jak se počítá spolehlivost? Magnusson, W. E., and G. Mourão. 2004. Statistics without math. Sinauer Associates, Londrina, Brasil

Postup statistického vyhodnocování  Smith, Fletcher: The Art & Science of Interpreting Market Research Evidence

Které analýzy v práci použít? Třídění 1. a 2. stupně + alespoň několik analýz 3. stupně: Popisná statistika: (analýza četností, polohy, variablity) Kontingenční tabulky Rozdíly ve středních hodnotách (t-test, Mann-Whitney test – ordinální data) Korelace (Pearson, Spearman (Kendall) – ordinální data) Nezapomenout na interpretaci výsledků Ideálně další a náročnější metody – vícerozměrná regrese, shluková analýza, diskriminační analýza, conjoint analyza, faktorová analýza. (tyto je třeba samostatně nastudovat, použít vhodně vzhledem k cíli a sestavit dotazník způsobem, abyste metodu mohli využít)

Software Statistica – licence MU SPSS – Multilicence MU MS Excel – doplněk Analýza dat XLStatistics http://www.deakin.edu.au/~rodneyc/XLStatistics / Statistica – licence MU SPSS – Multilicence MU Statgraphics – zaměřený spíš na průmysl. Výhodou jsou automatické komentáře k výsledkům.

Literatura IASTAT - INTERAKTIVNÍ UČEBNICE STATISTIKY http://iastat.vse.cz/ Štatistický navigátor http://rimarcik.com/navigator/ StatSoft, Inc. (2010). Electronic Statistics Textbook. http://www.statsoft.com/textbook/ Miroslav Disman: Jak se vyrábí sociologická znalost http://www.jakubholy.net/humanities/disman-soc_znalost.html Martin Kreidl: Metody měření reliability a validity. http://www.socioweb.cz/index.php?disp=teorie&shw=153&lst=106 Petr Mareš, Ladislav Rabušic: Studijní materiály pro předět SOC708 https://is.muni.cz/auth/el/1423/podzim2005/SOC708/um/?info=1