Analýza dotazníků RNDr. Michal Čihák, Ph.D..

Slides:



Advertisements
Podobné prezentace
Statistická indukce Teorie odhadu.
Advertisements

Neparametrické testy pro nezávislé výběry
Testování parametrických hypotéz
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Neparametrické metody a analýza rozptylu (lekce 3-7)
Testování neparametrických hypotéz
Testování statistických hypotéz
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL
Testování hypotéz (ordinální data)
Biostatistika 10. přednáška
Inference jako statistický proces 1
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
základní principy a použití
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regresní analýza
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Kontingenční tabulky.
Korelace a elaborace aneb úvod do vztahů proměnných
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Marketingový průzkum Milan Mrázek Matematika & Business
Kurz SPSS: Jednoduchá analýza dat 3. úvod do SPSS Jiří Šafr vytvořeno
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Inferenční statistika - úvod
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Základy zpracování geologických dat R. Čopjaková.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
… jsou bohatší lidé šťastnější?
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Induktivní statistika
Induktivní statistika
Příprava dat před analýzou
Neparametrické testy parametrické a neparametrické testy
Neparametrické testy parametrické a neparametrické testy
Úvod do molekulární medicíny – cvičení
METODOLOGIE MAGISTERSKÉ PRÁCE
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Analýza kardinálních proměnných
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Definiční obory. Množiny řešení. Intervaly.
Základy statistiky.
Základy popisné statistiky
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Analýza dotazníků RNDr. Michal Čihák, Ph.D.

Likertova škála je jednou z nejpoužívanějších a nejspolehlivějších technik měření postojů v dotaznících: raději použít „Neutrální postoj „

Typy proměnné – statistický znak Statistické znaky dělíme na: Nominální – lze interpretovat pouze rovnost nebo nerovnost hodnot Ordinální – hodnoty lze seřadit od nejmenší po největší (nebo naopak) Metrické intervalové – lze interpretovat rozdíl dvou hodnot poměrové – mimo rozdílu lze interpretovat i podíl dvou hodnot

Ordinální vs. Intervalový metrický znak Likertovy škály lze považovat za ordinální – je možné tvrdit, že například hodnota „Naprosto souhlasím“ je před hodnotou „Spíše souhlasím“. Některé typy škál je možné považovat i za intervalové – podmínkou je, aby mezi hodnotami byla stejná „vzdálenost. Příklad 1. Likertova škála "Poor", "Average", "Good", and "Very Good" nemůže být považována za intervalovou, je pouze ordinální.

Intervalové škály Příklad 2. Likertova škála " Strongly disagree ", "Disagree ", "Neither agree nor disagree ", "Agree ", "Strongly agree" je obvykle vnímána jako intervalová. Příklad 3. Sémantický diferenciál je typem škály, která bývá považována za intervalovou (běžný respondent vnímá stupnici lineárně).

Důsledky pro statistické zpracování Nominální znaky – lze použít pouze metody, které pracují s četnosti (například χ2 test nezávislosti) Ordinální – lze navíc použít i neparametrické metody, které pracují s pořadím (Wilcoxonův test, Mann-Whitneyův test, apod.) Intervalové metrické – odpovědi na několik otázek (se stejným typem škály) lze sčítat a na takto vzniklý znak lze použít parametrické testy (t-test, analýza rozptylu, apod.) Poznámka: Obecně se doporučuje sčítat minimálně 4 otázky, ideálně 8 a více otázek, což zaručuje (centrální limitní věta) normální rozdělení vzniklého znaku.

Nominální znaky → χ2 test nezávislosti Příklad 3. Pohlaví vs. účast v posledních volbách: Ptáme se, zda účast ve volbách závisí na pohlaví. χ2 test nezávislosti smí být použit pouze v případě výběrů, které nejsou párové. Volby Pohlaví muži ženy účast 2792 3591 neúčast 1486 2131

χ2 test nezávislosti v SPSS Analyze → Descriptive Statistics → Crosstabs…

χ2 test nezávislosti – výsledky p-hodnota je 0,015 < 0,05 (hladina významnosti) Zamítáme H0 a přijímáme HA Na hladině významnosti 5 % byla zjištěna závislost mezi pohlavím a státní příslušností.

Nominální znaky → McNemarův test Příklad 3. Ptáme se, zda je tzv. globálního oteplování vážným nebezpečím pro lidstvo: Zajímá nás, zda přečtení studie ovlivnilo názor na globální oteplování. Zde se jedná o tentýž výběrový soubor, pro nějž byl průzkum dvakrát zopakován (hodnoty tvoří páry) – musíme použít McNemarův test namísto χ2 test nezávislosti Před přečtením studie Po přečtení studie ano ne 33 67 147

McNemarův test v SPSS Analyze → Descriptive Statistics → Crosstabs… V našem cvičném souboru ale nemáme data vhodná pro tento test.

Ordinální znaky → Mann-Whitney test Test smí být použit pouze v případě výběrů, které nejsou párové (žádný respondent se nesmí vyskytovat současně v obou výběrových souborech). Příklad 4. Chceme zjistit, zda se liší názory Čechů a Poláků v otázce „Jsem si jistý/á, že se chci stát učitelem/kou.“

Mann-Whitney test v SPSS Analyze → Nonparametric Tests → Legacy Dialogs → → 2 Independent Samples…

Mann-Whitney test – výsledky p-hodnota je 0,351 > 0,05 (hladina významnosti) Nezamítáme H0 Na hladině významnosti 5 % nebyl zjištěn rozdíl mezi Čechy a Poláky v otázce „Jsem si jistý/á, že se chci stát učitelem/kou.“

Ordinální znaky → Wilcoxonův znaménkový test Test smí být použit pouze v případě výběrů, které jsou párové (na stejném souboru respondentů provedeme průzkum dvakrát). Analyze → Nonparametric Tests → Legacy Dialogs → → 2 Related Samples… V našem cvičném souboru ale nemáme data vhodná pro tento test.

Ordinální znaky → Spearmanův koeficient korelace Má smysl pouze v případě výběrů, které jsou párové (pro stejný soubor respondentů zkoumáme závislost dvou ordinálních statistických znaků). Příklad 5. Chceme zjistit míru závislosti mezi otázkou „Jsem si jistý/á, že se chci stát učitelkou“ a otázkou „Celkově považuji profesní přípravu za maximálně užitečnou“.

Spearmanův koeficient korelace v SPSS Analyze → Correlate → Bivariate…

Spearmanův koef. korelace – výsledky Spearmanův koeficient korelace je 0,078 p-hodnota pro tento koeficient je 0,195 > 0,05 Koeficient korelace nebyl shledán významným na hladině významnosti 5 %. Nebyla zjištěna závislost mezi těmito dvěma otázkami.

Odhad reliability dotazníku Reliabilita (spolehlivost, hodnověrnost) je statistická veličina, udávající spolehlivost skupiny položek dotazníku. Lze ji chápat jako míru přítomnosti chyby při měření Nabývá hodnot od 0 do 1 (0 % až 100 %) – čím je nižší, tím je měření měně spolehlivé. Příklad 6. Chceme zjistit reliabilitu položek A4a, A4B, A4c, A4d, A4e dotazníku. Předpokládejme, že tyto položky měří „spokojenost se studiem“. Zajímá nás, jak spolehlivě ji měří.

Odhad reliability dotazníku v SPSS Analyze → Scale → Reliability Analysis…

Odhad reliability dotazníku – výsledky Cronbachovo alfa vychází poměrně vysoké, tedy zvolených 5 otázek dobře měří jednu vlastnost „celkovou spokojenost se studiem“. V další tabulce můžeme najít vypočtené korelace mezi jednotlivými otázkami. V poslední tabulce můžeme pro každou otázku nalézt informaci, jak se změní Cronbachovo alfa, pokud tuto otázku odstraníme z dotazníku.

Intervalový znak vytvořený součtem ordinálních znaků Příklad 7. Vytvoříme novou proměnnou SoucetA4 = A4a + A4b + A4c + A4d + A4e Na takto vzniklou proměnnou lze použít parametrické testy (t-test, analýza rozptylu, apod.) Poznámka: Obecně se doporučuje sčítat minimálně 4 otázky, ideálně 8 a více otázek, což zaručuje (centrální limitní věta) normální rozdělení vzniklého znaku.

Vytvoření nové proměnné v SPSS Transform → Compute Variable… V datovém listu vznikne nová proměnná SoucetA4. Na záložce Data View nastavte pro tuto proměnnou ve sloupci Measure hodnotu Scale.

SoucetA4 = A4a + A4b + A4c + A4d + A4e Dvouvýběrový t-test Pouze pro metrické intervalové znaky (pro ordinální znaky je náhradou Mann-Whitneyův test) Pouze v případě výběrů, které nejsou párové (žádný respondent se nesmí vyskytovat současně v obou výběrových souborech) Příklad 8. Zajímá nás, zda se liší názor Čechů a Poláků na spokojenost se studiem. Vytvoříme novou proměnnou „spokojenost se studiem“ SoucetA4 = A4a + A4b + A4c + A4d + A4e

Dvouvýběrový t-test v SPSS Analyze → Compare Means → → Independent-Samples T Test…

Dvouvýběrový t-test – výsledky p-hodnota je 0,060 > 0,05 (hladina významnosti) Nezamítáme H0, nicméně výsledek testu je „hraniční“ (0,060 je blízko 0,05). Na hladině významnosti 5 % nebyl zjištěn rozdíl mezi Čechy a Poláky v „celkové spokojenosti se studiem“.

Intervalové rozdělené četností Příklad 9. Vytvoříme novou proměnnou Vek_intervaly, podle následujících pravidel: Vek ≤ 20 interval číslo 1 21 ≤ Vek ≤ 22 interval číslo 2 23 ≤ Vek interval číslo 3 Pomocí této proměnné určíme četnosti hodnot proměnné Vek v jednotlivých intervalech

Intervalové rozdělené četností v SPSS Transform → Recode Into Different Variables…

Analýza rozptylu – jednoduché třídění Chceme porovnat více nezávislých souborů (t-test porovnává dva nezávislé soubory) Respondenty třídíme do skupin podle jedné proměnné Opět pouze pro metrické intervalové znaky Příklad 10. Zajímá nás, zda se liší názor Čechů, Poláků a Němců na spokojenost se studiem (třídící proměnná – Stat). Příklad 11. Zajímá nás, zda se liší názor různých věkových skupin na spokojenost se studiem (třídící proměnná – Vek_intervaly).

Analýza rozptylu v SPSS Analyze → Compare Means → → One-Way ANOVA…

Analýza rozptylu – výsledky p-hodnota je 0,474 > 0,05 (hladina významnosti) Nezamítáme H0 Na hladině významnosti 5 % nebyl zjištěn rozdíl mezi jednotlivými věkovými skupinami. Pokud by v jiné úloze byl zjištěn, hledáme ve druhé tabulce, mezi kterými skupinami je Sig. menší než 0,05.

Analýza rozptylu – dvojné třídění Opět chceme porovnat více nezávislých souborů Respondenty třídíme do skupin podle dvou proměnných Opět pouze pro metrické intervalové znaky Příklad 12. Zajímá nás, zda se liší názor na spokojenost se studiem u českých dívek, českých chlapců, polských dívek a polských chlapců (dvě třídící proměnné – Stat a Pohlavi). Nevýhoda – chybí nabídka post hoc porovnání – lze řešit vytvořením nové třídící proměnné

Párový t-test Pouze pro metrické intervalové znaky (pro ordinální znaky je náhradou Wilcoxonův znaménkový test) Pouze v případě výběrů, které jsou párové (na stejném souboru respondentů provedeme průzkum dvakrát) Analyze → Compare Means → Paired_Samples T Test… V našem cvičném souboru ale nemáme data vhodná pro tento test.