Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilNella Hrušková
1
Kvantitativní metody výzkumu v praxi 4a. část Jiří Šafr jiri.safr@seznam.cz UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (ZS 2005)
2
KMVP část 4a2 Obsah části 4a Typy sběru dotazníku Výběry z populací Vytváření souboru dat Tabulky Vlastnosti rozdělení znaků Jednoduché popisné statistiky Několik rad jak číst statistiky Typy grafů
3
KMVP část 4a3 Typy sběru dotazníku vyplňovaný tazatelem osobní počítačové dotazování CAPI (Computer Assited Personal Interviewing) telefonní počítačové dotazováníCATI (Computer Assited Telephone Interviewing) dotazování elektronickou poštou CAMI (Computer Assited Mailing Interviewing) hromadně vyplňovaný dotazník v jedné místnosti poštou distribuovaný dotazník (tam i zpět / zpět) anketa v tisku - není výběrem!
4
Výběry z populací
5
KMVP část 4a5 Kvalita výběru Chyba klesá s rostoucí velikostí vzorku a vzrůstající homogennosti populace → získáme užší interval spolehlivosti. Velikost směrodatné chyby a intervalu spolehlivosti nezávisí na velikosti populace.
6
KMVP část 4a6 Typy výběrů Pravděpodobnostní -náhodné Prostý náhodný Vícestupňový náhodný Stratifikovaný náhodný Nepravděpodobnostní Kvótní výběr Systematický Úsudkem Nabalováním [Jeřábek 1993: 44]
7
KMVP část 4a7 Pravděpodobnostní náhodný výběr každý z populace má stejnou pravděpodobnost, že bude vybrán reprezentuje všechny známé i neznámé vlastnosti populace Při zkoumání vzácného jevu řídce vyskytujícího se v populaci nemusí náhodný výběr být tím nejlepším. [Babbie 1995: 207]
8
KMVP část 4a8 Prostý náhodný výběr vyžaduje nějakou oporu výběru – seznam reprezentující základní soubor, ze kterého budeme vybírat (losovat).
9
KMVP část 4a9 [Babbie 1995]
10
KMVP část 4a10 Vícestupňový náhodný výběr kroky: 1.Základní soubor rozdělíme do podsouborů (přirozená seskupení). 2.z nich vybereme skupiny (můžeme více kroků) 3.a v nich teprve jedince Příklad. Vybíráme postupně: 1. okresy → 2. obce → 3. volební okrsky → 4. respondenty Respondent v domácnosti je také vybrán náhodně! Na rozdíl od stratifikovaného výběru jsou skupinky vzájemně zastupitelné.
11
KMVP část 4a11 Výhody vícestupňového náhodného výběru nepotřebujeme seznam celé populace (ten málokdy existuje) kompaktnější výběr (koncentrace do určitých regionů) šetří náklady na organizaci tazatelé „neběhají“ po celé zemi.
12
KMVP část 4a12 Stratifikovaný náhodný výběr [Babbie 1995: 211] Populaci rozdělíme do homogenních skupin podle nějakého společného kritéria (např. školní třídy). V těchto skupinách provedeme náhodný výběr Výhodou je SNV je, že snižuje velikost směrodatné odchylky.
13
KMVP část 4a13 Kvótní výběr výběr na základě splnění kritérií daných kvótou počet kvót max. 3-5 kvóty: nezávislé nebo vzájemných vazbách musí být viditelné lze použít jen na populaci, kterou dobře známe (kvantitativní statistická opora o populaci) obtížně dostupné skupiny lze nadhodnotit
14
KMVP část 4a14 Kvótní výběr Výhody: levnější než náhodný výběr rychlejší, operativnější není třeba pořizovat seznamy (oporu) základního souboru
15
KMVP část 4a15 Kvótní výběr Nevýhody: nelze stanovit výběrovou chybu a určit přesnost ukazatelů předpokladem je znalost základních informací o základním souboru je reprezentativní jen z hlediska znaků použitých v kvótách.
16
KMVP část 4a16 Systematický výběr částečně náhodný > s náhodným počátkem založen na pevně zvoleném kroku výběru ze základního seznamu jednotek není zaručeno náhodné pořadí jednotek v souboru (může existovat skrytá pravidelnost v seznamu).
17
KMVP část 4a17 [Babbie 1995]
18
KMVP část 4a18 Výběr nabalováním (snowball sampling) pro speciální, hůře dostupné populace jakmile se osoby opakují, výběr ukončíme
19
KMVP část 4a19 „NEvýběry“ nereprezentují celou populaci! Živelný výběr Výběr toho, na koho narazíme jako první. Výběr úsudkem Záměrný výběr často znalcem jako „průměrné jednotky“→ nejednoznačnost → nepřípustné! Anketa Dotazník v tisku / na internetu
20
KMVP část 4a20 Velikost výběrového vzorku Záleží na homogennosti populace a úrovni třídění, tj. kolik proměnných (a jaké - kolik mají kategorií) chceme v analýze postavit proti sobě. Princip „dostatečného“ výběru pro adekvátní statistické zpracování: relevantní kategorie zastoupena v poli tabulky alespoň 5 případy. Pro tabulku 5 x 4 tedy nestačí celkem 20 případů, to by znak v populaci musel být homogenní. Pozor, respondenti musí být skutečně náhodně vybraní. Tedy ne jen ti, kdo byli ochotní odpovídat!
21
KMVP část 4a21 Velikost výběrového vzorku U „velmi malých populací“ (do cca 50) neexistuje univerzální pravidlo velikosti výběrového vzorku. Neboť v každém případě je vzorek pro běžné statistické metody příliš malý. Proto je korektní šetřit celý základní soubor, nebo aplikovat kvalitativní metody výzkumu. Výběrový soubor z „malé populace“ např. zaměstnanců nějakého podniku nebo obyvatel obce (nad cca 50 do cca 200-300 lidí), by velmi orientačně měl představovat cca 20 %, minimálně ale 30 případů. Nicméně, nejedná se o žádné pravidlo! [Gatnar, L.]
22
Vytváření souboru dat
23
KMVP část 4a23 Převod dotazníků na elektronický soubor dat 1.vytvoření kódovacího klíče (codebook) 2.kódování (dle kódovacího klíče) 3.nahrávání (datová matice - „děrování“) 4.čištění dat 5.rekódování
24
KMVP část 4a24 Souhrnný index – škála Nová proměnná, která vznikne z více otázek (proměnných). Je reliabilnější (přesněji měří zvolený koncept) a validnější (měří právě jen zvolený koncept).
25
KMVP část 4a25 Chybějící hodnoty – označování a překódování Typy chybějících hodnot a jejich nejčastější kódování: neví(8 / 88) neodpověděl(9 / 99) netýká se Chybějící hodnoty (missing values) jsou nejčastěji vyloučeny z analýzy.
26
KMVP část 4a26 Varianty řešení pro „neví“ vyloučit z analýzy kódovat jako missing value, např. hodnota 9 listwise deletion – plošné vylučování případů tj. u všech znaků, pokud se u jednoho objevila chybějící hodnota V odůvodněných případech lze i překódovat např. na střední hodnotu. Př. Hodnocení prospěšnosti zavedení zimního času: 1 - uškodilo, 2 - uškodilo trochu, 3 - prospělo trochu, 4 - prospělo. Překódováno na: 1 - uškodilo, 2 - uškodilo trochu, 3 – neví, 4 - prospělo trochu, 5 - prospělo.
27
Zmínit se o všech manipulacích (překódování apod.) s daty je nezbytné!
28
Tabulky
29
KMVP část 4a29 Pravidla pro tvorbu tabulek [Kreidl 2000] Tabulka musí mít název a popsané proměnné (řádky a sloupce). Vždy uvést zdroj dat. Uvést celkový počet případů (marginální distribuce absolutních četností).
30
KMVP část 4a30 V názvu tabulky uvést: typ tabulky např. Procentní distribuce... nebo... (%) proměnné zahrnuté v tabulce, např. Religiozita a Úroveň vzdělání z jakého vzorku pocházejí data rok sběru dat Př. Procento uživatelů marihuany podle dosaženého vzdělání, středoškoláci, 1997.
31
KMVP část 4a31 Pravidla pro tvorbu tabulek Samotná procenta říkají málo nebo nic. → nezamlčovat absolutní četnosti (stačí marginální = řádkové, sloupcové a celkový počet případů). V první řádce či sloupci uvést znak pro %, aby bylo jasné, že se jedná tabulku pro procenta.
32
KMVP část 4a32 Pravidla pro tvorbu tabulek Kontrolovat sama sebe tím, že vždy sečtete čísla v jednotlivých řádcích a sloupcích a porovnáte je se skutečnými marginálními četnostmi (z tabulek tř. 1st.). Celá čísla v % v tabulkách většinou bohatě stačí. 23,48 % → 23 % [Kreidl 2000]
33
KMVP část 4a33 Třídění prvního stupně [Zdroj: Deset let transformace, 1999] frekvence jedné proměnné
34
KMVP část 4a34 Třídění druhého stupně absolutní četnosti [Zdroj: Deset let transformace, 1999] frekvence jedné vs. druhé proměnné (kategorie příjmu podle vzdělání)
35
KMVP část 4a35 Třídění druhého stupně relativní četnosti [Zdroj: Deset let transformace, 1999]
36
KMVP část 4a36 Marginální četnosti Relativní sloupcové četnosti = součet v každém sloupci reprezentuje 100% Relativní řádkové četnosti = součet v každém řádku reprezentuje 100%
37
KMVP část 4a37 NEZÁVISLÁ - vysvětlující ZÁVISLÁ - vysvětlovaná pohlaví spokojenostmužženaCelkový součet 1 (nespokojen)5 (71 %)2 (29 %)7 (100 %) 25 (83 %)1 (27 %)6 (100 %) 3 (spokojen)2 (25 %)6 (75 %)8 (100 %) Celkový součet12921 (100 %) Uspořádání tabulky Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá (vysvětlující) ve sloupcích.
38
KMVP část 4a38 Interpretace tabulek závislá proměnná = je v hypotéze ovlivňována, způsobována (nejčastěji je v řádcích) nezávislá(é) proměnná = vysvětluje, ovlivňuje závislou V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. Pozor! Směr kauzality je vždy věcí teorie, nelze ji určit z dat samotných. [Kreidl 2000]
39
KMVP část 4a39 Interpretace tabulek Tabulky skoro vždy dělejte tak, aby vyjadřovaly podmíněnou pravděpodobnost, že respondent (věc) bude patřit do jednotlivých kategorií závislé proměnné, za předpokladu, že patří do dané kategorie nezávislé proměnné(ných). Procento je stým násobkem pravděpodobnosti. [Kreidl 2000]
40
KMVP část 4a40 Souvislost znaků v tabulce Kupení vysokých hodnot na diagonále tabulky naznačuje, že existuje souvislost mezi proměnnými. Souvislost ale může mít i jinou formu, např. v každém sloupci jsou pozorování nahromaděna do jediného pole, jehož pozice je pro každý sloupec jiná.
41
KMVP část 4a41 Porovnání podskupin 1.rozdělte případy do adekvátních podskupin (dle hypotéz, např. podle vzdělání) 2.popište proměnnou pro podskupiny pomocí zvolených statistik (např. medián, průměr, procenta) 3.srovnejte tyto údaje pro skupiny
42
KMVP část 4a42 Interpretace tabulek Při interpretaci procent obvykle stačí porovnávat extrémní hodnoty a ignorovat střední kategorie. Pokud jde o ordinální proměnné pak není dobré činit obsáhlé závěry na základě % uvnitř jednotlivých kategorií nezávislé proměnné. Smysluplné je dělat porovnání distribucí napříč kategoriemi nezávislé proměnné. Buďte opatrní a neberte názvy kategorií zas tak doslova.
43
Vlastnosti rozdělení znaků
44
KMVP část 4a44 Symetrie, variabilita [Hanousek, Charamza 1992: 21]
45
KMVP část 4a45 Šikmost a špičatost [Hanousek, Charamza 1992: 21]
46
Jednoduché popisné statistiky
47
KMVP část 4a47 Střední hodnoty: nominální znaky →modus ordinální znaky→medián ( aritmetický průměr) intervalové znaky→aritmetický průměr
48
KMVP část 4a48 Modus = kategorie s největší četností Medián = hodnota, která je ve prostředku všech pozorování seřazených podle hodnoty Aritmetický průměr = součet hodnot dělený počtem pozorování
49
KMVP část 4a49 Modus [Babbie 1995]
50
KMVP část 4a50 Medián [Babbie 1995]
51
KMVP část 4a51 Průměr [Babbie 1995]
52
KMVP část 4a52 Charakteristiky variability Udávají koncentraci nebo rozptýlení kolem střední hodnoty. Rozptyl = součet kvadratických odchylek od průměru dělený rozsahem výběr zmenšeným o 1. Směrodatná odchylka = odmocnina z rozptylu. Ukazují na „kvalitu“ průměru.
53
KMVP část 4a53 Výpočet směrodatné odchylky Příklad. Máme pozorování: 7 2 5 4 3 1 8 2 6 2 Součet řady = 40; n = 10; průměr = 40/10 = 4 Odchylky: 3 -2 1 0 -1 -3 4 -2 2 -2 součet odchylek je 9 – 9 = 0 čtverce odchylek:9; 4; 1; 1; 0; 1; 9; 1; 6; 4; 4; 4 součet čtverců odchylek = 52 průměrná čtvercová odchylka tj. rozptyl = 5,2 směrodatná odchylka (odmocnina z rozptylu) = 2,28
54
KMVP část 4a54 Další popisné statistiky Minimum / maximum Rozpětí Kvantily: dolní a horní kvartil Koeficienty šikmosti
55
Několik rad jak číst statistiky [Hanousek, Charamza 1993: 34-35]
56
KMVP část 4a56 Při čtení statistik pozor na: „přesná“ čísla ve statistických zprávách procenta versus absolutní čísla srovnatelné údaje nezaměňovat ukazatele je porovnání vhodné? na výběry (nebyly-li provedeny profesionály) podoba otázek vlastní příprava zjišťování (experimentu) „v nemocnici umírají lidé častěji než doma“ [Hanousek, Charamza 1993: 34-35] celé viz soubor Pozor_statistika.pdf
57
Typy grafů
58
KMVP část 4a58 Histogram
59
KMVP část 4a59 Histogram
60
KMVP část 4a60 Polygon
61
KMVP část 4a61 Literatura Babbie, E. (1995). The Practice of social Research. 7th Edition. Belmont: Wadsworth Disman, M. (1993): Jak se vyrábí sociologická znalost. Praha: Karolinum Hanousek J., Charamza P. (1992). Moderní metody zpracování dat – Matematická statistika pro každého. Praha: Grada. Kreidl, M. (2000). Podklady ke kurzu Analýza kvantitativních dat. FSV UK, LS 2000-2001. Jeřábek, H. (1993): Úvod do sociologického výzkumu. Praha: Karolinum Poděkování za cenné konzultace RNDr. L. Gatnarovi.
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.