Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Kurz SPSS: Jednoduchá analýza dat Kontingenční tabulky a analýza kategoriálních dat = KMVP část 4. Elementární analýza dat Jiří Šafr

Podobné prezentace


Prezentace na téma: "Kurz SPSS: Jednoduchá analýza dat Kontingenční tabulky a analýza kategoriálních dat = KMVP část 4. Elementární analýza dat Jiří Šafr"— Transkript prezentace:

1 Kurz SPSS: Jednoduchá analýza dat Kontingenční tabulky a analýza kategoriálních dat = KMVP část 4. Elementární analýza dat Jiří Šafr vytvořeno

2 Praktikum KMVP část 22 Obsah části 2 Tabulky –Jednorozměrná analýza –Dvou a vícerozměrná analýza –Uspořádání tabulky a její interpretace –Pravidla tvorby tabulek Vlastnosti rozdělení znaků Jednoduché popisné statistiky –Střední hodnoty: modus, medián, průměr –Směrodatná odchylka Několik rad jak číst statistiky Typy grafů

3 Tabulky

4 Praktikum KMVP část 24 Třídění prvního stupně [Zdroj: Deset let transformace, 1999] frekvence jedné proměnné

5 Praktikum KMVP část 25 Třídění druhého stupně absolutní četnosti [Zdroj: Deset let transformace, 1999] frekvence jedné vs. druhé proměnné (kategorie příjmu podle vzdělání)

6 Praktikum KMVP část 26 Třídění druhého stupně relativní četnosti [Zdroj: Deset let transformace, 1999]

7 Tabulky - metoda popisu dat

8 Praktikum KMVP část 28 Tabulky jako metoda popisu Co nám řekne tabulka? Vzorce variace jedné proměnné v čase Vzorce variace dvou (a více) proměnných ve vzájemném vztahu Porovnání mezi skupinami Vzájemný vztah mezi proměnnými

9 Praktikum KMVP část 29 Dvourozměrná tabulka příklad Existují dvě nemocnice, které provádí stejný typ operace. Každá při tom používá jiný typ anestetika (A / B). Které anestetikum byste raději dostali? Zdroj: [Campanelli 2007]

10 Praktikum KMVP část 210 Kterou nemocnici byste si vybrali? Zdroj: [Campanelli 2007]

11 Jednorozměrná analýza Distribuce případů pro jednu proměnnou (otázku v dotazníku) pro celkovou populaci

12 Praktikum KMVP část 212 Jednorozměrná analýza – tabulka procentní základ a chybějící hodnoty [Babbie 1997: 377]

13 Dvourozměrná analýza Vztah dvou proměnných: porovnání podskupin (vliv nezávislé na závislou proměnnou)

14 Nejprve příklad: Procenta v tabulce. Porovnání subpopulací [Babbie 1997: 386] nezávislá proměnná (pohlaví) závislá proměnná (genderová rovnost)

15 Praktikum KMVP část 215 [Babbie 1995: ]

16 Praktikum KMVP část 216 [Babbie 1997: 387]

17 Praktikum KMVP část 217 Marginální četnosti Relativní sloupcové četnosti = součet v každém sloupci reprezentuje 100% Relativní řádkové četnosti = součet v každém řádku reprezentuje 100%

18 Praktikum KMVP část 218 NEZÁVISLÁ - vysvětlující ZÁVISLÁ - vysvětlovaná Pohlaví SpokojenostMužMužŽenaCelkový součet 1 (nespokojen)41 % (5)22 % (2)7 241 % (5)11 % (1)6 3 (spokojen)16 % (2)66 % (6)8 Celkový součet100 % (12)100 % (9)21 Uspořádání tabulky sloupcová procenta: V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá (vysvětlující) ve sloupcích.

19 Praktikum KMVP část 219 pohlaví spokojenostmužženaCelkový součet 1 (nespokojen)5 (71 %)2 (29 %)7 (100 %) 25 (83 %)1 (27 %)6 (100 %) 3 (spokojen)2 (25 %)6 (75 %)8 (100 %) Celkový součet12921 (100 %) Nelogické uspořádání tabulky Názory nemohou ovlivňovat pohlaví !

20 Praktikum KMVP část 220 Interpretace tabulek závislá proměnná = je v hypotéze ovlivňována, způsobována (nejčastěji je v řádcích) nezávislá(é) proměnná = vysvětluje, ovlivňuje závislou V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. Pozor! Směr kauzality je vždy věcí teorie, nelze ji určit z dat samotných. [Kreidl 2000]

21 Praktikum KMVP část 221 Interpretace tabulek ŠPATNĚ: z žen pouze 41 % chodí do kostela a 59 uvádí, že chodí častěji. Proto být ženou snižuje pravděpodobnost, že člověk bude chodit do kostela častěji. SPRÁVNĚ: závěr, že pohlaví je proměnná, která ovlivňuje chození do kostela se musí učinit na základě porovnání mezi muži a ženami. Porovnáváme 41 % a 28 %, z čehož činíme závěr: Vyšší pravděpodobnost časté návštěvy kostela (každý týden) lze vysledovat u žen než u mužů. Uspořádání „procenta dolů“ 100% je ve sloupci a porovnáváme % (čteme) v řádcích mezi kategoriemi podskupin [Babbie 1997]

22 Praktikum KMVP část 222 Dvourozměrná (bivariátní) analýza: čtení tabulky a slučování kategorií 100 % [Babbie 1997:383-84] Sloučení kategorií 100 %

23 Praktikum KMVP část 223 Interpretace tabulek Tabulky skoro vždy dělejte tak, aby vyjadřovaly podmíněnou pravděpodobnost, že respondent (věc) bude patřit do jednotlivých kategorií závislé proměnné, za předpokladu, že patří do dané kategorie nezávislé proměnné(ných). Procento je stým násobkem pravděpodobnosti. [Kreidl 2000]

24 Praktikum KMVP část 224 Porovnání podskupin 1.rozdělte případy do adekvátních podskupin (dle hypotéz, např. podle vzdělání) 2.popište proměnnou pro podskupiny pomocí zvolených statistik (např. medián, průměr, procenta) 3.srovnejte tyto údaje pro skupiny

25 Praktikum KMVP část 225 Explanační interpretace dvojrozměrné tabulky 1.Případy rozdělíme do podskupin podle vlastností nezávislé proměnné (muži/ženy) 2.Každá podskupina je popsána podle vlastností závislé proměnné (spokojenost) 3.Tabulku čteme tak, že porovnáme navzájem podskupiny nezávislé proměnné (muži/ženy) podle vlastností závislé proměnné (spokojenost) [Babbie 1997]

26 Praktikum KMVP část 226 Souvislost znaků v tabulce Kupení vysokých hodnot na diagonále tabulky naznačuje, že existuje souvislost mezi proměnnými. Souvislost ale může mít i jinou formu, např. v každém sloupci jsou pozorování nahromaděna do jediného pole, jehož pozice je pro každý sloupec jiná. [Kreidl 2000]

27 Praktikum KMVP část 227 Interpretace tabulek Při interpretaci procent obvykle stačí porovnávat extrémní hodnoty a ignorovat střední kategorie. Pokud jde o ordinální proměnné pak není dobré činit obsáhlé závěry na základě % uvnitř jednotlivých kategorií nezávislé proměnné. Smysluplné je dělat porovnání distribucí napříč kategoriemi nezávislé proměnné. Buďte opatrní a neberte názvy kategorií zas tak doslova. [Kreidl 2000]

28 Vícerozměrná analýza: třídění třetího stupně Analyzujeme souběžně vztahy mezi několika proměnnými (nejčastěji více nezávislých – vysvětlujících znaků). Princip je stejný jako u dvourozměrné analýzy.

29 Praktikum KMVP část 229 Vícerozměrná analýza: třídění třetího stupně Jak mezi muži tak ženami starší lidé chodí do kostela častěji než mladí. V každé věkové kategorii ženy navštěvují kostel častěji než muži. Podle tabulky, pohlaví má nepatrně větší efekt na chození do kostela než věk. Věk a pohlaví mají nezávislý vliv na chození do kostela. Uvnitř každé kategorie nezávislé proměnné odlišné vlastnosti té druhé přesto ovlivňují jednání. Podobně obě nezávislé proměnné mají kumulativní efekt na jednání. Starší ženy chodí nejčastěji a mladí muži nejméně často. [Babbie 1997: 391] 100 %

30 Praktikum KMVP část 230 Zjednodušení předchozí tabulky: 100 % → 70 % méně často Ukazujeme pouze pozitivní kategorie znaku („do kostela chodí týdně). Při tom neztrácíme žádný údaj. Četnosti v závorkách uvádí procentní základ, z něj lze dopočítat podíl nezobrazené kategorie. [Babbie 1997: 391]

31 Praktikum KMVP část 231 Pravidla pro tvorbu tabulek Samotná procenta říkají málo nebo nic. → nezamlčovat absolutní četnosti (stačí marginální = řádkové, sloupcové a celkový počet případů). V první řádce či sloupci uvést znak pro %, aby bylo jasné, že se jedná tabulku pro procenta.

32 Praktikum KMVP část 232 Pravidla pro tvorbu tabulek Kontrolovat sama sebe tím, že vždy sečtete čísla v jednotlivých řádcích a sloupcích a porovnáte je se skutečnými marginálními četnostmi (z tabulek tř. 1st.). Celá čísla v % v tabulkách většinou bohatě stačí. 23,48 % → 23 % [Kreidl 2000]

33 Praktikum KMVP část 233 Pravidla pro tvorbu tabulek [Kreidl 2000, Babbie 1997] Tabulka musí mít název a popsané proměnné (řádky a sloupce). Uvést původní obsah proměnné, zejména pokud se jedná o postojové otázky (znění otázky) Vždy uvést zdroj dat. Uvést celkový počet případů (marginální distribuce absolutních četností). Uvést, jak byly spočítány procenta (procentní základ), u % tabulky uvést N Neuvádíme % i absolutní počty současně všude Zmínit pokud byly vynechány některé kategorie (např. nevím). chybějící hodnoty vždy uvést kolik lidí neodpovědělo, ale není nutno vždy zahrnovat do procentního základu

34 Praktikum KMVP část 234 V názvu tabulky uvést: typ tabulky např. Procentní distribuce... nebo... (%) proměnné zahrnuté v tabulce, např. Religiozita a Úroveň vzdělání z jakého vzorku pocházejí data rok sběru dat Př. Procento uživatelů marihuany podle dosaženého vzdělání, středoškoláci, 1997.

35 Praktikum KMVP část 235 Třídění druhého stupně: průměry a směrodatné odchylky v podskupinách

36 Baterie otázek (item response battery)

37 Praktikum KMVP část 237 Baterie otázek Stejná obecná otázka např. Jak jste spokojen s následujícími službami? Stejné hodnoty znaků (stejné odpovědi) Analytický přístup k baterii otázek: Lze porovnávat hodnoty (škál) mezi sebou (medián, průměr, rozptyl → pořadí) Lze vytvořit nový souhrnný index (např. součtový) → vyšší reliabilita i validita měření Lze redukovat komplexitu baterie → hledáme dimenze, vzájemné relace (ne/podobnost položek, typologie)

38 Praktikum KMVP část 238 Příklad položkové baterie: diverzita v přátelské síti (CVVM 07-04) Stejná o tázka Stejné odpovědi (škála) Vznikne 12 proměnných

39 Praktikum KMVP část 239 Baterie otázek: diverzita v přátelské síti. Frekvence (%) Chybějící hodnoty (> 5%)

40 Praktikum KMVP část 240 Baterie otázek: diverzita v přátelské síti Popisné statistiky: počet platných odpovědí, minimum/maximum, průměr, směrodatná odchylka Počet platných odpovědí za všechny položky baterie (ti, kdo odpověděli na všechny otázky) Pořadí položek dle průměru na škále 1-5

41 Praktikum KMVP část 241 Dimenzionalita v baterii otázek: faktorová analýza (rotované řešení, graf faktorových zátěží) Zdroj: Naše společnost

42 Praktikum KMVP část 242 Problém nízké variability odpovědí v baterii: Spokojenost klientů DSP Baterie otázek (9 proměnných) Žádná varianace v položce Žádná varianace mezi položkami (vzorce odpovědí respondentů) Hodnoty znaků: 1=ne, 2=ano Chybějící hodnoty (neodpověděli na všechny položky baterie)

43 ↓ již ve fázi sběru dat: → Zvýšit počet platných odpovědí → Zvýšit varianci v odpovědích (formulace otázek + pilotáž) Nízká (nulová) variabilita uvnitř/mezi položkami

44 Praktikum KMVP část 244 Snížení počtu položek bez odpovědí (Item non-response) Školení tazatelů: Získat jejich spolupráci Vyzkoušet s nimi kladení otázek Poučit je, jaké strategie pro odlišné typy respondentů Tazatel musí být profesionál: odpovědi neodhaduje nebo si je sám nevymýšlí Pro získání vynechaných odpovědí se lze k vybraným otázkám vrátit na konci rozhovoru Hlídejte kritéria výběru Tazatele dobře odměňte

45 Praktikum KMVP část 245 Snížení případů bez odpovědí Zajímavé téma Odpovídající metoda Upomínkování (telefonáty, dopisy) Přesvědčivý úvodní dopis/ oslovení Zpětné volání a přesvědčování o zúčastnění se

46 Praktikum KMVP část 246 Které otázky (ne)dát do dotazníku? Po té, co si uděláte seznam indikátorů (proměnných) a začnete formulovat dotazníkové otázky, zjistíte, že jste omezeni prostorem dotazníku (časem dotazovaní): Neptejte se respondentů nadbytečné otázky: - které neodpovídají na výzkumnou otázku (RQ) - u nichž předem znáte odpověď - o tom, co si myslí jiní lidé Mohou nám respondenti poskytnout informaci, kterou potřebujeme? - Budou všichni rozumět významu otázky? - Není dotaz příliš složitý k rychlému zodpovězení? (např. přesný celkový příjem)

47 Praktikum KMVP část 247 Formulace otázek v dotazníku Buďte konkrétní. např. Jak jste spokojen/a s péčí, která vám byla poskytnuta? → nespecifikováno Vs. Jak jste spokojen/a s informací, kterou vám o vaší nemoci poskytla vaše ošetřující sestra? → specifikováno Vždy jde o Trade off: formulace jednoduchých a srozumitelných otázek vs. získání dat k zodpovězení RQ

48 Praktikum KMVP část 248 Literatura Babbie, E. (1995). The Practice of social Research. 7th Edition. Belmont: Wadsworth Disman, M. (1993): Jak se vyrábí sociologická znalost. Praha: Karolinum Hanousek J., Charamza P. (1992). Moderní metody zpracování dat – Matematická statistika pro každého. Praha: Grada. Kreidl, M. (2000). Podklady ke kurzu Analýza kvantitativních dat. FSV UK, LS Jeřábek, H. (1993): Úvod do sociologického výzkumu. Praha: Karolinum Poděkování za cenné konzultace RNDr. L. Gatnarovi.


Stáhnout ppt "Kurz SPSS: Jednoduchá analýza dat Kontingenční tabulky a analýza kategoriálních dat = KMVP část 4. Elementární analýza dat Jiří Šafr"

Podobné prezentace


Reklamy Google