Kvantitativní metody výzkumu v praxi PRAKTIKUM

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Cíle a postupy empirického výzkumu
Analýza kvantitativních dat I./II. Typy dat Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 26/2/2012 UK FHS Historická sociologie, Řízení a supervize.
Kvantitativní metody výzkumu v praxi
Testování statistických hypotéz
Charakteristiky variability
Statistika Vypracoval: Mgr. Lukáš Bičík
Tloušťková struktura porostu
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Teorie psychodiagnostiky a psychometrie
Varianty výzkumu Kroky výzkumu Výběrový soubor
Obsah statistiky Jana Zvárová
Analýza dat.
Kvantitativní metody výzkumu v praxi (KMVP) 0. Poučení z minulých ročníků a novinky od ZS 2013 (2011) poslední aktualizace Jiří Šafr jiri.safr(at)seznam.cz.
Řízení a supervize v sociálních a zdravotnických organizacích
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Kvantitativní metody výzkumu v praxi 4a. část Jiří Šafr UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (ZS 2005)
Charakteristiky variability
Lineární regrese.
Lineární regresní analýza
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
Kurz SPSS: Jednoduchá analýza dat
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
DKV část 31 Design kvantitativního výzkumu 4. část ( ) Jiří Šafr UK FHS Historická sociologie (LS 2010)
PSY717 Statistická analýza dat 2010 První konzultace.
Základy zpracování geologických dat
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Design kvantitativního výzkumu
Praktikum 4c: Tabulky, baterie otázek 16/5/08. Tabulky - metoda popisu dat.
Biostatistika 8. přednáška
Kvantitativní metody výzkumu v praxi
Biostatistika 1. přednáška Aneta Hybšová
Metody sociálního výzkumu Kombinované studium ZS 2009.
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Základy pedagogické metodologie; seminář Mgr. Zdeněk Hromádka
Postup při empirickém kvantitativním výzkumu
Inferenční statistika - úvod
Základy popisné statistiky
Typy výzkumu  Kvantitativní  Kvalitativní  Smíšený  První zkoumá kolik lidí si co myslí atd …  Druhý co přesně si lidé myslí  Třetí je kombinací.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Statistika 2.cvičení
Popisná statistika: přehled
Popisná analýza v programu Statistica
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Kvantitativní metody výzkumu v praxi PRAKTIKUM
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
Kapitola 3: Centrální tendence a variabilita
Metodologie pro ISK 2 Úvod do práce s daty
Základní zpracování dat Příklad
Kvantitativní metody výzkumu v praxi
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Induktivní statistika
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Střední škola obchodně technická s. r. o.
Základy popisné statistiky
Transkript prezentace:

Kvantitativní metody výzkumu v praxi PRAKTIKUM UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (LS 2008) Kvantitativní metody výzkumu v praxi PRAKTIKUM část 4. Elementární analýza dat Jiří Šafr jiri.safr@seznam.cz vytvořeno 2. 5. 2008

Obsah části 2 Tabulky Vlastnosti rozdělení znaků Jednorozměrná analýza Dvou a vícerozměrná analýza Uspořádání tabulky a její interpretace Pravidla tvorby tabulek Vlastnosti rozdělení znaků Jednoduché popisné statistiky Střední hodnoty: modus, medián, průměr Směrodatná odchylka Několik rad jak číst statistiky Typy grafů Praktikum KMVP část 2

Proces analýzy dat musíme promyslet již ve stadiu plánování dotazníku (modelu vztahů a hypotéz).

Tabulky

Třídění prvního stupně frekvence jedné proměnné Praktikum KMVP část 2 [Zdroj: Deset let transformace, 1999]

Třídění druhého stupně absolutní četnosti frekvence jedné vs. druhé proměnné (kategorie příjmu podle vzdělání) [Zdroj: Deset let transformace, 1999] Praktikum KMVP část 2

Třídění druhého stupně relativní četnosti [Zdroj: Deset let transformace, 1999] Praktikum KMVP část 2

Tabulky - metoda popisu dat

Tabulky jako metoda popisu Co nám řekne tabulka? Vzorce variace jedné proměnné v čase Vzorce variace dvou (a více) proměnných ve vzájemném vztahu Porovnání mezi skupinami Vzájemný vztah mezi proměnnými Praktikum KMVP část 2

Dvourozměrná tabulka příklad Existují dvě nemocnice, které provádí stejný typ operace. Každá při tom používá jiný typ anestetika (A / B). Které anestetikum byste raději dostali? Zdroj: [Campanelli 2007] Praktikum KMVP část 2

Kterou nemocnici byste si vybrali? Zdroj: [Campanelli 2007] Praktikum KMVP část 2

Jednorozměrná analýza Distribuce případů pro jednu proměnnou (otázku v dotazníku) pro celkovou populaci

Jednorozměrná analýza – tabulka procentní základ a chybějící hodnoty Praktikum KMVP část 2 [Babbie 1997: 377]

Dvourozměrná analýza Vztah dvou proměnných: porovnání podskupin (vliv nezávislé na závislou proměnnou)

nezávislá proměnná (pohlaví) Nejprve příklad: Procenta v tabulce. Porovnání subpopulací závislá proměnná (genderová rovnost) nezávislá proměnná (pohlaví) [Babbie 1997: 386]

[Babbie 1995: 386-387] Praktikum KMVP část 2

Praktikum KMVP část 2 [Babbie 1997: 387]

Marginální četnosti Relativní sloupcové četnosti = součet v každém sloupci reprezentuje 100% Relativní řádkové četnosti = součet v každém řádku reprezentuje 100% Praktikum KMVP část 2

NEZÁVISLÁ - vysvětlující Uspořádání tabulky sloupcová procenta: V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. NEZÁVISLÁ - vysvětlující ZÁVISLÁ - vysvětlovaná Pohlaví Spokojenost Muž Žena Celkový součet 1 (nespokojen) 41 % (5) 22 % (2) 7 2 11 % (1) 6 3 (spokojen) 16 % (2) 66 % (6) 8 100 % (12) 100 % (9) 21 Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá (vysvětlující) ve sloupcích. Praktikum KMVP část 2

Nelogické uspořádání tabulky pohlaví spokojenost muž žena Celkový součet 1 (nespokojen) 5 (71 %) 2 (29 %) 7 (100 %) 2 5 (83 %) 1 (27 %) 6 (100 %) 3 (spokojen) 2 (25 %) 6 (75 %) 8 (100 %) 12 9 21 (100 %) Názory nemohou ovlivňovat pohlaví ! Praktikum KMVP část 2

Interpretace tabulek závislá proměnná = je v hypotéze ovlivňována, způsobována (nejčastěji je v řádcích) nezávislá(é) proměnná = vysvětluje, ovlivňuje závislou V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. Pozor! Směr kauzality je vždy věcí teorie, nelze ji určit z dat samotných. [Kreidl 2000] Praktikum KMVP část 2

Interpretace tabulek Uspořádání „procenta dolů“ 100% je ve sloupci a porovnáváme % (čteme) v řádcích mezi kategoriemi podskupin ŠPATNĚ: z žen pouze 41 % chodí do kostela a 59 uvádí, že chodí častěji. Proto být ženou snižuje pravděpodobnost, že člověk bude chodit do kostela častěji. SPRÁVNĚ: závěr, že pohlaví je proměnná, která ovlivňuje chození do kostela se musí učinit na základě porovnání mezi muži a ženami. Porovnáváme 41 % a 28 %, z čehož činíme závěr: Vyšší pravděpodobnost časté návštěvy kostela (každý týden) lze vysledovat u žen než u mužů. Praktikum KMVP část 2 [Babbie 1997]

Dvourozměrná (bivariátní) analýza: čtení tabulky a slučování kategorií 100 % Sloučení kategorií 100 % Praktikum KMVP část 2 [Babbie 1997:383-84]

Interpretace tabulek Tabulky skoro vždy dělejte tak, aby vyjadřovaly podmíněnou pravděpodobnost, že respondent (věc) bude patřit do jednotlivých kategorií závislé proměnné, za předpokladu, že patří do dané kategorie nezávislé proměnné(ných). Procento je stým násobkem pravděpodobnosti. [Kreidl 2000] Praktikum KMVP část 2

Porovnání podskupin rozdělte případy do adekvátních podskupin (dle hypotéz, např. podle vzdělání) popište proměnnou pro podskupiny pomocí zvolených statistik (např. medián, průměr, procenta) srovnejte tyto údaje pro skupiny Praktikum KMVP část 2

Explanační interpretace dvojrozměrné tabulky Případy rozdělíme do podskupin podle vlastností nezávislé proměnné (muži/ženy) Každá podskupina je popsána podle vlastností závislé proměnné (spokojenost) Tabulku čteme tak, že porovnáme navzájem podskupiny nezávislé proměnné (muži/ženy) podle vlastností závislé proměnné (spokojenost) Praktikum KMVP část 2 [Babbie 1997]

Souvislost znaků v tabulce Kupení vysokých hodnot na diagonále tabulky naznačuje, že existuje souvislost mezi proměnnými. Souvislost ale může mít i jinou formu, např. v každém sloupci jsou pozorování nahromaděna do jediného pole, jehož pozice je pro každý sloupec jiná. Praktikum KMVP část 2 [Kreidl 2000]

Interpretace tabulek Při interpretaci procent obvykle stačí porovnávat extrémní hodnoty a ignorovat střední kategorie. Pokud jde o ordinální proměnné pak není dobré činit obsáhlé závěry na základě % uvnitř jednotlivých kategorií nezávislé proměnné. Smysluplné je dělat porovnání distribucí napříč kategoriemi nezávislé proměnné. Buďte opatrní a neberte názvy kategorií zas tak doslova. [Kreidl 2000] Praktikum KMVP část 2

Vícerozměrná analýza: třídění třetího stupně Analyzujeme souběžně vztahy mezi několika proměnnými (nejčastěji více nezávislých – vysvětlujících znaků). Princip je stejný jako u dvourozměrné analýzy.

Vícerozměrná analýza: třídění třetího stupně 100 % Jak mezi muži tak ženami starší lidé chodí do kostela častěji než mladí. V každé věkové kategorii ženy navštěvují kostel častěji než muži. Podle tabulky, pohlaví má nepatrně větší efekt na chození do kostela než věk. Věk a pohlaví mají nezávislý vliv na chození do kostela. Uvnitř každé kategorie nezávislé proměnné odlišné vlastnosti té druhé přesto ovlivňují jednání. Podobně obě nezávislé proměnné mají kumulativní efekt na jednání. Starší ženy chodí nejčastěji a mladí muži nejméně často. Praktikum KMVP část 2 [Babbie 1997: 391]

Zjednodušení předchozí tabulky: 100 % → 70 % méně často Ukazujeme pouze pozitivní kategorie znaku („do kostela chodí týdně). Při tom neztrácíme žádný údaj. Četnosti v závorkách uvádí procentní základ, z něj lze dopočítat podíl nezobrazené kategorie. Praktikum KMVP část 2 [Babbie 1997: 391]

Pravidla pro tvorbu tabulek Samotná procenta říkají málo nebo nic. → nezamlčovat absolutní četnosti (stačí marginální = řádkové, sloupcové a celkový počet případů). V první řádce či sloupci uvést znak pro %, aby bylo jasné, že se jedná tabulku pro procenta. Praktikum KMVP část 2

Pravidla pro tvorbu tabulek Kontrolovat sama sebe tím, že vždy sečtete čísla v jednotlivých řádcích a sloupcích a porovnáte je se skutečnými marginálními četnostmi (z tabulek tř. 1st.). Celá čísla v % v tabulkách většinou bohatě stačí. 23,48 % → 23 % [Kreidl 2000] Praktikum KMVP část 2

Pravidla pro tvorbu tabulek [Kreidl 2000, Babbie 1997] Tabulka musí mít název a popsané proměnné (řádky a sloupce). Uvést původní obsah proměnné, zejména pokud se jedná o postojové otázky (znění otázky) Vždy uvést zdroj dat. Uvést celkový počet případů (marginální distribuce absolutních četností). Uvést, jak byly spočítány procenta (procentní základ), u % tabulky uvést N Neuvádíme % i absolutní počty současně všude Zmínit pokud byly vynechány některé kategorie (např. nevím). chybějící hodnoty vždy uvést kolik lidí neodpovědělo, ale není nutno vždy zahrnovat do procentního základu Praktikum KMVP část 2

V názvu tabulky uvést: typ tabulky např. Procentní distribuce ... nebo ... (%) proměnné zahrnuté v tabulce, např. Religiozita a Úroveň vzdělání z jakého vzorku pocházejí data rok sběru dat Př. Procento uživatelů marihuany podle dosaženého vzdělání, středoškoláci, 1997. Praktikum KMVP část 2

Třídění druhého stupně: průměry a směrodatné odchylky v podskupinách Praktikum KMVP část 2

Baterie otázek (item response battery)

Baterie otázek Stejná obecná otázka např. Jak jste spokojen s následujícími službami? Stejné hodnoty znaků (stejné odpovědi) Analytický přístup k baterii otázek: Lze porovnávat hodnoty (škál) mezi sebou (medián, průměr, rozptyl → pořadí) Lze vytvořit nový souhrnný index (např. součtový) → vyšší reliabilita i validita měření Lze redukovat komplexitu baterie → hledáme dimenze, vzájemné relace (ne/podobnost položek, typologie) Praktikum KMVP část 2

Příklad položkové baterie: diverzita v přátelské síti (CVVM 07-04) Stejná otázka Stejné odpovědi (škála) Vznikne 12 proměnných Praktikum KMVP část 2

Baterie otázek: diverzita v přátelské síti. Frekvence (%) Chybějící hodnoty (> 5%) Praktikum KMVP část 2

Pořadí položek dle průměru na škále 1-5 Baterie otázek: diverzita v přátelské síti Popisné statistiky: počet platných odpovědí, minimum/maximum, průměr, směrodatná odchylka Pořadí položek dle průměru na škále 1-5 Počet platných odpovědí za všechny položky baterie (ti, kdo odpověděli na všechny otázky) Praktikum KMVP část 2

Zdroj: Naše společnost 2007-04 Dimenzionalita v baterii otázek: faktorová analýza (rotované řešení, graf faktorových zátěží) Praktikum KMVP část 2 Zdroj: Naše společnost 2007-04

Problém nízké variability odpovědí v baterii: Spokojenost klientů DSP Baterie otázek (9 proměnných) Žádná varianace mezi položkami (vzorce odpovědí respondentů) Žádná varianace v položce Chybějící hodnoty (neodpověděli na všechny položky baterie) Hodnoty znaků: 1=ne, 2=ano Praktikum KMVP část 2

Nízká (nulová) variabilita uvnitř/mezi položkami ↓ již ve fázi sběru dat: → Zvýšit počet platných odpovědí → Zvýšit varianci v odpovědích (formulace otázek + pilotáž)

Snížení počtu položek bez odpovědí (Item non-response) Školení tazatelů: Získat jejich spolupráci Vyzkoušet s nimi kladení otázek Poučit je, jaké strategie pro odlišné typy respondentů Tazatel musí být profesionál: odpovědi neodhaduje nebo si je sám nevymýšlí Pro získání vynechaných odpovědí se lze k vybraným otázkám vrátit na konci rozhovoru Hlídejte kritéria výběru Tazatele dobře odměňte Praktikum KMVP část 2

Snížení případů bez odpovědí Zajímavé téma Odpovídající metoda Upomínkování (telefonáty, dopisy) Přesvědčivý úvodní dopis/ oslovení Zpětné volání a přesvědčování o zúčastnění se Praktikum KMVP část 2

Které otázky (ne)dát do dotazníku? Po té, co si uděláte seznam indikátorů (proměnných) a začnete formulovat dotazníkové otázky, zjistíte, že jste omezeni prostorem dotazníku (časem dotazovaní): Neptejte se respondentů nadbytečné otázky: - které neodpovídají na výzkumnou otázku (RQ) - u nichž předem znáte odpověď - o tom, co si myslí jiní lidé Mohou nám respondenti poskytnout informaci, kterou potřebujeme? - Budou všichni rozumět významu otázky? - Není dotaz příliš složitý k rychlému zodpovězení? (např. přesný celkový příjem) Praktikum KMVP část 2

Formulace otázek v dotazníku Buďte konkrétní. např. Jak jste spokojen/a s péčí, která vám byla poskytnuta? → nespecifikováno Vs. Jak jste spokojen/a s informací, kterou vám o vaší nemoci poskytla vaše ošetřující sestra? → specifikováno Vždy jde o Trade off: formulace jednoduchých a srozumitelných otázek vs. získání dat k zodpovězení RQ Praktikum KMVP část 2

Vlastnosti rozdělení znaků

Symetrie, variabilita Praktikum KMVP část 2 [Hanousek, Charamza 1992: 21]

Šikmost a špičatost Praktikum KMVP část 2 [Hanousek, Charamza 1992: 21]

Jednoduché popisné statistiky

Střední hodnoty: nominální znaky → modus ordinální znaky → medián (aritmetický průměr) intervalové znaky → aritmetický průměr Praktikum KMVP část 2

Modus = kategorie s největší četností Medián = hodnota, která je ve prostředku všech pozorování seřazených podle hodnoty Aritmetický průměr = součet hodnot dělený počtem pozorování Praktikum KMVP část 2

Modus Praktikum KMVP část 2 [Babbie 1995]

Medián Praktikum KMVP část 2 [Babbie 1995]

Průměr Praktikum KMVP část 2 [Babbie 1995]

Charakteristiky variability Udávají koncentraci nebo rozptýlení kolem střední hodnoty. Ukazují na „kvalitu“ průměru. Rozptyl = součet kvadratických odchylek od průměru dělený rozsahem výběr zmenšeným o 1. Směrodatná odchylka = odmocnina z rozptylu. Směrodatná odchylka je míra rozptýlení hodnot od průměrné (střední) hodnoty. Praktikum KMVP část 2

Výpočet směrodatné odchylky Příklad. Máme pozorování: 7 2 5 4 3 1 8 2 6 2 Součet řady = 40; n = 10; průměr = 40/10 = 4 Odchylky: 3 -2 1 0 -1 -3 4 -2 2 -2 součet odchylek je 9 – 9 = 0 čtverce odchylek: 9; 4; 1; 0; 1; 9; 16; 4; 4; 4 součet čtverců odchylek = 52 průměrná čtvercová odchylka tj. rozptyl = 52/10= 5,2 směrodatná odchylka (odmocnina z rozptylu) = 2,28 Praktikum KMVP část 2

Směrodatná odchylka v Excelu STDEVPA pro základní soubor STDEVA pro výběrový soubor Praktikum KMVP část 2

Další popisné statistiky Minimum / maximum Rozpětí Kvantily: dolní a horní kvartil Koeficienty šikmosti Praktikum KMVP část 2

Několik rad jak číst statistiky [Hanousek, Charamza 1993: 34-35]

Při čtení statistik pozor na: „přesná“ čísla ve statistických zprávách procenta versus absolutní čísla srovnatelné údaje nezaměňovat ukazatele je porovnání vhodné? na výběry (nebyly-li provedeny profesionály) podoba otázek vlastní příprava zjišťování (experimentu) „v nemocnici umírají lidé častěji než doma“ [Hanousek, Charamza 1993: 34-35] celé viz soubor Pozor_statistika.pdf Praktikum KMVP část 2

Typy grafů Excel viz část b. - grafy

Histogram Praktikum KMVP část 2

Histogram Praktikum KMVP část 2

Polygon Praktikum KMVP část 2

Literatura Babbie, E. (1995). The Practice of social Research. 7th Edition. Belmont: Wadsworth Disman, M. (1993): Jak se vyrábí sociologická znalost. Praha: Karolinum Hanousek J., Charamza P. (1992). Moderní metody zpracování dat – Matematická statistika pro každého. Praha: Grada. Kreidl, M. (2000). Podklady ke kurzu Analýza kvantitativních dat. FSV UK, LS 2000-2001. Jeřábek, H. (1993): Úvod do sociologického výzkumu. Praha: Karolinum Poděkování za cenné konzultace RNDr. L. Gatnarovi. Praktikum KMVP část 2