Řízení a supervize v sociálních a zdravotnických organizacích UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (ZS 2015+) Kvantitativní metody výzkumu v praxi Příklad postupu ověření platnosti hypotézy Základní postupy explorační analýzy pomocí třídění dat 2. stupně Zájem o službu osobní asistence podle samostatnosti klientů chráněného bydlení Hyp.: „Čím více jsou klienti chráněného bydlení samostatní, tím větší bude jejich zájem o službu osobní asistence“. Poslední aktualizace 12/11/2016 (15/11/2015, 20/1/2014)
Výzkumné otázky a hypotézy Slouží jako „navigace cesty“ výzkumu. Klademe si, a pak zkoumáme, jen smysluplné otázky, tj. zpravidla ot. nesamozřejmé, kde předem neznáme odpovědi; co nám mohou nějaký jev vysvětlit (→ odtud nesmyslnost většiny hypotéz 1.řádu) Podle nich určíme design výzkumu Ve výzkumných otázkách a hypotézách pracujeme se „základními kameny“ = proměnnými/znaky - měřitelnými veličinami Ty jsou ale jen pouhými „zástupci“ reálných jevů/stavů (validita?) Nemáme-li jasně postavené hypotézy (dle teorie) postupujeme tak, že klademe dílčí otázky a na základě dat na ně odpovídáme. Postupujeme tak dlouho, dokud nevytvoříme konzistentní a pro cíle výzkumu zajímavý a důležitý závěr (anebo dokud nevyčerpáme informační hodnotu dat).
Úrovně, jednotky měření a analýzy Měřit hodnoty proměnných můžeme u: Individuí (nejčastěji lidé, např. zaměstnanci, klienti) Organizací / seskupení (např. oddělení v nemocnici, pobočky organizace, obce) Někdy individuální data agregujeme a dále analyzujeme za organizační jednotky, např. průměrná spokojenost s vedoucím za jednotlivé pobočky (pak porovnáváme pobočky nikoliv variabilitu uvnitř nich). Někdy měříme přímo na úrovni organizací (např. dotazník pro manažery vypovídající „ne za sebe“ ale „za organizaci“ nebo statistická/výkaznická data, např. počty klientů atp.)
Úrovně, jednotky měření a analýzy Rozlišujeme úroveň na jaké měříme a na jaké pak data analyzujeme. Nejčastěji měříme na individuální (1) úrovni, kterou ale lze doplnit o data za vyšší (2) úroveň. Někdy také měříme data na individuální úrovni, ale analyzujeme jen na úrovni agregované, což ale může vést k problému opomenutí vnitřní variance, proto ideální je Víceúrovňový design měření i analýzy na příkladu pracovníků nebo klientů v odlišných organizacích: jedinci (např. zaměstnanci nebo klienti) organizace: kontextová data měřená přímo za organizace (např. počet a typ klientů, rozpočty organizačních jednotek atp.) agregovaná data z dat měřených individuálně uvnitř organizací (např. průměrný věk, průměrná loajalita k firmě, průměrná soběstačnost klientů)
Co vše potřebujeme znát/umět Co vše potřebujeme znát/umět ? (chceme-li zodpovědět výzkumné otázky resp. ověřovat platnost hypotéz) Myslet „ve znacích“ a ve vztazích mezi nimi (asociace/rozdíly, např. procentní rozdíl, korelace) Rozlišovat různé typy znaků – úrovně měření znaku (kategoriální: nominální, ordinální; kardinální-číselné) Úrovně-jednotky měření (→ sběru dat) a následně analýzy (individuální, organizační, agregované) Uvědomovat si (zohlednit v přípravě) a kontrolovat v datech(!) kvalitu měření znaků: validita, reliabilita nástroje a dbát na reprezentativitu výběru → Smyslem výzkumu je zobecnění naměřeného výsledku na cílovou populaci
Hypotézy Hypotézy a výzkumné otázky můžeme rozlišit podle toho, jaký je cíl výzkumu: Deskriptivní → ověřujeme souslednost nebo rozdíly (Taková je většina hypotéz se kterými se setkáte v průřezových cross-sectional datech) Přesto i zde se neomezujeme jen na vztah dvou znaků, ale pomocí elaborace (zapojení dalšího/ch znaku/ů) se snažíme podmínky sledovaného vztahu proměnných specifikovat – upřesnit (mj. se tak vyhnout falešné či potlačené korelaci). Explanatorní → snažíme se o prokázání kauzálního mechanismu, což je velmi komplikované a náročné, mj. na design výzkumu, data i metody analýzy.
Důležité upozornění (1) V následujícím příkladu nejde o „skutečné“ striktní testování hypotéz, tj. tak jak ho známe ze statistiky a především v reálné stiuaci bychom měli „komplexnější“ data (tj. více naměřených proměnných). To vlastně platí pro většinu kvantitativního výzkumu s průřezovým (cross-sectional) designem. Protože platí: Pokud máme pouze dvě proměnné měřené navíc ve stejném čase (cross-sectional), pak můžeme analyzovat pouze souběžný ne/výskyt jejich hodnot (asociace/korelace, rozdíly). Nic víc. → Naše výzkumná otázka/hypotéza sleduje deskriptivní cíl (možnosti explanatorního vysvětlení jsou značně omezené).
Důležité upozornění (2) Také nemáme nástroj (krom zdravého rozumu a orientačních doporučení pro tzv. effect-size míry), kterým bychom o naměřených hodnotách asociací/korelací / rozdílech mohli jednoznačně rozhodnout, zda hypotéza platí či nikoliv. → Věcná platnost našich výsledků Jaká je velikost rozdílů resp. účinku (effect size)? Je dostatečně velká, abychom mohli tvrdit, že hypotéza platí? Při výzkumu často nemáme data za celou populaci ale jen za náhodný výběr z ní (reprezentuje vlastnosti populace) a proto navíc potřebujeme testovat „statistickou“ (většinou tzv. „nulovou“) hypotézu. Ta pak navíc řeší, to zda námi naměřené korelace/rozdíly ve výběru lze zobecnit na celou populaci. Nicméně i tehdy musíme řešit otázku věcné platnosti hypotézy (velikost účinku – effect size).
Příklad: Zájem o službu osobní asistence podle samostatnosti klientů chráněného bydlení
Zájem o službu osobní asistence Příklad: Zájem o službu osobní asistence podle samostatnosti klientů chráněného bydlení Máme dva znaky: Samostatnost klienta Zájem o službu osobní asistence Ty lze měřit na různé úrovni (jako znak nominální, ordinální nebo kardinální). → odlišně formulované hypotézy Zkoumáme výpovědi klientů (individuí), tzn. Můžeme se jich zeptat pomocí standardizovaného interview (dotazníku). Míru samostatnosti možná lze operacionalizovat a zjistit i jinak (např. z osobní karty), ale pozor, potom výzkum nemůže být anonymní, což vyvolává etické otázky.
Výzkumná otázka (VO) Souvisí zájem o službu osobní asistence se samostatností klienta?→ předpokládáme obecný vztah Lepší je ale formulovat konkrétní „směrované“ (directional) otázky a hypotézy: Zvyšuje se zájem o službu osobní asistence s vyšší mírou samostatností klienta? To jak VO formulujeme souvisí mj. s úrovní měření znaků: Souvisí zájem o službu osobní asistence s mírou samostatnosti klienta? (Zájem: Ano/Ne x Úroveň samostatnosti 1-10) Souvisí míra zájmu o službu osobní asistence se samostatností klienta? (Míra zájmu 1-4 x Samostatnost: Ano/Ne) Zde předpokládáme lineární vztah mezi hodnotami znaků (vzájemně rostou nebo klesají), to ale nemusí být jediná forma vzájemného vztahu.
Hypotéza a její formulace v závislosti na úrovni měření (→ typu znaku) „Mezi klienty kteří vykazují samostatnost je vyšší podíl těch, kteří mají zájem o službu osobní asistence, než je tomu u klientů udávajících nesamostatnost.“ → oba znaky jsou kategoriální (zde dichotomické Samostatnost/Nesamostatnost a Zájem/Nezájem; mohly by ale být i ordinální dle míry samostatnosti resp. Zájmu, např. Nízká/střední/vysoká samostatnost) „Klienti chráněného bydlení se zájem o službu osobní asistence mají vyšší míru samostatnosti, než klienti kteří zájem nemají.“ → 1. znak je kategoriální (dichotomicky: Má zájem/Nemá zájem) a 2. je kardinální-číselný (míra samostatnosti měřená indexem) „Čím více jsou klienti chráněného bydlení samostatní, tím větší je jejich zájem o službu osobní asistence.“ → oba znaky jsou kardinální-číselné (ordinální škála* a index)
Hypotéza má cíl: deskripce/explorace „Čím více jsou klienti chráněného bydlení samostatní (SAMOST), tím větší je jejich zájem o službu osobní asistence (ZAJEM).“ Pozor je to deskriptivní hypotéza, neříká nic o vlivu samostatnosti na zájem o chráněné bydlení. Ve skutečnosti může být v pozadí např. nějaká společná příčina (zde třeba věk). Pro přiblížení se cíli explanace bychom měli dále provést minimálně elaboraci vztahů. Tedy analyzovat, zda vztah mezi hodnotami SAMOST a ZAJEM není podmíněn (modifikován) nějakou jinou proměnnou/nými. Tyto proměnné ovšem musíme mít v datech tzn. změřeny.
Postup při ověřování hypotézy 1. Konceptuálně vymezit indikátory proměnných: Samostatnost klienta a Zájem o službu osobní asistence 2. Tyto proměnné operacionalizovat (→ jak konkrétně je budeme měřit?) 3. Naměřit jejich hodnoty (na sobě nezávisle) a vytvořit datovou matici (případy-respondenti x proměnné). 4. Tyto hodnoty vzájemně provázat v třídění dat druhého stupně. Zde nastávají tři hlavní možnosti, v závislosti na úrovni měření (typu) znaků (viz následující tři ukázky). (5.) Ideálně pokračovat tříděním třetího/vyššího stupně, kdybychom vyloučili možný vliv dalších znaků.
Konceptualizace & Operacionalizace Konceptualizace: stanovení obecných indikátoru(ů) zkoumaného jevu vč. rozhodnutí o případných dimenzích jevu V tomto příkladu samostatnost klienta nepracujeme s nějakou teorií, přesto při konceptualizaci bychom i zde měli přemýšlet „co pro klienty znamená z hlediska kvality života samostatnost, jaké má projevy má atd.“ Podle toho jednak volíme indikátory a měli bychom uvažovat i o existenci různých dimenzí samostatnosti a jejich váze/významu pro každodenní život. Operacionalizace = jak konkrétně budu měřit. Má v praxi dvě roviny: 1. volba způsobu sběru dat (a tedy i designu výzkumu), zde v našem příkladu volíme dotazníkové šetření 2. volba a konstrukce nástroje měření, zde půjde o náš nový nástroj měření samostatnosti → princip dotazování a indikátory (vícepoložkové ukazatele hybnosti a nezávislosti) a následně formulace konkrétních otázek v dotazníku.
Operacionalizace Zájem o službu os. asistence Přímá otázka s jednou hlavní dimenzí s odpověďmi na tzv. Likertovské škále → Kategoriální znak, při měření ordinální, a ten ale můžeme rekódovat na nominální-dichotomický, např. Zájem / Nezájem (tj. dichotomizovat) Jak moc máte zájem o asistenční služby? Velmi ...................................................................................... 1 Dost ....................................................................................... 2 Jen trochu .............................................................................. 3 Vůbec ne ................................................................................ 4 (NENABÍZEJTE: Nevím) ........................................................8
Operacionalizace Samostatnost klienta Sumační index samostatnosti, měřený pomocí položkové baterie → sečteme do nové proměnné kolik věcí je schopen si sám obstarat (hodnoty 0-10) → kardinální znak (ten lze následně kategorizovat, např. Vysoká / Nízká samostatnost) Indikátory: Obstarání nákupů Jednání s úřady Doprava k lékaři Doprava do práce Práce s počítačem Chození za zábavou Úklid bytu Hygiena Příprava jídla Elementární pohyb po bytě Formulace v dotazníku: Dokážete si sám zajistit následující věci? Nakoupit si Ano / Ne Dojít na úřady Ano / Ne Dojít k lékaři Ano / Ne Dopravit se do práce Ano / Ne Pracovat s počítačem Ano / Ne Jít za zábavou Ano / Ne Uklidit si byt Ano / Ne Obstarat si hygienu Ano / Ne Připravit si jídlo Ano / Ne Pohybovat se po bytě Ano / Ne Otázky mimo rámec našeho příkladu: Je index jen jednodimenzionální? Nemůže se samostatnost projevovat v odlišných dimenzích? Mají jednotlivé položky z hlediska konceptu samostatnosti stejnou váhu?
Data – datová matice Jde o hypotetická – vymyšlená data. Původní data, jak jsme je měřili (dotazovali), tj. pouze otázky z dotazníku ID o1 o2_1 o2_2 o2_3 o2_4 o2_5 o2_6 o2_7 o2_8 o2_9 o2_10 č.dotazníku Zájem o službu OA nakoupí na úřady k lékaři doprava do práce úklid s počítačem hygiena pohyb po bytě za zábavou přip.jídlo 1 3 2 4 5 6 7 8 9 + nové „syntetické“ proměnné: Zájem (dichotomizováno z o1) a Index samostatnosti (suma o2_1 až o2_10) ID o1 o2_1 o2_2 o2_3 o2_4 o2_5 o2_6 o2_7 o2_8 o2_9 o2_10 ZAJEM2 SAMOST č.dotazníku Zájem o službu OA nakoupí na úřady k lékaři doprava do práce úklid s počítačem hygiena pohyb po bytě za zábavou přip.jídlo dichot index 1 3 6 2 10 4 7 5 9 8
Nejprve třídění dat 1. stupně Podíl (%) nebo medián (průměr) zájmu o službu os. asistence za všech klienty. U varianty znaků s více hodnotami zjišťujeme také variabilitu (rozptyl) hodnot. Slouží k: ověření celkové variability v datech „neodpovídají (skoro) všichni stejně? → použili jsme adekvátní nástroj měření? zjištění míry celkového zájmu o nabízenou službu (mezi všemi klienty bez rozdílu) a úroveň/rozložení míry samostatnosti klientů.
Základní metody ověření hypotézy 2. řádu (v explorační analýze) Po kontrole dat a třídění 1. stupně můžeme přistoupit k ověření hypotézy, podle úrovně měření znaků pomocí: Kontingenční tabulky → oba znaky kategoriální Průměry (mediány) v podskupinách → jeden kardinální (příp. ordinální), druhý kategorizovaný Bodový X-Y (korelační) graf nebo koeficient korelace (lineární regrese) → oba kardinální (příp. ordinální)
Upozornění: v následujících příkladech použitá hypotetická data/ hodnoty neodpovídají datům dříve uvedeným v příkladu datové matice (navíc výsledky nejsou navzájem zcela ekvivalentní). Časem budou příklady upraveny, nicméně na pochopení principu to nemá vliv.
NEZÁVISLÁ – vysvětlující proměnná Pomocí kontingenční tabulky (pro kategoriální znaky). Hyp.: „Samostatní klienti chráněného bydlení, mají větší zájem o službu osobní asistence než klienti s nízkou samostatností“. Princip: v kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné, zde máme sloupcová procenta NEZÁVISLÁ – vysvětlující proměnná ZÁVISLÁ – vysvětlovaná proměnná Samostatnost Zájem o službu os. asistence Nízká Vysoká Celkem (absolutní četnost) Zájem 41 % 66 % xx Nezájem 59 % 34 % Celkový součet 100 % Výsledek (hypotetický) ukazuje, že z těch co mají vysokou samostatnost má dvě třetiny zájem o službu OA (66 %), zatímco u těch, co mají nízkou samostatnost je to pouze dvě pětiny (41 %). Zdá se tedy, že hypotézu můžeme přijmout (Ale je 25 procentních bodů (66 vs. 41 %) opravdu dostatečný rozdíl?). Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá (vysvětlující) ve sloupcích (není to ale podmínkou, záleží na počtu kategorií, a jak se nám to vejde na stránku; lze o 90st. otočit). Uvádíme krom procent vždy také absolutní četnosti, alespoň u celku. Vždy tak aby, v kategoriích nezávislé proměnné byla kompletní (100 %) distribuce závislé proměnné.
Kontingenční tabulka (zde hodnoty odpovídají „datům“ v excelovské matici) ZAJEM2 x SAMOST2 Interpretujeme (zde) sloupcová procenta Ale vždy nejprve kontrolujeme rozložení absolutních četností v tabulce. Pozor na nulové/nízké četnosti, většinou představují problém..
Pomocí průměrů v podskupinách (kategoriální a kardinální znak) Průměrná míra samostatnosti podle zájmu o službu osobní asistence Samostatnost (hodnota indexu 1-10) Zájem o službu os. asistence Průměr Směrodatná odchylka (rozptyl) Celkem (absolutní četnost) Zájem 6,6 xx Nezájem 4,2 Celkový průměr 5,1 Hypotéza „Klienti chráněného bydlení se zájem o službu osobní asistence mají vyšší míru samostatnosti, než klienti kteří zájem nemají, “ platí. Pozor ale na velikost rozdílu, zde je to v hodnotě indexu samostatnosti pouze o 24 % (= (6,6-4,2)/10)) .
Bodový X-Y graf (scatter plot) pro dva kardinální (spojité-číselné) znaky Do grafu vyneseme hodnoty znaků (souřadnice bodů X a Y) pro každý případ (respondenta). Kupení bodů kolem přímky a její sklon odpovídá korelačnímu koeficientu (a regresní analýze) Zde je velmi slabá negativní korelace r = -0,13 (jde o mocninu koeficientu spolehlivosti Rsq = 0,0174). Zde hypotéza „Čím více jsou klienti chráněného bydlení samostatní, tím větší je jejich zájem o službu osobní asistence“ neplatí, jde totiž o vztah pouze velmi slabý (viz rozmístění bodů, které ukazuje spíše na neexistenci souvislosti).
Poznámky (co dalšího je třeba udělat) Nejprve je třeba zkontrolovat rozložení hodnot jednotlivých znaků (pomocí třídění 1. stupně), zda jsou dodrženy podmínky, za kterých tyto analýzy můžeme provádět (Musí být dostatečný počet případů u jednotlivých hodnot, ty nesmí být extrémně vychýlené jedním směrem). Jde pouze o základní varianty typů znaků. Možností přístupu k analýze existuje mnohem více; vše lze vizualizovat v grafech. Zde používáme pouze třídění 2. stupně. Pro podrobnější test platnosti hypotézy (vyloučení vlivu dalších proměnných) bychom potřebovali třídění třetího (vyššího) stupně. Pokud by se jednalo o výběrový soubor (nikoliv celou populaci klientů, jak předpokládáme zde), tak je navíc třeba ověření pomocí inferenční statistiky (statistické testy). Jak na to „prakticky“ se dozvíte v kurzu Praktikum - elementární zpracování dat z kvantitativního výzkumu.
K tomu viz např. kurz AKD II. http://metodykv.wz.cz/index.htm#analyza2 Zde jsme si ukázali (pouze) deskriptivní analýzu, pokud data pochází z náhodného výběru, pak je třeba ještě platnost hypotéz ověřit pomocí principů inferenční statistiky (intervalové odhady a statistické testy hypotéz). K tomu viz např. kurz AKD II. http://metodykv.wz.cz/index.htm#analyza2