Korelace a elaborace aneb úvod do vztahů proměnných
Tři typy proměnných aneb alfa a omega celé statistiky Nominální Ordinální Kardinální Kam patří dichotomické? Vazba typu proměnných k metodám
Závislost dvou proměnných-přehled Nominální (kontingenční koeficienty, koeficienty asociace) Ordinální (Korelační koeficienty dle Spearmana a Kendalla) Kardinální (Pearsonův párový korelační koeficient, párová regrese)
Začněme opakováním aneb 4 typy závislosti 2 kardinálních proměnných Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Dopad na korelační koeficient a regresní koeficient Exkurz o kovarianci Upozornění-lineární regrese, korelace i kovariance měří jen lineární vztahy
!!!Korelace předpoklady!!! Předpoklad pro Pearsonův koeficient normalita proměnných viz např procedura Explore v Analyze-Descriptives (tedy pro korelace chceme náhodný výběr z normálního rozdělení/regrese naopak předpokládá volbu kombinace vysvětlujících proměnných) Předpoklad pro Spearmanův/Kendallův koeficient ordinalita proměnných
Korelace v SPSS Analyze-Correlate-Bivariate Výběr tří základních koeficientů Options-popisná statistika a kovariance a součin směrodatných odchylek Volba práce s chybějícími hodnotami (viz i další metody)
Korelace v SPSS Jedno (one-tailed) a dvoustranný test (two-tailed) aneb různé alternativní hypotézy Flag significant correlations. Korelační koeficienty významné na 5% (0,05) hlaině významnosti označeny jednou hvězdičkou resp. pro 1% dvěmi
Poznámky závěrem Jiné/další koeficienty-viz Analyze-Descriptives-Crosstabs (tam jsou i kontingenční koeficienty) Vždy než začneme počítat zobrazme si grafy zobrazující závislost proměnných, to nám může ušetřit mnohá překvapení či pochybení
Jak odhalit vliv třetí proměnné (Elaborace)
Otázky, které je třeba si položit při odhalení bivariačního vztahu (de Vaus 2002): Jaká je povaha tohoto vztahu, je kauzální nebo ne? Pokud je tento vztah kauzální, je přímý, nebo nepřímý (to je když X ovlivňuje Y prostřednictvím třetí proměnné)? Pokud je tento vztah nepřímý, jakým mechanismem proměnná X ovlivňuje proměnnou Y? Pokud je vztah mezi X a Y nekauzální povahy, jakou funkcí se dá modelovat?
Elaborace Způsob jak odhalit vliv třetí proměnné rozpracovali už v roce 1950 Patricia Kendall s Paulem Lazarsfeldem. Technika byla nazvána elaboration, což lze překládat jak rozpracování, precizace nebo elaborace. Definice tohoto způsobu analýzy by mohla znít: Elaborační analýza obsahuje zavedení třetí proměnné do vztahu mezi dvěma proměnnými a zhodnocení jejího působení. Tím umožňuje hlubší porozumění původnímu bivariačnímu vztahu.
Elaborace se obvykle provádí prostřednictvím dvou postupů: Zavedením třetí, testové proměnné do třídění druhého stupně – jinými slovy vytvořením podmíněných tabulek a výpočtem podmíněných korelací. Výpočtem parciálních tabulek a parciálních korelací.
Modely vztahů mezi třemi proměnnými Vztah nultého řádu X Y 1. Proměnná Z nemá žádný vliv na vztah mezi X a Y Z
Modely vztahů mezi třemi proměnnými 2. Z je intervenující proměnnou (mezi X a Y je nepřímý vztah) X Y Z Příklad: Zjistili jsme, že mezi pohlavím a příjmem existuje vztah: muži vydělávají více než ženy. Když zavedeme třetí proměnnou, počty odpracovaných hodin, zjistíme, že ženy pracují méně hodin, což se odráží na jejich nižším příjmu. Pokud by nebylo rozdílu v odpracovaných hodinách (proměnná Z), původní vztah by neexistoval.
Modely vztahů mezi třemi proměnnými 3. Z má jak přímý, tak i nepřímý vliv X Y Z Příklad: Pohlaví má nepřímý vliv na příjem prostřednictvím počtu odpracovaných hodin, má však také přímý vliv díky působení dalších faktorů, které nejsou v analýze zahrnuty.
Modely vztahů mezi třemi proměnnými 4. Mezi X a Y je zdánlivý (nepravý) vztah (spurious) X Y Z Příklad: Nepravý vztah je takový, kdy nalezený domněle kauzální vztah, takovýmto vztahem vůbec není. Vztah mezi X a Y se jeví jako existující, avšak je nalezen pouze proto, že jak X, tak Y jsou ovlivňovány existencí a působením proměnné Z. Např. Byl nalezen vztah mezi počtem dětí a výskytem čápů. Tento vztah je způsoben tím, že čápi se nalézají na venkově a na venkově (proměnná Z) se rodí více dětí.
Modely vztahů mezi třemi proměnnými 5. Mezi X a Y je zdánlivý i přímý vztah X Y Z Příklad: Lepší výsledky studentů na víceletých gymnáziích ve srovnání s gymnázii čtyřletými státními je vztahem zdánlivým, neboť může být způsoben faktorem selektivity: rodiče dají talentované dítě již v páté třídě raději na víceleté gymnázium, aby ho uchránili retardujícího vlivu prostředí základní školy. Nicméně tyto lepší výsledky mohou být také způsobeny přímým vlivem víceletých gymnázií na studenty: více se jim tam věnují, učitelé mají vyšší ambice ze studentů „něco vychovat“ apod. Zkrátka působí samotné prostředí školy.
Modely vztahů mezi třemi proměnnými 6. Mezi X a Y je zdánlivý i nepřímý vztah X Y Z Příklad: Zjistíme, že studenti, kteří navštěvují křesťanská gymnázia jsou více nábožensky založení, než studenti, kteří chodí na ostatní gymnázia. Skutečně náboženská škola vede k větší náboženskosti? Může to být ale tak, že nábožensky založení rodiče (Z) dávají děti častěji na náboženské školy, současně nábožensky založení rodiče také vychovávají své děti k víře častěji než nenábožensky naložení rodiče. Náboženskost rodičů je tak společná kauzální příčina X a Y. Nicméně, škola samotná může podporovat náboženskost rodičů (přímý vliv), což dále přispívá k náboženskosti dětí.
Modely vztahů mezi třemi proměnnými 7. Mezi X a Y je zdánlivý, přímý i nepřímý vztah X Y Z Příklad: Stejná situace jako v příkladě 6, doplněná navíc o fakt, že prostředí školy samotné působí navíc přímo na religiozitu svých studentů a posiluje ji.
Modely vztahů mezi třemi proměnnými 7. Dvojitá příčina proměnné Y X Y Z Příklad:
Modely vztahů mezi třemi proměnnými 8. Podmíněný vliv Z1 X Y Z2 X Y Příklad: Do škol jsou zavedeny nové didaktické prostředky ke zlepšení výsledků studentů. Zjistí se, že zlepšení nastalo pouze u chlapců, nikoliv však u dívek. Když jsou tedy tyto dva faktory (nové postupy učení a pohlaví) zkombinovány, nastává interakce způsobující pozorovaný efekt.