Korelace a elaborace aneb úvod do vztahů proměnných

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Analýza experimentu pro robustní návrh
Použité statistické metody
Analýza dotazníků RNDr. Michal Čihák, Ph.D..
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
Testování hypotéz (ordinální data)
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Základy ekonometrie Cvičení září 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Lineární regrese.
Obecný lineární model Fitované hodnoty and regresní residuály
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Statistika Zkoumání závislostí
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Metrologie   Přednáška č. 5 Nejistoty měření.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
Korelace a elaborace aneb úvod do vztahů proměnných
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Analýza kvantitativních dat I. Vztahy mezi 3 znaky v kontingenční tabulce - úvod Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Motivační příklad – 1a Vliv rodičů a prostředí na vývoj mláďat Nejstarší mládě v každém hnízdě měřeno ve věku X dní Vysvětlující údaje: počet mláďat, stáří.
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Jiří Šafr jiri.safr(zavináč)seznam.cz
Téma Hypotézy ve výzkumu
IV..
Vendula Slámová Markéta Otáhalová Jitka Wagenknechtová
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Základní informace o předmětu1. Přednášející: RNDr. Martin Hála, CSc. katedra matematiky, B105, Další informace a soubory ke stažení.
Základy zpracování geologických dat R. Čopjaková.
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Parciální korelace Regresní analýza
Korelace a elaborace aneb úvod do vztahů proměnných
Úvod do induktivní statistiky
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Třídění 2. a 3. stupně: orientační mapa možností bivariátních analýz
Základy statistiky.
Transkript prezentace:

Korelace a elaborace aneb úvod do vztahů proměnných

Tři typy proměnných aneb alfa a omega celé statistiky Nominální Ordinální Kardinální Kam patří dichotomické? Vazba typu proměnných k metodám

Závislost dvou proměnných-přehled Nominální (kontingenční koeficienty, koeficienty asociace) Ordinální (Korelační koeficienty dle Spearmana a Kendalla) Kardinální (Pearsonův párový korelační koeficient, párová regrese)

Začněme opakováním aneb 4 typy závislosti 2 kardinálních proměnných Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Dopad na korelační koeficient a regresní koeficient Exkurz o kovarianci Upozornění-lineární regrese, korelace i kovariance měří jen lineární vztahy

!!!Korelace předpoklady!!! Předpoklad pro Pearsonův koeficient normalita proměnných viz např procedura Explore v Analyze-Descriptives (tedy pro korelace chceme náhodný výběr z normálního rozdělení/regrese naopak předpokládá volbu kombinace vysvětlujících proměnných) Předpoklad pro Spearmanův/Kendallův koeficient ordinalita proměnných

Korelace v SPSS Analyze-Correlate-Bivariate Výběr tří základních koeficientů Options-popisná statistika a kovariance a součin směrodatných odchylek Volba práce s chybějícími hodnotami (viz i další metody)

Korelace v SPSS Jedno (one-tailed) a dvoustranný test (two-tailed) aneb různé alternativní hypotézy Flag significant correlations. Korelační koeficienty významné na 5% (0,05) hlaině významnosti označeny jednou hvězdičkou resp. pro 1% dvěmi

Poznámky závěrem Jiné/další koeficienty-viz Analyze-Descriptives-Crosstabs (tam jsou i kontingenční koeficienty) Vždy než začneme počítat zobrazme si grafy zobrazující závislost proměnných, to nám může ušetřit mnohá překvapení či pochybení

Jak odhalit vliv třetí proměnné (Elaborace)

Otázky, které je třeba si položit při odhalení bivariačního vztahu (de Vaus 2002): Jaká je povaha tohoto vztahu, je kauzální nebo ne? Pokud je tento vztah kauzální, je přímý, nebo nepřímý (to je když X ovlivňuje Y prostřednictvím třetí proměnné)? Pokud je tento vztah nepřímý, jakým mechanismem proměnná X ovlivňuje proměnnou Y? Pokud je vztah mezi X a Y nekauzální povahy, jakou funkcí se dá modelovat?

Elaborace Způsob jak odhalit vliv třetí proměnné rozpracovali už v roce 1950 Patricia Kendall s Paulem Lazarsfeldem. Technika byla nazvána elaboration, což lze překládat jak rozpracování, precizace nebo elaborace. Definice tohoto způsobu analýzy by mohla znít: Elaborační analýza obsahuje zavedení třetí proměnné do vztahu mezi dvěma proměnnými a zhodnocení jejího působení. Tím umožňuje hlubší porozumění původnímu bivariačnímu vztahu.

Elaborace se obvykle provádí prostřednictvím dvou postupů: Zavedením třetí, testové proměnné do třídění druhého stupně – jinými slovy vytvořením podmíněných tabulek a výpočtem podmíněných korelací. Výpočtem parciálních tabulek a parciálních korelací.

Modely vztahů mezi třemi proměnnými Vztah nultého řádu X Y 1. Proměnná Z nemá žádný vliv na vztah mezi X a Y Z

Modely vztahů mezi třemi proměnnými 2. Z je intervenující proměnnou (mezi X a Y je nepřímý vztah) X Y Z Příklad: Zjistili jsme, že mezi pohlavím a příjmem existuje vztah: muži vydělávají více než ženy. Když zavedeme třetí proměnnou, počty odpracovaných hodin, zjistíme, že ženy pracují méně hodin, což se odráží na jejich nižším příjmu. Pokud by nebylo rozdílu v odpracovaných hodinách (proměnná Z), původní vztah by neexistoval.

Modely vztahů mezi třemi proměnnými 3. Z má jak přímý, tak i nepřímý vliv X Y Z Příklad: Pohlaví má nepřímý vliv na příjem prostřednictvím počtu odpracovaných hodin, má však také přímý vliv díky působení dalších faktorů, které nejsou v analýze zahrnuty.

Modely vztahů mezi třemi proměnnými 4. Mezi X a Y je zdánlivý (nepravý) vztah (spurious) X Y Z Příklad: Nepravý vztah je takový, kdy nalezený domněle kauzální vztah, takovýmto vztahem vůbec není. Vztah mezi X a Y se jeví jako existující, avšak je nalezen pouze proto, že jak X, tak Y jsou ovlivňovány existencí a působením proměnné Z. Např. Byl nalezen vztah mezi počtem dětí a výskytem čápů. Tento vztah je způsoben tím, že čápi se nalézají na venkově a na venkově (proměnná Z) se rodí více dětí.

Modely vztahů mezi třemi proměnnými 5. Mezi X a Y je zdánlivý i přímý vztah X Y Z Příklad: Lepší výsledky studentů na víceletých gymnáziích ve srovnání s gymnázii čtyřletými státními je vztahem zdánlivým, neboť může být způsoben faktorem selektivity: rodiče dají talentované dítě již v páté třídě raději na víceleté gymnázium, aby ho uchránili retardujícího vlivu prostředí základní školy. Nicméně tyto lepší výsledky mohou být také způsobeny přímým vlivem víceletých gymnázií na studenty: více se jim tam věnují, učitelé mají vyšší ambice ze studentů „něco vychovat“ apod. Zkrátka působí samotné prostředí školy.

Modely vztahů mezi třemi proměnnými 6. Mezi X a Y je zdánlivý i nepřímý vztah X Y Z Příklad: Zjistíme, že studenti, kteří navštěvují křesťanská gymnázia jsou více nábožensky založení, než studenti, kteří chodí na ostatní gymnázia. Skutečně náboženská škola vede k větší náboženskosti? Může to být ale tak, že nábožensky založení rodiče (Z) dávají děti častěji na náboženské školy, současně nábožensky založení rodiče také vychovávají své děti k víře častěji než nenábožensky naložení rodiče. Náboženskost rodičů je tak společná kauzální příčina X a Y. Nicméně, škola samotná může podporovat náboženskost rodičů (přímý vliv), což dále přispívá k náboženskosti dětí.

Modely vztahů mezi třemi proměnnými 7. Mezi X a Y je zdánlivý, přímý i nepřímý vztah X Y Z Příklad: Stejná situace jako v příkladě 6, doplněná navíc o fakt, že prostředí školy samotné působí navíc přímo na religiozitu svých studentů a posiluje ji.

Modely vztahů mezi třemi proměnnými 7. Dvojitá příčina proměnné Y X Y Z Příklad:

Modely vztahů mezi třemi proměnnými 8. Podmíněný vliv Z1 X Y Z2 X Y Příklad: Do škol jsou zavedeny nové didaktické prostředky ke zlepšení výsledků studentů. Zjistí se, že zlepšení nastalo pouze u chlapců, nikoliv však u dívek. Když jsou tedy tyto dva faktory (nové postupy učení a pohlaví) zkombinovány, nastává interakce způsobující pozorovaný efekt.