Korelace a elaborace aneb úvod do vztahů proměnných

Slides:



Advertisements
Podobné prezentace
Korelace a elaborace aneb úvod do vztahů proměnných
Advertisements

Korelace a elaborace aneb úvod do vztahů proměnných
Korelace a elaborace aneb úvod do vztahů proměnných
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Experimentální metody oboru – Pokročilá tenzometrie – Měření vnitřního pnutí Další využití tenzometrie Měření vnitřního pnutí © doc. Ing. Zdeněk Folta,
Význam diferenciálních rovnic převzato od Doc. Rapanta.
Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Induktivní statistika
Korelace 20. prosince 2013 VY_42_INOVACE_190227
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
Historická sociologie, Řízení a supervize
Interpolace funkčních závislostí
7. Statistické testování
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
Testování hypotéz Testování hypotéz o rozdílu průměrů
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
standardní alternativní teorie firmy
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Oblast: Dobré životní podmínky zvířat
Párový neparametrický test
Statistické metody pro vysvětlující otázky
4.1 – 4.3 Lineární nerovnice i jednoduchý podílový tvar
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Míry asociace obecná definice – síla a směr vztahu
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
Kvadratické nerovnice
Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Test z Metodologie – náměty k přípravě
Spojité VELIČINY Vyšetřování normality dat
PSY252 Statistická analýza dat v psychologii II
Rovnice základní pojmy.
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
XII. Binomické rozložení
Metody sociálního výzkumu 6. blok
3. přednáška Laplaceova transformace
ASTAc/03 Biostatistika 4. cvičení
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Lineární regrese.
Lomené výrazy (2) Podmínky řešitelnost
Analýza variance (ANOVA).
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
Teorie chyb a vyrovnávací počet 1
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Teorie chyb a vyrovnávací počet 1
Více náhodných veličin
Vzdělávání jako hlavní složka řízení lidských zdrojů
Dělitelnost přirozených čísel
Teorie chyb a vyrovnávací počet 2
Slovní úlohy o společné práci − 3
Transkript prezentace:

Korelace a elaborace aneb úvod do vztahů proměnných

Závislost dvou proměnných-přehled Nominální (kontingenční koeficienty, koeficienty asociace) Ordinální (Korelační koeficienty dle Spearmana a Kendalla) Kardinální (Pearsonův párový korelační koeficient, párová regrese)

Korelace ord. proměnných Spearmanův koeficient pořadové korelace princip vyhodnocení test a interval spolehlivosti Kendallovo tau test a interval spolehlivosti (Bootstrap)

!!!Korelace kard. - předpoklady!!! Předpoklad pro Pearsonův koeficient normalita proměnných viz např procedura Explore v Analyze-Descriptives (tedy pro korelace chceme náhodný výběr z normálního rozdělení/regrese naopak předpokládá volbu kombinace vysvětlujících proměnných)

Korelace v SPSS Analyze-Correlate-Bivariate Výběr tří základních koeficientů Options-popisná statistika a kovariance a součin směrodatných odchylek Volba práce s chybějícími hodnotami (viz i další metody)

Korelace v SPSS Jedno (one-tailed) a dvoustranný test (two-tailed) aneb různé alternativní hypotézy Co je za tím? Flag significant correlations. Korelační koeficienty významné na 5% (0,05) hladině významnosti označeny jednou hvězdičkou resp. pro 1% dvěmi

Korelace v SPSS-syntax Všechny proměnné se všemi CORRELATIONS /VARIABLES=q9 q10 q53 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE. Jedna proměnná (q53) se všemi /VARIABLES=q53 with q9 q10

Poučky o korelačních koeficientech Koeficient pro intervalové proměnné měří lineární vztah. Vychází-li korelace nízká, znamená to pouze, že vztah mezi proměnnými nemá lineární povahu. Možná je souvislost mezi znaky velmi těsná, ale má jinou než lineární podobu. Co s tím udělat? A) Použijte koeficientu pro nominální znaky, např. Cramerova V. Pokud vyjde vyšší než ten, který jste použili původně, je to indikace nelinearity. B) Použijte k analýze grafu nebo tabulky, abyste zjistili, v kterých kategoriích dochází k odchylce od linearity.

Poučky o korelačních koeficientech V případě, že počítáte příliš mnoho korelací mezi navzájem provázanými proměnnými, vychází zpravidla všechny korelační koeficienty jako významné. V duchu vícenásobných porovnání (používaných například v analýze rozptylu) se doporučuje snížit konvenční hladinu významnosti (0,05) tolikrát kolik počítáme párových korelačních koeficientů (dle autora této metody se nazývá Bonferonniho korekce) . Tímto postupem zajistíme, že celková hladina významnosti všech párových srovnání bude maximálně rovna konvenční hladině významnosti (0,05). Stejného výsledku lze dosáhnout i tak, že jednotlivé Sig. vypočtené v SPSS vynásobíme počtem párových srovnání a porovnáváme je s konvenční hladinou významnosti 0,05.

Poučky o velikosti koeficientů Hodnota korelace v abs. hodnotě interpretace souvislosti 0,01 – 0,09 triviální, žádná 0,10 – 0,29 nízká až střední 0,30 – 0,49 střední až podstatná 0,50 0,69 podstatná až velmi silná 0,70 0,89 velmi silná 0,90 – 0,99 téměř perfektní De Vaus: 2002

Poznámky závěrem Jiné/další koeficienty-viz Analyze-Descriptives-Crosstabs (tam jsou i kontingenční koeficienty) Vždy než začneme počítat zobrazme si grafy zobrazující závislost proměnných, to nám může ušetřit mnohá překvapení či pochybení

Jak odhalit vliv třetí proměnné (Elaborace a dílčí korelace)

Otázky, které je třeba si položit při odhalení párového vztahu (de Vaus 2002): Jaká je povaha tohoto vztahu, je kauzální nebo ne? Pokud je tento vztah kauzální, je přímý, nebo nepřímý (to je když X ovlivňuje Y prostřednictvím třetí proměnné)? Pokud je tento vztah nepřímý, jakým mechanismem proměnná X ovlivňuje proměnnou Y? Pokud je vztah mezi X a Y nekauzální povahy, jakou funkcí se dá modelovat?

Elaborace Způsob jak odhalit vliv třetí proměnné rozpracovali už v roce 1950 Patricia Kendall s Paulem Lazarsfeldem. Technika byla nazvána elaboration, což lze překládat jak rozpracování, precizace nebo elaborace. Definice tohoto způsobu analýzy by mohla znít: Elaborační analýza obsahuje zavedení třetí proměnné do vztahu mezi dvěma proměnnými a zhodnocení jejího působení. Tím umožňuje hlubší porozumění původnímu párovému vztahu.

Elaborace se obvykle provádí prostřednictvím dvou postupů: Zavedením třetí, testové proměnné do třídění druhého stupně – jinými slovy vytvořením podmíněných tabulek a výpočtem podmíněných korelací. Výpočtem parciálních tabulek a parciálních korelací.

Modely vztahů mezi třemi proměnnými Mezi X a Y je zdánlivý (nepravý) vztah (spurious) X Y Z Příklad: Nepravý vztah je takový, kdy nalezený domněle kauzální vztah, takovýmto vztahem vůbec není. Vztah mezi X a Y se jeví jako existující, avšak je nalezen pouze proto, že jak X, tak Y jsou ovlivňovány existencí a působením proměnné Z. Např. Byl nalezen vztah mezi počtem dětí a výskytem čápů. Tento vztah je způsoben tím, že čápi se nalézají na venkově a na venkově (proměnná Z) se rodí více dětí.

Dílčí korelace v SPSS Analyze-Correlate-Partial Pouze Pearsonův koeficient Options-popisná statistika a párové korelace (nultého řádu) Ostatní jako u Bivariate

Poučky o dílčích korelacích a) Nastane situace, že vypočtený parciální koeficient má přibližně stejnou hodnotu, jako původní korelace. Co to znamená? Testová proměnná nemá na původní vztah vliv a my si můžeme být jisti, že původní korelace není zdánlivá. b) Parciální koeficient je výrazně nižší než původní korelace a je blízký nule. V takovém případě to znamená, že testová proměnná plně vysvětluje původní vztah, který byl zdánlivý. (resp. zdánlivá korelace či intervenující proměnná ) c) Parciální koeficient se změní jenom částečně. Pak je testová proměnná jen částečně vhodná k vysvětlení původní korelace.

Poznámka závěrem k dílčí korelaci Jak se snažila ukázat tato lekce, při hledání statistických vztahů bychom se neměli spokojit pouze s párovám (bivariate) výsledkem. Vždy, když to má smysl, se pokoušejte zavádět třetí proměnné a zjišťujte, zdali původní vztah „vydržel“, nebo byl modifikován. Prohloubíte tím své poznání a přinesete výsledky, které budou postaveny na solidním základě.