SEM 12. Přednáška Petr Soukup.

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Cvičení října 2010.
Lineární regresní analýza Úvod od problému
SEM J.Hendl a P. Soukup.
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Statistika Vypracoval: Mgr. Lukáš Bičík
Teorie psychodiagnostiky a psychometrie
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Základy ekonometrie Cvičení září 2010.
Shluková analýza.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Základy ekonometrie Cvičení 3 4. října 2010.
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Lineární regrese.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
V. Analýza rozptylu ANOVA.
AKD VII.
Metrologie   Přednáška č. 5 Nejistoty měření.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
V experimentu měníme hodnotu jedné nebo několika veličin x i a studujeme závislost veličiny y. - např. měníme, ostatní x i bereme jako parametry ( , ,
Hustota pravděpodobnosti – případ dvou proměnných
Teorie psychodiagnostiky a psychometrie
Aplikovaná statistika 2. Veronika Svobodová
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Aplikovaná statistika 2.
Základy zpracování geologických dat R. Čopjaková.
Odhady odhady bodové a intervalové odhady
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Interpolace funkčních závislostí
Induktivní statistika
Induktivní statistika
Monte Carlo Typy MC simulací
Co se dá změřit v psychologii a pedagogice?
Neparametrické testy parametrické a neparametrické testy
Úvod do praktické fyziky
SEM J.Hendl a P. Soukup.
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Pokročilé neparametrické metody Validační techniky
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
Lineární regrese.
Transkript prezentace:

SEM 12. Přednáška Petr Soukup

SEM - podstata Soustava rovnic pro manifestní a latentní proměnné a pro kovarianční matici manifestních proměnných Odhadujeme parametry - zpravidla korelační a regresní koeficienty (kovariance) a rozptyly Snažíme se, aby náš model byl co nejjednodušší (tj. měl co nejméně parametrů a přesto byl co nejvhodnější pro naše data – viz dále testy a kritéria)

SEM – vstupní data Kovarianční matice manifestních proměnných – tj. rozptyly a kovariance mezi nimi Lze vyjít i z korelační matice ale obecně se preferuje kovarianční matice (zachytí se odlišnost proměnných díky jejich různému rozptylu) Nemusíme mít původní data, stačí získat kovarianční či korelační matici a počet respondentů (obdobně např. pro faktorovou analýzu exploračního typu v SPSS – viz např. kap 17 v Norusis) Poznámka: Jako vstup lze mít i matici jiných než Pearsonovských korelací (tetrachorické, polychorické) a lze tak korektně pracovat s proměnnými dichotomické či ordinální povahy!!!

SEM – rovnice Dva typy rovnic: (1. pro proměnné) Nepřipomíná to něco?

SEM – rovnice Dva typy rovnic: (2. pro kovariance) Co to znamená?

SEM – rovnice 2. typ rovnic pro kovariance je základem výpočtu Co známe: kovarianční matici pro výběrová data u manifestních proměných (Σ) Co chceme znát: kovarianční matici latentních proměnných (Ψ), náhodných chyb (Θ) a dále faktorové zátěže (Λ) Problém: často máme méně prvků kovarianční matice než je odhadovaných parametrů (problém identifikovatelnosti – viz dále)

SEM – postup výpočtu Kovarianční či korelační matici se snažíme reprodukovat modelem Používá se různých technik odhadu – běžně v několika krocích, tzv. iterace Nevážená metoda nejmenších čtverců:

SEM – metody odhadu I Zobecněná metoda nejmenších čtverců: Metoda maximální věrohodnosti:

SEM – metody odhadu II Vážená metoda nejmenších čtverců (ADF): Robustní metody AMOS i MPlus umí ULS, GLS, WLS

SEM – typy parametrů volné pevné omezené ukázky

SEM – vyhodnocení modelu I Lze vyhodnotit model jako celek – testy a kritéria Lze vyhodnotit jednotlivé parametry – testy a intervaly spolehlivosti Lze zjistit, zda některý parametr do modelu není vhodné přidat (ze stat. hlediska) – modification indeces

Hodnocení celkové kvality SEM modelů (model fit) Chí-kvadrát test Kritéria založená na měření podobnosti napozorované kovarianční matice a namodelované kovarianční matice: AGFI – cca nad 0,95 velmi dobré NNFI – opět nad 0,95 velmi dobré TLI – nad 0,9 CFI - nad 0,9 Kritéria založená na měření chyby RMSEA – hodnoty do cca 0,05 (0,08) jsou považovány za dobré Vzorce lze nalézt např. zde: http://davidakenny.net/cm/fit.htm

Hodnocení kvality SEM modelů (model fit) Poměr Χ2 a df – doporučená hodnota ze shora se blíží 1 (pod 1 model má moc parametrů) Informační kritéria: Založena na věrohodnostní funkci, počtu parametrů a případně i počtu respondentů Penalizují modely s vyšším počtem parametrů (složitější) Nejužívanější je AIC a BIC AIC = Χ2 + k(k - 1) - 2df

Hodnocení kvality SEM modelů (model fit) Doporučení pro informační kritéria U BIC rozdíl o 5 či více modely se nejspíše liší, o více než 10 téměř jistě se liší, vybíráme model s nižším BIC (platí i pro AIC) BIC lze použít i pro srovnání modelů, které nejsou tzv. nested (Exkurz o nested) Více viz: Raftery, A.E. (1995), Bayesian model selection in social research. In P.V.Marsden (Ed.), Sociological Methodology 1995. Oxford: Blackwell Diskuse AIC vs. BIC: http://emdbolker.wikidot.com/forum/t-81139/

Hodnocení parametrů Každý parametr je odhadován společně s jeho standardní chybou Poměrem odhadu parametru a jeho st. chyby získáme veličinu s t-rozdělením (lze testovat nulovost parametru – nepřítomnost vazby, nulovost rozptylu) Lze konstruovat interval spolehlivosti – Jak?

Modifikační indexy a ECPI Pro každý potenciálně zahrnutelný parametr (vazbu či rozptyl) lze zjistit, zda by se model jeho přidáním zlepšil Toto řeší tzv. modifikační indexy Doporučení – je-li hodnota indexu větší než 4, je ze statistického pohledu dobré parametr do modelu přidat Praktická rada – parametry přidáváme vždy po jednom, ne tedy všechny s MI větším než 4

Problém identifikovatelnosti modelů Teoreticky si lze představit libovolný model, ale ne vše lze spočítat Existují nejrůznější pravidla, která je třeba dodržovat, aby bylo možné model odhadnout Uvedeme jen ta nejjednodušší – více viz Urbánek (kap. 4) a tam zmíněná literatura, plus dále 6 pravidel (viz dále)

Identifikovatelnost - pomůcky Model měření by měl mít pro každou latentní proměnnou alespoň tři indikátory (manifestní proměnné) Aspoň jedna vazba indikátoru a latentní proměnné se fixuje (zpravidla na jednotku)

Jednoduchý příklad Vychází se z kovarianční matice měřených proměnných Počet jedinečných prvků této matice udává maximální možný počet odhadovaných parametrů Kolik parametrů lze tedy odhadovat u dvoufaktorového modelu založeného na 6 indikátorech?

Strukturní modely - připomenutí Zpravidla se skládají ze dvou částí: Model měření (CFA) Úseková analýza či její modifikace Poznámka: nejjednodušími strukturními modely jsou kovariance, jednoduchá regrese a jednofaktorový model

Strukturní modely - ukázka Budování modelu sociální stratifikace – viz Matějů (2005)

Strukturní modely – Model 1 Varování: Následující obrázky nedodržují zavedenou symboliku, proč?

Strukturní modely – Model 2

Strukturní modely – Model 3

Strukturní modely – Model 4

Strukturní modely – Model 5

Strukturní modely – Model 6 0,218

Strukturní modely – Model 7 - část

Šest pravidel pro budování modelů (viz SEM.pdf) Pravidlo 1. Rozptyly nezávislých veličin jsou odhadované parametry (jde zejména o latentní proměnné v modelech měření a dále chybové složky) Poznámka: Ke každé závislé veličině zpravidla patří chybová složka, její rozptyl určuje co se nedaří vysvětlit za pomoci našeho modelu Pravidlo 2. Kovariance nezávislých proměnných jsou odhadované parametry (pokud teorie nepředpokládá nezávislost či určitou velikost této vazby)

Šest pravidel pro budování modelů (viz SEM.pdf) Pravidlo 3. Všechny možné faktorové zátěže v modelech měření jsou odhadované parametry (opět pokud teorie nepředpokládá, že některé vazby jsou vyloučeny) Poznámka: Běžně jsou např. ve dvoufaktorovém modely některé indikátory pro první faktor a jiné pro druhý a vzájemné křížení se nepřipouští Pravidlo 4. Regresní koeficienty mezi latentními nebo pozorovanými proměnnými jsou odhadované parametry (opět toto neplatí, pokud teorie nepředpokládá nezávislost či určitou velikost této vazby)

Šest pravidel pro budování modelů (viz SEM.pdf) Pravidlo 5. Rozptyly a kovariance mezi závislými proměnnými a kovariance mezi závislými a nezávislými proměnnými nejsou nikdy odhadované parametry (bez výjimek, vyplývá z logiky modelování) Pravidlo 6. U každé latentní proměnné v modelu je nutno nastavit její škálu. Důvod: žádnou přirozenou škálu na rozdíl od manifestních proměnných nemá. Dvě možnosti: fixovat rozptyl (typicky na 1), nebo fixovat vazbu z ní vycházející k proměnné (typicky na 1).

Aplikace pravidel na jednoduchý model Aplikujte pravidla 1-6 na dvoufaktorový model Kolik maximálně parametrů se bude odhadovat? Jaká pravidla se použijí a která se nepoužijí? Jak bude vypadat realistický model měření, kolik parametrů se bude odhadovat?

Ukázky modelů v Mplus – příprava modelu CFA