SEM J.Hendl a P. Soukup.

Slides:



Advertisements
Podobné prezentace
4EK211 Základy ekonometrie Modely simultánních rovnic Problém identifikace strukturních simultánních rovnic Cvičení / Zuzana.
Advertisements

Použité statistické metody
Testování neparametrických hypotéz
Cvičení 6 – 25. října 2010 Heteroskedasticita
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
SEM 12. Přednáška Petr Soukup.
Analýza variance (Analysis of variance)
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Testování hypotéz (ordinální data)
Hypotézy ve výzkumu.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Testování hypotéz vymezení důležitých pojmů
Základy ekonometrie Cvičení září 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Mnohonásobné imputace chybějících hodnot
Vybrané multivariační techniky
Lineární regrese.
Statistika Zkoumání závislostí
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Princip maximální entropie
Základy zpracování geologických dat
Metrologie   Přednáška č. 5 Nejistoty měření.
Základy ekonometrie 4EK211
1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
TECHNIKY SBĚRU DAT KVANTITATIVNÍ KVALITATIVNÍ VÝZKUM VÝZKUM
Statistická významnost a její problémy
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Biostatistika 1. přednáška Aneta Hybšová
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
MPlus – jak na to? P. Soukup.
1. cvičení
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
IV..
Aplikovaná statistika 2.
Základy zpracování geologických dat R. Čopjaková.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Historická sociologie, Řízení a supervize
Co se dá změřit v psychologii a pedagogice?
SEM J.Hendl a P. Soukup.
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
PSY252 Statistická analýza dat v psychologii II
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Pokročilé neparametrické metody Validační techniky
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Transkript prezentace:

SEM J.Hendl a P. Soukup

SEM a možné zdroje informací Česky Knihy: Urbánek.2000. Strukturní modelování.Psychologický ústav AV ČR Hendl. 2009. Přehled kvantitativních metod zpracování dat. Portál McDonald.1991. faktorová analýza a příbuzné metody v psychologii.Academia články: Matějů.1989. Matějů, P. 1989. „Metoda strukturního modelování. Přehled základních problémů“.Sociologický časopis 25 (4): 399–418.

SEM a možné zdroje informací Anglicky Knihy (dostupné na SOU či FSV): Kline.2005. Principles and practice of structural equation modeling. New York : Guilford Press Byrne. 2001. Structural equation modeling with AMOS :basic concepts, applications, and programming. New Jersey: Lawrence Erlbaum Maruyama.1998. Basics of structural equation modeling. Sage Publications Raykov and Marcoulides.2006. A first course in structural equation modeling. Mahwah : Lawrence Erlbaum Associates Schumacker and Lomax.2004.A beginner’s guide to structural equation modeling. Mahwah : Lawrence Erlbaum Associates články: Časopis Structural Equation Modeling Dobrý úvod v AMOS na webu:http://faculty.chass.ncsu.edu/garson/PA765/structur.htm

Cíle Co to je modelování pomocí strukturních rovnic (SEM)? - Structural equation modeling - Proč potřebujeme SEM? Co to je AMOS? What do you do when traditional analytical techniques such as regression don't tell the whole story? Many researchers are using structural equation modeling (SEM) to go beyond traditional techniques to explore complex relationships such as latent proměnné, mediating efekty a multi-group analýza.

Co to je SEM? Obecný přístup k mnohorozměnné analýze, který se používá k prozkoumání komplexních závislostí mezi proměnnými Rozšiřuje standardní techniky jako je regresní a faktorová analýza Používá manifestní (pozorované) a latentní (nepozorované) proměnné

Proč SEM? K přezkoumání vztahů a testování hypotéz- verifikace , zda proměnné se vzájemně ovlivňují předpokládaným způsobem a jak silně Testují se komplexní vztahy- používáme latentní a manifestní proměnné Porovnání skupin nebo k provedení analýzy longitudinálních výzkumů Omezení na hodnoty parametrů k upřesnění modelů

Stručný statistický základ Vztah mezi regresní analýzou a úsekovou analýzou What do you do when traditional analytical techniques such as regression don't tell the whole story? Many researchers are using structural equation modeling (SEM) to go beyond traditional techniques to explore complex relationships such as latent proměnné, mediating efekty a multi-group analýza.

Připomínka: Korelace a regrese Korelace měří sílu a směr vztahu mezi dvěma nebo více proměnnými. Jednoduchá regresní analýza se zabývá, jak pomocí jedné proměnné (X) predikovat druhou závisle proměnnou (Y). E

Vícen. regrese Mnohonásobná regrese analyzuje možnost predikovat pomocí více proměnných závisle proměnnou (Y). Tato metoda má výhody, protože málokdy můžeme vysvětlit závisle proměnnou pouze pomocí jedné proměnné. Y' = a + b1X1 +b2X2 +b3X3

Úseková analýza, analýza korelačních cest Jde o rozšíření regresní analýzy. V tomto typu analýzy pracujeme s pozorovatelnými proměnnými a snažíme se predikovat pomocí množiny proměnných predikovat jinou množinu proměnných.. Je zapotřebí vysvětlit několik pojmů E E

Úseková analýza Měřené proměnné Exogenní proměnné Endogenní proměnné Přímé efekty Nepřímé efekty Chyba predikce E E E

Definice pojmů Měřené proměnné Proměnné, které výzkumník měřil nebo pozoroval. V grafech se označují čtverci nebo obdélníky V úsekové analýze jsou všechny proměnné měřené. E

Definice pojmů Exogenní proměnné Exogenní proměnné jsou takové, které v modelu nevysvětlujeme. V příkladu úsekové analýzy máme dvě exogenní proměnné: X1 a X2. E

Definice pojmů Endogenní proměnné Endogenní proměnné jsou takové, které v modelu vysvětlujeme. V příkladu úsekové analýzy máme dvě endogenní proměnné: Y1 a Y2. E

Definice pojmů Přímé efekty Přímé efekty jsou takové parametry , které odhadují "přímý" efekt dané proměnné na druhou. Označují se šipkou, která směřuje od jedné proměnné ke druhé proměnné. V našem modelu máme čtyři přímé efekty E

Definice pojmů Nepřímé efekty Nepřímé efekty jsou takové, kdy ovlivnění proměnnou druhé proměnné se děje zprostředkovaně pomocí třetí proměnné. V našem modelu X1 a X2, mají přímé efekty na Y1 a nepřímé efekty na Y2 prostřednictím Y1. E

Definice pojmů Chyba v predikci: V každém predikčním modelu máme chyby. Existují chyby při predikci Y1 a Y2. E

Rovnice Jaké jsou rovnice ? Jaké parametry odhadujeme ? E

Faktorová analýza (CFA a EFA) Faktorová analýza je základem modelování pomocí strukturních rovnic. Faktorová analýza zkoumá závislosti mezi proměnnými, zda je možné je seskupit do menšího množství faktorů.

Aplikace faktorové analýzy Rozeznáváme tři faktorové analýzy: Explorování dat a hledání konfigurací. Exploratorní faktorová analýza odhaluje vzorce mezi závislostmi položek. Datová redukce: Redukuje se velké množství proměnných do malého přehledného počtu faktorů. Faktorová analýza může počítat faktorové skóry a přiřazovat tedy hodnoty novým proměnným. Potvrzení hypotéz o faktorové struktuře. Testují se různé předpokládané hypotézy o struktuře faktorů.

Exploratorní faktorová analýza Konfirmační faktorová analýza

Modelování pomocí strukturních rovnic SEM SEM model sestává ze dvou částí: Model měření Konfirmační faktorová analýza Strukturní model Model s latentními proměnnými predikující ostatní latentní proměnné

KFA SM KFA I2 I1 X 1 I3 I4 2 Y I6 I5 E

Model strukturních rovnic Má dvě složky: Model měření nebo modely měření V našem jsou dva. Vlastně se jedná of CFA. Strukturní model Týká se latentních proměnných.

CFA CFA I1 E X 1 I2 I5 E E Y 1 I6 E I3 E X 2 I4 E

Strukturní model Strukturní model popisuje: Přímé efekty dvou latentních proměnných na jednu latentní proměnou Dvě exogenní latentní proměnné Jedná endogenní latentní proměnná Chyba v predikci

SM X 1 Y 1 X 2 E

CFA SM CFA I2 I1 X 1 I3 I4 2 Y I6 I5 E

CFA – základní model Máme předpoklad (model) o faktorové struktuře (jeden faktor, dva faktory nezávislé, dav faktory provázané atd.) Data (indikátory) jsou spojité a pokud možno normálně rozdělené (nebo se aspoň blíží Máme data nebo aspoň kovarianční matici (možnost sekundární analýzy) 29

CFA – základní postup Model a data – zadání Vyhodnocení modelu a jeho částí Zvážení úpravy modelu Alternativa: porovnání několika málo konkurenčních modelů 30

CFA – rovnice a graficky 1 faktor a 2 indikátory 1 faktor a 3 indikátory 1 faktor a 4 indikátory ? Poučení ? 31

CFA – vyhodnocení Testy Rezidua Kritéria 32

Testy v CFA Celkový test χ2 Založen na srovnání kovarianční matice v našich datech a té kterou generuje model (observed and implied) U velkých N nepoužitelný (citlivý), proto se k němu moc nepřihlíží Základem pro kritéria (viz dále) 33

Testy v CFA Celkový test χ2 Založen na srovnání kovarianční matice v našich datech a té kterou generuje model (observed and implied) Vychází z počtu stupňů volnosti (počet rovnic – počet odh. parametrů) Někdy se užívá v rel. podobě – tj. výsledek dělíme df a chceme, aby podíl byl blízký 1 (doporučení do cca 2-3, naopak pod 1 je již mode přeurčen) 34

Kritéria v CFA (I) Absolutní, relativní, nebo informační Z relativních užívá MPlus TLI a CFI Mezi 0 a 1, doporučené hodnoty aspoň 0,9 lépe nad 0,95 35

Kritéria v CFA (II) Absolutní (měří chybu) V MPlus RMSEA Mezi 0 a 1, doporučené hodnoty max. 0,08 36

Kritéria v CFA (III) Informační (měří kvalitu a složitost modelu), složitější modely penalizovány V MPlus AIC a BIC Nemají žádnou škálu Slouží k porovnání modelů, doporučení: čím menší, tím lepší, rozdíl o 10 už značí lepší model k – počet parametrů 37

Další problémy Nenormalita dat (hodně sešikmená, špičatá) Data jsou binární, nominální či ordinální (Mplus umí elegantně) Chybějící data (dnes neřešíme, ale základní ML algoritmus si uspokojivě poradí) 38

Souhrn SEM Pro zkoumání komplexních modelů a vztahů mezi postoji, vnímáním a ostatními faktory chování  Rozšiřuje běžné techniky regresní a faktorové analýzy Pro konfirmaci a testování hypotéz o vztahu proměnných

Konfirmační FA (I) – 1 faktor DATA: FILE IS spss_mplus2.dat; VARIABLE: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); MODEL: F1 by preroz vlastnik pracuji tradice smrt autor OUTPUT: sampstat modindices standardized; 40

Konfirmační FA (II) – 2 nez. faktory DATA: FILE IS mplus2.dat; variable: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); Model: F1 by preroz vlastnik pracuji; f2 by tradice smrt autor; f2 with f1 @0 !fixujeme vazbu na hodnotu nula, tj. predpokladame nezavislost faktoru. OUTPUT: sampstat standardized modindices (4); Srovnání s SPSS nelze Lepší než předchozí model, ale stále nic moc 41

Konfirmační FA (III) – 2 záv. faktory DATA: FILE IS mplus2.dat; variable: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); Model: F1 by preroz vlastnik pracuji; f2 by tradice smrt autor; !kdyz vypustime fixaci je spoctena vazba mezi faktory, je predpokladana jako default. OUTPUT: sampstat standardized modindices (4); Srovnání s SPSS nelze, tento model je uz slusny 42