SEM J.Hendl a P. Soukup
SEM a možné zdroje informací Česky Knihy: Urbánek.2000. Strukturní modelování.Psychologický ústav AV ČR Hendl. 2009. Přehled kvantitativních metod zpracování dat. Portál McDonald.1991. faktorová analýza a příbuzné metody v psychologii.Academia články: Matějů.1989. Matějů, P. 1989. „Metoda strukturního modelování. Přehled základních problémů“.Sociologický časopis 25 (4): 399–418.
SEM a možné zdroje informací Anglicky Knihy (dostupné na SOU či FSV): Kline.2005. Principles and practice of structural equation modeling. New York : Guilford Press Byrne. 2001. Structural equation modeling with AMOS :basic concepts, applications, and programming. New Jersey: Lawrence Erlbaum Maruyama.1998. Basics of structural equation modeling. Sage Publications Raykov and Marcoulides.2006. A first course in structural equation modeling. Mahwah : Lawrence Erlbaum Associates Schumacker and Lomax.2004.A beginner’s guide to structural equation modeling. Mahwah : Lawrence Erlbaum Associates články: Časopis Structural Equation Modeling Dobrý úvod v AMOS na webu:http://faculty.chass.ncsu.edu/garson/PA765/structur.htm
Cíle Co to je modelování pomocí strukturních rovnic (SEM)? - Structural equation modeling - Proč potřebujeme SEM? Co to je AMOS? What do you do when traditional analytical techniques such as regression don't tell the whole story? Many researchers are using structural equation modeling (SEM) to go beyond traditional techniques to explore complex relationships such as latent proměnné, mediating efekty a multi-group analýza.
Co to je SEM? Obecný přístup k mnohorozměnné analýze, který se používá k prozkoumání komplexních závislostí mezi proměnnými Rozšiřuje standardní techniky jako je regresní a faktorová analýza Používá manifestní (pozorované) a latentní (nepozorované) proměnné
Proč SEM? K přezkoumání vztahů a testování hypotéz- verifikace , zda proměnné se vzájemně ovlivňují předpokládaným způsobem a jak silně Testují se komplexní vztahy- používáme latentní a manifestní proměnné Porovnání skupin nebo k provedení analýzy longitudinálních výzkumů Omezení na hodnoty parametrů k upřesnění modelů
Stručný statistický základ Vztah mezi regresní analýzou a úsekovou analýzou What do you do when traditional analytical techniques such as regression don't tell the whole story? Many researchers are using structural equation modeling (SEM) to go beyond traditional techniques to explore complex relationships such as latent proměnné, mediating efekty a multi-group analýza.
Připomínka: Korelace a regrese Korelace měří sílu a směr vztahu mezi dvěma nebo více proměnnými. Jednoduchá regresní analýza se zabývá, jak pomocí jedné proměnné (X) predikovat druhou závisle proměnnou (Y). E
Vícen. regrese Mnohonásobná regrese analyzuje možnost predikovat pomocí více proměnných závisle proměnnou (Y). Tato metoda má výhody, protože málokdy můžeme vysvětlit závisle proměnnou pouze pomocí jedné proměnné. Y' = a + b1X1 +b2X2 +b3X3
Úseková analýza, analýza korelačních cest Jde o rozšíření regresní analýzy. V tomto typu analýzy pracujeme s pozorovatelnými proměnnými a snažíme se predikovat pomocí množiny proměnných predikovat jinou množinu proměnných.. Je zapotřebí vysvětlit několik pojmů E E
Úseková analýza Měřené proměnné Exogenní proměnné Endogenní proměnné Přímé efekty Nepřímé efekty Chyba predikce E E E
Definice pojmů Měřené proměnné Proměnné, které výzkumník měřil nebo pozoroval. V grafech se označují čtverci nebo obdélníky V úsekové analýze jsou všechny proměnné měřené. E
Definice pojmů Exogenní proměnné Exogenní proměnné jsou takové, které v modelu nevysvětlujeme. V příkladu úsekové analýzy máme dvě exogenní proměnné: X1 a X2. E
Definice pojmů Endogenní proměnné Endogenní proměnné jsou takové, které v modelu vysvětlujeme. V příkladu úsekové analýzy máme dvě endogenní proměnné: Y1 a Y2. E
Definice pojmů Přímé efekty Přímé efekty jsou takové parametry , které odhadují "přímý" efekt dané proměnné na druhou. Označují se šipkou, která směřuje od jedné proměnné ke druhé proměnné. V našem modelu máme čtyři přímé efekty E
Definice pojmů Nepřímé efekty Nepřímé efekty jsou takové, kdy ovlivnění proměnnou druhé proměnné se děje zprostředkovaně pomocí třetí proměnné. V našem modelu X1 a X2, mají přímé efekty na Y1 a nepřímé efekty na Y2 prostřednictím Y1. E
Definice pojmů Chyba v predikci: V každém predikčním modelu máme chyby. Existují chyby při predikci Y1 a Y2. E
Rovnice Jaké jsou rovnice ? Jaké parametry odhadujeme ? E
Faktorová analýza (CFA a EFA) Faktorová analýza je základem modelování pomocí strukturních rovnic. Faktorová analýza zkoumá závislosti mezi proměnnými, zda je možné je seskupit do menšího množství faktorů.
Aplikace faktorové analýzy Rozeznáváme tři faktorové analýzy: Explorování dat a hledání konfigurací. Exploratorní faktorová analýza odhaluje vzorce mezi závislostmi položek. Datová redukce: Redukuje se velké množství proměnných do malého přehledného počtu faktorů. Faktorová analýza může počítat faktorové skóry a přiřazovat tedy hodnoty novým proměnným. Potvrzení hypotéz o faktorové struktuře. Testují se různé předpokládané hypotézy o struktuře faktorů.
Exploratorní faktorová analýza Konfirmační faktorová analýza
Modelování pomocí strukturních rovnic SEM SEM model sestává ze dvou částí: Model měření Konfirmační faktorová analýza Strukturní model Model s latentními proměnnými predikující ostatní latentní proměnné
KFA SM KFA I2 I1 X 1 I3 I4 2 Y I6 I5 E
Model strukturních rovnic Má dvě složky: Model měření nebo modely měření V našem jsou dva. Vlastně se jedná of CFA. Strukturní model Týká se latentních proměnných.
CFA CFA I1 E X 1 I2 I5 E E Y 1 I6 E I3 E X 2 I4 E
Strukturní model Strukturní model popisuje: Přímé efekty dvou latentních proměnných na jednu latentní proměnou Dvě exogenní latentní proměnné Jedná endogenní latentní proměnná Chyba v predikci
SM X 1 Y 1 X 2 E
CFA SM CFA I2 I1 X 1 I3 I4 2 Y I6 I5 E
CFA – základní model Máme předpoklad (model) o faktorové struktuře (jeden faktor, dva faktory nezávislé, dav faktory provázané atd.) Data (indikátory) jsou spojité a pokud možno normálně rozdělené (nebo se aspoň blíží Máme data nebo aspoň kovarianční matici (možnost sekundární analýzy) 29
CFA – základní postup Model a data – zadání Vyhodnocení modelu a jeho částí Zvážení úpravy modelu Alternativa: porovnání několika málo konkurenčních modelů 30
CFA – rovnice a graficky 1 faktor a 2 indikátory 1 faktor a 3 indikátory 1 faktor a 4 indikátory ? Poučení ? 31
CFA – vyhodnocení Testy Rezidua Kritéria 32
Testy v CFA Celkový test χ2 Založen na srovnání kovarianční matice v našich datech a té kterou generuje model (observed and implied) U velkých N nepoužitelný (citlivý), proto se k němu moc nepřihlíží Základem pro kritéria (viz dále) 33
Testy v CFA Celkový test χ2 Založen na srovnání kovarianční matice v našich datech a té kterou generuje model (observed and implied) Vychází z počtu stupňů volnosti (počet rovnic – počet odh. parametrů) Někdy se užívá v rel. podobě – tj. výsledek dělíme df a chceme, aby podíl byl blízký 1 (doporučení do cca 2-3, naopak pod 1 je již mode přeurčen) 34
Kritéria v CFA (I) Absolutní, relativní, nebo informační Z relativních užívá MPlus TLI a CFI Mezi 0 a 1, doporučené hodnoty aspoň 0,9 lépe nad 0,95 35
Kritéria v CFA (II) Absolutní (měří chybu) V MPlus RMSEA Mezi 0 a 1, doporučené hodnoty max. 0,08 36
Kritéria v CFA (III) Informační (měří kvalitu a složitost modelu), složitější modely penalizovány V MPlus AIC a BIC Nemají žádnou škálu Slouží k porovnání modelů, doporučení: čím menší, tím lepší, rozdíl o 10 už značí lepší model k – počet parametrů 37
Další problémy Nenormalita dat (hodně sešikmená, špičatá) Data jsou binární, nominální či ordinální (Mplus umí elegantně) Chybějící data (dnes neřešíme, ale základní ML algoritmus si uspokojivě poradí) 38
Souhrn SEM Pro zkoumání komplexních modelů a vztahů mezi postoji, vnímáním a ostatními faktory chování Rozšiřuje běžné techniky regresní a faktorové analýzy Pro konfirmaci a testování hypotéz o vztahu proměnných
Konfirmační FA (I) – 1 faktor DATA: FILE IS spss_mplus2.dat; VARIABLE: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); MODEL: F1 by preroz vlastnik pracuji tradice smrt autor OUTPUT: sampstat modindices standardized; 40
Konfirmační FA (II) – 2 nez. faktory DATA: FILE IS mplus2.dat; variable: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); Model: F1 by preroz vlastnik pracuji; f2 by tradice smrt autor; f2 with f1 @0 !fixujeme vazbu na hodnotu nula, tj. predpokladame nezavislost faktoru. OUTPUT: sampstat standardized modindices (4); Srovnání s SPSS nelze Lepší než předchozí model, ale stále nic moc 41
Konfirmační FA (III) – 2 záv. faktory DATA: FILE IS mplus2.dat; variable: names are preroz vlastnik pracuji tradice smrt autor; MISSING ARE ALL (-1); Model: F1 by preroz vlastnik pracuji; f2 by tradice smrt autor; !kdyz vypustime fixaci je spoctena vazba mezi faktory, je predpokladana jako default. OUTPUT: sampstat standardized modindices (4); Srovnání s SPSS nelze, tento model je uz slusny 42