Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Víceúrovňové modely Aneb kontextuální analýza v současnosti.

Podobné prezentace


Prezentace na téma: "Víceúrovňové modely Aneb kontextuální analýza v současnosti."— Transkript prezentace:

1 Víceúrovňové modely Aneb kontextuální analýza v současnosti

2 3 možné strategie práce s kontextuáními daty 1) Klasická jednoúrovňová analýza – regrese, ANOVA, ANCOVA atd. na úrovni jedinců 2) Analýza na úrovni vyšších celků – Ecological inference 3) víceúrovňová analýza pracující s daty z jedince i kontext

3 Základní otázky v lineární regresi Lze nalézt lineární vztah mezi proměnnými? Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky U více nezávislých proměnných se nabízí i další otázky

4 Regresní úkol a interpretace parametrů snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese- konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku) význam parametrů u lineární regrese- konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)

5 !!!Regrese předpoklady!!! Normalita závislé i nezávislých proměnných viz např procedura Explore v Analyze-Descriptives), nezávislá proměnná může být i dichotomická (nikdy ale ne ordinální či nominální) Normalita závislé i nezávislých proměnných viz např procedura Explore v Analyze-Descriptives), nezávislá proměnná může být i dichotomická (nikdy ale ne ordinální či nominální) Nekorelovanost nezávislých proměnných (opak multikolinearita) Nekorelovanost nezávislých proměnných (opak multikolinearita) Nezávislost jednotlivých pozorování - tedy prostý náhodný výběr Nezávislost jednotlivých pozorování - tedy prostý náhodný výběr Homoskedasticita a nekorelovanost náhodné složky Homoskedasticita a nekorelovanost náhodné složky

6 Metody odhadu parametrů metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální

7 Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) R 2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné R 2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

8 Regrese v SPSS-závislost příjmu na počtu let vzdělání RSquare- po vynásobení stem jde o procento vysvětleného rozptylu RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

9 Regrese v SPSS-závislost příjmu na počtu let vzdělání F-test Ho: Model není dobrý H1: Lze ho použít F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)

10 Regrese v SPSS-závislost příjmu na počtu let vzdělání T-testy pro jednotlivé proměnné Ho: Proměnná do modelu T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

11 Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví Z hodnot v tabulce lze napsat rovnici: Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání *pohlaví(je muž) Příjem= * roky vzdělání *pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má v průměru o 3800 Kč více Obě proměnné v modelu správně

12 Kontextuální analýza Proměnné na úrovni jednotlivců: absolutní (absolute), absolutní (absolute), vztahové (relational), vztahové (relational), porovnávací (comparative) a porovnávací (comparative) a kontextuální (contextual) kontextuální (contextual)

13 Kontextuální analýza Proměnné na úrovni vyšších celků: Analytické (analytical) Analytické (analytical) Strukturní (structural) a Strukturní (structural) a Globální (global) Globální (global)

14 Kontexty běžné pro analýzu dat PříkladČlen kolektivity (úroveň 1) Kolektivita (úroveň 2) Kolektivita vyššího řádu (úroveň 3) Školyžáktřídaškola SousedéjedinecsousedstvíRegion Náboženstvíjedinecnáboženské společen ství Církev Regionyjedinecokreskraj

15 Vznik jednotlivých typů proměnných (úroveň 1) (úroveň 2) (úroveň 3) AbsolutníA→AnalytickáA→Analytická VztahováA→StrukturníA→Strukturní PorovnávacíA→AnalytickáA→Analytická GlobálníA→Analytická ←DKontextuální ←DKontextuální A→ znamená, že z proměnné umístěné vlevo vzniká proměnná vpravo agregací ←D znamená, že proměnná umístěná vpravo se užívá na nižší úrovni za pomoci procesu opačnému k agregaci (desagregace).

16 Víceúrovňové modely-motivace a) teoretickometodologická (Kontextuální analýza) [Lazarsfeld, Menzel 1961] členění proměnných do těchto typů: globální (global), vztahové (relational), kontextuální (contextual), analytické a strukturní [Lazarsfeld, Menzel 1961] členění proměnných do těchto typů: globální (global), vztahové (relational), kontextuální (contextual), analytické a strukturní na první úrovni (u jednotlivců) má smysl se zabývat prvními třemi typy proměnných, na druhé (a vyšších úrovních) již všemi uvedenými typy na první úrovni (u jednotlivců) má smysl se zabývat prvními třemi typy proměnných, na druhé (a vyšších úrovních) již všemi uvedenými typy Přehlížení kontextu např. Robinsův efekt [Robinson 1950], který vzniká při izolované práci s agregovanými daty ale i známý Simpsonův paradox popsaný ve většině učebnic věnovaných analýze kategoriálních dat, česky například u Hendla [Hendl 2004: 330-4]. Přehlížení kontextu např. Robinsův efekt [Robinson 1950], který vzniká při izolované práci s agregovanými daty ale i známý Simpsonův paradox popsaný ve většině učebnic věnovaných analýze kategoriálních dat, česky například u Hendla [Hendl 2004: 330-4].

17 Víceúrovňové modely-jazyk V angličtině se využívá několik ekvivalentů V angličtině se využívá několik ekvivalentů multilevel modeling (nejužívanější), multilevel modeling (nejužívanější), random-coefficient modeling, random-coefficient modeling, hierarchical modeling, hierarchical modeling, mixed-effects modeling, mixed-effects modeling, covariance components models covariance components models

18 Obrázek 1 (Stejné konstanty, stejné směrnice)

19 Obrázek 2 (Různé konstanty, stejné směrnice)

20 Obrázek 3 (Stejné konstanty, různé směrnice)

21 Obrázek 4 (Různé konstanty, různé směrnice)

22 Víceúrovňové modely-motivace Problém různého vztahu ve skupinách a jeho regresního modelování Pokud chceme za pomoci jedné (agregované) regresní rovnice řešit vztah proměnných (při existenci dvou skupin), potom v případech na obrázcích 1 a 2 s klasickou regresí vystačíme. V případě zachyceném na druhém obrázku je třeba dát do modelu dichotomickou proměnnou zachycující pohlaví Pokud chceme za pomoci jedné (agregované) regresní rovnice řešit vztah proměnných (při existenci dvou skupin), potom v případech na obrázcích 1 a 2 s klasickou regresí vystačíme. V případě zachyceném na druhém obrázku je třeba dát do modelu dichotomickou proměnnou zachycující pohlaví

23 Problém různého vztahu ve skupinách - pokračování Velmi často (vždy?) se setkáváme s případy na obrázcích 3 a 4 (resp. nejčastěji s případy na obrázku 4). Co se stane, pokud v těchto případech ignorujeme různý vztah pro muže a ženy, naznačují opět slabší nepřerušované regresní přímky. Velmi často (vždy?) se setkáváme s případy na obrázcích 3 a 4 (resp. nejčastěji s případy na obrázku 4). Co se stane, pokud v těchto případech ignorujeme různý vztah pro muže a ženy, naznačují opět slabší nepřerušované regresní přímky. V realitě je běžně sledovaných skupin více a problém se jen komplikuje a volá po víceúrovňové analýze V realitě je běžně sledovaných skupin více a problém se jen komplikuje a volá po víceúrovňové analýze

24 Problém jednoúrovňové analýzy rozptylu Skupiny, v nichž se vztahy liší, jsou náhodně vybrány ze základního souboru. Příkladem může být náhodný výběr několika škol, ve kterých jsou potom náhodně vybráni žáci Skupiny, v nichž se vztahy liší, jsou náhodně vybrány ze základního souboru. Příkladem může být náhodný výběr několika škol, ve kterých jsou potom náhodně vybráni žáci Chceme-li ale zobecnit závěry na všechny školy v ČR a hledat faktory které způsobují odlišnost škol, nevystačíme již s klasickou analýzou rozptylu. Opět nám úlohu může pomoci vyřešit víceúrovňové modelování, které se zaměřuje na modelování vztahů na úrovni jedinců (mikroúrovni) i na modelování rozdílů mezi jednotlivými skupinami Chceme-li ale zobecnit závěry na všechny školy v ČR a hledat faktory které způsobují odlišnost škol, nevystačíme již s klasickou analýzou rozptylu. Opět nám úlohu může pomoci vyřešit víceúrovňové modelování, které se zaměřuje na modelování vztahů na úrovni jedinců (mikroúrovni) i na modelování rozdílů mezi jednotlivými skupinami

25 Jak poznat kdy má víceúrovňové modelování smysl? Pokud byl výběr vícestupňový pak bychom měli již díky narušení předpokladu nezávislosti pozorování použít víceúrovňové modely téměř automaticky Pokud byl výběr vícestupňový pak bychom měli již díky narušení předpokladu nezávislosti pozorování použít víceúrovňové modely téměř automaticky Pomůcka, která nám napoví je ICC (vnitrotřídní korelační koeficient) Pomůcka, která nám napoví je ICC (vnitrotřídní korelační koeficient) ICC je založen na rozkladu rozptylu na první a druhou (třetí atd.) úroveň, tedy jako v analýze rozptylu na vnitro a meziskupinový rozptyl ICC je založen na rozkladu rozptylu na první a druhou (třetí atd.) úroveň, tedy jako v analýze rozptylu na vnitro a meziskupinový rozptyl

26 Stručná poznámka o tříúrovňových modelech Obecně lze modelovat více úrovní než pouze dvě Obecně lze modelovat více úrovní než pouze dvě V případě tří úrovní můžeme vysvětlovat změny v proměnných druhé úrovně za pomoci proměnných na třetí úrovni V případě tří úrovní můžeme vysvětlovat změny v proměnných druhé úrovně za pomoci proměnných na třetí úrovni Lze nechat náhodně variovat nejen proměnné první ale i druhé úrovně Lze nechat náhodně variovat nejen proměnné první ale i druhé úrovně Je zřejmé, že narůstá složitost modelu a bohužel také klesá stabilita nelezeného řešení Je zřejmé, že narůstá složitost modelu a bohužel také klesá stabilita nelezeného řešení Navíc rostou požadavky na velikost výběrového souboru-na každé úrovni musíme mít dostatečný počet pozorování (jednotek) Navíc rostou požadavky na velikost výběrového souboru-na každé úrovni musíme mít dostatečný počet pozorování (jednotek) V praxi převažují dvouúrovňové modely, v případě speciálních studií s mnohatisícovými vzorky tříúrovňové, více úrovní se nepoužívá, ač teoreticky to samozřejmě není vyloučeno (a existují i software pro takovéto modely) V praxi převažují dvouúrovňové modely, v případě speciálních studií s mnohatisícovými vzorky tříúrovňové, více úrovní se nepoužívá, ač teoreticky to samozřejmě není vyloučeno (a existují i software pro takovéto modely)

27 Problémy řešitelné víceúrovňově Modely růstu (growth models) U modelu růstu máme změřenou určitou vlastnost ve více časových okamžicích u různých jedinců. Měření v různých časových okamžicích můžeme považovat za první úroveň (stejně tak jako jednotlivé žáky ve škole) a jedince za druhou úroveň, tak jako školy. Výsledkem modelů růstu může být jednak zjištění, zda obecně dochází k nárůstu či poklesu sledované vlastnosti, zda se jedinci liší v růstových křivkách mezi sebou U modelu růstu máme změřenou určitou vlastnost ve více časových okamžicích u různých jedinců. Měření v různých časových okamžicích můžeme považovat za první úroveň (stejně tak jako jednotlivé žáky ve škole) a jedince za druhou úroveň, tak jako školy. Výsledkem modelů růstu může být jednak zjištění, zda obecně dochází k nárůstu či poklesu sledované vlastnosti, zda se jedinci liší v růstových křivkách mezi sebouMetaanalýza 1. úroveň data z jednotlivých studií 1. úroveň data z jednotlivých studií 2. úroveň jednotlivé studie 2. úroveň jednotlivé studieCíle: 1. najít společný („průměrný“) výsledek všech nalezených studií a 1. najít společný („průměrný“) výsledek všech nalezených studií a 2. odhalit příčiny rozdílů mezi studiemi 2. odhalit příčiny rozdílů mezi studiemi

28 Další problémy řešitelné víceúrovňově Modely se smíšenými hierarchiemi (Cross classified models) jedinec není zařazen jen do jedné skupiny která ho výrazněji ovlivňuje, ale do mnoha skupin a vlivy jednotlivých skupin se kříží jedinec není zařazen jen do jedné skupiny která ho výrazněji ovlivňuje, ale do mnoha skupin a vlivy jednotlivých skupin se kříží Víceúrovňové strukturní modely Modely s latentními a manifestními proměnnými Modely s latentními a manifestními proměnnými Víceúrovňové modely IRT (psychologie)

29 Možné zdroje informací Kreft, I. G., J. de Leeuw Introducing multilevel modeling. London : Sage. Snijders, Tom A.B., Roel J.Bosker Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling. London: Sage Publisher. Hox, J Applied Multilevel Analysis: Techniques and Applications. Erlbaum associates. Raudenbush, S. W., A.S. Bryk Hierarchical Linear Models 2nd edition. London: Sage Publications.

30 Poznámky o software Speciální pakety: HLM –existuje zdarma studentská verze HLM –existuje zdarma studentská verze MLWin MLWin Mplus Mplus MIXOR/MIXREG MIXOR/MIXREG Obecné statistické pakety: SAS-zřejmě nejlepší SAS-zřejmě nejlepší SPSS (od verze 11)-jen lineární modely SPSS (od verze 11)-jen lineární modely STATA-pouze dvě úrovně STATA-pouze dvě úrovně


Stáhnout ppt "Víceúrovňové modely Aneb kontextuální analýza v současnosti."

Podobné prezentace


Reklamy Google