Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

ANALÝZA LATENTNÍCH TŘÍD

Podobné prezentace


Prezentace na téma: "ANALÝZA LATENTNÍCH TŘÍD"— Transkript prezentace:

1 ANALÝZA LATENTNÍCH TŘÍD
1

2 Literatura McCutcheon 1987. Latent Class analysis.Sage (viz sken)
Hauberer, J Latent class analysis in Jeřábek, Soukup (2008). Advanced Lazarsfeldian Methodology. Karolinum

3 HISTORICKÝ EXKURZ 3

4 Vznik LCA základní idea: P.F. Lazarsfeld v 50. letech 20. století
reakce na skutečnost, že většina měření v sociálních vědách (zejména sociologii) nemá charakter intervalové či poměrové škály chování lidí je ovlivněno strukturami stojícími v pozadí, které nelze přímo měřit (latentními) a tyto struktury Lazarsfeld nazývá latentní struktury Vzniká Analýza latentních struktur (LSA) LSA je omezena jen na dichotomické proměnné

5 Vznik LCA Rozvinutí pro případ položek, které mají více než 2 kategorie Hlavní autoři: Leo Goodman, Haberman a Clogg Základní cíl LCA: umožňuje nalézt k latentních tříd ze dvou či více pozorovaných proměnných kategoriální povahy Základní rovnice: , pravděpodobnost odpovědi I na položku A, kde i = 1, 2, ..., I a odpovědi j na položku B, kde j = 1, 2, ., J; a náležení do jedné z latentních tříd, kde t = 1,2, ...,T. Další složky jsou pravděpodobnost přináležení do lat. třídy a odpovědi na A či B při přináležení do lat. třídy

6 Statistické pojetí LCA
Nutno odhadnout pravděpodobnosti na pravé straně rovnice Výsledky (odhadnuté parametry) nutno interpretovat: tj. určit velikosti tříd ( z nepodmíněných pravděpodobností) a „význam“ tříd ( z podmíněných pravděpodobností)

7 Srovnání LCA a FA I FA LCA Manif. a lat. proměnné ANO
Char. man. proměnné spojitá nom. či ord. Char. lat.proměnné Spojitá (faktor) Nominální (třída) Zdrojová data Korelační matice Kontingenční tabulka

8 Srovnání LCA a FA II Pojem FA LCA Způsob měření souv.
Pearsonova korelace Pravděpodobnost spoluvýskytu Označení lat. Prom. Faktor Latentní proměnná Vazba mezi lat. prom. a man. Faktorová zátěž Podmíněná pravděpodobnost určité odpovědi na položku při přináležení do třídy t Hodnota lat. proměnné Faktorové skóre Latentní třída

9 Dvě varianty LCA Explorační LCA – cílem je zjistit kolik tříd je v datech a udělat zákaldní popis tříd Konfirmační LCA – cílem je otestovat model (například existenci 3 tříd), případně lze specifikovat různá omezení modelu (konkrétní velikost jedné či více tříd, shodu podmíněných pravděpodobností v různých třídách, jejich určitou velikost apod.) Poznámka: LCA lze využívat i pro škálování (mimo naší lekci)

10 DETAILY VÝPOČTU 10

11 Vstupní data Několik nominálních či ordinálních proměnných
Předpoklad, že získaná data reprezentují v pozadí stojící latentní třídy Nutno mít dostatečný počet kombinací, aby bylo mžné odhadnout všechny pravděpodobnosti přináležení do tříd a podmíněných pravděpodobností jednotlivých odpovědí

12 Odhad parametrů Nejužívanější ML
Nutno mít prvotní odhady parametrů (SW umí tyto stanovit) Iterační postup pro výpočet odhadu (EM algoritmus) Problém lokálního minima (díky tomu se odhad provádí s různými počátečními hodnotami a zjišťuje se shoda jednotlivých výsledků – při neshodě nutno navýšit počet těchto počátečních hodnot)

13 Odhad parametrů – iterace EM

14 Odhad parametrů – iterace EM

15 Výstupy LCA Pravděpodobnost přináležení do tříd
Podmíněná pravděpodobnost odpovědi na položku při přináležení do latentní třídy Možno vyžádat též zařazení jedince do latentní třídy (uloží se do dat) Základní charakteristiky vhodnosti modelu: Chi-kvadrát test či LR test AIC či BIC – problém různosti doporučení Entropie Průměrné pravděpodobnosti (úspěšnost klasifikace)

16 Praktický příklad 16

17 Příklad Hledání latentních tříd vztahu ke čtení
Data: PIRLS 2011 pro ČR (žáci 4. třídy ZŠ) 6 výroků o čtení Předpoklad: existence minimálně dvou skupin dětí dle vztahu ke čtení (mají vs. nemají rádi) Explorační průzkum dat a stanovení počtu tříd

18 Zadání v Mplus – ukázka 3 tříd
DATA: FILE IS postojecte.dat; variable: names are id must talk present boring more enjoy must1 talk1 present1 boring1 more1 enjoy1 pohl w; auxiliary=id; !pomocna id promenna potrebvna pro ulozenoi trid MISSING ARE ALL (9); weight is w; !pouziti vahy v datech usev are must1 talk1 present1 boring1 more1 enjoy1; categorical are must1 talk1 present1 boring1 more1 enjoy1; classes=c(3); !nazev promenne pro lat. tridy a jejich pocet analysis: type=mixture; !pro LCA nutno zadat mixture plot: type=plot3; !pozadavek na grafy podm. pravdepodobnosti series=must1(1) talk1(2) present1(3) boring1(4) more1(5) enjoy1 (6); save: file=pirls3classes.dat; !ulozueni dat vc. tridni prislusnosti Save=cprobabilities;

19 Software 19

20 LCA v software Starší programy: MLLSA (Maximum Likelihood Latent Structure Analysis) vyvinutý Cloggem, dále LAT napsaný Habermanem (1979, Appendix 2) a dále LCAG (Hagenaars, Luijkx 1990 V současnosti se užívají zejména: lEM, Mplus a LatentGold. Kromě speciálních produktů je možné používat analýzu latentních tříd i v některých statistických paketech, zejména v SAS. lEM je freeware, ostatní je placené Autorem lEM i LatentGold je Vermunt, asi největší žijící odborník LCA

21 Zadání v MPlus DATA: FILE IS postojecte.dat;
variable: names are id must talk present boring more enjoy must1 talk1 present1 boring1 more1 enjoy1 pohl w; auxiliary=id; MISSING ARE ALL (9); weight is w; usev are must1 talk1 present1 boring1 more1 enjoy1; categorical are must1 talk1 present1 boring1 more1 enjoy1; classes=c(3); analysis: type=mixture; plot: type=plot3; series=must1(1) talk1(2) present1(3) boring1(4) more1(5) enjoy1 (6); save: file=pirls3classes.dat;

22 Zadání v MPlus Další finty: 1) Do dekce analysis
Starts = ; !navysi počet nahodnych staru rpo iterace (1. krok 500, 2. krok 50) Siterations =50; !navysi počet iterac9 na max. 50 Nastavení vhdoné cca od 4 latentních tříd 2) Do sekce output: Tech10; !vygeneruje hodnoty rezidui – rozdil mezi skutecnou a odhadnutou cetnosti 22

23 PŘÍBUZNÍ LCA 23

24 Podobné techniky k LCA Loglineární analýza Logitová analýza
Podobnosti a odlišnosti


Stáhnout ppt "ANALÝZA LATENTNÍCH TŘÍD"

Podobné prezentace


Reklamy Google