PSY252 Statistická analýza dat v psychologii II

Slides:



Advertisements
Podobné prezentace
Analýza experimentu pro robustní návrh
Advertisements

Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Monte Carlo permutační testy & Postupný výběr
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
SB029 Dodatek k přednáškám Základy analýzy dat a SPSS
Lineární regresní analýza Úvod od problému
Analytické metody výzkumu
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Statistika Vypracoval: Mgr. Lukáš Bičík
Teorie psychodiagnostiky a psychometrie
Varianty výzkumu Kroky výzkumu Výběrový soubor
Hypotézy ve výzkumu.
Sociologický výzkum.
Řízení a supervize v sociálních a zdravotnických organizacích
Inference jako statistický proces 1
Základy ekonometrie Cvičení 3 4. října 2010.
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Vybrané multivariační techniky
Lineární regrese.
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Korelace a elaborace aneb úvod do vztahů proměnných
Jiří Šafr jiri.safr(zavináč)seznam.cz
ISS Chybějící hodnoty, standardizace Semináře ke kurzu Analytické metody výzkumu Jindřich Krejčí.
Lineární regrese.
Praktické využití regresní analýzy Struktura národního hospodářství a znečištění ovzduší v tranzitivních ekonomikách: Případ České republiky Gabriela Jandová.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Test dobré shody Fisherův přesný test McNemar test
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
Práce s výsledky statistických studií
Pohled z ptačí perspektivy
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Základy ekonometrie 4EK211
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Teorie psychodiagnostiky a psychometrie
Praktikum 4c: Tabulky, baterie otázek 16/5/08. Tabulky - metoda popisu dat.
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
PSY717 – statistická analýza dat
Teorie psychodiagnostiky a psychometrie
Aplikovaná statistika 2. Veronika Svobodová
IV..
Základy zpracování geologických dat R. Čopjaková.
CHISA 2011, Srní, října 2011 OBRAZOVÁ ANALÝZA – porovnání vlivu recepturního složení pečiva I. Švec, M. Hrušková, T. Hofmanová.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Opakování – přehled metod
Varianty výzkumu Kroky výzkumu Výběrový soubor
4. cvičení
Co se dá změřit v psychologii a pedagogice?
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
SEM J.Hendl a P. Soukup.
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
PSY252 Statistická analýza dat v psychologii II Seminář 9
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Neparametrické testy pro porovnání polohy
Lineární optimalizační model
Metodologie pro ISK 2 Úvod do práce s daty
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Lineární regrese.
Transkript prezentace:

PSY252 Statistická analýza dat v psychologii II 9.12.2009 Faktorová analýza PSY252 Statistická analýza dat v psychologii II 9.12.2009

Latentní a manifestní proměnné 13.11.2018 Latentní a manifestní proměnné Perspektiva CTT: (pro)Jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou určeny stejnou latentní proměnnou LP je hypotetický konstrukt, odvozený právě z manifestací (jevů), které spolu nějakým způsobem kovariují Manifestní proměnné tedy sdílí nějakou část svého celkového rozptylu Classical test theory, latent & manifest variables, structural equation modelling 13.11.2018

Faktorový model Dvě složky rozptylu manifestní proměnné ve faktorovém modelu: Komunalita: sdílený (faktorový) rozptyl – určený latentní proměnnou, „společný“ s ostatními proměnnými Unicita: jedinečnost, vlastní část rozptylu proměnné Unicita = 1 – komunalita CTT: Unicita zahrnuje jednak část „vlastního rozptylu“ proměnné, jednak chybu měření Sdílený rozptyl je patrný z korelační matice MP; jsou-li korelace MP nenulové, potom MP sdílí nějakou část rozptylu Celkový rozptyl, sdílený rozptyl, jedinečný rozptyl 13.11.2018

Faktorový model Korelující proměnné mohou být nahrazeny jedinou proměnnou, která je jejich lineární kombinací – faktorem. Faktorový náboj (Fx, Fy) je interpretován jako korelace původní proměnné s daným faktorem. Komunalita h2 = FxP12 * FyP12 je faktorový rozptyl položky, podíl rozptylu položky vyčerpaný daným faktorovým řešením. „Dobrá struktura“ je požadavek na jasnost faktorové matice. Každá položka by měla vysoko skórovat v právě jednom faktoru, každý faktor by měl obsahovat dva nebo více vysokých faktorových nábojů. 1 ,17 ,59 ,08 P4 ,19 ,74 P3 -,14 P2 P1 Korelační matice ,77 ,66 ,58 ,87 -,35 ,81 ,47 ,89 -,60 ,73 h2 F2 F1 Faktorová matice Factor loadings, simple structure, communality, 13.11.2018

Explorativní a konfirmatorní FA Explorativní faktorová analýza je analytický postup, jehož smyslem je nalézt optimální matici faktorových nábojů, které maximálně zjednoduší korelační matici = při co nejmenším počtu faktorů vysvětlí co největší podíl celkového rozptylu „Redukce korelační matice“ Metoda maximální věrohodnosti (maximum likelihood) Vlastní FA; zdůrazňuje specifické faktory Analýza hlavních komponent (principal components) Postupný rozbor sdílených rozptylů; zdůrazňuje g-faktor Konfirmatorní faktorová analýza je test hypotézy o korelační a faktorové matici Matice je nulová Matice má konkrétní strukturu Kdykoliv je to možné, měli bychom se snažit o použití CFA – tedy formulovat hypotézy, spíše než dojit data Software nám bohužel nevychází vstříc STATISTICA – SEPATH SPSS – AMOS LISREL, M+ a další 13.11.2018

Předpoklady použití FA Možnost vytvoření smysluplné korelační matice: Ordinální úroveň měření Rozložení proměnných nesmí být extrémně šikmé Proměnné musí pocházet zhruba ze stejné domény Až na speciální případy nemá smysl analyzovat jednotlivé položky osobnostního dotazníku společně se součtovými skóry jiného či proměnnými úplně jiného charakteru (výsledky výkonového testu) Smysluplný počet faktorů: 3 při předpokladu jediného faktoru k*2 při předpokladu k faktorů (jinak nemůže vzniknout Thurstonova struktura) Adekvátní počet měření Málo je málo a moc je moc  Absolutní minimum velikosti vzorku je N>5*mp a současně N>20*k, ideálně od N>20*mp Extrémně velké soubory poskytují nepříjemně přesné odhady parametrů: V CFA paradoxně dochází k zamítnutí jakéhokoliv modelu V ML nikdy nevyjde uspokojivě test dobré shody Proto se zavádí tzv. Chi2/df ratio: Chi2/df by měl poskytovat hodnotu okolo 2, nikdy více než 5 13.11.2018

Komunality Přehled komunalit... 13.11.2018 V PC vždy vyšší. požadavek alespoň 0,7 teoreticky! V případě ML pozor na tzv. nevlastní řešení (Heywoodův případ) – faktorová matice je problematická Znamená, že některá z položek „vyčnívá“, je sama o sobě faktorem 13.11.2018

Eigenvalue & Explained variance Přehled vysvětleného rozptylu Eigen value – vlastní hodnota Suma eigenvalues vždy rovna počtu položek  Vypovídá o poměru rozptylu vysvětleného daným faktorem/komponentou vzhledem k celku Obdobně procentuální údaj Eigenvalue je obvykle kriteriem volby počtu interpretovaných faktorů/komponent Eigen > 1 Nemá smysl interpretovat faktory, které vysvětlují méně než „jednu“ proměnnou 13.11.2018

Je řešení smysluplné? Test dobré shody a reprodukovaná matice Test dobré shody (pouze ML) Test hypotézy o residuální matici !!! Testujeme hypotézu o tom, že residuální matice je nulová – tedy naším požadavkem je dojít k neprůkaznému testu V praxi problematické, na velkých souborech je test vždy průkazný a na malých průkaznost nespolehlivá Proto požadavek na Chi2/df ratio okolo hodnoty 2 Residuální matice by neměla obsahovat věcně významné korelace (dejme tomu do 10%) 13.11.2018

Komponentová/faktorová matice Primární výstup PC/ML, obsahuje matici nerotovaných faktorových nábojů Kontrola požadavků na dobrou strukturu! Za nepodstatné lze považovat pouze náboje pod 0,1 Pokud není jasná dobrá struktura, rotujeme. 13.11.2018

Rotovaná matice Rotovaná matice je výsledek pokusu „vyčistit“ řešení při zachování stávajících dimenzí Pokud ani rotovaná matice nedává smysl, opouštíme FA jako řešení daného problému... 13.11.2018