Faktorová analýza cíl faktorové analýzy základní pojmy, postup

Slides:



Advertisements
Podobné prezentace
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Advertisements

Cvičení 6 – 25. října 2010 Heteroskedasticita
SB029 Dodatek k přednáškám Základy analýzy dat a SPSS
Lineární regresní analýza Úvod od problému
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Analytické metody výzkumu
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Statistika Vypracoval: Mgr. Lukáš Bičík
Obecný lineární model Analýza kovariance Nelineární modely
ROZHODOVACÍ ÚLOHY.
Shluková analýza.
Biostatistika 9. přednáška Aneta Hybšová
Řízení a supervize v sociálních a zdravotnických organizacích
Vybrané multivariační techniky
Databázové systémy Přednáška č. 6 Proces návrhu databáze.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Lineární regrese.
geografie/věková pyramida ČR
Korelace a elaborace aneb úvod do vztahů proměnných
Jiří Šafr jiri.safr(zavináč)seznam.cz
Lineární regrese.
Lineární regresní analýza
Biostatistika 6. přednáška
Biostatistika 7. přednáška
- Pojmy - SPSS Statistické zpracování kvantitativních šetření.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Statistika 4  Korelace VY_32_INOVACE_ Korelace - teorie.
Práce s výsledky statistických studií
Automaty a gramatiky.
Teorie psychodiagnostiky a psychometrie
Základy ekonometrie 4EK211
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Praktikum 4c: Tabulky, baterie otázek 16/5/08. Tabulky - metoda popisu dat.
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
Teorie psychodiagnostiky a psychometrie
Aplikovaná statistika 2. Veronika Svobodová
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
Inferenční statistika - úvod
Aplikovaná statistika 2.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
CZECH STATISTICAL OFFICE Na padesátém 81, CZ Praha 10, Czech Republic STATISTIKA CIZINCŮ V REGIONECH ČR Tisková konference ČSÚ 11.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Popisná statistika I tabulky četností
Induktivní statistika
Induktivní statistika
Mixed methods design (MMD)
Induktivní statistika
4. cvičení
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
Vybrané multivariační techniky
Vybrané multivariační techniky
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Základy pedagogické metodologie
Kapitola 3: Centrální tendence a variabilita
PSY252 Statistická analýza dat v psychologii II
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
Induktivní statistika
Transkript prezentace:

Faktorová analýza cíl faktorové analýzy základní pojmy, postup interpretace faktorů příklad

Faktorová analýza cílem faktorové analýzy (exploratorní) je 1) redukce dat – zmenšení počtu proměnných odstraněním nadbytečných proměnných (tj. těsně korelujících s ostatními proměnnými) 2) idetifikace struktury dat – prozkoumat vztahy mezi proměnnými

Faktorová analýza výsledkem faktorové analýzy (exploratorní) je vytvoření několika hypotetických proměnných – faktorů někdy bývají nazývány latentní proměnné faktory jsou lineárními kombinacemi původních proměnných vysvětlují vztahy mezi původními proměnnými

Faktorová analýza korelace většího množství proměnných se analyzuje tak, že se hledají shluky proměnných, které spolu navzájem korelují silně a s ostatními proměnnými naopak slabě nebo vůbec faktory se interpretují podle toho, které proměnné obsahuje daný shluk cílem je najít malé množství faktorů, které vysvětlí velké množství variability dat

Korelační matice matematika fyzika angličtina čeština 0,893 0,215 0,196 0,308 0,262 0,820 dějepis 0,117 0,065 0,590 0,685

Korelační matice matematika fyzika angličtina čeština 0,893 0,215 0,196 0,308 0,262 0,820 dějepis 0,117 0,065 0,590 0,685

Faktorová analýza extrakce faktorů – na základě matice vztahů mezi proměnnými (např. korelační matice) počet extrahovaných faktorů – do značné míry závisí na rozhodnutí výzkumníka

Faktorová analýza cílem je vysvětlit co největší množství společného rozptylu co nejmenším počtem faktorů (80-90% rozptylu) při tomto rozhodování se používá tzv. sutinový graf (scree plot), který ukazuje závislost vysvětlené variability na počtu faktorů – znázorňuje pro každý faktor hodnoty charakteristických kořenů/vlastních hodnot

Faktorová analýza vlastní hodnota = podíl společné variability všech proměnných, který vysvětluje daný faktor

Faktorová analýza interpretace faktorů – faktorová analýza sama o sobě nenabídne označení faktorů (to je opět na výzkumníkovi) faktor bývá označen na základě proměnných, které k němu mají nejtěsnější vztah (nejvyšší tzv. faktorové náboje/zátěže – korelace mezi faktorem a položkou) část variability proměnné, která je vysvětlená extrahovanými faktory, se nazývá komunalita

Faktorová analýza rotace faktorového řešení – usnadní interpretaci faktorů rotace může být ortogonální (tj. předpokládá, že faktory jsou nezávislé) nebo šikmá (předpoklad korelace mezi faktory) faktorové náboje zde můžeme interpretovat jako parciální korelace položky s faktorem

Faktorové skóry výsledky faktorové analýzy lze uložit v podobě nových proměnných – faktorových skórů, a s nimi pak dále pracovat

Faktorová analýza - příklad příklad aplikace FA: Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů: struktura a rozdíly mezi pohlavím. Sborník konference Sociální procesy a osobnost, MU Brno.

Faktorová analýza - příklad cílem studie bylo mj.vytvořit typologii adolescentů na základě jejich zdravotních obtíží adolescenti v dotazníku označili, jak často trpí každou z 18 nabídnutých zdravotních obtíží

Faktorová analýza - příklad bolesti hlavy dýchací potíže žaludeční potíže závratě nechutenství nervozita, neklid nespavost noční můry nesoustředěnost nevolnosti silný tlukot srdce třesení rukou náhlé zpocení průjem, zácpa bolesti v zádech krční bolesti bolesti na prsou bolesti v pánvi

Faktorová analýza - příklad typologie na základě 18 proměnných by byla příliš složitá – je třeba tento počet snížit autoři spočítali faktorovou analýzu (metodou analýzy hlavních komponent) a extrahovali 3 faktory (vysvětlovaly celkem 48% společného rozptylu)

Faktorová analýza - příklad nevolnosti 71 17 22 nechutenství 65 23 10 závratě 62 14 30 žaludeční potíže 60 -15 50 bolesti hlavy 58 27 4 nervozita, neklid 56 41 12 třesení rukou 69 19 nespavost 38 63 -3 náhlé zpocení -2 61 35 silný tlukot srdce 16 nesoustředěnost 37 54 noční můry 32 49 20 bolesti v pánvi 28 průjem, zácpa 21 -9 bolesti na prsou 36 krční bolesti 33 52 bolesti v zádech 15 42 dýchací potíže procento rozptylu

Faktorová analýza - příklad první faktor nazvali nevolnosti – sytily ho především tyto potíže: nevolnosti nechutenství závratě žaludeční potíže bolesti hlavy nervozita, neklid

Faktorová analýza - příklad druhý faktor označili vegetativní obtíže – sytily ho především položky: třesení rukou nespavost náhlé zpocení silný tlukot srdce nesoustředěnost noční můry

Faktorová analýza - příklad třetí faktor označili bolesti – sytily ho především tyto potíže: bolesti v pánvi průjem, zácpa bolesti na prsou krční bolesti bolesti v zádech

Faktorová analýza - příklad místo původních 18 proměnných indikujících frekvenci zdravotních potíží měli nyní 3 proměnné (lineární kombinace původní proměnných) – nevolnosti, vegetativní potíže a bolesti s nimi pak pracovali při typologii (viz další přednášky)

Kontrolní otázky cíle faktorové analýzy postup faktorové analýzy faktorové náboje/zátěže, komunalita, vlastní hodnota, faktorové skóry

Literatura Hendl: kapitoly 13.7 a 13.8 článek Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů. In M. Blatný (Ed.): Sociální procesy a osobnost. Brno 1998, str. 135-144.

Faktorová analýza ve Statistice zadává se v menu Vícerozměrné průzkumné techniky v úvodní tabulce zadáme proměnné poté zvolíme metodu extrakce faktorů (přednastavena metoda hlavních komponent) a kritérium pro počet faktorů – jejich max. počet a min. vlastní číslo faktoru

Faktorová analýza pro posouzení, kolik faktorů extrahovat si necháme zobrazit sutinový graf (scree plot) a vypočítat vlastní čísla pro lepší interpretovatelnost můžeme provést rotaci faktorů uložíme faktorová skóre pro další analýzy jako nová data

Příklad 1 data GSS 1993 proměnné 36-46 jsou škály pro měření obliby různých hudebních stylů (škála 1-5, 1=velice oblíbený styl, 5=velmi neoblíbený) proveďte faktorovou analýzu (s rotací Varimax) faktorové skóry uložte; porovnejte skóry mužů a žen a skóry věkových skupin (agecat4)