Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jiří Šafr jiri.safr(zavináč)seznam.cz

Podobné prezentace


Prezentace na téma: "Jiří Šafr jiri.safr(zavináč)seznam.cz"— Transkript prezentace:

1 Jiří Šafr jiri.safr(zavináč)seznam.cz
UK FHS Historická sociologie (LS 2011+) Analýza kvantitativních dat II./III. Redukce ve struktuře dat a vytváření sumačních indexů Odhalení struktury a vazeb mezi promennými a objekty Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace (vytvořeno )

2 Analýza hlavních komponent (PCA)
Cílem metody Principal Component Analysis (PCA) je transformace dat z původních proměnných do menšího poctu latentních proměnných Tyto nové proměnné mají vhodnější vlastnosti, je jich výrazně méně, vystihují téměř celou proměnlivost původních proměnných - jsou vzájemné nekorelované Latentní proměnné - hlavní komponenty → lineární kombinace původních proměnných, kdy: první hlavní komponenta y1 vystihuje největší část proměnlivosti (rozptylu) původních dat, druhá hlavní komponenta y2 zase největší část rozptylu neobsaženého v y1 , atd. [Zdroj:

3 Vstupní matice podobností souboru proměnných (korelační matice)

4 Metoda hlavních komponent (PCA)
Dimenzionalita heterogenity okruhu přátel? (12 položek)

5 Metoda hlavních komponent (PCA) v SPSS
Pozor: Předpokladem je že znaky jsou kardinální a s přibližně normálním rozložením. Existuje varianta CPCA pro ordinální znaky (nemá ale rotaci). Proměnné mohou mít odlišné škály – vstupem ale musí být korelační matice (nikoliv kovariance).

6 PCA - SYNTAX SPSS FACTOR
/VARIABLES q27_a q27_b q27_c q27_d q27_e q27_f q27_g q27_h q27_i q27_j q27_k q27_l /MISSING LISTWISE /ANALYSIS q27_a q27_b q27_c q27_d q27_e q27_f q27_g q27_h q27_i q27_j q27_k q27_l /PRINT INITIAL EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION.

7 Faktorové zátěže – rotované řešení (VARIMAX)

8 Jiné metody „rozkrývání“ a redukce struktury v datech
Multidimenzionální škálování (MDS) Většinou je vstupní maticí nějaká míra nepodobnosti – distance (např. Euklidovská vzdálenost) Výhodou je možnost zkoumat binární proměnné (v klasické PCA/faktorové analýze v SPSS to nelze, ale je zde CPCPA) Nelze ale rotované řešení, ani uložení hodnot latentních proměnných (lze pouze pomocí součtových indexů) Shluková analýza (nejčastěji Hierarchická klastrová analýza) Tyto metody vychází z (stejné) matice nepodobností a jejich výsledky se navzájem doplňují. Shlukovat a MDS lze provádět jak pro proměnné (analogie k předchozímu příkladu s PCA), tak i pro případy (tj. respondenty, používáme pro agregovaná data)

9 Konstrukce souhrnné škály/indexu
Položková reliabilita

10 Konstrukce souhrnné škály/indexu
chceme z několika otázek (položek) konstruovat souhrnnou škálu položky by měly měřit různé odrazy jednoho společného konstruktu. (1.) Ověření homogenity / dimenzionality (např. pomocí PCA) 2. Ověření položkové reliability - vnitřní konzistence indexu např. pomocí koeficientu Cronbachovo alfa nebo Split-Half Coefficients

11 Dimenzionalita (5 položek pro BSC)? → PCA

12 Vnitřní konzistence (položková reliabilita) koeficient Cronbachovo alfa
doporučená hodnota CA je > 0,7 ale záleží na počtu položek! Tato reliabilita vychází z předpokladu, že by všechny položky měřící jednu vlastnost měly mít mezi sebou kladné, dostatečně vysoké korelace. Ale čím vyšší je vnitřní konzistence, tím nižší je validita metody. To proto, že při měření latentních proměnných chceme zachytit celou šíři aspektů daného faktoru, avšak při vysoké vnitřní konzistenci všechny položky měří zhruba to stejné - jde tedy o neustálé vyvažování reliability a validity. Vnitřní konzistence také z principu roste s počtem položek. Více info viz [Soukup 2006] na

13 Položková reliabilita - Cronbachova alfa
Zjišťujeme stupeň vnitřní konzistence položek ve škále, čímž odhadujeme reliabilitu (spolehlivost) Cronbachovo alfa má hodnoty 0 až 1 > 0,7 představuje vysokou konzistenci a reliabilitu škály ale záleží na počtu položek! K počet položek, var (Yj) je rozptyl j-té položky, var (Y) rozptyl celkových skóre CA = 1 položky jsou svázány lineárně. Naopak nízké hodnoty vypovídají o nízké vnitřní konzistenci položek (tj. nízké spolehlivosti testu). Pro dichotomické proměnné (ano/ne) existuje zjednodušená varianta Kuder-Richardsonův vzorec 20 Zdroj:

14 Položková reliabilita v SPSS Příklad index Přemosťujícího sociálního kapitálu

15 Položková reliabilita v SPSS Příklad index Přemosťujícího sociálního kapitálu

16 Položková reliabilita v SPSS Příklad index Přemosťujícího sociálního kapitálu
Vyřazení položky A – jiná generace

17 Položková reliabilita: Syntax
RELIABILITY /VARIABLES=q27_a q27_b q27_c q27_d q27_e /SCALE ('Přemostující soc.kapitál') ALL /MODEL=ALPHA /STATISTICS=SCALE /SUMMARY=TOTAL.

18 Konstrukce součtového (aditivního) indexu BSC (Bridging Social Capital)
COMPUTE BSC_4x = SUM(q27_b, q27_c, q27_d, q27_e). FORMATS BSC_4x (f8). VAR LAB BSC_4x "Přemosťující soc. kapitál - oslišnost přátel (q27b+c+d+e; CA 0,72)". FREQ BSC_4x /histo=norm. Šafr, J., J. Häuberer „Měření přemosťujícího sociálního kapitálu: baterie PSK zjišťující odlišnosti v okruhu přátel“. Data a výzkum / SDA Info. 2007/2:

19 Literatura Totální úvod: Soukup, P „Čím větší, tím lepší (aneb mýty o reliabilitě.“ Socioweb. č.7 Podrobně k měření pomocí položkových baterií - položkové reliabilitě, ověřování dimenzionality: Schubert, J „Klasická testová teorie reliability v metodologii výběrových šetření“. Data a výzkum - SDA Info 4(2).


Stáhnout ppt "Jiří Šafr jiri.safr(zavináč)seznam.cz"

Podobné prezentace


Reklamy Google