Vybrané multivariační techniky

Slides:



Advertisements
Podobné prezentace
Vybrané multivariační techniky
Advertisements

Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Poměrní ukazatelé Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Organizační legitimita: aplikace institucionální teorie a teorie závislosti na zdrojích v rámci výzkumu NNO Magdaléna Šťovíčková SOS FHS UK, 2013/2014.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Redukce lůžek Existuje prostor pro redukci lůžek akutní péče?
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Období vzniku: duben _inovace_FG.9.48 Autor : Vladimír TesaříkČlověk a svět práce, finanční gramotnost, nové auto.
Spolupráce OSPOD se školami a školskými zařízeními TENTO PROJEKT JE FINANCOVÁN Z EVROPSKÉHO SOCIÁLNÍHO FONDU PROSTŘEDNICTVÍM OPERAČNÍHO PROGRAMU LIDSKÉ.
K OMUNIKACE VERBÁLNÍ A NEVERBÁLNÍ Zpracovala: Mgr. Kateřina Holá Speciální základní škola, Česká Kamenice, Jakubské nám. 113, příspěvková organizace.
Dítě jako majetek v rozvodovém řízení. Co dítě prožívá? Proč rozvod rodičů dítě tak bolí? Protože bylo zvyklé na jistotu, která najednou není. Čas rozvodu.
Základní škola a Mateřská škola Bílá Třemešná, okres Trutnov Autor: Simona Lehrausová Datum/období: Podzim 2013 Číslo projektu: CZ.1.07/1.4.00/
Experimentální metody oboru – Pokročilá tenzometrie – Měření vnitřního pnutí Další využití tenzometrie Měření vnitřního pnutí © doc. Ing. Zdeněk Folta,
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně AUTOR: Ing. Oldřich Vavříček NÁZEV: Podpora výuky v technických oborech TEMA: Základy elektrotechniky.
VY_32_ INOVACE_ 04_ VLASTIVĚDA 4 Základní škola a Mateřská škola, Potštejn, okres Rychnov nad Kněžnou NADMOŘSKÁ VÝŠKA Autor: Mgr.Renata Viktorinová.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Inf Vizualizace dat a tvorba grafů. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Autor práce: Denisa Vydrová Vedoucí práce: Ing. Petra Solarová, Ph.D. Oponent práce: Ing. František Martíšek České Budějovice, červen 2016.
Induktivní statistika
Dopravní modely v SUMP Jitka Ondráčková
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Testování hypotéz Testování hypotéz o rozdílu průměrů
Interpolace funkčních závislostí
Vnitropodniková komunikace ve vybraném subjektu
Rozvoj zaměstnanosti ve vybraném podniku
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav podnikové strategie Řízení vztahů se zákazníky ve vybraném podnikatelském subjektu v oblasti.
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu
Název školy: Základní škola speciální Litvínov, Šafaříkova 991
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
Registrační číslo: CZ.1.07/1.4.00/
Testování hypotéz Testování hypotéz o rozdílu průměrů
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
ORGANIZACE DAT V POČÍTAČI
Název: Trojúhelník Autor:Fyrbachová
P2 MARKETINGOVÉ PROSTŘEDÍ
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Faktorová analýza cíl faktorové analýzy základní pojmy, postup
Význam utkání v sportovních hrách
Číslo projektu Číslo materiálu název školy Autor Tématický celek
Stimulace tvořivosti – tvůrčí řízení a vedení lidí,
Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice,
Úvodní a seznamovací hry
Poměr v základním tvaru.
Vybrané multivariační techniky
4.1 – 4.3 Lineární nerovnice i jednoduchý podílový tvar
Vykazování postupu nebo stavu
Základy zpracování geologických dat testování statistických hypotéz
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
Marketingová komunikace ve vybrané společnosti
BIBS Informatika pro ekonomy přednáška 2
Informatika pro ekonomy přednáška 8
Číslo projektu Číslo materiálu název školy Autor TEmatický celek
Zlomky Sčítání zlomků..
Psychologie test.
Základní škola Ústí nad Labem, Anežky České 702/17, příspěvková organizace   Číslo projektu: CZ.1.07/1.4.00/ Název projektu: „Učíme lépe a moderněji“
Corel PHOTO-PAINT Úloha 3 Zpracovala: Mgr. Jitka Hotařová
Materiál byl vytvořen v rámci projektu
Digitální gramotnost Informatické myšlení
Text zápatí (edituje se v menu Vložení / Záhlaví a zápatí)
Teorie chyb a vyrovnávací počet 1
Lineární regrese.
Poměr v základním tvaru.
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
NÁZEV: VY_32_INOVACE_06_07_M7_Hanak
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

Vybrané multivariační techniky faktorová analýza shluková analýza multidimenzionální škálování

Faktorová analýza cíl faktorové analýzy základní pojmy, postup interpretace faktorů příklad

Faktorová analýza cílem faktorové analýzy (exploratorní) je 1) redukce dat – zmenšení počtu proměnných odstraněním nadbytečných proměnných (tj. těsně korelujících s ostatními proměnnými) 2) idetifikace struktury dat – prozkoumat vztahy mezi proměnnými

Faktorová analýza výsledkem faktorové analýzy (exploratorní) je vytvoření několika hypotetických proměnných – faktorů někdy bývají nazývány latentní proměnné faktory jsou lineárními kombinacemi původních proměnných vysvětlují vztahy mezi původními proměnnými

Faktorová analýza korelace většího množství proměnných se analyzuje tak, že se hledají shluky proměnných, které spolu navzájem korelují silně a s ostatními proměnnými naopak slabě nebo vůbec faktory se interpretují podle toho, které proměnné obsahuje daný shluk cílem je najít malé množství faktorů, které vysvětlí velké množství variability dat

Korelační matice matematika fyzika angličtina čeština 0,893 0,215 0,196 0,308 0,262 0,820 dějepis 0,117 0,065 0,590 0,685

Korelační matice matematika fyzika angličtina čeština 0,893 0,215 0,196 0,308 0,262 0,820 dějepis 0,117 0,065 0,590 0,685

Faktorová analýza extrakce faktorů – na základě matice vztahů mezi proměnnými (např. korelační matice) počet extrahovaných faktorů – do značné míry závisí na rozhodnutí výzkumníka

Faktorová analýza cílem je vysvětlit co největší množství společného rozptylu co nejmenším počtem faktorů (80-90% rozptylu) při tomto rozhodování se používá tzv. sutinový graf (scree plot), který ukazuje závislost vysvětlené variability na počtu faktorů – znázorňuje pro každý faktor hodnoty charakteristických kořenů/vlastních hodnot

Faktorová analýza vlastní hodnota = podíl společné variability všech proměnných, který vysvětluje daný faktor

Faktorová analýza interpretace faktorů – faktorová analýza sama o sobě nenabídne označení faktorů (to je opět na výzkumníkovi) faktor bývá označen na základě proměnných, které k němu mají nejtěsnější vztah (nejvyšší tzv. faktorové náboje/zátěže – korelace mezi faktorem a položkou) část variability proměnné, která je vysvětlená extrahovanými faktory, se nazývá komunalita

Faktorová analýza rotace faktorového řešení – usnadní interpretaci faktorů rotace může být ortogonální (tj. předpokládá, že faktory jsou nezávislé) nebo šikmá (předpoklad korelace mezi faktory) faktorové náboje zde můžeme interpretovat jako parciální korelace položky s faktorem

Faktorové skóry výsledky faktorové analýzy lze uložit v podobě nových proměnných – faktorových skórů, a s nimi pak dále pracovat

Faktorová analýza - příklad příklad aplikace FA: Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů: struktura a rozdíly mezi pohlavím. Sborník konference Sociální procesy a osobnost, MU Brno.

Faktorová analýza - příklad cílem studie bylo mj.vytvořit typologii adolescentů na základě jejich zdravotních obtíží adolescenti v dotazníku označili, jak často trpí každou z 18 nabídnutých zdravotních obtíží

Faktorová analýza - příklad bolesti hlavy dýchací potíže žaludeční potíže závratě nechutenství nervozita, neklid nespavost noční můry nesoustředěnost nevolnosti silný tlukot srdce třesení rukou náhlé zpocení průjem, zácpa bolesti v zádech krční bolesti bolesti na prsou bolesti v pánvi

Faktorová analýza - příklad typologie na základě 18 proměnných by byla příliš složitá – je třeba tento počet snížit autoři spočítali faktorovou analýzu a extrahovali 3 faktory (vysvětlovaly celkem 48% společného rozptylu)

Faktorová analýza - příklad nevolnosti 71 17 22 nechutenství 65 23 10 závratě 62 14 30 žaludeční potíže 60 -15 50 bolesti hlavy 58 27 4 nervozita, neklid 56 41 12 třesení rukou 69 19 nespavost 38 63 -3 náhlé zpocení -2 61 35 silný tlukot srdce 16 nesoustředěnost 37 54 noční můry 32 49 20 bolesti v pánvi 28 průjem, zácpa 21 -9 bolesti na prsou 36 krční bolesti 33 52 bolesti v zádech 15 42 dýchací potíže procento rozptylu

Faktorová analýza - příklad první faktor nazvali nevolnosti – sytily ho především tyto potíže: nevolnosti nechutenství závratě žaludeční potíže bolesti hlavy nervozita, neklid

Faktorová analýza - příklad druhý faktor označili vegetativní obtíže – sytily ho především položky: třesení rukou nespavost náhlé zpocení silný tlukot srdce nesoustředěnost noční můry

Faktorová analýza - příklad třetí faktor označili bolesti – sytily ho především tyto potíže: bolesti v pánvi průjem, zácpa bolesti na prsou krční bolesti bolesti v zádech

Faktorová analýza - příklad místo původních 18 proměnných indikujících frekvenci zdravostních potíží měli nyní 3 proměnné (lineární kombinace původní proměnných) – nevolnosti, vegetativní potíže a bolesti s nimi pak pracovali při typologii (viz dále)

Shluková analýza pro zájemce o podrobnosti o využití metod shlukové analýzy v psychologii doporučuji publikaci: Osecká, L. (2001). Typologie v psychologii. Praha, Academia.

Shluková analýza slouží ke klasifikaci velkého počtu osob (na základě jejich dat v určitých proměnných) do několika málo shluků anglické označení cluster analysis se někdy v českých textech překládá také jako clusterová analýza

Shluková analýza

Shluková analýza

Shluková analýza tyto shluky osob – typy – jsou potom na základě jejich společných charakteristik popsány či pojmenovány někdy se v psychologii používá shluková analýza i pro analýzu vztahů mezi proměnnými (obdoba faktorové analýzy)

Shluková analýza pokud máme pro vymezení typu osob větší množství proměnných, které jsou navzájem závislé, je vhodné např. provést nejdříve faktorovou analýzu a tak počet proměnných redukovat na několik nezávislých dimenzí teprve na nich provést shlukovou analýzu

Shluková analýza pokud jsou proměnné měřeny na různých stupnicích, doporučuje se nejprve provést jejich standardizaci

Shluková analýza metod shlukování existuje mnoho, dělí se na např. metody rozkladu – celý soubor najednou je rozčleněn v navzájem se nepřekrývající shluky hierarchické metody „chumáčování“ (clumping) – výsledné shluky se mohou překrývat

Shluková analýza výsledkem shlukové analýzy je určení pro každý objekt, do kterého typu patří typy se obvykle charakterizují profilem průměrů jednotlivých proměnných, příp. graficky (u hierarchických metod tzv. dendrogramem)

Shluková analýza interpretace a validizace výsledků shlukové analýzy u hierarchické analýzy tzv. kofenetické korelace testy významnosti na vnitřních proměnných (použitých k analýze) – obvykle spíše zavádějící testy významnosti na vnějších proměnných – považuje se za nejlepší způsob

Shluková analýza interpretace a validizace výsledků shlukové analýzy replikace – sledujeme, do jaké míry dospějeme ke stejným výsledkům na různých výběrech ze stejné populace; často se prakticky postupuje tak, že se původní soubor rozdělí na několik částí a na nich se provede shluková analýza

Shluková analýza problémy při shlukové analýze: kvalita výsledků je dána kvalitou vstupních dat a kvalitou jejich měření empiricky definované typy je někdy obtížné interpretovat neexistuje jedinečné řešení – různé techniky dávají různá řešení (neexistuje jednoznačná statistická definice shluku)

Aplikace shlukové analýzy umožňuje typologický přístup v psychologii – zaměřit se více na člověka než na proměnné a vztahy mezi nimi přehled psychologických výzkumů, kde byla aplikována shluková analýza: viz citovaná publikace Osecké

Shluková analýza - příklad navazuje na příklad aplikace faktorové analýzy autoři se snažili identifikovat skupiny (shluky) adolescentů, kteří jsou si podobní ve svých zdravotních obtížích použili 3 proměnné vytvořené na základě FA – nevolnosti, vegetativní potíže a bolesti

Shluková analýza - příklad bude uveden výsledek pro 4 shluky - v grafu na následujícím snímku jsou průměrná faktorová skóre v použitých 3 proměnných pro osoby klasifikované do daného shluku výsledky pro vyšší počty shluků viz citovaná publikace Osecké, kapitola 14

Shluková analýza - příklad

Shluková analýza - příklad osoby v prvním shluku si stěžují především na bolesti, zčásti také na vegetativní potíže adolescenty ve druhém shluku trápí hlavně nevolnosti osoby ve třetím shluku trpí vegetativními obtížemi osoby ve čtvrtém shluku tvořily největší část souboru – trpěly pouze do určité míry bolestmi (průměrně), úroveň ostatních zdravotních stesků u nich byla podprůměrná

Multidimenzionální škálování alternativa k faktorové analýze, nevyžaduje však normální rozdělení a lineární vztahy mezi proměnnými cílem je identifikovat smysluplné dimenze, kterými vysvětlíme určité podobnosti (či nepodobnosti) mezi zkoumanými objekty

Multidimenzionální škálování ve FA jsou podobnosti mezi proměnnými vyjádřeny pomocí korelací – korelační matice v MDS se tyto podobnosti vyjadřují maticí podobností/nepodobností

Multidimenzionální škálování logika MDS – příklad: zjistíme vzájemné vzdálenosti mezi vybranými městy ČR při analýze pomocí MDS dojdeme nejspíše ke dvoudimenzionálnímu řešení: osy dimenzí můžeme nastavit tak, že jednou dimenzí bude orientace západ-východ a druhou sever-jih při zobrazení v grafu dostaneme dvoudimenzionální reprezentaci vzájemné polohy měst (zkreslení oproti mapě je dané tím, že šlo o silniční vzdálenosti)

Multidimenzionální škálování Praha Brno Ostrava Plzeň Olomouc České Budějovice Hradec Králové 202 362 94 275 140 112 165 296 78 186 142 456 93 346 240 369 133 206 259 149 217

Multidimenzionální škálování

Multidimenzionální škálování pomocí MDS uspořádáme posuzované objekty v prostoru o určitém počtu dimenzí tak, aby byly co nejlépe vyjádřeny podobnosti či vzdálenosti mezi objekty počet dimenzí volí výzkumník

Multidimenzionální škálování nejobvyklejší mírou toho, jak dobře řešení reprezentuje původní vzdálenosti či podobnosti mezi objekty, je funkce zvaná stress její hodnota by měla být co nejnižší (ideálně 0), za přijatelné se považují hodnoty do 0.1 (ale v praxi se akceptují i vyšší) pokud je vyšší, je většinou třeba zvýšit počet dimenzí a tak lépe reprezentovat data – což ale může vést k horší interpretovatelnosti

Multidimenzionální škálování posledním krokem analýzy je interpretace dimenzí (podobně jako ve FA) dimenze samy o sobě nenesou žádný význam, je třeba ho dovodit – předpokládá se, že „vysvětlují“ vzdálenosti mezi objekty je třeba mít na paměti, že respondenti, kteří třídili objekty podle podobnosti nemusí sdílet stejné důvody či vysvětlení pro podobnost objektů

Multidimenzionální škálování nejčastější aplikace MDS v psychologii: posuzování podobnosti objektů (především v oblasti interpersonální percepce pro odhalení skrytých dimenzí v percepci osobnostních rysů) marketingový výzkum shoda mezi posuzovateli

Multidimenzionální škálování umožňuje výzkumníkům klást neobtěžující, neohrožující otázky („jak moc podobný výrobek A a výrobek B“) odhalit skryté dimenze posuzování, aniž si dotazovaný vůbec uvědomí, jaký je skutečný zájem výzkumníka na rozdíl od FA není nutno tyto dimenze dopředu vymezit proměnnými – stačí přímé posouzení podobností mezi objekty

Multidimenzionální škálování příklad aplikace MDS: Kappesser J., Williams A. C. (2002). Pain and negative emotions in the face: judgements by health care professionals. Pain 99, 197-206.

Multidimenzionální škálování hlavním cílem studie bylo zjistit, jak se výraz bolesti liší od výrazu jiných negativních emocí smutek, strach, hněv, znechucení, úlek, rozpaky tj. s jakými emocemi může být bolest zaměňována, kterým je více podobná a kterým méně, čím je podobnost určena?

Multidimenzionální škálování posuzovatelé byli odborníci – lékaři a sestry dvou londýnských nemocnic bylo jim předloženo 7 fotografií tváře jednoho muže, na kterých předváděl vždy jinou emoci – měli si představit, že jde o pacienta na pohotovosti posuzovatelé měli srovnat všechny možné páry fotografií, co se týče jejich podobnosti/nepodobnosti ve výrazu bolesti (na škále 0-10)

Multidimenzionální škálování poté ještě následovala validizační část studie, kdy měli posuzovatelé označit, jakou emoci tvář muže na každé fotografii vyjadřuje

Multidimenzionální škálování autorky se provedly MDS a rozhodly se interpretovat dvoudimenzionální řešení první dimenze oddělila rozpaky od ostatních 6 výrazů emocí druhá dimenze rozdělila strach, úlek, znechucení a bolest, hněv, smutek

Multidimenzionální škálování

Multidimenzionální škálování autorky interpretovaly první dimenzi tak, že se výraz rozpaků odlišuje od všech ostatních užitých výrazů pohybem rtů, až téměř připomínajícím úsměv někteří respondenti sami tuto fotografii komentovali: „někdo, kdo se usmívá, nemůže trpět bolestí“

Multidimenzionální škálování druhá dimenze byla interpretována na základě fyzických charakteristik výrazů – u strachu, úleku a znechucení dochází ke změnám výrazu obličeje „vertikálním“ směrem, zatímco u hněvu, bolesti a smutku jsou změny výrazu doprovázeny spíše tzv. „odstředivými“ pohyby

Multidimenzionální škálování alternativní interpretace druhé dimenze: strach, úlek nebo znechucení představují reakce většinou na vnější podněty, zatímco smutek či bolest spíše na vnitřní stavy (výraz hněvu může podle autorek znamenat u mužů výsledek snahy o potlačení výrazu bolesti)

Kontrolní otázky cíle faktorové analýzy postup faktorové analýzy faktorové náboje/zátěže, komunalita, vlastní hodnota, faktorové skóry

Kontrolní otázky účel shlukové analýzy postup shlukové analýzy možnosti validizace výsledků shlukové analýzy multidimenzionální škálování – princip a možnosti aplikace v psychologii

Literatura Hendl: kapitoly 13.6, 13.7 a 13.8 článek Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů. In M. Blatný (Ed.): Sociální procesy a osobnost. Brno 1998, str. 135-144.

Literatura Osecká, L. (2001). Typologie v psychologii. Praha, Academia Kappesser J., Williams A. C. (2002). Pain and negative emotions in the face: judgements by health care professionals. Pain 99, 197-206.