1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro jaké úkoly jsou vhodné jednotlivé techniky. Diskutujeme podstatu měření, typy proměnných a vztah k mnohorozměrným technikám. Popisujeme koncepční a statistické aspekty mnohorozměrné analýzy.
Analýza kvantitativních dat Základní informace: Povinnosti – úkoly, prezentace, zkouška Sylabus Literatura – viz dále Související kurzy JSM031 a JSM152 Organizace kurzu
Literatura Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál, 2009. Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium, 2004. Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav AV ČR a Nakladatelství Pavel Křepela, Brno. Tarling, R. 2009: Statistical modeling for social researchers. Routledge. Norusis. 2005. SPSS 13. Statistical procedures companion. Prentice Hall. StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft. http://www.statsoft.com/textbook/stathome.html Další nepřeberné množství knih a článků a WWW stránek (články budou průběžně doporučovány)
Co je mnohorozměrná analýza? Co to je? Mnohorozměrná analýza dat (Multivariate Data Analysis ) = jsou všechny statistické metody, které simultánně analyzují více proměnných měřených na jedincích nebo objektech sledování. Proč je používat? Měření Explanace & predikce Testování hypotéz
Základní koncepty mnohorozměrné analýzy Proměnná Škály měření Nemetrické Metrické Mnohorozměrná měření Chyba měření Druhy technik
Typy dat a škál měření Data Nemetrická nebo Kvalitativní Metrická nebo Kvantitativní Nominální škála Ordinální škála Interval. škála Poměr. škála
Škála měření Nemetrické škály Metrické škály Nominální – označení číslem nemá vztah k žádné velikosti. Ordinální – existuje řazení. Metrické škály Intervalové– má vlastnosti ordinální škály a jsou zde stejné diference mezi jednotlivými body škály. Poměrové – má vlastnosti intervalové škála+přirozená nula. Poznámka: Typ škály je mnohdy kritický při určování správné statistické techniky
Chyba měření Všechny proměnné jsou zatížen nějakou chybou. Jaké jsou zdroje chyb? Chyba měření = zkresluje pozorovaný vztah a znehodnocuje výsledky analýzy. Výzkumníci používají součtové škály a vytvářejí kompositní reprezentace konceptů.
Chyba měření Při posuzování chyb měření si všímáme dvou charakteristik měření: Validita = stupeň, jak dobře měří proměnná to, co má měřit. Reliabilita = stupeň, jak postup měří spolehlivě (bez náhodné chyby).
Statistická významnost a síla testu Chyba I. druhu. Hodnota je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona platí. Chyba II. druhu. Hodnota je pravděpodobnost nezamítnutí nulové hypotézy za předpokladu, že ona neplatí. Síla testu nebo-li 1- je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona neplatí. H0 platí H0 neplatí Nezamítne H0 1- Chyba II. druhu Zamítne H0 Chyba I. druhu 1- Síla
Síla je určena třemi faktory: Velikostí účinku (ES): aktuální hodnota efektu (např. rozdíl mezi průměry nebo velikost korelace mezi proměnnými). Alfa (): nasadíme malou hodnotu, čím menší tak zmenšujeme sílu. Typicky = 0.05. Velikost výběru: jak rozsah výběru se zvětšuje, tak se zvětšuje síla. Při velkých výběrech i malou odchylku hodnotíme jako statisticky významnou.
Na obrázku je vztah mezi silou (Y) a velikostí výběru (X)
Síla testu, statistická významnost, nesprávné užívání Literatura : částečně viz Hendl Článek: Soukup 2010 (http://archiv.soc.cas.cz/articles/cz/73/Data-a-vyzkum.html#artID413) a pomůcky na http://samba.fsv.cuni.cz/~soukup/stat_vyznamnost_clanek/
Typy mnohorozměrných technik Techniky analýzy závislostí: proměnná nebo více proměnných se považují za závisle proměnné. Vysvětlují se pomocí množiny nezávislých proměnných. Mnohonásobná regrese Mnohonásobná diskriminační analýza Logitová/logistická regrese Mnohonásobná analýza rozptylu a kovariance Kanonická korelační analýza Strukturální modelování (SEM)
Typy mnohorozměrných technik Techniky pro hledání podobností (interrelací) bez rozlišení na závislé a nezávislé proměnné, více proměnných. Metoda hlavních komponent a faktorová analýza Shluková analýza Mnohorozměrné škálování Korespondenční analýza
Výběr technik mnohorozměrné analýzy Jaký typ vztahu se zkoumá– závislosti nebo interrelace? Vztah závislosti: Kolik proměnných se predikuje? Jaká je škála proměnných závisle proměnných? Jaká je škála nezávisle proměnných? Interdependence: Zkoumáme vztahy (podobnosti) mezi proměnnými, respondenty nebo objekty?
Mnohonásobná regrese Jednoduchá metrická závisle proměnná predikovaná několika nezávisle proměnnými (metrickými). Bude v kurzu JSM 034
Diskriminační analýza Nemetrická (nominální) závisle proměnná je predikována několika metrickými nezávisle proměnnými. Bude v kurzu JSM 034 Příklady Pohlaví – Muž resp. žena Těžký případ nemoci, lehký případ nemoci Kreditní důvěra, kreditní nedůvěra Člen nebo nečlen
Logistická regrese Jednoduchá závisle nemetrická proměnná je predikovaná několika metrickými nezávisle proměnnými . Tato technika je podobná diskriminační analýze, ale výpočty jsou trochu jiné, podobné regresi. Bude v kurzu JSM 034
MANOVA Několik metrických proměnných je predikováno několika kategoriálními nezávisle proměnnými (nemetrickými).
Kanonická korelační analýza Několik metrických závisle proměnných je predikováno několika metrickými nezávisle proměnnými.
Strukturální modelování (SEM) Hodnotí se několik provázaných závislostí, vychází se ze dvou modelů: Strukturální model Model měření Bude v kurzu JSM 034
Faktorová analýza . . . . Analyzují se struktury vztahů mezi velkou množinou proměnných, aby bylo možno určit společné faktory. De facto hledáme podobné proměnné. (viz JSB 029 a JSM031)
Shluková analýza . . . . Skupina objektů (respondenti, produkty, firmy atd.) se analyzuje pomocí měr vzdáleností a určují se kategorie objektů (shluky). De facto hledáme podobné případy. (viz JSM 031)
Mnohorozměrné škálování . . . Identifikují se nerozpoznané dimenze, které diferencují objekty zájmu pomocí: podobností nebo preferencí Opět hledáme podobné případy (viz JSM 031)
Korespondenční analýza . . . Používá nemetrická data a vyhodnocuje lineární nebo nelineární vztahy, aby bylo možné nalézt asociace mezi objekty a určit popisné charakteristiky objektů. Hledáme vazby mezi řádky a sloupci kontingenční tabulky (viz JSM 152).
Pokyny pro provedení mnohorozměrné analýzy Určujeme věcné a statistické významnosti Velikost souboru určuje výsledek (nadto potřebujeme zpravidla dostatečně velká data) Poznáváme data Hledáme úsporný popis Posouzení chyb a opomenutí Validizace výsledků
Strukturovaný přístup k MA při tvoření modelu Fáze 1: Určíme výzkumný problém, cíle a mnohorozměrnou techniku Fáze 2: Navrhneme plán analýzy Fáze 3: Vyhodnotíme předpoklady techniky Fáze 4: Odhadujeme parametry modelu a vyhodnocujeme kvalitu proložení Fáze 5: Interpretujeme získané výsledky Fáze 6: Validizujeme získaný model Poznámka: Často zpracováváme sekundárně data, pak odpadá bod 2.
Kontrolní otázky Co je mnohorozměrná analýza? Proč používáme mnohorozměrnou analýzu? Proč je znalost škály důležitá v mnohorozměrné analýze? Jaké základní aspekty musíme posuzovat v mnohorozměrné analýze? Popište proces aplikace mnohorozměrné analýzy ?