1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro.

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování neparametrických hypotéz
Testování statistických hypotéz
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Analýza variance (Analysis of variance)
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Mgr. Alena Lukáčová, Ph.D., Dr. Ján Šugár, CSc.
Testování hypotéz vymezení důležitých pojmů
Analýza dat.
Sociologický výzkum.
Biostatistika 9. přednáška Aneta Hybšová
Řízení a supervize v sociálních a zdravotnických organizacích
Lineární regrese.
Biostatistika 5. přednáška Aneta Hybšová
Korelace a elaborace aneb úvod do vztahů proměnných
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
DKV část 31 Design kvantitativního výzkumu 4. část ( ) Jiří Šafr UK FHS Historická sociologie (LS 2010)
Odhad metodou maximální věrohodnost
Pohled z ptačí perspektivy
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Statistická významnost a její problémy
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
Marketingový průzkum Milan Mrázek Matematika & Business
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
STATISTICKÝ ROZCESTNÍK aneb CO S DATY Martin Sebera.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
IV..
HYPOTÉZY ● Hypotéza je tvrzrní (výrok) vyjařující vztah mezi proměnnými ● Hypotézy vychází z výzkumného problému. ● Hypotézy se stanoví na začátku výzkumu.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Základy zpracování geologických dat R. Čopjaková.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Opakování – přehled metod
Statistické testování – základní pojmy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
- váhy jednotlivých studií
Co se dá změřit v psychologii a pedagogice?
Neparametrické testy parametrické a neparametrické testy
SEM J.Hendl a P. Soukup.
Proč statistika ? Dva důvody Popis Inference
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Úvod do induktivní statistiky
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

1 Úvod Cíle: Vysvětlíme co je mnohorozměrná analýza a k čemu jsou dobré její aplikace. Vymezíme specifické techniky mnohorozměrné analýzy. Určíme pro jaké úkoly jsou vhodné jednotlivé techniky. Diskutujeme podstatu měření, typy proměnných a vztah k mnohorozměrným technikám. Popisujeme koncepční a statistické aspekty mnohorozměrné analýzy.

Analýza kvantitativních dat Základní informace: Povinnosti – úkoly, prezentace, zkouška Sylabus Literatura – viz dále Související kurzy JSM031 a JSM152 Organizace kurzu

Literatura Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál, 2009. Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium, 2004. Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav AV ČR a Nakladatelství Pavel Křepela, Brno. Tarling, R. 2009: Statistical modeling for social researchers. Routledge. Norusis. 2005. SPSS 13. Statistical procedures companion. Prentice Hall. StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft. http://www.statsoft.com/textbook/stathome.html Další nepřeberné množství knih a článků a WWW stránek (články budou průběžně doporučovány)

Co je mnohorozměrná analýza? Co to je? Mnohorozměrná analýza dat (Multivariate Data Analysis ) = jsou všechny statistické metody, které simultánně analyzují více proměnných měřených na jedincích nebo objektech sledování. Proč je používat? Měření Explanace & predikce Testování hypotéz

Základní koncepty mnohorozměrné analýzy Proměnná Škály měření Nemetrické Metrické Mnohorozměrná měření Chyba měření Druhy technik

Typy dat a škál měření Data Nemetrická nebo Kvalitativní Metrická nebo Kvantitativní Nominální škála Ordinální škála Interval. škála Poměr. škála

Škála měření Nemetrické škály Metrické škály Nominální – označení číslem nemá vztah k žádné velikosti. Ordinální – existuje řazení. Metrické škály Intervalové– má vlastnosti ordinální škály a jsou zde stejné diference mezi jednotlivými body škály. Poměrové – má vlastnosti intervalové škála+přirozená nula. Poznámka: Typ škály je mnohdy kritický při určování správné statistické techniky

Chyba měření Všechny proměnné jsou zatížen nějakou chybou. Jaké jsou zdroje chyb? Chyba měření = zkresluje pozorovaný vztah a znehodnocuje výsledky analýzy. Výzkumníci používají součtové škály a vytvářejí kompositní reprezentace konceptů.

Chyba měření Při posuzování chyb měření si všímáme dvou charakteristik měření: Validita = stupeň, jak dobře měří proměnná to, co má měřit. Reliabilita = stupeň, jak postup měří spolehlivě (bez náhodné chyby).

Statistická významnost a síla testu Chyba I. druhu. Hodnota  je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona platí. Chyba II. druhu. Hodnota  je pravděpodobnost nezamítnutí nulové hypotézy za předpokladu, že ona neplatí. Síla testu nebo-li 1- je pravděpodobnost zamítnutí nulové hypotézy za předpokladu, že ona neplatí. H0 platí H0 neplatí Nezamítne H0 1-  Chyba II. druhu Zamítne H0  Chyba I. druhu 1- Síla

Síla je určena třemi faktory: Velikostí účinku (ES): aktuální hodnota efektu (např. rozdíl mezi průměry nebo velikost korelace mezi proměnnými). Alfa (): nasadíme malou hodnotu, čím menší tak zmenšujeme sílu. Typicky  = 0.05. Velikost výběru: jak rozsah výběru se zvětšuje, tak se zvětšuje síla. Při velkých výběrech i malou odchylku hodnotíme jako statisticky významnou.

Na obrázku je vztah mezi silou (Y) a velikostí výběru (X)

Síla testu, statistická významnost, nesprávné užívání Literatura : částečně viz Hendl Článek: Soukup 2010 (http://archiv.soc.cas.cz/articles/cz/73/Data-a-vyzkum.html#artID413) a pomůcky na http://samba.fsv.cuni.cz/~soukup/stat_vyznamnost_clanek/

Typy mnohorozměrných technik Techniky analýzy závislostí: proměnná nebo více proměnných se považují za závisle proměnné. Vysvětlují se pomocí množiny nezávislých proměnných. Mnohonásobná regrese Mnohonásobná diskriminační analýza Logitová/logistická regrese Mnohonásobná analýza rozptylu a kovariance Kanonická korelační analýza Strukturální modelování (SEM)

Typy mnohorozměrných technik Techniky pro hledání podobností (interrelací) bez rozlišení na závislé a nezávislé proměnné, více proměnných. Metoda hlavních komponent a faktorová analýza Shluková analýza Mnohorozměrné škálování Korespondenční analýza

Výběr technik mnohorozměrné analýzy Jaký typ vztahu se zkoumá– závislosti nebo interrelace? Vztah závislosti: Kolik proměnných se predikuje? Jaká je škála proměnných závisle proměnných? Jaká je škála nezávisle proměnných? Interdependence: Zkoumáme vztahy (podobnosti) mezi proměnnými, respondenty nebo objekty?

Mnohonásobná regrese Jednoduchá metrická závisle proměnná predikovaná několika nezávisle proměnnými (metrickými). Bude v kurzu JSM 034

Diskriminační analýza Nemetrická (nominální) závisle proměnná je predikována několika metrickými nezávisle proměnnými. Bude v kurzu JSM 034 Příklady Pohlaví – Muž resp. žena Těžký případ nemoci, lehký případ nemoci Kreditní důvěra, kreditní nedůvěra Člen nebo nečlen

Logistická regrese Jednoduchá závisle nemetrická proměnná je predikovaná několika metrickými nezávisle proměnnými . Tato technika je podobná diskriminační analýze, ale výpočty jsou trochu jiné, podobné regresi. Bude v kurzu JSM 034

MANOVA Několik metrických proměnných je predikováno několika kategoriálními nezávisle proměnnými (nemetrickými).

Kanonická korelační analýza Několik metrických závisle proměnných je predikováno několika metrickými nezávisle proměnnými.

Strukturální modelování (SEM) Hodnotí se několik provázaných závislostí, vychází se ze dvou modelů: Strukturální model Model měření Bude v kurzu JSM 034

Faktorová analýza . . . . Analyzují se struktury vztahů mezi velkou množinou proměnných, aby bylo možno určit společné faktory. De facto hledáme podobné proměnné. (viz JSB 029 a JSM031)

Shluková analýza . . . . Skupina objektů (respondenti, produkty, firmy atd.) se analyzuje pomocí měr vzdáleností a určují se kategorie objektů (shluky). De facto hledáme podobné případy. (viz JSM 031)

Mnohorozměrné škálování . . . Identifikují se nerozpoznané dimenze, které diferencují objekty zájmu pomocí: podobností nebo preferencí Opět hledáme podobné případy (viz JSM 031)

Korespondenční analýza . . . Používá nemetrická data a vyhodnocuje lineární nebo nelineární vztahy, aby bylo možné nalézt asociace mezi objekty a určit popisné charakteristiky objektů. Hledáme vazby mezi řádky a sloupci kontingenční tabulky (viz JSM 152).

Pokyny pro provedení mnohorozměrné analýzy Určujeme věcné a statistické významnosti Velikost souboru určuje výsledek (nadto potřebujeme zpravidla dostatečně velká data) Poznáváme data Hledáme úsporný popis Posouzení chyb a opomenutí Validizace výsledků

Strukturovaný přístup k MA při tvoření modelu Fáze 1: Určíme výzkumný problém, cíle a mnohorozměrnou techniku Fáze 2: Navrhneme plán analýzy Fáze 3: Vyhodnotíme předpoklady techniky Fáze 4: Odhadujeme parametry modelu a vyhodnocujeme kvalitu proložení Fáze 5: Interpretujeme získané výsledky Fáze 6: Validizujeme získaný model Poznámka: Často zpracováváme sekundárně data, pak odpadá bod 2.

Kontrolní otázky Co je mnohorozměrná analýza? Proč používáme mnohorozměrnou analýzu? Proč je znalost škály důležitá v mnohorozměrné analýze? Jaké základní aspekty musíme posuzovat v mnohorozměrné analýze? Popište proces aplikace mnohorozměrné analýzy ?