Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Neparametrické metody a analýza rozptylu (lekce 3-7)
Statistika II FSV UK Petr Soukup ISS FSV UK
2
SPSS Inc. Neparametrické testy Obecně testy nevyžadující tolik předpokladů jako parametrické testy (t-testy, analýza rozptylu apod. viz předpoklady normality, kardinalita proměnných apod.) Některé testy obdoby výše zmíněných parametrických t-testů V SPSS: Analyze- Nonparametric tests Datový soubor pro demonstrace: nepar.sav Copyright 2006 SPSS Inc. 2
3
Typy neparametrických testů
SPSS Inc. Typy neparametrických testů 1. Obdoby parametrických T- testů a analýzy rozptylu 2. Neparametrické testy pro nominální a dichotomické proměnné (Binomial Test, Chi-Square test, Runs test) viz pozdější lekce 3. Neparametrické testy pro rozložení proměnných (Kolmogorov-Smirnov test pro 1 a 2 výběry) viz též lekce 1 (1 výběrový) Copyright 2006 SPSS Inc. 3
4
NEPARAMETRICKÉ TESTY I
SPSS Inc. NEPARAMETRICKÉ TESTY I Copyright 2006 SPSS Inc. 4
5
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů založené zejm. na mediánech a pořadí tedy určeny zejm. pro ordinální proměnné a malé soubory Pozn. předpoklady parametrických testů- kardinální veličina s normálním rozdělením (u t-testů nevadí, pokud je normalita porušena- testy jsou „robustní“) a alespoň 30 pozorování Předpoklady pro neparametrické testy: malé výběry (cca do 30) nekardinální charakter proměnných nebo kardinální proměnné s nenormálním rozložením (malých výběrů) Copyright 2006 SPSS Inc. 5
6
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů situace Parametrický test Neparametrický test a) Dva nezávislé výběry Dvouvýběrový t-test Man-Whitney test aj. b) Dva závislé výběry Párový t-test Wilcoxonův test aj. c) Více nezávislých výběrů Jednofaktorová analýza rozptylu Kruskal-Wallis test aj. d) Více závislých výběrů Friedmanův test aj. Copyright 2006 SPSS Inc. 6
7
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů a) Dva nezávislé výběry Mann- Whitney test SPSS: Analyze- Nonparametric tests-2 Independent Samples pro dva nezávislé výběry pro malé výběry, ordinální veličiny Ho: mediány ve výběrech se rovnají H1: mediány se liší v SPSS se rozhodujeme podle Sig Vysvětlení výpočtů přesných Sig. (modul Exact v SPSS pro výběry menší než 15 použití Exact Sig. (přesná signifikace) pro výběry větší použití přibližné statistické významnosti (Asymp. Sig.) Monte Carlo simulace namísto přesné hodnoty statistické významnosti s intervalem spolehlivosti (přednosti) Př. Rozdíl v míře spokojenosti mužů a žen Copyright 2006 SPSS Inc. 7
8
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů a) Dva nezávislé výběry Další testy pro dva nezávislé výběry: Kolmogorov-Smirnov test, Wald-Wolfowitz test – testují nejen různou polohu dvou výběrů (medián) ale i tvar jejich rozdělení Moses extreme reactions test pro experimenty, zjišťuje zda v experimentální skupině jsou výrazná vychýlení oproti kontrolní (Pozn. v SPSS kontrolní skupina skupina 1 při definici skupin) Copyright 2006 SPSS Inc. 8
9
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů b) Dva závislé výběry Wilcoxonův test pro dva závislé výběry SPSS: Analyze- Nonparametric tests-2 Related Samples pro ordinální veličiny, kdy neplatí normalita a je malý počet pozorování Ho: mediány u dvou závislých proměnných (výběrů) se rovnají H1: mediány u dvou závislých proměnných se liší př.: jednomu respondentovi 2 otázky, ptáme se po nějaké době toho samého respondenta znovu, ptáme se členů jedné rodiny, ptáme se na související otázky atd. Copyright 2006 SPSS Inc. 9
10
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů b) Dva závislé výběry Další testy v SPSS: Sign (Znaménkový) – slabší síla oproti Wilcoxon, Copyright 2006 SPSS Inc. 10
11
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů c) Více nezávislých výběrů Kruskal- Wallisův test SPSS: Analyze- Nonparametric tests-K Independent Samples obdoba analýzy rozptylu pro ordinální proměnné nebo pro kardinální proměnné, kde se rozptyly ve skupinách výrazně liší při teoretickém výpočtu se hodnota testového kritéria porovnává s tabulkou normálního rozdělení nebo s kvantity v přesných tabulkách Ho zamítáme méně často než při parametrickém testu (máme méně kvalitní data)- účinnost testu v porovnání s analýzou rozptylu cca 90% H0: mediány ve všech skupinách (výběrech) se rovnají H1: mediány alespoň dvou skupin se liší ;Po zamítnutí H0 nutno zkoumat které skupiny se liší Copyright 2006 SPSS Inc. 11
12
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů c) Více nezávislých výběrů Jiné testy v SPSS: Mediánový test H0: mediány ve skupinách v populaci se rovnají H1: mediány alespoň dvou skupin se liší Méně silný test než K-W test Jonckheere- Terpstra test Ho: mediány se rovnají H1: mediány ve skupinách se postupně zvyšují vhodnější než Kruskal- Wallis- zamítáme Ho s pravděpodobností cca 95% v porovnání s analýzou rozptylu, když jsou mediány postupně narůstající Copyright 2006 SPSS Inc. 12
13
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů d) Více závislých výběrů Friedmanův test V SPSS: Analyze- Nonparametric tests-K Related Samples Otázka: existuje rozdíl mezi mediány v jednotlivých závislých skupinách? H0: rozdělení ve více závislých výběrech jsou shodné H1: rozdělení v alespoň dvou závislých výběrech se liší po zamítnutí Ho musí následovat další test, abychom zjistili, které skupiny se mezi sebou liší- vytvoříme dvojice a následně použijeme např. Wilcoxův test (pro dva závislé výběry, cesta: Analyze- Nonparametric tests- 2 related samples) Copyright 2006 SPSS Inc. 13
14
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů d) Více závislých výběrů Další testy v SPSS Kendall (stejné jako Friedman, jen navíc počítá Kendallův koeficient konkordance W od 0 do 1 čím více shoda v jednotlivých výběrech tím větší hodnota koeficientu) Cochranovo Q (Friedman pouze pro dichotomické proměnné) Př. Posouzení shody hodnocení u několika porotců, shoda Copyright 2006 SPSS Inc. 14
15
SPSS Inc. ANALÝZA ROZPTYLU Copyright 2006 SPSS Inc. 15
16
Stručně o názvu NÁZEV: Analýza rozptylu
ALE CÍL: hledat rozdíly v průměrech několika skupin Anglicky ANOVA – ANalysis Of VAriance V SPSS několik procedur
17
Základní myšlenka IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2
NEJSOU ROZDÍLY V PRŮMĚRECH JSOU ROZDÍLY V PRŮMĚRECH ? JAK JE TO S ROZPTYLEM?
18
Rozdíly ve složkách rozptylu
1. VNITROSHLUKOVÝ ROZPTYL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL ? A CO ROZPTYL MEZI SHLUKY?
19
Rozdíly ve složkách rozptylu
2. MEZISHLUKOVÝ ROZPTYL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 x x x x x x MALÝ MEZISHL. ROZPTYL RESP VELKÝ MEZISHL. ROZPTYL
20
Základní myšlenka PODÍL ROZPTYLŮ POMŮŽE URČIT, ZDA JE ROZDÍL
IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 MALÝ MEZISHL. ROZPTYL VELKÝ MEZISHL. ROZPTYL =? =? VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL PODÍL ROZPTYLŮ POMŮŽE URČIT, ZDA JE ROZDÍL ALESPOŇ MEZI 2 PRŮMĚRY STATISTICKY VÝZNAMNÝ
21
Základní hypotézy analýzy rozptylu
nulová hypotéza (H0): všechny průměry ve sledovaných skupinách jsou stejné (obecně nulové hypotézy většinou tvrdí, že neexistují rozdíly resp. závislosti) alternativní hypotéza (H1): alespoň mezi dvěmi skupinami existuje statisticky významný (zobecnitelný) rozdíl Základní možnosti rozhodnutí ve statistickém testu: A) nezamítnutí nulové hypotézy B) zamítnutí nulové hypotézy (přijetí hypotézy alternativní), tedy alespoň mezi 2 skupinami existuje statisticky významný rozdíl v průměrech Pomůcka pro rozhodnutí: vypočtená hladina statistické významnosti (Sig., P, P-level, alfa-level apod.) Rozhodnutí: Při malé hodnotě (většinou do 0,05 zamítáme H0 při větších nezamítáme)
22
Ukázka na tabulce z analýzy rozptylu
TEST Složky rozptylu
23
Předpoklady použití analýzy
A. 1 kardinální proměnná (ZÁVISLÁ) – př. příjem, spokojenost, prestiž profese B. 1 proměnná určující příslušnost alespoň do tří skupin (FAKTOR) – př. vzdělání, region, typ zákazníka (Poznámka:v případě dvou skupin lze užít t-testy) C. Požadavek shodných rozptylů ve skupinách (Levene test), nezávislosti skupin
24
Ukázka na datech v SPSS Příprava dat (vzdělání a Internet) Zadání:
Analyze»Compare Means»One-Way-Anova Základní výstupy a komentář Následné testy (Post-hoc) 2 typy Eta2 – měření důležitosti třídícího faktoru
25
Poznámky závěrem Lze posuzovat vliv více faktorů-vícefaktorová analýza rozptylu Lze kromě faktorů použít i kardinální proměnné (Covariate) jako nezávislé-viz GLM V případě malých výběrů a nedodržení předpokladů analýzy rozptylu lze užít neparametrické testy (K-W, Friedman)
26
NEPARAMETRICKÉ TESTY II, III
SPSS Inc. NEPARAMETRICKÉ TESTY II, III Copyright 2006 SPSS Inc. 26
27
1. Obdoby parametrických testů
SPSS Inc. 1. Obdoby parametrických testů b) Dva závislé výběry (testy shody rozdlěení dvou závislýchg proměnných) McNemar-pouze pro dichotomické proměnné, posun názoru u sdružených (opakovaných) měření Marginal Homogenity rozšíření McNemar pro kategoriální proměnné s více než 2 hodnotami Copyright 2006 SPSS Inc. 27
28
2. Neparametrické testy pro nomin. a dichotomické proměnné
SPSS Inc. 2. Neparametrické testy pro nomin. a dichotomické proměnné Chi-kvadrát test o podílu (relativní četnosti) v SPSS Analyze- Nonparametric tests-Binomial Test H0: Podíl určitého jevu (v kategorii označené nižší hodnotou) v populaci je roven předem stanovené hodnotě (přednastaveno 0,5 možno změnit dle úlohy) H1: Podíl určitého jevu (v kategorii označené nižší hodnotou) není roven předem přednastavené hodnotě Př. Podíl voličů určité strany se rovná 10% jako loni, podíl firmy na trhu je 30 % jako loni atd. Copyright 2006 SPSS Inc. 28
29
2. Neparametrické testy pro nomin. a dichotomické proměnné
SPSS Inc. 2. Neparametrické testy pro nomin. a dichotomické proměnné Chi-kvadrát test o rozložení četností v SPSS Analyze- Nonparametric tests-Chi-Square test H0: Rozložení kategorií určité proměnné v populaci odpovídá naší představě (např. z loňského roku, jiné země atd.) H1: Rozložení kategorií určité proměnné v populaci neodpovídá naší představě Př. Rozdělení zákazníků dle zájmu o různé země v cestovní kanceláři je obdobné jako loni, rozložení politické přízně stranám rok po volbách odpovídá volebnímu výsledku atd. Copyright 2006 SPSS Inc. 29
30
2. Neparametrické testy pro nomin. a dichotomické proměnné
SPSS Inc. 2. Neparametrické testy pro nomin. a dichotomické proměnné Test náhodnosti pořadí v SPSS Analyze- Nonparametric tests-Runs test Testuje, zda hodnoty dichotomické proměnné jdoucí po sobě jsou uspořádané náhodně H0: Uspořádání hodnot je náhodné (tedy hodnoty se náhodně střídají) např. při hodu mincí panna a orel H1: Uspořádání hodnot není náhodné Pozn. Lze testovat i náhodné střídání hodnot větších a menších než je medián modus, průměr nebo jiná uživatelem zadaná hodnota) v případě že proměnná je jiná než dichotomická Copyright 2006 SPSS Inc. 30
31
3. Neparametrické testy pro rozložení proměnných
SPSS Inc. 3. Neparametrické testy pro rozložení proměnných Kolmogorov-Smirnov test pro 1 výběr v SPSS Analyze- Nonparametric tests-One-Sample K-S test Testuje zda rozdělení námi vybrané proměnné odpovídá některému z teoretických (normální, rovnoměrné, poissonovo, exponenciální) H0: Rozdělení sledované proměnné odpovídá teoretickému rozdělení H1: Rozdělení sledované proměnné neodpovídá teoretickému rozdělení Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů) Copyright 2006 SPSS Inc. 31
32
3. Neparametrické testy pro rozložení proměnných
SPSS Inc. 3. Neparametrické testy pro rozložení proměnných Kolmogorov-Smirnov test pro 2 výběry v SPSS Analyze- Nonparametric tests-2-Independent Samples Testuje zda rozdělení námi vybrané proměnné je shodné ve dvou skupinách H0: Rozdělení proměnné ve dvou nezávislých výběrech je shodné H1: Rozdělení proměnné ve dvou nezávislých výběrech není shodné Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů) Copyright 2006 SPSS Inc. 32
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.