Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Neparametrické metody a analýza rozptylu (lekce 3-7) Statistika II FSV UK Petr Soukup ISS FSV UK.

Podobné prezentace


Prezentace na téma: "Neparametrické metody a analýza rozptylu (lekce 3-7) Statistika II FSV UK Petr Soukup ISS FSV UK."— Transkript prezentace:

1 Neparametrické metody a analýza rozptylu (lekce 3-7) Statistika II FSV UK Petr Soukup ISS FSV UK

2 2 Neparametrické testy Obecně testy nevyžadující tolik předpokladů jako parametrické testy (t-testy, analýza rozptylu apod. viz předpoklady normality, kardinalita proměnných apod.) Obecně testy nevyžadující tolik předpokladů jako parametrické testy (t-testy, analýza rozptylu apod. viz předpoklady normality, kardinalita proměnných apod.) Některé testy obdoby výše zmíněných parametrických t-testů Některé testy obdoby výše zmíněných parametrických t-testů V SPSS: Analyze- Nonparametric tests V SPSS: Analyze- Nonparametric tests Datový soubor pro demonstrace: nepar.sav Datový soubor pro demonstrace: nepar.sav

3 3 Typy neparametrických testů Typy neparametrických testů 1. Obdoby parametrických T- testů a analýzy rozptylu 1. Obdoby parametrických T- testů a analýzy rozptylu 2. Neparametrické testy pro nominální a dichotomické proměnné (Binomial Test, Chi- Square test, Runs test) viz pozdější lekce 2. Neparametrické testy pro nominální a dichotomické proměnné (Binomial Test, Chi- Square test, Runs test) viz pozdější lekce 3. Neparametrické testy pro rozložení proměnných (Kolmogorov-Smirnov test pro 1 a 2 výběry) viz též lekce 1 (1 výběrový) 3. Neparametrické testy pro rozložení proměnných (Kolmogorov-Smirnov test pro 1 a 2 výběry) viz též lekce 1 (1 výběrový)

4 4 NEPARAMETRICKÉ TESTY I

5 5 1. Obdoby parametrických testů 1. Obdoby parametrických testů založené zejm. na mediánech a pořadí tedy určeny zejm. pro ordinální proměnné a malé soubory založené zejm. na mediánech a pořadí tedy určeny zejm. pro ordinální proměnné a malé soubory Pozn. předpoklady parametrických testů- kardinální veličina s normálním rozdělením (u t- testů nevadí, pokud je normalita porušena- testy jsou „robustní“) a alespoň 30 pozorování Pozn. předpoklady parametrických testů- kardinální veličina s normálním rozdělením (u t- testů nevadí, pokud je normalita porušena- testy jsou „robustní“) a alespoň 30 pozorování Předpoklady pro neparametrické testy: malé výběry (cca do 30) malé výběry (cca do 30) nekardinální charakter proměnných nebo kardinální proměnné s nenormálním rozložením (malých výběrů) nekardinální charakter proměnných nebo kardinální proměnné s nenormálním rozložením (malých výběrů)

6 6 1. Obdoby parametrických testů 1. Obdoby parametrických testů situace Parametrický test Neparametrický test a) Dva nezávislé výběry Dvouvýběrový t- test Man-Whitney test aj. b) Dva závislé výběry Párový t-test Wilcoxonův test aj. c) Více nezávislých výběrů Jednofaktorová analýza rozptylu Kruskal-Wallis test aj. d) Více závislých výběrů Friedmanův test aj.

7 7 1. Obdoby parametrických testů 1. Obdoby parametrických testů a) Dva nezávislé výběry Mann- Whitney test Mann- Whitney test SPSS: Analyze- Nonparametric tests-2 Independent Samples SPSS: Analyze- Nonparametric tests-2 Independent Samples pro dva nezávislé výběry pro dva nezávislé výběry pro malé výběry, ordinální veličiny pro malé výběry, ordinální veličiny Ho: mediány ve výběrech se rovnají Ho: mediány ve výběrech se rovnají H1: mediány se liší H1: mediány se liší v SPSS se rozhodujeme podle Sig v SPSS se rozhodujeme podle Sig Vysvětlení výpočtů přesných Sig. (modul Exact v SPSS Vysvětlení výpočtů přesných Sig. (modul Exact v SPSS pro výběry menší než 15 použití Exact Sig. (přesná signifikace) pro výběry menší než 15 použití Exact Sig. (přesná signifikace) pro výběry větší použití přibližné statistické významnosti (Asymp. Sig.) pro výběry větší použití přibližné statistické významnosti (Asymp. Sig.) Monte Carlo simulace namísto přesné hodnoty statistické významnosti s intervalem spolehlivosti (přednosti) Monte Carlo simulace namísto přesné hodnoty statistické významnosti s intervalem spolehlivosti (přednosti) Př. Rozdíl v míře spokojenosti mužů a žen Př. Rozdíl v míře spokojenosti mužů a žen

8 8 1. Obdoby parametrických testů 1. Obdoby parametrických testů a) Dva nezávislé výběry Další testy pro dva nezávislé výběry: Další testy pro dva nezávislé výběry: Kolmogorov-Smirnov test, Wald-Wolfowitz test – testují nejen různou polohu dvou výběrů (medián) ale i tvar jejich rozdělení Kolmogorov-Smirnov test, Wald-Wolfowitz test – testují nejen různou polohu dvou výběrů (medián) ale i tvar jejich rozdělení Moses extreme reactions test pro experimenty, zjišťuje zda v experimentální skupině jsou výrazná vychýlení oproti kontrolní (Pozn. v SPSS kontrolní skupina skupina 1 při definici skupin) Moses extreme reactions test pro experimenty, zjišťuje zda v experimentální skupině jsou výrazná vychýlení oproti kontrolní (Pozn. v SPSS kontrolní skupina skupina 1 při definici skupin)

9 9 1. Obdoby parametrických testů 1. Obdoby parametrických testů b) Dva závislé výběry Wilcoxonův test pro dva závislé výběry Wilcoxonův test pro dva závislé výběry SPSS: Analyze- Nonparametric tests-2 Related Samples SPSS: Analyze- Nonparametric tests-2 Related Samples pro ordinální veličiny, kdy neplatí normalita a je malý počet pozorování pro ordinální veličiny, kdy neplatí normalita a je malý počet pozorování Ho: mediány u dvou závislých proměnných (výběrů) se rovnají Ho: mediány u dvou závislých proměnných (výběrů) se rovnají H1: mediány u dvou závislých proměnných se liší H1: mediány u dvou závislých proměnných se liší př.: jednomu respondentovi 2 otázky, ptáme se po nějaké době toho samého respondenta znovu, ptáme se členů jedné rodiny, ptáme se na související otázky atd. př.: jednomu respondentovi 2 otázky, ptáme se po nějaké době toho samého respondenta znovu, ptáme se členů jedné rodiny, ptáme se na související otázky atd.

10 10 1. Obdoby parametrických testů 1. Obdoby parametrických testů b) Dva závislé výběry Další testy v SPSS: Další testy v SPSS: Sign (Znaménkový) – slabší síla oproti Wilcoxon, Sign (Znaménkový) – slabší síla oproti Wilcoxon,

11 11 1. Obdoby parametrických testů 1. Obdoby parametrických testů c) Více nezávislých výběrů Kruskal- Wallisův test Kruskal- Wallisův test SPSS: Analyze- Nonparametric tests-K Independent Samples SPSS: Analyze- Nonparametric tests-K Independent Samples obdoba analýzy rozptylu pro ordinální proměnné nebo pro kardinální proměnné, kde se rozptyly ve skupinách výrazně liší obdoba analýzy rozptylu pro ordinální proměnné nebo pro kardinální proměnné, kde se rozptyly ve skupinách výrazně liší při teoretickém výpočtu se hodnota testového kritéria porovnává s tabulkou normálního rozdělení nebo s kvantity v přesných tabulkách při teoretickém výpočtu se hodnota testového kritéria porovnává s tabulkou normálního rozdělení nebo s kvantity v přesných tabulkách Ho zamítáme méně často než při parametrickém testu (máme méně kvalitní data)- účinnost testu v porovnání s analýzou rozptylu cca 90% Ho zamítáme méně často než při parametrickém testu (máme méně kvalitní data)- účinnost testu v porovnání s analýzou rozptylu cca 90% H0: mediány ve všech skupinách (výběrech) se rovnají H0: mediány ve všech skupinách (výběrech) se rovnají H1: mediány alespoň dvou skupin se liší H1: mediány alespoň dvou skupin se liší ;Po zamítnutí H0 nutno zkoumat které skupiny se liší ;Po zamítnutí H0 nutno zkoumat které skupiny se liší

12 12 1. Obdoby parametrických testů 1. Obdoby parametrických testů c) Více nezávislých výběrů Jiné testy v SPSS: Jiné testy v SPSS: Mediánový test Mediánový test H0: mediány ve skupinách v populaci se rovnají H0: mediány ve skupinách v populaci se rovnají H1: mediány alespoň dvou skupin se liší H1: mediány alespoň dvou skupin se liší Méně silný test než K-W test Méně silný test než K-W test Jonckheere- Terpstra test Jonckheere- Terpstra test Ho: mediány se rovnají Ho: mediány se rovnají H1: mediány ve skupinách se postupně zvyšují H1: mediány ve skupinách se postupně zvyšují vhodnější než Kruskal- Wallis- zamítáme Ho s pravděpodobností cca 95% v porovnání s analýzou rozptylu, když jsou mediány postupně narůstající vhodnější než Kruskal- Wallis- zamítáme Ho s pravděpodobností cca 95% v porovnání s analýzou rozptylu, když jsou mediány postupně narůstající

13 13 1. Obdoby parametrických testů 1. Obdoby parametrických testů d) Více závislých výběrů Friedmanův test Friedmanův test V SPSS: Analyze- Nonparametric tests-K Related Samples V SPSS: Analyze- Nonparametric tests-K Related Samples Otázka: existuje rozdíl mezi mediány v jednotlivých závislých skupinách? Otázka: existuje rozdíl mezi mediány v jednotlivých závislých skupinách? H0: rozdělení ve více závislých výběrech jsou shodné H0: rozdělení ve více závislých výběrech jsou shodné H1: rozdělení v alespoň dvou závislých výběrech se liší H1: rozdělení v alespoň dvou závislých výběrech se liší po zamítnutí Ho musí následovat další test, abychom zjistili, které skupiny se mezi sebou liší- vytvoříme dvojice a následně použijeme např. Wilcoxův test (pro dva závislé výběry, cesta: Analyze- Nonparametric tests- 2 related samples) po zamítnutí Ho musí následovat další test, abychom zjistili, které skupiny se mezi sebou liší- vytvoříme dvojice a následně použijeme např. Wilcoxův test (pro dva závislé výběry, cesta: Analyze- Nonparametric tests- 2 related samples)

14 14 1. Obdoby parametrických testů 1. Obdoby parametrických testů d) Více závislých výběrů Další testy v SPSS Další testy v SPSS Kendall (stejné jako Friedman, jen navíc počítá Kendallův koeficient konkordance W od 0 do 1 čím více shoda v jednotlivých výběrech tím větší hodnota koeficientu) Kendall (stejné jako Friedman, jen navíc počítá Kendallův koeficient konkordance W od 0 do 1 čím více shoda v jednotlivých výběrech tím větší hodnota koeficientu) Cochranovo Q (Friedman pouze pro dichotomické proměnné) Cochranovo Q (Friedman pouze pro dichotomické proměnné) Př. Posouzení shody hodnocení u několika porotců, shoda Př. Posouzení shody hodnocení u několika porotců, shoda

15 15 ANALÝZA ROZPTYLU

16 Stručně o názvu NÁZEV: Analýza rozptylu NÁZEV: Analýza rozptylu ALE CÍL: hledat rozdíly v průměrech několika skupin ALE CÍL: hledat rozdíly v průměrech několika skupin Anglicky ANOVA – ANalysis Of VAriance Anglicky ANOVA – ANalysis Of VAriance V SPSS několik procedur V SPSS několik procedur

17 Základní myšlenka NEJSOU ROZDÍLY V PRŮMĚRECH JSOU ROZDÍLY V PRŮMĚRECH ? JAK JE TO S ROZPTYLEM? IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2

18 Rozdíly ve složkách rozptylu VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL ? A CO ROZPTYL MEZI SHLUKY? IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 1. VNITROSHLUKOVÝ ROZPTYL

19 Rozdíly ve složkách rozptylu MALÝ MEZISHL. ROZPTYL RESP. 0 VELKÝ MEZISHL. ROZPTYL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 2. MEZISHLUKOVÝ ROZPTYL x xx x x x

20 Základní myšlenka IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL MALÝ MEZISHL. ROZPTYL VELKÝ MEZISHL. ROZPTYL PODÍL ROZPTYLŮ POMŮŽE URČIT, ZDA JE ROZDÍL ALESPOŇ MEZI 2 PRŮMĚRY STATISTICKY VÝZNAMNÝ =?

21 Základní hypotézy analýzy rozptylu nulová hypotéza (H0): všechny průměry ve sledovaných skupinách jsou stejné (obecně nulové hypotézy většinou tvrdí, že neexistují rozdíly resp. závislosti) nulová hypotéza (H0): všechny průměry ve sledovaných skupinách jsou stejné (obecně nulové hypotézy většinou tvrdí, že neexistují rozdíly resp. závislosti) alternativní hypotéza (H1): alespoň mezi dvěmi skupinami existuje statisticky významný (zobecnitelný) rozdíl alternativní hypotéza (H1): alespoň mezi dvěmi skupinami existuje statisticky významný (zobecnitelný) rozdíl Základní možnosti rozhodnutí ve statistickém testu: A) nezamítnutí nulové hypotézy A) nezamítnutí nulové hypotézy B) zamítnutí nulové hypotézy (přijetí hypotézy alternativní), tedy alespoň mezi 2 skupinami existuje statisticky významný rozdíl v průměrech B) zamítnutí nulové hypotézy (přijetí hypotézy alternativní), tedy alespoň mezi 2 skupinami existuje statisticky významný rozdíl v průměrech Pomůcka pro rozhodnutí: vypočtená hladina statistické významnosti (Sig., P, P-level, alfa-level apod.) Pomůcka pro rozhodnutí: vypočtená hladina statistické významnosti (Sig., P, P-level, alfa-level apod.) Rozhodnutí: Při malé hodnotě (většinou do 0,05 zamítáme H0 při větších nezamítáme) Rozhodnutí: Při malé hodnotě (většinou do 0,05 zamítáme H0 při větších nezamítáme)

22 Ukázka na tabulce z analýzy rozptylu TEST Složky rozptylu

23 Předpoklady použití analýzy A. 1 kardinální proměnná (ZÁVISLÁ) – př. příjem, spokojenost, prestiž profese B. 1 proměnná určující příslušnost alespoň do tří skupin (FAKTOR) – př. vzdělání, region, typ zákazníka (Poznámka:v případě dvou skupin lze užít t-testy) C. Požadavek shodných rozptylů ve skupinách (Levene test), nezávislosti skupin

24 Ukázka na datech v SPSS Příprava dat (vzdělání a Internet) Příprava dat (vzdělání a Internet) Zadání: Zadání: Analyze»Compare Means»One- Way-Anova Analyze»Compare Means»One- Way-Anova Základní výstupy a komentář Základní výstupy a komentář Následné testy (Post-hoc) 2 typy Následné testy (Post-hoc) 2 typy Eta 2 – měření důležitosti třídícího faktoru Eta 2 – měření důležitosti třídícího faktoru

25 Poznámky závěrem Lze posuzovat vliv více faktorů- vícefaktorová analýza rozptylu Lze posuzovat vliv více faktorů- vícefaktorová analýza rozptylu Lze kromě faktorů použít i kardinální proměnné (Covariate) jako nezávislé-viz GLM Lze kromě faktorů použít i kardinální proměnné (Covariate) jako nezávislé-viz GLM V případě malých výběrů a nedodržení předpokladů analýzy rozptylu lze užít neparametrické testy (K-W, Friedman) V případě malých výběrů a nedodržení předpokladů analýzy rozptylu lze užít neparametrické testy (K-W, Friedman)

26 26 NEPARAMETRICKÉ TESTY II, III

27 27 1. Obdoby parametrických testů 1. Obdoby parametrických testů b) Dva závislé výběry (testy shody rozdlěení dvou závislýchg proměnných) McNemar-pouze pro dichotomické proměnné, posun názoru u sdružených (opakovaných) měření McNemar-pouze pro dichotomické proměnné, posun názoru u sdružených (opakovaných) měření Marginal Homogenity rozšíření McNemar pro kategoriální proměnné s více než 2 hodnotami Marginal Homogenity rozšíření McNemar pro kategoriální proměnné s více než 2 hodnotami

28 28 2. Neparametrické testy pro nomin. a dichotomické proměnné Chi-kvadrát test o podílu (relativní četnosti) Chi-kvadrát test o podílu (relativní četnosti) v SPSS Analyze- Nonparametric tests-Binomial Test v SPSS Analyze- Nonparametric tests-Binomial Test H0: Podíl určitého jevu (v kategorii označené nižší hodnotou) v populaci je roven předem stanovené hodnotě (přednastaveno 0,5 možno změnit dle úlohy) H0: Podíl určitého jevu (v kategorii označené nižší hodnotou) v populaci je roven předem stanovené hodnotě (přednastaveno 0,5 možno změnit dle úlohy) H1: Podíl určitého jevu (v kategorii označené nižší hodnotou) není roven předem přednastavené hodnotě H1: Podíl určitého jevu (v kategorii označené nižší hodnotou) není roven předem přednastavené hodnotě Př. Podíl voličů určité strany se rovná 10% jako loni, podíl firmy na trhu je 30 % jako loni atd. Př. Podíl voličů určité strany se rovná 10% jako loni, podíl firmy na trhu je 30 % jako loni atd.

29 29 Chi-kvadrát test o rozložení četností Chi-kvadrát test o rozložení četností v SPSS Analyze- Nonparametric tests-Chi-Square test v SPSS Analyze- Nonparametric tests-Chi-Square test H0: Rozložení kategorií určité proměnné v populaci odpovídá naší představě (např. z loňského roku, jiné země atd.) H0: Rozložení kategorií určité proměnné v populaci odpovídá naší představě (např. z loňského roku, jiné země atd.) H1: Rozložení kategorií určité proměnné v populaci neodpovídá naší představě H1: Rozložení kategorií určité proměnné v populaci neodpovídá naší představě Př. Rozdělení zákazníků dle zájmu o různé země v cestovní kanceláři je obdobné jako loni, rozložení politické přízně stranám rok po volbách odpovídá volebnímu výsledku atd. Př. Rozdělení zákazníků dle zájmu o různé země v cestovní kanceláři je obdobné jako loni, rozložení politické přízně stranám rok po volbách odpovídá volebnímu výsledku atd. 2. Neparametrické testy pro nomin. a dichotomické proměnné

30 30 Test náhodnosti pořadí Test náhodnosti pořadí v SPSS Analyze- Nonparametric tests-Runs test v SPSS Analyze- Nonparametric tests-Runs test Testuje, zda hodnoty dichotomické proměnné jdoucí po sobě jsou uspořádané náhodně Testuje, zda hodnoty dichotomické proměnné jdoucí po sobě jsou uspořádané náhodně H0: Uspořádání hodnot je náhodné (tedy hodnoty se náhodně střídají) např. při hodu mincí panna a orel H0: Uspořádání hodnot je náhodné (tedy hodnoty se náhodně střídají) např. při hodu mincí panna a orel H1: Uspořádání hodnot není náhodné H1: Uspořádání hodnot není náhodné Pozn. Lze testovat i náhodné střídání hodnot větších a menších než je medián modus, průměr nebo jiná uživatelem zadaná hodnota) v případě že proměnná je jiná než dichotomická Pozn. Lze testovat i náhodné střídání hodnot větších a menších než je medián modus, průměr nebo jiná uživatelem zadaná hodnota) v případě že proměnná je jiná než dichotomická 2. Neparametrické testy pro nomin. a dichotomické proměnné

31 31 3. Neparametrické testy pro rozložení proměnných 3. Neparametrické testy pro rozložení proměnných Kolmogorov-Smirnov test pro 1 výběr Kolmogorov-Smirnov test pro 1 výběr v SPSS Analyze- Nonparametric tests-One-Sample K-S test v SPSS Analyze- Nonparametric tests-One-Sample K-S test Testuje zda rozdělení námi vybrané proměnné odpovídá některému z teoretických (normální, rovnoměrné, poissonovo, exponenciální) Testuje zda rozdělení námi vybrané proměnné odpovídá některému z teoretických (normální, rovnoměrné, poissonovo, exponenciální) H0: Rozdělení sledované proměnné odpovídá teoretickému rozdělení H0: Rozdělení sledované proměnné odpovídá teoretickému rozdělení H1: Rozdělení sledované proměnné neodpovídá teoretickému rozdělení H1: Rozdělení sledované proměnné neodpovídá teoretickému rozdělení Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů) Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů)

32 32 3. Neparametrické testy pro rozložení proměnných 3. Neparametrické testy pro rozložení proměnných Kolmogorov-Smirnov test pro 2 výběry Kolmogorov-Smirnov test pro 2 výběry v SPSS Analyze- Nonparametric tests-2-Independent Samples v SPSS Analyze- Nonparametric tests-2-Independent Samples Testuje zda rozdělení námi vybrané proměnné je shodné ve dvou skupinách Testuje zda rozdělení námi vybrané proměnné je shodné ve dvou skupinách H0: Rozdělení proměnné ve dvou nezávislých výběrech je shodné H0: Rozdělení proměnné ve dvou nezávislých výběrech je shodné H1: Rozdělení proměnné ve dvou nezávislých výběrech není shodné H1: Rozdělení proměnné ve dvou nezávislých výběrech není shodné Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů) Pozn. Tento test je vhodný zejména pro ověřování předpokladů pro určité statistické procedury (např. normalita proměnné u analýzy rozptylu a t-testů)


Stáhnout ppt "Neparametrické metody a analýza rozptylu (lekce 3-7) Statistika II FSV UK Petr Soukup ISS FSV UK."

Podobné prezentace


Reklamy Google