T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Neparametrické testy pro nezávislé výběry
Úvod do analýzy rozptylu
MONITORING PACIENTŮ UŽÍVAJÍCÍCH ArthroStop® PLUS
Testování parametrických hypotéz
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Neparametrické metody a analýza rozptylu (lekce 3-7)
Jednovýběrové testy parametrickch hypotéz
Analýza dotazníků RNDr. Michal Čihák, Ph.D..
Testování hypotéz.
Testování statistických hypotéz
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
Statistika II Michal Jurajda.
Testování hypotéz (ordinální data)
Obecný postup při testování souborů
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Řízení a supervize v sociálních a zdravotnických organizacích
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Analýza variance (ANOVA).
V. Analýza rozptylu ANOVA.
Dvouvýběrový t-test 11 stejně starých selat bylo náhodně rozděleno do 2 skupin. První skupina byla krmena krmivem A, druhá krmivem B. Po 6 měsících byly.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Statistická významnost a její problémy
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Marketingový průzkum Milan Mrázek Matematika & Business
PSY717 – statistická analýza dat
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Základy testování hypotéz
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednovýběrový t-test Jednovýběrový test rozptylu V.d1 Statistické.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
PSY117 Statistická analýza dat v psychologii Přednáška
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Testování hypotéz párový test
Neparametrické testy parametrické a neparametrické testy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Normální rozdělení a ověření normality dat Modelová rozdělení
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Spojité VELIČINY Vyšetřování normality dat
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Základy statistiky.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

T-testy, neparametrické metody a analýza rozptylu (lekce 5-6) Analýza dat FSV UK Petr Soukup ISS FSV UK

T-TESTY 2

T-testy „Testy pro průměry“ Poznámka: lze užít pro proporce u dichotomické proměnné Tři varianty: Jednovýběrový –málo Dva nezávislé výběry (Two independent samples) - nejčastěji Párový (paired, dependent) - občas 3

T-tests Požadavky : Spojitá proměnná (ideálně normální) Shoda rozptylů (není nutná) 4

T-testy Analyze-Compare Means 1. ONE SAMPLE : 2. TWO IND. SAMPLES : Průměrný příjem 2. TWO IND. SAMPLES : Rozdíl v příjmu mezi M a Ž (nula vs. Jiná smysluplná částka) Poznámka: Výpočet Cohenova d a rozdíl mezi věcnou a stat. významností https://www.socscistatistics.com/effectsize/Default3.aspx 5

TESTY & CI 6

Interval spolehlivosti (CI) a testy CI umí dát stejnou odpověď jako test na otázku: Je efekt zobecnitelný na populaci (z výběru)? CI umí víc: Odhad neznámého parametru skrze interval Varování I: Testování je jen dichotomický proces: statisticky významné vs. statisticky NEvýznamné 7

Interval spolehlivosti (CI) a testy Varování II: I CI mají své slabiny 8

ALTERNATIVY T-TESTŮ (NEPARAMETRICKÉ TESTY) 9

Obdoby parametrických testů SPSS Inc. Obdoby parametrických testů situace Parametrický test Neparametrický test a) Dva nezávislé výběry Dvouvýběrový t-test Man-Whitney test aj. b) Dva závislé výběry Párový t-test Wilcoxonův test aj. c) Více nezávislých výběrů Jednofaktorová analýza rozptylu Kruskal-Wallis test aj. d) Více závislých výběrů Friedmanův test aj. Copyright 2006 SPSS Inc. 10

SPSS Inc. Neparametrické testy Obecně testy nevyžadující tolik předpokladů jako parametrické testy (t-testy, analýza rozptylu apod. viz předpoklady normality, kardinalita proměnných apod.) Některé testy obdoby výše zmíněných parametrických t-testů V SPSS: Analyze- Nonparametric tests Copyright 2006 SPSS Inc. 11

Typy neparametrických testů SPSS Inc. Typy neparametrických testů 1. Obdoby parametrických T- testů a analýzy rozptylu 2. Neparametrické testy pro nominální a dichotomické proměnné (Binomial Test, Chi-Square test, Runs test) viz pozdější lekce 3. Neparametrické testy pro rozložení proměnných (Kolmogorov-Smirnov test pro 1 a 2 výběry) viz též lekce 1 (1 výběrový) Copyright 2006 SPSS Inc. 12

NEPARAMETRICKÉ TESTY I SPSS Inc. NEPARAMETRICKÉ TESTY I Copyright 2006 SPSS Inc. 13

1. Obdoby parametrických testů SPSS Inc. 1. Obdoby parametrických testů založené zejm. na mediánech a pořadí tedy určeny zejm. pro ordinální proměnné a malé soubory Pozn. předpoklady parametrických testů- kardinální veličina s normálním rozdělením (u t-testů nevadí, pokud je normalita porušena- testy jsou „robustní“) a alespoň 30 pozorování Předpoklady pro neparametrické testy: malé výběry (cca do 30) nekardinální charakter proměnných nebo kardinální proměnné s nenormálním rozložením (malých výběrů) Copyright 2006 SPSS Inc. 14

1. Obdoby parametrických testů SPSS Inc. 1. Obdoby parametrických testů a) Dva nezávislé výběry Mann- Whitney test SPSS: Analyze- Nonparametric tests-2 Independent Samples pro dva nezávislé výběry pro malé výběry, ordinální veličiny Ho: mediány ve výběrech se rovnají H1: mediány se liší v SPSS se rozhodujeme podle Sig Vysvětlení výpočtů přesných Sig. (modul Exact v SPSS pro výběry menší než 15 použití Exact Sig. (přesná signifikace) pro výběry větší použití přibližné statistické významnosti (Asymp. Sig.) Monte Carlo simulace namísto přesné hodnoty statistické významnosti s intervalem spolehlivosti (přednosti) Př. Rozdíl v míře spokojenosti mužů a žen Copyright 2006 SPSS Inc. 15

1. Obdoby parametrických testů SPSS Inc. 1. Obdoby parametrických testů b) Dva závislé výběry Wilcoxonův test pro dva závislé výběry SPSS: Analyze- Nonparametric tests-2 Related Samples pro ordinální veličiny, kdy neplatí normalita a je malý počet pozorování Ho: mediány u dvou závislých proměnných (výběrů) se rovnají H1: mediány u dvou závislých proměnných se liší př.: jednomu respondentovi 2 otázky, ptáme se po nějaké době toho samého respondenta znovu, ptáme se členů jedné rodiny, ptáme se na související otázky atd. Copyright 2006 SPSS Inc. 16

SPSS Inc. ANALÝZA ROZPTYLU Copyright 2006 SPSS Inc. 17

Stručně o názvu NÁZEV: Analýza rozptylu ALE CÍL: hledat rozdíly v průměrech několika skupin Anglicky ANOVA – ANalysis Of VAriance V SPSS několik procedur

Základní myšlenka IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 NEJSOU ROZDÍLY V PRŮMĚRECH JSOU ROZDÍLY V PRŮMĚRECH ? JAK JE TO S ROZPTYLEM?

Rozdíly ve složkách rozptylu 1. VNITROSHLUKOVÝ ROZPTYL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL ? A CO ROZPTYL MEZI SHLUKY?

Rozdíly ve složkách rozptylu 2. MEZISHLUKOVÝ ROZPTYL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 x x x x x x MALÝ MEZISHL. ROZPTYL RESP. 0 VELKÝ MEZISHL. ROZPTYL

Základní myšlenka PODÍL ROZPTYLŮ POMŮŽE URČIT, ZDA JE ROZDÍL IDEÁLNÍ PŘÍPAD 1 IDEÁLNÍ PŘÍPAD 2 MALÝ MEZISHL. ROZPTYL VELKÝ MEZISHL. ROZPTYL =? =? VELKÝ VNITR. ROZPTYL MALÝ VNITR. ROZPTYL PODÍL ROZPTYLŮ POMŮŽE URČIT, ZDA JE ROZDÍL ALESPOŇ MEZI 2 PRŮMĚRY STATISTICKY VÝZNAMNÝ

Základní hypotézy analýzy rozptylu nulová hypotéza (H0): všechny průměry ve sledovaných skupinách jsou stejné (obecně nulové hypotézy většinou tvrdí, že neexistují rozdíly resp. závislosti) alternativní hypotéza (H1): alespoň mezi dvěmi skupinami existuje statisticky významný (zobecnitelný) rozdíl Základní možnosti rozhodnutí ve statistickém testu: A) nezamítnutí nulové hypotézy B) zamítnutí nulové hypotézy (přijetí hypotézy alternativní), tedy alespoň mezi 2 skupinami existuje statisticky významný rozdíl v průměrech Pomůcka pro rozhodnutí: vypočtená hladina statistické významnosti (Sig., P, P-level, alfa- level apod.) Rozhodnutí: Při malé hodnotě (většinou do 0,05 zamítáme H0 při větších nezamítáme)

Ukázka na tabulce z analýzy rozptylu TEST Složky rozptylu

Předpoklady použití analýzy A. 1 kardinální proměnná (ZÁVISLÁ) – př. příjem, spokojenost, prestiž profese B. 1 proměnná určující příslušnost alespoň do tří skupin (FAKTOR) – př. vzdělání, region, typ zákazníka (Poznámka:v případě dvou skupin lze užít t-testy) C. Požadavek shodných rozptylů ve skupinách (Levene test), nezávislosti skupin

Ukázka na datech v SPSS Příprava dat (vzdělání a Internet) Zadání: Analyze»Compare Means»One-Way-Anova Základní výstupy a komentář Následné testy (Post-hoc) 2 typy (shodné a neshodné rozptyly) Eta2 – měření věcné důležitosti třídícího faktoru

Poznámky závěrem Lze posuzovat vliv více faktorů-vícefaktorová analýza rozptylu Lze kromě faktorů použít i kardinální proměnné (Covariate) jako nezávislé-viz GLM V případě malých výběrů a nedodržení předpokladů analýzy rozptylu lze užít neparametrické testy (K-W, Friedman, viz dále)

NEPARAMETRICKÉ TESTY II SPSS Inc. NEPARAMETRICKÉ TESTY II Copyright 2006 SPSS Inc. 28

2. Obdoby parametrických testů SPSS Inc. 2. Obdoby parametrických testů c) Více nezávislých výběrů Kruskal- Wallisův test SPSS: Analyze- Nonparametric tests-K Independent Samples obdoba analýzy rozptylu pro ordinální proměnné nebo pro kardinální proměnné, kde se rozptyly ve skupinách výrazně liší při teoretickém výpočtu se hodnota testového kritéria porovnává s tabulkou normálního rozdělení nebo s kvantity v přesných tabulkách Ho zamítáme méně často než při parametrickém testu (máme méně kvalitní data)- účinnost testu v porovnání s analýzou rozptylu cca 90% H0: mediány ve všech skupinách (výběrech) se rovnají H1: mediány alespoň dvou skupin se liší ;Po zamítnutí H0 nutno zkoumat které skupiny se liší Copyright 2006 SPSS Inc. 29

2. Obdoby parametrických testů SPSS Inc. 2. Obdoby parametrických testů d) Více závislých výběrů Friedmanův test V SPSS: Analyze- Nonparametric tests-K Related Samples Otázka: existuje rozdíl mezi mediány v jednotlivých závislých skupinách? H0: rozdělení ve více závislých výběrech jsou shodné H1: rozdělení v alespoň dvou závislých výběrech se liší po zamítnutí Ho musí následovat další test, abychom zjistili, které skupiny se mezi sebou liší- vytvoříme dvojice a následně použijeme např. Wilcoxův test (pro dva závislé výběry, cesta: Analyze- Nonparametric tests- 2 related samples) Copyright 2006 SPSS Inc. 30