ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Neparametrické testy pro nezávislé výběry
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Neparametrické metody a analýza rozptylu (lekce 3-7)
Analýza dotazníků RNDr. Michal Čihák, Ph.D..
Testování neparametrických hypotéz
Testování statistických hypotéz
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Cvičení 6 – 25. října 2010 Heteroskedasticita
Analýza variance (Analysis of variance)
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Tloušťková struktura porostu
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Inference jako statistický proces 1
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Lineární regrese.
Další spojitá rozdělení pravděpodobnosti
Analýza variance (ANOVA).
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
ADDS cviceni Pavlina Kuranova. Fischerův exaktní test.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Neparametrické testy  neparametrické pořadové testy  Chí-kvadrát kontingenční tabulky test dobré shody.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Bi8600: Vícerozměrné metody – cvičení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

ADDS cviceni Pavlina Kuranova

Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku) –v případě stejně velkých výběrů pro oba je pak Wilc. statistika menší hodnota ze získaných součtů. Test vhodný i pro ordinální data.

Mannův-Whitneyho test Příklad (soubor spokojenost_v_praci) Budeme zjišťovat zda je spokojenost se svou pracovní pozicí závislá na pohlaví. H0: spokojenost v práci nezávisí na pohlaví (med HA: spokojenost v práci závisí na pohlaví Analyze – Nonparametric Tests a 2 Independent Samples

Mannův-Whitneyho test Příklad (soubor spokojenost_v_praci) Budeme zjišťovat zda je spokojenost se svou pracovní pozicí závislá na pohlaví. Analyze – Nonparametric Tests a 2 Independent Samples Na základě hodnoty Asymp. Sig. nezamítáme H 0, tzn. Spokojenost v práci nezávisí na pohlaví.

Testy pro více než dva nezávislé výběry

Kruskal-Wallisův test - příklad Na základě získaných dat budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. H0: spokojenost s pracovní pozicí nezávisí na věku respondenta HA: spokojenost s pracovní pozicí závisí na věku respondenta Jedná se o test, který využívá pro výpočet hodnotu mediánu, tzn. H0: mediány ve věkových skupinách jsou shodné, HA: alespoň jeden medián je různý od ostatních

Testy pro více než dva nezávislé výběry Kruskal-Wallisův test - příklad Budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. Analyze – Nonparametric Tests – K Independent Samples – Zaškrtnuto Kruskal–Wallis H -Proměnnou věk nutno překódovat na metrickou…. -Na základě hodnoty Asymp. Sig, vidíme, že na 5% hladině významnosti nezamítáme H O o shodě mediánů. Spokojenost s pracovní pozicí nezávisí na věku respondentů.

Mediánový test pro K výběrů Používá se když předpokládáme ve výběrech různá rozdělení. Nevytváříme pořadí, ale spočteme medián ze všech hodnot vysvětlované proměnné (grand median) Není ovlivněn odlehlými hodnotami Konzervativnější - méně informací určuje pouze zda se nacházíme nad nebo pod mediánem

Mediánový test pro K výběrů Příklad: zadání stejné jako v předchozím případě: Budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. Analyze – Nonparanetric Tests – K Indenpendent Samples – zaškrtneme položku Median Na základě této tabulky bychom byli schopni spočítat očekávané četnosti…

Mediánový test pro K výběrů Příklad: zadání stejné jako v předchozím případě: Zjišťujeme, zda spokojenost se svou pracovní pozicí závisí na věku respondentů. » Zde vidíme údaje: N – celkový počet pozorování Median – určený ze všech pozorování (N hodnot vysvětlující proměnné) – gradn Median Chi-Square – hodnota testové statistiky df- počet stupňů volnosti Asymp. Sig. – minimální hladina význanmnosti od které zamítáme nulovou hypotézu Výsledek: Na 5% hladině významnosti nezamítáme H 0, spokojenost s pracovní pozicí nezávisí na věku respondenta

ANOVA ANOVA = ANalysis Of VAriance H 0 : proměnné jsou nezávislé (průměry ve všech skupinách jsou si rovny) H A : proměnné jsou závislé (alespoň dva průměry jsou různé)

ANOVA - předpoklady

Levenův test

ANOVA - příklad -Otestujme zda příjem obyvatel je závislý na dosaženém vzdělání. -Soubor spokojenost_v_praci (pro jednoduchost spojíme data do 3 skupin) -Překódování je nutné!!! Pro ANOVU musí být proměnné metrické!!! Proměnná vzdělání: -Nižší (základní + vyučen) -Střední (maturita) -Vyšší (vysokoškolské + vyšší odborné) Proměnná příjem: překódujeme do řádu tisíců

ANOVA - příklad

-Otestujme zda příjem obyvatel je závislý na dosaženém vzdělání. -Na základě hodnoty Sig. (p-value) bychom zamítli nulovou hypotézu na hladině významnosti 5%. -NEBYL splněn předpoklad testu!!! Anova by neměla být prováděna, je možno využít nějakou alternativu (K-W test, mediánový test)

ANOVA – příklad 2 -Otestujme zda příjem je závislý na věku respondentů. -Soubor spokojenost_v_praci -Zkontrolujte proměnné!!! Pro ANOVU musí být proměnné metrické!!! Proměnná věk (4 skupiny): - do 25-ti let - Nad 46 let Proměnná příjem: překódujeme do řádu tisíců

ANOVA - příklad

-Otestujme zda příjem obyvatel je závislý na věku. -Na základě hodnoty Sig. (p-value) zamítáme nulovou hypotézu na hladině významnosti 5%. Na hladině významnosti 1% bychom nulovou hypotézu nemohli zamítnout!!! -Výsledek: Příjem respondentů nezávisí na věku.

ANOVA – POST HOC testy -V případě zamítnutí nulové hypotézy!! Otestujme zda jsou některé věkové skupiny ekvivalentní. -Analyze – Compare Means – One-Way Anova – POST HOC

ANOVA – POST HOC testy -V případě zamítnutí nulové hypotézy!! Otestujme zda jsou některé věkové skupiny ekvivalentní. -Analyze – Compare Means – One-Way Anova – POST HOC