Analýza variance (ANOVA).

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Analýza experimentu pro robustní návrh
Úvod do analýzy rozptylu
kvantitativních znaků
Testování parametrických hypotéz
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Faktory a jejich uspořádání
Další modely ANOVY.
Testování statistických hypotéz
Monte Carlo permutační testy & Postupný výběr
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
Porovnání průměrů více než dvou normálních rozdělení
Obecný postup při testování souborů
Princip testování hypotéz, c2 testy.
Faktory a jejich uspořádání
ANALÝZA ROZPTYLU (ANOVA)
kvantitativních znaků
Testování hypotéz vymezení důležitých pojmů
Obecný lineární model Analýza kovariance Nelineární modely
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
ANOVA (s použitím materiálů Petra Šmilauera)
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Data s diskrétním rozdělením
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Práce s výsledky statistických studií
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
V. Analýza rozptylu ANOVA.
Dvouvýběrový t-test 11 stejně starých selat bylo náhodně rozděleno do 2 skupin. První skupina byla krmena krmivem A, druhá krmivem B. Po 6 měsících byly.
Jan Vávra Působení auxinu u Oscillatoria sp. pozorované in situ.
Princip testování hypotéz, c2 testy.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Základy testování hypotéz
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Možnosti biostatistiky RNDr. Karel Hrach, Ph.D. Ústav zdravotnických studií UJEP Biomedicínský výzkum s podporou evropských zdrojů v nemocnicích ( )
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Analýza variance (ANOVA).
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Testování hypotéz párový test
Dvoufaktorová analýza rozptylu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
8. Analýza rozptylu a korelace
Parametrická analýza rozptylu Kruskal-Wallisův test
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
PSY252 Statistická analýza dat v psychologii II Seminář 9
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Analýza variance (ANOVA).
7. Kontingenční tabulky a χ2 test
Transkript prezentace:

Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, 0.9 2. odrůda: 1.3, 1, 1.3 3. odrůda: 1.3, 1.5, 1.6, 1.1, 1.5 4. odrůda: 1.1, 1.2, 1 Liší se průměrné hmotnosti brambor z 1 trsu u těchto 4 odrůd? H0: m1 = m2 = m3 = m4 H1: některá z rovností neplatí Porovnávání dvojic, tj. 6 t-testů pravděpodobnost chyby 1. druhu se zvyšuje Proto se porovnávání dvojic neprovádí. Model: Xij = m + ai + chyba ij Neboli ANOVA umí odhalit posun celých sloupců hodnot o ai, tedy přičtením/odečtením a1 k m se dostávám od dat 1. druhu k 2. druhu.

Předpoklady. normalita rozdělení – neověřuje e homogenita variancí - základní předpoklad – ověřuje se Průměry: Chyby průměru: 1. odhad variance (variabilita mezi sloupci): s2 (mezi) = S.E.*n = (0.07*4 + 0.1*3 + 0.089*5 + 0.058*3)/4 =0.029975 2. odhad variance (variabilita uvnitř souboru): s2 (uvnitř) = 0.025 Za platnosti H0 je s2 (mezi)/ s2 (uvnitř) = 1. Proto Analýza variance. Pokud máme a sloupců, v každém ni měření, pak testovací rozdělení je F – rozdělení s (a – 1) a (S (ni) – a) stupni volnosti. Příznivá pro platnost H0 je F = 1.

Pokračování příkladu. F(3, 11) = 9.9733, P = 0.001805  některá z rovností neplatí Patrně se budou lišit odrůdy 1 a 3.

Post – hoc testy: H0: průměr sloupce i = průměr sloupce j, i ≠ j H1: nerovnost mezi průměry sloupců i a j. Zodpoví otázku, KDE je rozdíl zjištěný Anovou. Statistica ukazuje rozdíl mezi 1. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.001182/2 = 0.000591), rozdíl mezi 2. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.03829/2 = 0.019145). V příkladu jsme měli 1 třídící znak “odrůda“  jednofaktorová ANOVA

Analýza variance vícefaktorová (ANOVA). A. Faktoriální uspořádání. Příklad: Krysy byly krmeny 73 dní čerstvým nebo žluklým tukem. Zajímá nás spotřeba kvality tuku v závislosti na pohlaví krys [g]. Samci spotřebují více než samice Čerstvý tuk je atraktivnější než žluklý. Nulové hypotézy: H01: není rozdíl mezi samci a samicemi H02: není rozdíl mezi čerstvým a žluklým tukem H03: nejsou průkazné interakce. Model:

Spojnice přibližně rovnoběžné “H“ pouze posunuty (přibližně) Interakce neprůkazné

H01 nezamítáme  není statisticky průkazný rozdíl mezi samci a samicemi. H02 zamítáme  je rozdíl ve spotřebě čerstvého tuku a žluklého tuku. H03 nezamítáme  nejsou průkazné interakce. Neprůkazné interakce  model je v pořádku, lze použít Anovu. Průkazné interakce  něco dalšího (další faktor) ovlivňuje měření  nutno zdůvodnit. Post-hoc testy: Pouze pro tuk: čerstvý se spotřebovává více než žluklý. Modifikace příkladu.

Průkazné interakce  přímky nejsou rovnoběžné Samci mají zcela jiné preference než samice, model není aditivní (posun), Něco dalšího vstupuje do pokusu?? Anovu nelze použít. Někdy nelze průkazné interakce odstranit  je nutno zdůvodnit.

B. Hierarchická Anova (Nested design). Připravím 2 akvária: Do prvního dám čerstvý tuk, do druhého žluklý tuk. Do první nádoby vyberu náhodně 6 krys, do druhého náhodně 6 krys. 1. nádoba 2. nádoba 6 krys 6 krys 2 faktory: Krysy - náhodný faktor Tuk - pevný faktor Sestoupili jsme na úroveň jedinců – nejde o rozdíly “samice – samec“, jde o rozdíly mezi jedinci Faktor “krysa“ je vnořen (nested in) do faktoru strava Na toto uspořádání lze pohlížet jako na jednofaktorovou Anovu a krysy se berou jako opakování.

Liší se teploty v jednotlivých hloubkách? ANOVA – náhodné bloky. Příklad: Na 10 místech jezera byla měřena teplota vody v hloubce 0, 2 a 5 metrů. Liší se teploty v jednotlivých hloubkách? 1. místo 2. místo 3. místo 10. místo 0 m 0 m 0 m 0 m …. 2 m 2 m 2 m 2 m 5 m 5 m 5 m 5 m Náhodné bloky

Každá hloubka je na daném místě měřena jen jednou Jedná se vlastně o 1-faktorovou Anovu s faktorem “hloubka“. 1-faktorová ANOVA: F(2, 27) = 571.23, P = 0 2-faktorová ANOVA: F(2, 18) = 1119.491, P = 0