Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, 0.9 2. odrůda: 1.3, 1, 1.3 3. odrůda: 1.3, 1.5, 1.6, 1.1, 1.5 4. odrůda: 1.1, 1.2, 1 Liší se průměrné hmotnosti brambor z 1 trsu u těchto 4 odrůd? H0: m1 = m2 = m3 = m4 H1: některá z rovností neplatí Porovnávání dvojic, tj. 6 t-testů pravděpodobnost chyby 1. druhu se zvyšuje Proto se porovnávání dvojic neprovádí. Model: Xij = m + ai + chyba ij Neboli ANOVA umí odhalit posun celých sloupců hodnot o ai, tedy přičtením/odečtením a1 k m se dostávám od dat 1. druhu k 2. druhu.
Předpoklady. normalita rozdělení – neověřuje e homogenita variancí - základní předpoklad – ověřuje se Průměry: Chyby průměru: 1. odhad variance (variabilita mezi sloupci): s2 (mezi) = S.E.*n = (0.07*4 + 0.1*3 + 0.089*5 + 0.058*3)/4 =0.029975 2. odhad variance (variabilita uvnitř souboru): s2 (uvnitř) = 0.025 Za platnosti H0 je s2 (mezi)/ s2 (uvnitř) = 1. Proto Analýza variance. Pokud máme a sloupců, v každém ni měření, pak testovací rozdělení je F – rozdělení s (a – 1) a (S (ni) – a) stupni volnosti. Příznivá pro platnost H0 je F = 1.
Pokračování příkladu. F(3, 11) = 9.9733, P = 0.001805 některá z rovností neplatí Patrně se budou lišit odrůdy 1 a 3.
Post – hoc testy: H0: průměr sloupce i = průměr sloupce j, i ≠ j H1: nerovnost mezi průměry sloupců i a j. Zodpoví otázku, KDE je rozdíl zjištěný Anovou. Statistica ukazuje rozdíl mezi 1. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.001182/2 = 0.000591), rozdíl mezi 2. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = 0.03829/2 = 0.019145). V příkladu jsme měli 1 třídící znak “odrůda“ jednofaktorová ANOVA
Analýza variance vícefaktorová (ANOVA). A. Faktoriální uspořádání. Příklad: Krysy byly krmeny 73 dní čerstvým nebo žluklým tukem. Zajímá nás spotřeba kvality tuku v závislosti na pohlaví krys [g]. Samci spotřebují více než samice Čerstvý tuk je atraktivnější než žluklý. Nulové hypotézy: H01: není rozdíl mezi samci a samicemi H02: není rozdíl mezi čerstvým a žluklým tukem H03: nejsou průkazné interakce. Model:
Spojnice přibližně rovnoběžné “H“ pouze posunuty (přibližně) Interakce neprůkazné
H01 nezamítáme není statisticky průkazný rozdíl mezi samci a samicemi. H02 zamítáme je rozdíl ve spotřebě čerstvého tuku a žluklého tuku. H03 nezamítáme nejsou průkazné interakce. Neprůkazné interakce model je v pořádku, lze použít Anovu. Průkazné interakce něco dalšího (další faktor) ovlivňuje měření nutno zdůvodnit. Post-hoc testy: Pouze pro tuk: čerstvý se spotřebovává více než žluklý. Modifikace příkladu.
Průkazné interakce přímky nejsou rovnoběžné Samci mají zcela jiné preference než samice, model není aditivní (posun), Něco dalšího vstupuje do pokusu?? Anovu nelze použít. Někdy nelze průkazné interakce odstranit je nutno zdůvodnit.
B. Hierarchická Anova (Nested design). Připravím 2 akvária: Do prvního dám čerstvý tuk, do druhého žluklý tuk. Do první nádoby vyberu náhodně 6 krys, do druhého náhodně 6 krys. 1. nádoba 2. nádoba 6 krys 6 krys 2 faktory: Krysy - náhodný faktor Tuk - pevný faktor Sestoupili jsme na úroveň jedinců – nejde o rozdíly “samice – samec“, jde o rozdíly mezi jedinci Faktor “krysa“ je vnořen (nested in) do faktoru strava Na toto uspořádání lze pohlížet jako na jednofaktorovou Anovu a krysy se berou jako opakování.
Liší se teploty v jednotlivých hloubkách? ANOVA – náhodné bloky. Příklad: Na 10 místech jezera byla měřena teplota vody v hloubce 0, 2 a 5 metrů. Liší se teploty v jednotlivých hloubkách? 1. místo 2. místo 3. místo 10. místo 0 m 0 m 0 m 0 m …. 2 m 2 m 2 m 2 m 5 m 5 m 5 m 5 m Náhodné bloky
Každá hloubka je na daném místě měřena jen jednou Jedná se vlastně o 1-faktorovou Anovu s faktorem “hloubka“. 1-faktorová ANOVA: F(2, 27) = 571.23, P = 0 2-faktorová ANOVA: F(2, 18) = 1119.491, P = 0