Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, odrůda: 1.3, 1, odrůda: 1.3, 1.5, 1.6, 1.1, odrůda: 1.1, 1.2, 1 Liší se průměrné hmotnosti brambor z 1 trsu u těchto 4 odrůd? H0: 1 = 2 = 3 = 4 H1: některá z rovností neplatí Porovnávání dvojic, tj. 6 t-testů pravděpodobnost chyby 1. druhu se zvyšuje Proto se porovnávání dvojic neprovádí. Model: X ij = + i + chyba ij Neboli ANOVA umí odhalit posun celých sloupců hodnot o i, tedy přičtením/odečtením k se dostávám od dat 1. druhu k 2. druhu.
Předpoklady. normalita rozdělení – neověřuje e homogenita variancí - základní předpoklad – ověřuje se Průměry: Chyby průměru: 1. odhad variance (variabilita mezi sloupci): 2 (mezi) = S.E.*n = (0.07* * * *3)/4 = odhad variance (variabilita uvnitř souboru): 2 (uvnitř) = Za platnosti H0 je 2 (mezi)/ 2 (uvnitř) = 1. Proto Analýza variance. Pokud máme a sloupců, v každém n i měření, pak testovací rozdělení je F – rozdělení s (a – 1) a ( (n i ) – a) stupni volnosti. Příznivá pro platnost H0 je F = 1.
Pokračování příkladu. F(3, 11) = , P = některá z rovností neplatí Patrně se budou lišit odrůdy 1 a 3.
Post – hoc testy: H0: průměr sloupce i = průměr sloupce j, i ≠ j H1: nerovnost mezi průměry sloupců i a j. Zodpoví otázku, KDE je rozdíl zjištěný Anovou. Statistica ukazuje rozdíl mezi 1. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = /2 = ), rozdíl mezi 2. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = /2 = ). V příkladu jsme měli 1 třídící znak “odrůda“ jednofaktorová ANOVA