Analýza variance (Analysis of variance) ANOVA
ANOVA Slouží ke zjištění vlivu kategoriálních proměnných na kvantitativní proměnnou porovnávám mezi sebou 2 a více skupin př: hmotnost kapra ze 3 různých rybníků – jsou všude stejně těžcí? př. počet bodů z testu 7 různých tříd – v jsou všude stejně chytří (hloupí)?
Základní princip z každého náhodného výběru (skupiny) získám výběrový průměr porovnám varianci výběrových průměrů (vliv sledovaného faktoru) a varianci uvnitř výběrů (residuální vlivy) pokud je variance mezi skupinami větší než variance jednotlivých pozorování, jde o skupiny s různými průměry
Základní princip variance porovnávám F-testem předpoklad: normalita dat a homogenita variancí! H0: 1=2=3= ...= k (střední hodnota výběrů se neliší, skupiny jsou stejné) nezjistím, které skupiny se liší (k tomu slouží post-hoc mnohonásobná porovnání)
proč netestuji t-testem dvojice skupin? při k skupinách bych musel provést testů pro 5 skupin je to 10 testů, pro 7 skupin už 21 v každém testu mám pravděpodobnost chyby I. druhu (větš. 0.05), celková pravděpodobnost chyby potom stoupá s počtem testů (k=3: p = 0.13; k=4: p= 0.21,…) Statistical fishing
Síla testu roste s rozdílem mezi skupinami roste s počtem pozorování roste s vyvážeností skupin klesá s počtem skupin!
Výsledky součet čtverců odchylek mezi skupinami; součet čtverců uvnitř skupin, stupně volnosti, hodnota F; p Rozdíly jsou statisticky významné (F2,46 = 15.237, p < 10-5)
jednofaktorová ANOVA testuji vliv jednoho faktoru (mám několik skupin rozdělených podle jednoho kritéria) hmotnost kaprů z několika rybníků body žáků v několika třídách obsah škrobu v různých částech rostliny
příklad mám zvážené kapry ze tří rybníků (data viz http://www.pf.jcu.cz/stru/katedry/bi/ditrich/anova.xls) v Excelu – Nástroje Analýza dat Anova: jeden faktor
ve Statistice na Anovu se dostanu několika způsoby např. Statistics - ANOVA – one-way ANOVA
V případě průkazného výsledku dám „více výsledků“
post-hoc: Tukey