Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná (či naopak se významně liší)? je u všech čtyř strojů délka výlisků srov- natelná (či naopak se významně liší)? ANOVA - jednofaktorová analýza rozptylu “ ANOVA - jednofaktorová analýza rozptylu ANOVA = zkratka z „analysis of variance“ plat ve skupině absolventů ZŠ, SŠ, VŠ; délku výlisků ze strojů A, B, C, D;
ANOVA Předpoklady: všechny skupiny jsou nezávislé sledovaná veličina (plat respondenta, resp. délka výlisku,…) se ve všech srovnávaných skupinách chová jako veličina normálně rozdělená, a to se stejnou variabilitou (tzv. podmínka homogenity rozptylů)
ANOVA homogenita rozptylů
ANOVA Komentáře: jde tedy o zobecnění 2-výběrových testů na případ dvou či více porovnávaných skupin zajímá nás vlastně, zda chování sledované normálně rozdělené veličiny Y (plat respondenta, resp. délka výlisku,…) závisí na příslušnosti do té či oné kategorie ANEB zda Y závisí na tzv. kategoriálním faktoru (na vzdělání, na typu stroje,…), odtud označení „jednofaktorová ANOVA“
ANOVA Značení: r …počet rozlišovaných kategorií u daného faktoru (r > 2) i …střední hodnota Y v i-té kategorii (i=1…r) Testujeme: H 0 : 1 =…= r ANEB nezávislost na faktoru H 1 : non H 0 ANEB závislost na faktoru
ANOVA Gaussovy křivky (3-kategoriální faktor):
ANOVA Data (3-kategoriální faktor):
ANOVA Výpočty: „podmíněné“ průměry (po kategoriích)
ANOVA Výpočty: celkový průměr (všech skupin)
ANOVA Výpočty: „součty čtverců“Q TOT, Q m, Q v viz přehled vzorců:
ANOVA Výpočty: T a W viz přehled vzorců:
ANOVA Výsledky – tabulka ANOVY: hodnotasoučetčtvercůstupněvolnostipodíl mezi-skupinová QmQmQmQm r–1r–1r–1r–1 Q m /(r–1) vnitro- skupinová QvQvQvQv n–rn–rn–rn–r Q v /(n–r) suma Q TOT n–1n–1n–1n–1
ANOVA Byly sledovány výnosy čtyř odrůd brambor (označme odrůdy A, B, C, D). Každá odrůda byla pěstována na sedmi srovnatelných polích. Zjistěte, zda je typ odrůdy faktorem, který ovlivňuje hektarový výnos brambor. Data – jednotlivé výnosy (v Excelu): Příklad: H 0 : nezávislost výnosů na odrůdě H 0 : nezávislost výnosů na odrůdě H 1 : závislost (aneb výnosy se významně liší) H 1 : závislost (aneb výnosy se významně liší)
ANOVA Příklad (řešení):
ANOVA Příklad (řešení - pokračování):
ANOVA hodnotasoučetčtvercůstupněvolnostipodíl mezi-skupinová174,9125 4–1=3 58,304 vnitro- skupinová 82, =243,427 suma257, –1=27 x 58,304 / 3,427 = 17,01313 T = 58,304 / 3,427 = 17,01313
ANOVA
W= 2,99; ) T W zamítáme H 0 zamítáme nezávislost Typ odrůdy je faktorem, který ovlivňuje hektarový výnos brambor. Typ odrůdy je faktorem, který ovlivňuje hektarový výnos brambor. ANOVA Příklad (řešení - dokončení):
ANOVA
ANOVA
ANOVA p = 4·10 -6 = 0, p = 4·10 -6 = 0,
ANOVA Výsledek: 0, < 0,05 zamítáme H 0 Data prokázala, že výnosy jednotlivých 4 odrůd se významně liší ANEB že odrůda je faktorem, na němž výnos významně závisí.
ANOVA Poznámky: a) Sice jsme prokázali významné rozdíly ve výnosech, můžeme dokonce porovnat zjištěné podmíněné průměry (viz Excel), ale NELZE hned tvrdit, že ANOVA prokázala, která odrůda je horší či lepší – zatím víme jen, že „jsou významné rozdílnosti“
ANOVA Poznámky: b) pokud r=2, lze závislost na faktoru porovnat jak ANOVOU, tak 2-výběrovými testy (které mají oproti ANOVĚ tu výhodu, že existují i v jednostranných variantách a lze tudíž případně posoudit, která z obou porovnávaných kategorií je „lepší“)