Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Chováme králíčky Liší se tato tři králičí plemena hmotností? 3, 3, 4, 5, 54, 4, 6, 5, 67, 5, 6, 5, 7 Mezi plemeny nemusí být skutečný rozdíl: průměry skupin.

Podobné prezentace


Prezentace na téma: "Chováme králíčky Liší se tato tři králičí plemena hmotností? 3, 3, 4, 5, 54, 4, 6, 5, 67, 5, 6, 5, 7 Mezi plemeny nemusí být skutečný rozdíl: průměry skupin."— Transkript prezentace:

1 Chováme králíčky Liší se tato tři králičí plemena hmotností? 3, 3, 4, 5, 54, 4, 6, 5, 67, 5, 6, 5, 7 Mezi plemeny nemusí být skutečný rozdíl: průměry skupin se mohou lišit jen proto, že mám malý počet pozorování Příklad výběrů z normální distribuce N(5,2), každý s 5 případy: průměry jsou například: 5.89, 4.50, 5.69, 5.73,.... H0:1=2=3H0:1=2=3 H A : alespoň jeden se liší

2 Zas ti králíci... SS tot = Celková suma čtverců Total sum of squares SS tot rozptyl kolem společného průměru SS tot = (3-5) 2 +(3-5) 2 +(4-5) 2 +(5-5) 2 + (5-5) 2 +(4-5) 2 +(4-5) (7-5) 2 = 22 Skupinová (modelová) suma čtverců Among-group sum of squares SS G rozptyl hodnot předpovídaných plemenem kolem celkového průměru SS G = (4-5) 2 +(4-5) 2 +(4-5) 2 +(4-5) 2 + (4-5) 2 +(5-5) 2 +(5-5) (6-5) 2 = 10 Residuální suma čtverců Error sum of squares SS e rozptyl hodnot kolem průměrů předpovídaných plemenem SS e = (3-4) 2 +(3-4) 2 +(4-4) 2 +(5-4) 2 + (5-4) 2 +(4-5) 2 +(4-5) (7-6) 2 = 12 Jaký počet nezávislých informací jsme použili? SS G + SS e DF tot = počet pozorování – 1 (pro celkový průměr) = 14 DF G = počet skup. průměrů – 1 (pro celkový průměr) = 2 DF e = počet pozorování – počet nezávislých průměrů = 12 MS tot je celková variance = 22/14 = MS G je objasněná variance = 10/2 = 5.0 MS e je neobjasněná variance = 12/12 = 1.0

3 A pořád ještě králíci... Pokud platí nulová hypotéza, měly by být obě variability zhruba stejné – jejich poměr lze popsat F distribucí, se dvěma parametry: DF G a DF e MS G a MS e odhadují mezi-skupinovou a vnitro- skupinovou variabilitu na srovnatelné škále V našem příkladě F = 5.0 / 1.0 = 5.0 Pravděpodnost, že takto velkou nebo větší hodnotu „si vytáhnu“ z F 2,12 distribuce je asi Zamítám tedy H 0 ve prospěch H A s p=0.0263

4 ANOVA Použitá metoda je nejjednodušším typem analýzy variance (Analysis of variance = ANOVA) Tento typ se nazývá analýza variance jednoduchého třídění (= jednocestná ANOVA) one-way ANOVA případně single-factor ANOVA

5 Model pro one-way ANOVA Nulovou hypotézu pro případ jednocestné analýzy variance se 3 skupinami jsme popsali takto: H 0 :  1 =  2 =  3 Nebo vytvoříme model, popisující naše data v případě, že platí alternativní hypotéza H A : X ij =  +  i +  ij Společná střední hodnota “posunutí” průměru i -té skupiny proti společnému průměru  náhodná variabilita N(0, σ 2 ) nezávislá na α H 0 :  1 =  2 =  3 = 0

6 V programu Statistica

7 Shoda variancí Test shody variancí mezi skupinami: Bartlettův test

8 Liší se všechna plemena? Zamítnutí H 0 může znamenat:  1 =  2 ≠  3  1 ≠  2 =  3 1 ≠ 2 ≠ 3 1 ≠ 2 ≠ 3 Jak zjistím, co z toho je správně? Problém – opakované použití stejných údajů: rychlý růst chyby I. typu Mnohonásobná porovnání (multiple comparisons = post-hoc compar.)

9 Tukey-ho test Používáme testovou statistiku q podobnou statistice z dvouvýběrového T-testu Standardní chyba rozdílu průměrů je: Smysl podobný jako u T statistiky, ale q nemá T distribuci!

10 Tukey v programu Statistica Výstup může vypadat různě:

11 Proč nesrovnávat po dvojicích a nepoužít řadu t-testů? Plemeno CPlemeno B Plemeno A

12 Pokud máme k skupin (a srovnáváme k průměrů) Provádíme k(k-1)/2 testů Pravděpodobnost chyby I. druhu je α v každém z nich Šance, že uděláme alespoň jednu chybu prvního druhu roste s počtem porovnávaných průměrů

13 Dunnetův test Pojem kontrola (control treatment) Dunnetův test používáme v případě, že chceme porovnávat jednotlivé hladiny faktoru jen proti kontrole V programu Statistica provedeme takto:

14 Pokud mám dvě skupiny, mám užít ANOVA nebo t-test ? Je to jedno, P vyjde v obou případech zcela shodné Hodnota F statistiky z ANOVA bude druhou mocninou hodnoty T z t-testu

15 Síla testu Roste s počtem pozorování ve skupině Roste s vyvážeností skupin (balanced design) Klesá s rostoucím počtem skupin (nesnažte se porovnávat všechno možné při malém počtu pozorování ve skupině!)

16 Narušení předpokladů – robustnost testu Robustnost k narušení normality stoupá s počtem pozorování ve skupině Robustnost k narušení homogenity variancí výrazně klesá při nevyvážených počtech ve skupinách

17 Pevné a náhodné efekty Králičí příklad představoval problém, ve kterém faktor (nezávislá proměnná) plemeno obsahoval hladiny, které nás konkrétně zajímaly – podobně hnojené vs. nehnojené plochy, srovnání vlivu několika druhů léků. Plemeno, hnojení, druh léku jsou faktory s pevným efektem (fixed effect factor) V jiných situacích: porovnáváme variabilitu hodnot mezi kategoriemi vs. uvnitř kategorií: liší se hmotnost plodů mezi mateřskými rostlinami, tj. existuje systematický vliv rostliny? Konkrétní rostlina mne nezajímá, faktor rostlina odpovídá tzv. náhodnému efektu (random effect factor) ANOVA s náhodnými efekty se označuje také jako model II ANOVA (x model I – s pevnými efekty). Mixed-effect ANOVA V případě faktorů s náhodným efektem nemá smysl testovat rozdíly mezi konkrétními hladinami faktoru (nemá smysl dělat multiple comparisons)

18 Kruskal – Wallisův test Neparametrický test – zobecnění Mann – Whitneyova testu pro tři a více (k) skupin Původní hodnoty se nahradí pro každé pozorování hodnotou jeho pořadí Ze součtu pořadí ve skupinách se pak spočítá testová statistika H, která by měla za platnosti H 0 pocházet z  2 distribuce s k-1 stupni volnosti Problém shodných hodnot (ties)

19 Kruskal – Wallisův test: příklad Porovnáváme četnost určitého druhu hmyzu ve třech vegetačních patrech. Původní data nahradíme pořadím

20 Kruskal – Wallisův test: Statistica


Stáhnout ppt "Chováme králíčky Liší se tato tři králičí plemena hmotností? 3, 3, 4, 5, 54, 4, 6, 5, 67, 5, 6, 5, 7 Mezi plemeny nemusí být skutečný rozdíl: průměry skupin."

Podobné prezentace


Reklamy Google