Chováme králíčky Liší se tato tři králičí plemena hmotností?

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Úvod do analýzy rozptylu
Testování parametrických hypotéz
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Neparametrické metody a analýza rozptylu (lekce 3-7)
Ideový závěr Co si mám z přednášky odnést (+ komentáře k užití statistiky v biologii)
Faktory a jejich uspořádání
Testování statistických hypotéz
Jednofaktorová ANOVA Jednofaktorová analýza rozptylu
Monte Carlo permutační testy & Postupný výběr
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
Analýza variance (Analysis of variance)
Statistika II Michal Jurajda.
Porovnání průměrů více než dvou normálních rozdělení
Faktory a jejich uspořádání
ANALÝZA ROZPTYLU (ANOVA)
Testování hypotéz vymezení důležitých pojmů
Obecný lineární model Analýza kovariance Nelineární modely
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
ANOVA (s použitím materiálů Petra Šmilauera)
Biostatistika 9. přednáška Aneta Hybšová
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Data s diskrétním rozdělením
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
základní principy a použití
Lineární regrese.
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
PSY717 – statistická analýza dat
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
Základy testování hypotéz
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
PSY117/454 Statistická analýza dat v psychologii II Seminář 7 - 8
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Opakování – přehled metod
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Testování hypotéz párový test
Dvoufaktorová analýza rozptylu
Neparametrické testy parametrické a neparametrické testy
Neparametrické testy parametrické a neparametrické testy
8. Analýza rozptylu a korelace
Parametrická analýza rozptylu Kruskal-Wallisův test
Opakování Shrnutí statistických testů Neparametrické testy
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Neparametrické testy pro porovnání polohy
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

Chováme králíčky Liší se tato tři králičí plemena hmotností? HA: alespoň jeden se liší H0:m1=m2=m3 Liší se tato tři králičí plemena hmotností? 3, 3, 4, 5, 5 4, 4, 6, 5, 6 7, 5, 6, 5, 7 Mezi plemeny nemusí být skutečný rozdíl: průměry skupin se mohou lišit jen proto, že mám malý počet pozorování Příklad výběrů z normální distribuce N(5,2), každý s 5 případy: průměry jsou například: 5.89, 4.50, 5.69, 5.73, ....

Zas ti králíci ... SStot = SSG + SSe Celková suma čtverců Total sum of squares SStot rozptyl kolem společného průměru Skupinová (modelová) suma čtverců Among-group sum of squares SSG rozptyl hodnot předpovídaných plemenem kolem celkového průměru Residuální suma čtverců Error sum of squares SSe rozptyl hodnot kolem průměrů předpovídaných plemenem SStot = (3-5)2+(3-5)2+(4-5)2+(5-5)2+ (5-5)2+(4-5)2+(4-5)2+...+(7-5)2 = 22 SSG = (4-5)2+(4-5)2+(4-5)2+(4-5)2+ (4-5)2+(5-5)2+(5-5)2+...+(6-5)2 = 10 SSe = (3-4)2+(3-4)2+(4-4)2+(5-4)2+ (5-4)2+(4-5)2+(4-5)2+...+(7-6)2 = 12 SStot = SSG + SSe Jaký počet nezávislých informací jsme použili? DFtot = počet pozorování – 1 (pro celkový průměr) = 14 DFG = počet skup. průměrů – 1 (pro celkový průměr) = 2 DFe = počet pozorování – počet nezávislých průměrů = 12 MStot je celková variance = 22/14 = 1.5714 MSG je objasněná variance = 10/2 = 5.0 MSe je neobjasněná variance = 12/12 = 1.0

A pořád ještě králíci ... MSG a MSe odhadují mezi-skupinovou a vnitro-skupinovou variabilitu na srovnatelné škále Pokud platí nulová hypotéza, měly by být obě variability zhruba stejné – jejich poměr lze popsat F distribucí, se dvěma parametry: DFG a DFe V našem příkladě F = 5.0 / 1.0 = 5.0 Pravděpodnost, že takto velkou nebo větší hodnotu „si vytáhnu“ z F2,12 distribuce je asi 0.0263 Zamítám tedy H0 ve prospěch HA s p=0.0263

ANOVA Použitá metoda je nejjednodušším typem analýzy variance (Analysis of variance = ANOVA) Tento typ se nazývá analýza variance jednoduchého třídění (= jednocestná ANOVA) one-way ANOVA případně single-factor ANOVA

Model pro one-way ANOVA Nulovou hypotézu pro případ jednocestné analýzy variance se 3 skupinami jsme popsali takto: H0: m1 = m2 = m3 Nebo vytvoříme model, popisující naše data v případě, že platí alternativní hypotéza HA: Xij = m + ai + eij H0: a1 = a2 = a3 = 0 Společná střední hodnota “posunutí” průměru i-té skupiny proti společnému průměru m náhodná variabilita N(0, σ2) nezávislá na α

V programu Statistica

Shoda variancí Test shody variancí mezi skupinami: Bartlettův test

Liší se všechna plemena? Zamítnutí H0 může znamenat: m1 = m2 ≠ m3 m1 ≠ m2 = m3 m1 ≠ m2 ≠ m3 Jak zjistím, co z toho je správně? Problém – opakované použití stejných údajů: rychlý růst chyby I. typu Mnohonásobná porovnání (multiple comparisons = post-hoc compar.)

Tukey-ho test Používáme testovou statistiku q podobnou statistice z dvouvýběrového T-testu Standardní chyba rozdílu průměrů je: Smysl podobný jako u T statistiky, ale q nemá T distribuci!

Tukey v programu Statistica Výstup může vypadat různě:

Proč nesrovnávat po dvojicích a nepoužít řadu t-testů? Plemeno C Plemeno B Plemeno A

Pokud máme k skupin (a srovnáváme k průměrů) Provádíme k(k-1)/2 testů Pravděpodobnost chyby I. druhu je α v každém z nich Šance, že uděláme alespoň jednu chybu prvního druhu roste s počtem porovnávaných průměrů

Dunnetův test Pojem kontrola (control treatment) Dunnetův test používáme v případě, že chceme porovnávat jednotlivé hladiny faktoru jen proti kontrole V programu Statistica provedeme takto:

Pokud mám dvě skupiny, mám užít ANOVA nebo t-test ? Je to jedno, P vyjde v obou případech zcela shodné Hodnota F statistiky z ANOVA bude druhou mocninou hodnoty T z t-testu

Síla testu Roste s počtem pozorování ve skupině Roste s vyvážeností skupin (balanced design) Klesá s rostoucím počtem skupin (nesnažte se porovnávat všechno možné při malém počtu pozorování ve skupině!)

Narušení předpokladů –robustnost testu Robustnost k narušení normality stoupá s počtem pozorování ve skupině Robustnost k narušení homogenity variancí výrazně klesá při nevyvážených počtech ve skupinách

Pevné a náhodné efekty Králičí příklad představoval problém, ve kterém faktor (nezávislá proměnná) plemeno obsahoval hladiny, které nás konkrétně zajímaly – podobně hnojené vs. nehnojené plochy, srovnání vlivu několika druhů léků. Plemeno, hnojení, druh léku jsou faktory s pevným efektem (fixed effect factor) V jiných situacích: porovnáváme variabilitu hodnot mezi kategoriemi vs. uvnitř kategorií: liší se hmotnost plodů mezi mateřskými rostlinami, tj. existuje systematický vliv rostliny? Konkrétní rostlina mne nezajímá, faktor rostlina odpovídá tzv. náhodnému efektu (random effect factor) ANOVA s náhodnými efekty se označuje také jako model II ANOVA (x model I – s pevnými efekty). Mixed-effect ANOVA V případě faktorů s náhodným efektem nemá smysl testovat rozdíly mezi konkrétními hladinami faktoru (nemá smysl dělat multiple comparisons)

Kruskal – Wallisův test Neparametrický test – zobecnění Mann – Whitneyova testu pro tři a více (k) skupin Původní hodnoty se nahradí pro každé pozorování hodnotou jeho pořadí Ze součtu pořadí ve skupinách se pak spočítá testová statistika H, která by měla za platnosti H0 pocházet z c2 distribuce s k-1 stupni volnosti Problém shodných hodnot (ties)

Kruskal – Wallisův test: příklad Porovnáváme četnost určitého druhu hmyzu ve třech vegetačních patrech. Původní data nahradíme pořadím

Kruskal – Wallisův test: Statistica