Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Úvod do analýzy rozptylu
kvantitativních znaků
Testování parametrických hypotéz
Statistika Ing. Jan Popelka, Ph.D. odborný asistent
Testování statistických hypotéz
Jednofaktorová ANOVA Jednofaktorová analýza rozptylu
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
Porovnání průměrů více než dvou normálních rozdělení
Testování hypotéz vymezení důležitých pojmů
také Gaussovo rozdělení (normal or Gaussian distribution)
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
ANOVA (s použitím materiálů Petra Šmilauera)
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Data s diskrétním rozdělením
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
základní principy a použití
Transformace v Anově. Předpoklady Anovy: normalita dat
Další spojitá rozdělení pravděpodobnosti
Analýza variance (ANOVA).
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
V. Analýza rozptylu ANOVA.
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
Dvouvýběrový t-test 11 stejně starých selat bylo náhodně rozděleno do 2 skupin. První skupina byla krmena krmivem A, druhá krmivem B. Po 6 měsících byly.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Inferenční statistika - úvod
IV..
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Možnosti biostatistiky RNDr. Karel Hrach, Ph.D. Ústav zdravotnických studií UJEP Biomedicínský výzkum s podporou evropských zdrojů v nemocnicích ( )
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Odhady odhady bodové a intervalové odhady
… jsou bohatší lidé šťastnější?
Analýza variance (ANOVA).
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Testování hypotéz párový test
Induktivní statistika
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
Neparametrické testy parametrické a neparametrické testy
Induktivní statistika
Úvod do statistického testování
PSY252 Statistická analýza dat v psychologii II Seminář 9
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Analýza variance (ANOVA).
7. Kontingenční tabulky a χ2 test
Induktivní statistika
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Transkript prezentace:

Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno použít ANOVu se stejnými P. U 4 odrůd brambor se zjišťovala celková hmotnost brambor z jednoho trsu: 1.odrůda: 0.9, 0.8, 0.6, odrůda: 1.3, 1, odrůda: 1.3, 1.5, 1.6, 1.1, odrůda: 1.1, 1.2, 1 Liší se průměrné hmotnosti brambor z 1 trsu u těchto 4 odrůd? H0:  1 =  2 =  3 =  4 H1: některá z rovností neplatí Porovnávání dvojic, tj. 6 t-testů  pravděpodobnost chyby 1. druhu se zvyšuje Proto se porovnávání dvojic neprovádí. Model: X ij =  +  i + chyba ij Neboli ANOVA umí odhalit posun celých sloupců hodnot o  i, tedy přičtením/odečtením   k  se dostávám od dat 1. druhu k 2. druhu.

Předpoklady.  normalita rozdělení – neověřuje e  homogenita variancí - základní předpoklad – ověřuje se Průměry: Chyby průměru: 1. odhad variance (variabilita mezi sloupci):  2 (mezi) = S.E.*n = (0.07* * * *3)/4 = odhad variance (variabilita uvnitř souboru):  2 (uvnitř) = Za platnosti H0 je  2 (mezi)/  2 (uvnitř) = 1. Proto Analýza variance. Pokud máme a sloupců, v každém n i měření, pak testovací rozdělení je F – rozdělení s (a – 1) a (  (n i ) – a) stupni volnosti. Příznivá pro platnost H0 je F = 1.

Pokračování příkladu. F(3, 11) = , P =  některá z rovností neplatí Patrně se budou lišit odrůdy 1 a 3.

Post – hoc testy: H0: průměr sloupce i = průměr sloupce j, i ≠ j H1: nerovnost mezi průměry sloupců i a j. Zodpoví otázku, KDE je rozdíl zjištěný Anovou. Statistica ukazuje rozdíl mezi 1. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = /2 = ), rozdíl mezi 2. a 3. odrůdou ve smyslu, že hmotnost trsu 1. odrůdy je nižší, než u 3. odrůdy (P = /2 = ). V příkladu jsme měli 1 třídící znak “odrůda“  jednofaktorová ANOVA