Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.

Slides:



Advertisements
Podobné prezentace
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Advertisements

Statistická indukce Teorie odhadu.
Úvod do analýzy rozptylu
Testování parametrických hypotéz
Neparametrické metody a analýza rozptylu (lekce 3-7)
Analýza dotazníků RNDr. Michal Čihák, Ph.D..
Testování neparametrických hypotéz
Testování statistických hypotéz
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Jednofaktorová ANOVA Jednofaktorová analýza rozptylu
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Analýza variance (Analysis of variance)
Porovnání průměrů více než dvou normálních rozdělení
Indexy pojem OA a VOŠ Příbram.
Obecný postup při testování souborů
Testování hypotéz vymezení důležitých pojmů
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Transformace v Anově. Předpoklady Anovy: normalita dat
Lineární regrese.
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
AKD 1 (7/5) Transformace – vytváření nových proměnných: COMPUTE → SUMA celkový počet knih Konstanta → Student FHS COUNT → knihomol (2 x III. Tercil)
PSY117/454 Statistická analýza dat v psychologii II Seminář 7 - 8
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Možnosti biostatistiky RNDr. Karel Hrach, Ph.D. Ústav zdravotnických studií UJEP Biomedicínský výzkum s podporou evropských zdrojů v nemocnicích ( )
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Základy statistické indukce
Neparametrické testy parametrické a neparametrické testy
- váhy jednotlivých studií
Neparametrické testy parametrické a neparametrické testy
Homogenita meteorologických pozorování
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Homogenita meteorologických pozorování
Parciální korelace Regresní analýza
Spojité VELIČINY Vyšetřování normality dat
Neparametrické testy pro porovnání polohy
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
7. Kontingenční tabulky a χ2 test
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná (či naopak se významně liší)? je u všech čtyř strojů délka výlisků srov- natelná (či naopak se významně liší)? ANOVA - jednofaktorová analýza rozptylu “ ANOVA - jednofaktorová analýza rozptylu ANOVA = zkratka z „analysis of variance“ plat ve skupině absolventů ZŠ, SŠ, VŠ; délku výlisků ze strojů A, B, C, D;

ANOVA Předpoklady: všechny skupiny jsou nezávislé sledovaná veličina (plat respondenta, resp. délka výlisku,…) se ve všech srovnávaných skupinách chová jako veličina normálně rozdělená, a to se stejnou variabilitou (tzv. podmínka homogenity rozptylů)

ANOVA homogenita rozptylů

ANOVA Komentáře: jde tedy o zobecnění 2-výběrových testů na případ dvou či více porovnávaných skupin zajímá nás vlastně, zda chování sledované normálně rozdělené veličiny Y (plat respondenta, resp. délka výlisku,…) závisí na příslušnosti do té či oné kategorie ANEB zda Y závisí na tzv. kategoriálním faktoru (na vzdělání, na typu stroje,…), odtud označení „jednofaktorová ANOVA“

ANOVA Značení: r …počet rozlišovaných kategorií u daného faktoru (r > 2)  i …střední hodnota Y v i-té kategorii (i=1…r) Testujeme: H 0 :  1 =…=  r ANEB nezávislost na faktoru H 1 : non H 0 ANEB závislost na faktoru

ANOVA Gaussovy křivky (3-kategoriální faktor):

ANOVA Data (3-kategoriální faktor):

ANOVA Výpočty: „podmíněné“ průměry (po kategoriích)

ANOVA Výpočty: celkový průměr (všech skupin)

ANOVA Výpočty: „součty čtverců“Q TOT, Q m, Q v viz přehled vzorců:

ANOVA Výpočty: T a W viz přehled vzorců:

ANOVA Výsledky – tabulka ANOVY: hodnotasoučetčtvercůstupněvolnostipodíl mezi-skupinová QmQmQmQm r–1r–1r–1r–1 Q m /(r–1) vnitro- skupinová QvQvQvQv n–rn–rn–rn–r Q v /(n–r) suma Q TOT n–1n–1n–1n–1

ANOVA Byly sledovány výnosy čtyř odrůd brambor (označme odrůdy A, B, C, D). Každá odrůda byla pěstována na sedmi srovnatelných polích. Zjistěte, zda je typ odrůdy faktorem, který ovlivňuje hektarový výnos brambor. Data – jednotlivé výnosy (v Excelu): Příklad: H 0 : nezávislost výnosů na odrůdě H 0 : nezávislost výnosů na odrůdě H 1 : závislost (aneb výnosy se významně liší) H 1 : závislost (aneb výnosy se významně liší)

ANOVA Příklad (řešení):

ANOVA Příklad (řešení - pokračování):

ANOVA hodnotasoučetčtvercůstupněvolnostipodíl mezi-skupinová174,9125 4–1=3 58,304 vnitro- skupinová 82, =243,427 suma257, –1=27 x 58,304 / 3,427 = 17,01313 T = 58,304 / 3,427 = 17,01313

ANOVA

W=  2,99;  ) T  W  zamítáme H 0  zamítáme nezávislost Typ odrůdy je faktorem, který ovlivňuje hektarový výnos brambor. Typ odrůdy je faktorem, který ovlivňuje hektarový výnos brambor. ANOVA Příklad (řešení - dokončení):

ANOVA

ANOVA

ANOVA p = 4·10 -6 = 0, p = 4·10 -6 = 0,

ANOVA Výsledek: 0, < 0,05  zamítáme H 0 Data prokázala, že výnosy jednotlivých 4 odrůd se významně liší ANEB že odrůda je faktorem, na němž výnos významně závisí.

ANOVA Poznámky: a) Sice jsme prokázali významné rozdíly ve výnosech, můžeme dokonce porovnat zjištěné podmíněné průměry (viz Excel), ale NELZE hned tvrdit, že ANOVA prokázala, která odrůda je horší či lepší – zatím víme jen, že „jsou významné rozdílnosti“

ANOVA Poznámky: b) pokud r=2, lze závislost na faktoru porovnat jak ANOVOU, tak 2-výběrovými testy (které mají oproti ANOVĚ tu výhodu, že existují i v jednostranných variantách a lze tudíž případně posoudit, která z obou porovnávaných kategorií je „lepší“)