Testování hypotéz párový test

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Úvod do analýzy rozptylu
Testování parametrických hypotéz
Testování neparametrických hypotéz
Testování statistických hypotéz
Odhady parametrů základního souboru
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Obecný postup při testování souborů
Testování hypotéz přednáška.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Testování hypotéz vymezení důležitých pojmů
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Další spojitá rozdělení pravděpodobnosti
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
Dvouvýběrové testy parametrickch hypotéz
MATEMATICKÁ STATISTIKA
Dvouvýběrový t-test 11 stejně starých selat bylo náhodně rozděleno do 2 skupin. První skupina byla krmena krmivem A, druhá krmivem B. Po 6 měsících byly.
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 11/3/2014
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
1. cvičení
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednovýběrový t-test Jednovýběrový test rozptylu V.d1 Statistické.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
… jsou bohatší lidé šťastnější?
Jednovýběrový a párový t - test
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Základy statistické indukce
Neparametrické testy parametrické a neparametrické testy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Homogenita meteorologických pozorování
Odhady parametrů základního souboru
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek.
Homogenita meteorologických pozorování
Parciální korelace Regresní analýza
Neparametrické testy pro porovnání polohy
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
7. Kontingenční tabulky a χ2 test
Základy statistiky.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Testování hypotéz párový test Sledujeme (např.): tržby ve stejných prodejnách před a po reklamní kampani; u manželských dvojic věk muže a ženy; Chceme prokázat (např.): měla reklamní kampaň vliv na výši tržeb? jsou v populaci v manželských párech muži výrazně starší než jejich ženy?

Testování hypotéz párový test Data jsou ve tvaru párů, tj. uspořádaných dvojic: (y1;z1), …, (yn; zn), kde např. yi = tržby před kampaní v i-té prodejně, zi = tržby po kampani v i-té prodejně i=1,…,n n=počet prodejen yi = věk muže v i-tém manželském páru, zi = věk ženy v i-tém manželském páru i=1,…,n n=počet manželských párů

Testování hypotéz párový test Řešení („ruční“ výpočet): spočteme rozdíly xi = yi – zi (i=1,…,n) tak vznikne „rozdílová“ veličina X, jejíž střední hodnotu označíme μ

Testování hypotéz párový test Řešení („ruční“ výpočet): pro „rozdílovou“ veličinu X provedeme parametrický test s nulovou hypotézou H0: μ=0 (mezi hodnotami v párech není významný rozdíl) a s alternativou H1: μ0 (mezi hodnotami v párech je významný rozdíl), příp. (často) s alternativou jednostrannou

Testování hypotéz párový test Příklad (další viz Sbírka úloh): Posuďte na základě uvedených dat, zda vlivem reklamní kampaně propagující příslušný obchodní řetězec došlo k významné změně tržeb. Tržby před kampaní (mil.Kč) 1,2 2,4 1,6 1,8 3,2 2,7 2,0 1,9 Tržby po kampani (mil.Kč) 1,3 1,7 3,3 3,1 2,2

Testování hypotéz párový test Rozdíly v tržbách: průměrné x = [-0,1+…+(-0,3)] / 8 = -0,100 M2=0,035  s2=0,040  s=0,200 yi 1,2 2,4 1,6 1,8 3,2 2,7 2,0 1,9 zi 1,3 1,7 3,3 3,1 2,2 xi -0,1 -0,2 0,1 -0,4 0,2 -0,3

Testování hypotéz párový test t 0,975 (7) = 2,365, takže: W = (-∞; -2,365  U  2,365; ∞) TW  nelze zamítnout H0 Data neprokázala významné rozdíly v tržbách před kampaní a po ní.

Testování hypotéz párový test Počítačové řešení (Excelem):

Testování hypotéz párový test

Testování hypotéz párový test p> (0,2002>0,05)  nelze zamítnout H0

Testování hypotéz párový test Poznámka (k zamyšlení): Jakou změnu při řešení by znamenala tato přeformulace zadání? Posuďte na základě uvedených dat, zda vlivem reklamní kampaně propagující příslušný obchodní řetězec došlo k významnému zvýšení tržeb.

Testování hypotéz Dvouvýběrové testy Sledujeme (např.): věk ve skupině mužů a ve skupině žen; hmotnost výlisků ze strojů A a B; Chceme prokázat: je věk mužů a žen srovnatelný? je mezi oběma stroji výrazný rozdíl ve hmotnosti výlisků?

Testování hypotéz Dvouvýběrové testy Předpoklady: obě skupiny jsou nezávislé (např. u mužů a žen nejde o manželské páry) sledovaná veličina (věk respondenta, resp. hmotnost výlisku,…) se v obou srovnávaných skupinách (tj. vůči pohlaví – skupina mužů versus žen, resp. vzhledem k typu stroje – A versus B) chová jako veličina normálně rozdělená

Testování hypotéz Dvouvýběrové testy Možnosti: a) v obou skupinách odlišné  i 2

Testování hypotéz Dvouvýběrové testy Možnosti: b) v obou skupinách shodné , 2 odlišné

Testování hypotéz Dvouvýběrové testy Možnosti: c) v obou skupinách odlišné , 2 shodné

Testování hypotéz Dvouvýběrové testy Možnosti: d) v obou skupinách shodné  i 2

Testování hypotéz Dvouvýběrové testy Testujeme tedy (popořadě): 1. Je v obou skupinách srovnatelná či naopak výrazně odlišná variabilita? ANEB: H0: a2 = b2 versus H1: a2  b2 Jde o tzv. F-test homogenity rozptylů.

Testování hypotéz Dvouvýběrové testy Příklad: Zjistěte, zda ve sledované populaci závisí chování veličiny věk na pohlaví. Obecně jde o příklad závislosti spojité veličiny (s předpokladem normality) na veličině alternativní. Jinak řečeno, porovnáváme chování veličiny věk u mužů a u žen. Nejprve zjistíme, zda je v obou skupinách srovnatelná variabilita. (Dvouvýběrové testy probereme pouze s využitím Excelu, „ruční“ výpočty jsou zdlouhavé.)

Dvouvýběrové testy Výsledkem je p-hodnota (zde =0,522); protože p>0,05, nelze zamítnout H0. Znamená to, že variabilita obou skupin je srovnatelná.

Testování hypotéz Dvouvýběrové testy

Testování hypotéz Dvouvýběrové testy F < F krit …. p-hodnota > 0,05  nelze zamítnout H0, rozptyly jsou srovnatelné

Testování hypotéz Dvouvýběrové testy Následně testujeme: 2. Jsou v obou skupinách srovnatelné či naopak výrazně odlišné střední hodnoty? ANEB: H0: a= b versus H1: a  b Jde o tzv. 2-výběrový t-test. Na F-test navazuje proto, že existuje ve dvou variantách: při různých a při shodných rozptylech.

Testování hypotéz Dvouvýběrové testy Příklad - pokračování: Už víme, že veličina věk má ve sledované populaci srovnatelný rozptyl u mužů a u žen. Teď ověříme, zda je i střední hodnota (střední věk) u obou pohlaví srovnatelná, nebo zda se výrazně liší u mužů a u žen.

Testování hypotéz Dvouvýběrové testy p-hodnota = 0,374 p>0,05nelze zamítnout H0 Nejen rozptyl věku, ale také střední věk mužů a žen je srovnatelný. Jinak řečeno (celkově) – ve sledované populaci nebyla zjištěna závislost věku na pohlaví (Gaussovy křivky cca viz možnost d)).

Testování hypotéz Dvouvýběrové testy Možnosti: d) v obou skupinách shodné  i 2