Testování hypotéz párový test Sledujeme (např.): tržby ve stejných prodejnách před a po reklamní kampani; u manželských dvojic věk muže a ženy; Chceme prokázat (např.): měla reklamní kampaň vliv na výši tržeb? jsou v populaci v manželských párech muži výrazně starší než jejich ženy?
Testování hypotéz párový test Data jsou ve tvaru párů, tj. uspořádaných dvojic: (y1;z1), …, (yn; zn), kde např. yi = tržby před kampaní v i-té prodejně, zi = tržby po kampani v i-té prodejně i=1,…,n n=počet prodejen yi = věk muže v i-tém manželském páru, zi = věk ženy v i-tém manželském páru i=1,…,n n=počet manželských párů
Testování hypotéz párový test Řešení („ruční“ výpočet): spočteme rozdíly xi = yi – zi (i=1,…,n) tak vznikne „rozdílová“ veličina X, jejíž střední hodnotu označíme μ
Testování hypotéz párový test Řešení („ruční“ výpočet): pro „rozdílovou“ veličinu X provedeme parametrický test s nulovou hypotézou H0: μ=0 (mezi hodnotami v párech není významný rozdíl) a s alternativou H1: μ0 (mezi hodnotami v párech je významný rozdíl), příp. (často) s alternativou jednostrannou
Testování hypotéz párový test Příklad (další viz Sbírka úloh): Posuďte na základě uvedených dat, zda vlivem reklamní kampaně propagující příslušný obchodní řetězec došlo k významné změně tržeb. Tržby před kampaní (mil.Kč) 1,2 2,4 1,6 1,8 3,2 2,7 2,0 1,9 Tržby po kampani (mil.Kč) 1,3 1,7 3,3 3,1 2,2
Testování hypotéz párový test Rozdíly v tržbách: průměrné x = [-0,1+…+(-0,3)] / 8 = -0,100 M2=0,035 s2=0,040 s=0,200 yi 1,2 2,4 1,6 1,8 3,2 2,7 2,0 1,9 zi 1,3 1,7 3,3 3,1 2,2 xi -0,1 -0,2 0,1 -0,4 0,2 -0,3
Testování hypotéz párový test t 0,975 (7) = 2,365, takže: W = (-∞; -2,365 U 2,365; ∞) TW nelze zamítnout H0 Data neprokázala významné rozdíly v tržbách před kampaní a po ní.
Testování hypotéz párový test Počítačové řešení (Excelem):
Testování hypotéz párový test
Testování hypotéz párový test p> (0,2002>0,05) nelze zamítnout H0
Testování hypotéz párový test Poznámka (k zamyšlení): Jakou změnu při řešení by znamenala tato přeformulace zadání? Posuďte na základě uvedených dat, zda vlivem reklamní kampaně propagující příslušný obchodní řetězec došlo k významnému zvýšení tržeb.
Testování hypotéz Dvouvýběrové testy Sledujeme (např.): věk ve skupině mužů a ve skupině žen; hmotnost výlisků ze strojů A a B; Chceme prokázat: je věk mužů a žen srovnatelný? je mezi oběma stroji výrazný rozdíl ve hmotnosti výlisků?
Testování hypotéz Dvouvýběrové testy Předpoklady: obě skupiny jsou nezávislé (např. u mužů a žen nejde o manželské páry) sledovaná veličina (věk respondenta, resp. hmotnost výlisku,…) se v obou srovnávaných skupinách (tj. vůči pohlaví – skupina mužů versus žen, resp. vzhledem k typu stroje – A versus B) chová jako veličina normálně rozdělená
Testování hypotéz Dvouvýběrové testy Možnosti: a) v obou skupinách odlišné i 2
Testování hypotéz Dvouvýběrové testy Možnosti: b) v obou skupinách shodné , 2 odlišné
Testování hypotéz Dvouvýběrové testy Možnosti: c) v obou skupinách odlišné , 2 shodné
Testování hypotéz Dvouvýběrové testy Možnosti: d) v obou skupinách shodné i 2
Testování hypotéz Dvouvýběrové testy Testujeme tedy (popořadě): 1. Je v obou skupinách srovnatelná či naopak výrazně odlišná variabilita? ANEB: H0: a2 = b2 versus H1: a2 b2 Jde o tzv. F-test homogenity rozptylů.
Testování hypotéz Dvouvýběrové testy Příklad: Zjistěte, zda ve sledované populaci závisí chování veličiny věk na pohlaví. Obecně jde o příklad závislosti spojité veličiny (s předpokladem normality) na veličině alternativní. Jinak řečeno, porovnáváme chování veličiny věk u mužů a u žen. Nejprve zjistíme, zda je v obou skupinách srovnatelná variabilita. (Dvouvýběrové testy probereme pouze s využitím Excelu, „ruční“ výpočty jsou zdlouhavé.)
Dvouvýběrové testy Výsledkem je p-hodnota (zde =0,522); protože p>0,05, nelze zamítnout H0. Znamená to, že variabilita obou skupin je srovnatelná.
Testování hypotéz Dvouvýběrové testy
Testování hypotéz Dvouvýběrové testy F < F krit …. p-hodnota > 0,05 nelze zamítnout H0, rozptyly jsou srovnatelné
Testování hypotéz Dvouvýběrové testy Následně testujeme: 2. Jsou v obou skupinách srovnatelné či naopak výrazně odlišné střední hodnoty? ANEB: H0: a= b versus H1: a b Jde o tzv. 2-výběrový t-test. Na F-test navazuje proto, že existuje ve dvou variantách: při různých a při shodných rozptylech.
Testování hypotéz Dvouvýběrové testy Příklad - pokračování: Už víme, že veličina věk má ve sledované populaci srovnatelný rozptyl u mužů a u žen. Teď ověříme, zda je i střední hodnota (střední věk) u obou pohlaví srovnatelná, nebo zda se výrazně liší u mužů a u žen.
Testování hypotéz Dvouvýběrové testy p-hodnota = 0,374 p>0,05nelze zamítnout H0 Nejen rozptyl věku, ale také střední věk mužů a žen je srovnatelný. Jinak řečeno (celkově) – ve sledované populaci nebyla zjištěna závislost věku na pohlaví (Gaussovy křivky cca viz možnost d)).
Testování hypotéz Dvouvýběrové testy Možnosti: d) v obou skupinách shodné i 2