Testování statistických hypotéz Statistická indukce Testování statistických hypotéz
Dvouvýběrové testy (testy hypotéz o parametrech dvou rozdělení) Máme k dispozici dva výběrové soubory a na základě jejich porovnání provádíme úsudky o základních charakteristikách dvou ZS, z nichž byly výběry provedeny. Test významnosti rozdílu dvou výběrových rozptylů (F-test) Uvažujme dva nezávislé náhodné výběry X = (x1, x2, …, xm)´ a Y = (y1, y2, …, yn)´ o rozsazích m, resp. n, jež byly odebrány ze ZS s rozdělením , resp. , kde 1 , 2 , a jsou neznámé hodnoty.
Test nulové hypotézy provedeme pomocí testového kritéria kde jsou nestranné výběrové rozptyly, pomocí nichž odhadujeme neznámé rozptyly a .
Za platnosti H0 má statistika Snedecorovo F-rozdělení o f1 = (m-1) a f2 = (n-1) stupních volnosti. Kritický obor Alternativa Kritický obor K = F > F/2 [(m-1), (n-1)] K = F > F [(m-1), (n-1)] Jestliže F < F (f1, f2), není důvod, abychom nulovou hypotézu zamítali.
Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 30 a zjistili pro některý jejich rozměr výběrovou směrodatnou odchylku 4,081 mm. Ze zásilky od druhého dodavatele jsme vybrali 25 součástek a zjistili jsme pro stejný rozměr výběrový rozptyl 18,25. Na základě těchto údajů chceme ověřit, zda variabilita sledovaného parametru je u obou dodávek shodná. m = 30 n = 25
F (f1, f2) = F0,05 (24; 29) = 1,90 F < F (f1, f2) H0 nezamítáme a variabilita obou dodávek je v ZS shodná.
Test významnosti rozdílu dvou výběrových průměrů (t-test) t-test při známých rozptylech Budeme předpokládat, že ze dvou základních souborů, které mají rozdělení , resp. byly provedeny nezávislé náhodné výběry o rozsazích m, resp. n (vyžaduje větší rozsahy). Na základě těchto nezávislých náhodných výběrů chceme ověřit nulovou hypotézu H0: 1 = 2 proti alternativní hypotéze H1: 1 2 (event. 1 – 2 = 0). Je třeba rozhodnout, zda výběrové průměry určené z nezávislých náhodných výběrů o rozsazích m a n se liší statisticky významně nebo pouze náhodně.
Jako testovacího kritéria použijeme statistiky U, která má za platnosti H0 rozdělení N(0; 1). Kritický obor Alternativa Kritický obor H1: 1 2 K = U> u H1: 1 2 K = U > u2 H1: 1 2 K = U < -u2
t-test při neznámých rozptylech K dispozici máme pouze nestranné odhady rozptylů a , vypočtené z hodnot, zjištěných ve dvou nezávislých náhodných výběrech o rozsazích m a n. Před vlastním provedením testu je potřeba ověřit, zda se neznámé rozptyly a sobě rovnají nebo zda se od sebe liší. Tzn. před každým t-testem se provádí F-test (test hypotézy o shodě dvou rozptylů).
Test hypotézy H0: 1 = 2 při stejných rozptylech (dvouvýběrový t-test) Jsou-li oba rozptyly a stejné , používá se k testování hypotézy testové kritérium kde
Kritické obory uvádí následující přehled. Alternativa Kritický obor H1: 1 2 K = t> t (m+n-2) H1: 1 2 K = t > t2 (m+n-2) H1: 1 2 K = t < -t2 (m+n-2)
Příklad Máme k dispozici údaje o zaměstnanosti žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti žen existuje rozdíl mezi novými a starými zeměmi EU?
H0: 1 = 2 – zaměstnanost žen je stejná H1: 1 2 – zaměstnanost žen je rozdílná m = 15 n = 10 1 = 58,033 2 = 53,23 Nejprve je potřeba provést F-test.
F0,05 (14; 10) = 2,86 F < F (f1, f2) H0 se nezamítá, tzn. že variabilita obou souborů v ZS je shodná Nyní pokračujeme t-testem pro variantu shodných rozptylů.
t0,05 (15+10-2) = 2,069 t = 1,327 < t = 2,069 t < t (f) H0: 1 = 2 se nezamítá a rozdíl v průměrné zaměstnanosti žen v rámci starých a nových zemí EU lze označit za statisticky nevýznamný
Test hypotézy H0: 1 = 2 při nestejných rozptylech (Welchův t-test) Jsou-li oba rozptyly a podle F–testu rozdílné , použije se Welchův test založený na testové statistice Kritické obory pro tento test mají zcela analogický tvar jako kritické obory uvedené u předchozího testu s tím rozdílem, že počet stupňů volnosti v kritických hodnotách je potřeba stanovit samostatným výpočtem.
Počet stupňů volnosti pro Welchův test Jestliže t > t (f) H0: 1 = 2 se na dané hladině významnosti zamítá a platí hypotéza alternativní.
Behrens-Fisherův test. Kromě Welchova testu lze použít i jiný způsob provedení testu, který se nazývá Behrens-Fisherův test. Jako testové kritérium slouží statistika U tohoto testu se nestanovují stupně volnosti, nýbrž se přepočítává celá tabulková hodnota.
Přepočet tabulkové hodnoty Kritický obor Alternativa Kritický obor H1: 1 2 H1: 1 2 H1: 1 2
Příklad Máme k dispozici údaje o zaměstnanosti mužů a žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti existuje mezi muži a ženami rozdíl?
H0: 1 = 2 – zaměstnanost mužů a žen je stejná H1: 1 2 – zaměstnanost mužů a žen je rozdílná m = 25 n = 25 1 = 71,116 2 = 56,112 Nejprve je potřeba provést F-test.
F0,05 (24; 24) = 1,98 F > F (f1, f2) H0 se zamítá, tzn. že variabilita obou souborů je rozdílná Nyní pokračujeme t-testem pro variantu rozdílných rozptylů. Nejprve použijeme Welchův test.
t0,05 (41) = 2,021 t = 6,99 > t = 2,021 t > t (f) H0: 1 = 2 se zamítá a rozdíl v průměrné zaměstnanosti mužů a žen v rámci EU lze označit za statisticky významný
Nyní použijeme druhý možný postup a to test Behrens – Fisherův.
t-test pro párové hodnoty (párový t-test) Ve všech předchozích úvahách jsme vycházeli z předpokladu nezávislosti výběrových souborů. V praxi se však často stává, že oba porovnávané soubory jsou určitým způsobem vázány a to tak, že každý prvek jednoho souboru tvoří pár s určitým prvkem druhého souboru. V těchto případech hovoříme o tzv. párových výběrech. Setkáváme s nimi např. tehdy, provádíme-li měření na jedné statistické jednotce dvakrát nebo na objektech máme párové části (oči, uši, nohy) a provedeme na nich měření.
Výsledkem zjišťování jsou dvojice hodnot (xi, yi), které tvoří páry závislých pozorování. Test hypotézy, že výběry x = (x1, x2, …, xn)´ a y = (y1, y2, …, yn)´ pocházejí z rozdělení se stejnými středními hodnotami 1 a 2, lze převést na jednovýběrový t-test, aplikovaný na hodnoty di = xi – yi. Soubor diferencí d = (d1, d2, …, dn)´ lze považovat za náhodný výběr o rozsahu n z rozdělení , kde d = 1 – 2.
Aritmetický průměr a rozptyl tohoto výběru jsou: Testovanou nulovou hypotézu ve tvaru H0: 1 = 2 můžeme nyní napsat v upraveném podobě jako H0: d = 0, kde d je průměr souboru diferencí di.
Testové kritérium má tvar Kritický obor Alternativa Kritický obor H1: 1 2 K = t> t (n-1) H1: 1 2 K = t > t2 (n-1) H1: 1 2 K = t < -t2 (n-1)
Příklad Máme k dispozici údaje o výkonech žáků ve skoku do dálky při tréninku a při závodě. Je možné konstatovat, že jsou výkony žáků při tréninku a při závodě shodné? H0: 1 = 2 H1: 1 2
t(n-1) = t0,05 (11) = 2,201 t < t (n-1) H0 se nezamítá, tzn. lze konstatovat, že výkony žáků jsou vyrovnané (nebyl prokázán statisticky významný rozdíl ve výkonech při tréninku a v závodě)
Test významnosti rozdílu dvou výběrových relativních čeností Přepokládejme, že jsou dány dva ZS s alternativním rozdělením s parametry p1 a p2. Na základě náhodných výběrů o velkých rozsazích n1 a n2 (n1 > 100; n2 > 100) je třeba ověřit hypotézu H0: p1 = p2. Test je založen na statistice
výběrové relativní četnosti výskytu náhodného jevu A v 1. , resp. ve 2 výběrové relativní četnosti výskytu náhodného jevu A v 1., resp. ve 2. výběru – vážený aritmetický průměr obou výběrových relativních četností
Pro tento test je možné použít i trochu jiné testové kritérium.
Kritický obor je stejný pro obě varianty testového kritéria. Alternativa Kritický obor H1: p1 p2 K = u> u H1: p1 p2 K = u > u2 H1: p1 p2 K = u < -u2
Příklad Máme k dispozici údaje o počtu narozených dětí v rámci dvou regionů. V regionu A zjistili, že během sledovaného období se v rámci 120 dětí narodilo 51 chlapců, zatímco v regionu B se za stejné období narodilo celkem 150 dětí, z toho 66 děvčat. Je možné konstatovat, že pravděpodobnost narození chlapce je u obou regionů stejná? H0: p1 = p2 – pravděpodobnost narození chlapce je shodná H1: p1 p2 – pravděpodobnost je odlišná m1 = 51 m2 = 84 n1 = 120 n2 = 150
u = u0,05 = 1,96 u> u H0 se zamítá, tzn. že pravděpodobnost narození chlapce je v rámci dvou sledovaných regionů odlišná
Nyní použijeme druhé testové kritérium.
Testy rovnosti parametrů , k > 2 normálních rozdělení Vícevýběrové testy (testy hypotéz o parametrech více než dvou rozdělení) Testy rovnosti parametrů , k > 2 normálních rozdělení Test rovnosti dvou rozptylů lze zobecnit na případ k > 2 normálně rozdělených základních souborů, z nichž pořizujeme výběry. Bartlettův test Mějme k > 2 vzájemně nezávislých náhodných výběrů ze ZS s rozdělením , kde oba parametry jsou neznámé. Rozsahy jednotlivých výběrů jsou n1, n2, …, nk.
H1: alespoň dva z rozptylů jsou různé. Na základě uvedených náhodných výběrů testujeme hypotézu proti hypotéze alternativní H1: alespoň dva z rozptylů jsou různé. Testovacím kritériem je statistika
Statistika má za platnosti H0 rozdělení 2 – rozdělení o (k-1) stupních volnosti. Jestliže se zamítá.
Cochranův test Vyjdeme ze stejných předpokladů jako u Bartlettova testu a předpokládejme dále, že všechny výběrové soubory mají stejné rozsahy, tzn. n1 = n2 =…= nk = n. Ověření nulové hypotézy lze sice i v tomto případě provést pomocí Bartlettova testu, ale výhodnější a rychlejší je zde Cochranův test. Testovací kritérium má tvar
Jestliže G G (k, f) H0 se zamítá. kde je největší z rozptylů (i = 1, 2, …, m), které představují nestranné odhady neznámých populačních rozptylů . Kritický obor se určí z podmínky P (G G (k, f) / H0) = , kde G(k, f) je kritická hodnota, kterou určíme pro zvolenou hladinu významnosti , přičemž k je počet srovnávaných rozptylů a f = n–1 je počet stupňů volnosti těchto rozptylů (je stejný pro všechny rozptyly, neboť jsou vypočteny ze stejného počtu pozorování). Jestliže G G (k, f) H0 se zamítá.
V případě vyváženého třídění (n1 = n2 = … = nk = n) lze hypotézu o shodě více jak dvou rozptylů ověřit pomocí Hartleyova testu. Testové kritérium má tvar Kritický obor je vymezen takto: K=Fmax Fmax; (k, f) Fmax; (k, f) – tabulková hodnota pro k – počet srovnávaných rozptylů a pro f = n – 1 stupňů volnosti
Testujeme hypotézu o shodě rozptylů ZS Příklad Tří různých vyučovacích metod bylo použito na malých skupinách žáků. Na základě závěrečného zkoušení (v bodech), které jsou uvedeny v tabulce, posuďte, zda existuje rozdíl ve variabilitě v počtu získaných bodů mezi jednotlivými metodami. Testujeme hypotézu o shodě rozptylů ZS
Výpočty k Bartlettovu testu Metoda A 1853 27225 1815,0 2,71 0,4330 B 2706 39204 2613,0 6,60 0,8195 C 3242 46656 3110,4 9,40 0,9731 Celkem 7801 113085 7539,0 18,71 2,2256
H0 o shodě rozptylů nemůžeme zamítnout.
Bylo možné také použít Cochranův test. Odchylky mezi rozptyly lze pokládat za nevýznamné. Hartleyův test