Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Testování statistických hypotéz

Podobné prezentace


Prezentace na téma: "Testování statistických hypotéz"— Transkript prezentace:

1 Testování statistických hypotéz
Statistická indukce Testování statistických hypotéz

2 Dvouvýběrové testy (testy hypotéz o parametrech dvou rozdělení)
Máme k dispozici dva výběrové soubory a na základě jejich porovnání provádíme úsudky o základních charakteristikách dvou ZS, z nichž byly výběry provedeny. Test významnosti rozdílu dvou výběrových rozptylů (F-test) Uvažujme dva nezávislé náhodné výběry X = (x1, x2, …, xm)´ a Y = (y1, y2, …, yn)´ o rozsazích m, resp. n, jež byly odebrány ze ZS s rozdělením , resp , kde 1 , 2 , a jsou neznámé hodnoty.

3 Test nulové hypotézy provedeme pomocí testového kritéria kde jsou nestranné výběrové rozptyly, pomocí nichž odhadujeme neznámé rozptyly a

4 Za platnosti H0 má statistika Snedecorovo F-rozdělení o f1 = (m-1) a f2 = (n-1) stupních volnosti.
Kritický obor Alternativa Kritický obor K = F > F/2 [(m-1), (n-1)] K = F > F [(m-1), (n-1)] Jestliže F < F (f1, f2), není důvod, abychom nulovou hypotézu zamítali.

5 Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 30 a zjistili pro některý jejich rozměr výběrovou směrodatnou odchylku 4,081 mm. Ze zásilky od druhého dodavatele jsme vybrali 25 součástek a zjistili jsme pro stejný rozměr výběrový rozptyl 18,25. Na základě těchto údajů chceme ověřit, zda variabilita sledovaného parametru je u obou dodávek shodná. m = n = 25

6 F (f1, f2) = F0,05 (24; 29) = 1,90 F < F (f1, f2)  H0 nezamítáme a variabilita obou dodávek je v ZS shodná.

7 Test významnosti rozdílu dvou výběrových průměrů (t-test)
t-test při známých rozptylech Budeme předpokládat, že ze dvou základních souborů, které mají rozdělení , resp byly provedeny nezávislé náhodné výběry o rozsazích m, resp. n (vyžaduje větší rozsahy). Na základě těchto nezávislých náhodných výběrů chceme ověřit nulovou hypotézu H0: 1 = 2 proti alternativní hypotéze H1: 1  2 (event. 1 – 2 = 0). Je třeba rozhodnout, zda výběrové průměry určené z nezávislých náhodných výběrů o rozsazích m a n se liší statisticky významně nebo pouze náhodně.

8 Jako testovacího kritéria použijeme statistiky U, která má za platnosti H0 rozdělení N(0; 1).
Kritický obor Alternativa Kritický obor H1: 1  2 K = U> u H1: 1  2 K = U > u2 H1: 1  2 K = U < -u2

9 t-test při neznámých rozptylech
K dispozici máme pouze nestranné odhady rozptylů a , vypočtené z hodnot, zjištěných ve dvou nezávislých náhodných výběrech o rozsazích m a n. Před vlastním provedením testu je potřeba ověřit, zda se neznámé rozptyly a sobě rovnají nebo zda se od sebe liší. Tzn. před každým t-testem se provádí F-test (test hypotézy o shodě dvou rozptylů).

10 Test hypotézy H0: 1 = 2 při stejných rozptylech (dvouvýběrový t-test)
Jsou-li oba rozptyly a stejné , používá se k testování hypotézy testové kritérium kde

11 Kritické obory uvádí následující přehled.
Alternativa Kritický obor H1: 1  2 K = t> t (m+n-2) H1: 1  2 K = t > t2 (m+n-2) H1: 1  2 K = t < -t2 (m+n-2)

12 Příklad Máme k dispozici údaje o zaměstnanosti žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti žen existuje rozdíl mezi novými a starými zeměmi EU?

13 H0: 1 = 2 – zaměstnanost žen je stejná
H1: 1  2 – zaměstnanost žen je rozdílná m = n = 10 1 = 58, 2 = 53,23 Nejprve je potřeba provést F-test.

14 F0,05 (14; 10) = 2,86 F < F (f1, f2)  H0 se nezamítá, tzn. že variabilita obou souborů v ZS je shodná Nyní pokračujeme t-testem pro variantu shodných rozptylů.

15 t0,05 ( ) = 2,069 t = 1,327 < t = 2,069 t < t (f)  H0: 1 = 2 se nezamítá a rozdíl v průměrné zaměstnanosti žen v rámci starých a nových zemí EU lze označit za statisticky nevýznamný

16 Test hypotézy H0: 1 = 2 při nestejných rozptylech (Welchův t-test)
Jsou-li oba rozptyly a podle F–testu rozdílné , použije se Welchův test založený na testové statistice Kritické obory pro tento test mají zcela analogický tvar jako kritické obory uvedené u předchozího testu s tím rozdílem, že počet stupňů volnosti v kritických hodnotách je potřeba stanovit samostatným výpočtem.

17 Počet stupňů volnosti pro Welchův test
Jestliže t > t (f)  H0: 1 = 2 se na dané hladině významnosti zamítá a platí hypotéza alternativní.

18 Behrens-Fisherův test.
Kromě Welchova testu lze použít i jiný způsob provedení testu, který se nazývá Behrens-Fisherův test. Jako testové kritérium slouží statistika U tohoto testu se nestanovují stupně volnosti, nýbrž se přepočítává celá tabulková hodnota.

19 Přepočet tabulkové hodnoty
Kritický obor Alternativa Kritický obor H1: 1  2 H1: 1  2 H1: 1  2

20 Příklad Máme k dispozici údaje o zaměstnanosti mužů a žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti existuje mezi muži a ženami rozdíl?

21 H0: 1 = 2 – zaměstnanost mužů a žen je stejná
H1: 1  2 – zaměstnanost mužů a žen je rozdílná m = n = 25 1 = 71, 2 = 56,112 Nejprve je potřeba provést F-test.

22 F0,05 (24; 24) = 1,98 F > F (f1, f2)  H0 se zamítá, tzn. že variabilita obou souborů je rozdílná Nyní pokračujeme t-testem pro variantu rozdílných rozptylů. Nejprve použijeme Welchův test.

23 t0,05 (41) = 2,021 t = 6,99 > t = 2,021 t > t (f)  H0: 1 = 2 se zamítá a rozdíl v průměrné zaměstnanosti mužů a žen v rámci EU lze označit za statisticky významný

24 Nyní použijeme druhý možný postup a to test Behrens – Fisherův.

25 t-test pro párové hodnoty (párový t-test)
Ve všech předchozích úvahách jsme vycházeli z předpokladu nezávislosti výběrových souborů. V praxi se však často stává, že oba porovnávané soubory jsou určitým způsobem vázány a to tak, že každý prvek jednoho souboru tvoří pár s určitým prvkem druhého souboru. V těchto případech hovoříme o tzv. párových výběrech. Setkáváme s nimi např. tehdy, provádíme-li měření na jedné statistické jednotce dvakrát nebo na objektech máme párové části (oči, uši, nohy) a provedeme na nich měření.

26 Výsledkem zjišťování jsou dvojice hodnot (xi, yi), které tvoří páry závislých pozorování.
Test hypotézy, že výběry x = (x1, x2, …, xn)´ a y = (y1, y2, …, yn)´ pocházejí z rozdělení se stejnými středními hodnotami 1 a 2, lze převést na jednovýběrový t-test, aplikovaný na hodnoty di = xi – yi. Soubor diferencí d = (d1, d2, …, dn)´ lze považovat za náhodný výběr o rozsahu n z rozdělení , kde d = 1 – 2.

27 Aritmetický průměr a rozptyl tohoto výběru jsou:
Testovanou nulovou hypotézu ve tvaru H0: 1 = 2 můžeme nyní napsat v upraveném podobě jako H0: d = 0, kde d je průměr souboru diferencí di.

28 Testové kritérium má tvar
Kritický obor Alternativa Kritický obor H1: 1  2 K = t> t (n-1) H1: 1  2 K = t > t2 (n-1) H1: 1  2 K = t < -t2 (n-1)

29 Příklad Máme k dispozici údaje o výkonech žáků ve skoku do dálky při tréninku a při závodě. Je možné konstatovat, že jsou výkony žáků při tréninku a při závodě shodné? H0: 1 = 2 H1: 1  2

30

31 t(n-1) = t0,05 (11) = 2,201 t < t (n-1)  H0 se nezamítá, tzn. lze konstatovat, že výkony žáků jsou vyrovnané (nebyl prokázán statisticky významný rozdíl ve výkonech při tréninku a v závodě)

32 Test významnosti rozdílu dvou výběrových relativních čeností
Přepokládejme, že jsou dány dva ZS s alternativním rozdělením s parametry p1 a p2. Na základě náhodných výběrů o velkých rozsazích n1 a n2 (n1 > 100; n2 > 100) je třeba ověřit hypotézu H0: p1 = p2. Test je založen na statistice

33 výběrové relativní četnosti výskytu náhodného jevu A v 1. , resp. ve 2
výběrové relativní četnosti výskytu náhodného jevu A v 1., resp. ve 2. výběru – vážený aritmetický průměr obou výběrových relativních četností

34 Pro tento test je možné použít i trochu jiné testové kritérium.

35 Kritický obor je stejný pro obě varianty testového kritéria.
Alternativa Kritický obor H1: p1  p2 K = u> u H1: p1  p2 K = u > u2 H1: p1  p2 K = u < -u2

36 Příklad Máme k dispozici údaje o počtu narozených dětí v rámci dvou regionů. V regionu A zjistili, že během sledovaného období se v rámci 120 dětí narodilo 51 chlapců, zatímco v regionu B se za stejné období narodilo celkem 150 dětí, z toho 66 děvčat. Je možné konstatovat, že pravděpodobnost narození chlapce je u obou regionů stejná? H0: p1 = p2 – pravděpodobnost narození chlapce je shodná H1: p1  p2 – pravděpodobnost je odlišná m1 = m2 = 84 n1 = n2 = 150

37 u = u0,05 = 1,96 u> u  H0 se zamítá, tzn. že pravděpodobnost narození chlapce je v rámci dvou sledovaných regionů odlišná

38 Nyní použijeme druhé testové kritérium.

39 Testy rovnosti parametrů , k > 2 normálních rozdělení
Vícevýběrové testy (testy hypotéz o parametrech více než dvou rozdělení) Testy rovnosti parametrů , k > 2 normálních rozdělení Test rovnosti dvou rozptylů lze zobecnit na případ k > 2 normálně rozdělených základních souborů, z nichž pořizujeme výběry. Bartlettův test Mějme k > 2 vzájemně nezávislých náhodných výběrů ze ZS s rozdělením , kde oba parametry jsou neznámé. Rozsahy jednotlivých výběrů jsou n1, n2, …, nk.

40 H1: alespoň dva z rozptylů jsou různé.
Na základě uvedených náhodných výběrů testujeme hypotézu proti hypotéze alternativní H1: alespoň dva z rozptylů jsou různé. Testovacím kritériem je statistika

41 Statistika má za platnosti H0 rozdělení 2 – rozdělení o (k-1) stupních volnosti.
Jestliže se zamítá.

42 Cochranův test Vyjdeme ze stejných předpokladů jako u Bartlettova testu a předpokládejme dále, že všechny výběrové soubory mají stejné rozsahy, tzn. n1 = n2 =…= nk = n. Ověření nulové hypotézy lze sice i v tomto případě provést pomocí Bartlettova testu, ale výhodnější a rychlejší je zde Cochranův test. Testovací kritérium má tvar

43 Jestliže G  G (k, f)  H0 se zamítá.
kde je největší z rozptylů (i = 1, 2, …, m), které představují nestranné odhady neznámých populačních rozptylů Kritický obor se určí z podmínky P (G  G (k, f) / H0) = , kde G(k, f) je kritická hodnota, kterou určíme pro zvolenou hladinu významnosti , přičemž k je počet srovnávaných rozptylů a f = n–1 je počet stupňů volnosti těchto rozptylů (je stejný pro všechny rozptyly, neboť jsou vypočteny ze stejného počtu pozorování). Jestliže G  G (k, f)  H0 se zamítá.

44 V případě vyváženého třídění (n1 = n2 = … = nk = n) lze hypotézu o shodě více jak dvou rozptylů ověřit pomocí Hartleyova testu. Testové kritérium má tvar Kritický obor je vymezen takto: K=Fmax  Fmax;  (k, f) Fmax;  (k, f) – tabulková hodnota pro k – počet srovnávaných rozptylů a pro f = n – 1 stupňů volnosti

45 Testujeme hypotézu o shodě rozptylů ZS
Příklad Tří různých vyučovacích metod bylo použito na malých skupinách žáků. Na základě závěrečného zkoušení (v bodech), které jsou uvedeny v tabulce, posuďte, zda existuje rozdíl ve variabilitě v počtu získaných bodů mezi jednotlivými metodami. Testujeme hypotézu o shodě rozptylů ZS

46 Výpočty k Bartlettovu testu
Metoda A 1853 27225 1815,0 2,71 0,4330 B 2706 39204 2613,0 6,60 0,8195 C 3242 46656 3110,4 9,40 0,9731 Celkem 7801 113085 7539,0 18,71 2,2256

47 H0 o shodě rozptylů nemůžeme zamítnout.

48 Bylo možné také použít Cochranův test.
Odchylky mezi rozptyly lze pokládat za nevýznamné. Hartleyův test


Stáhnout ppt "Testování statistických hypotéz"

Podobné prezentace


Reklamy Google