Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistická indukce Testování statistických hypotéz.

Podobné prezentace


Prezentace na téma: "Statistická indukce Testování statistických hypotéz."— Transkript prezentace:

1 Statistická indukce Testování statistických hypotéz

2 Dvouvýběrové testy (testy hypotéz o parametrech dvou rozdělení) Máme k dispozici dva výběrové soubory a na základě jejich porovnání provádíme úsudky o základních charakteristikách dvou ZS, z nichž byly výběry provedeny. Test významnosti rozdílu dvou výběrových rozptylů (F-test) Uvažujme dva nezávislé náhodné výběry X = (x 1, x 2, …, x m )´ a Y = (y 1, y 2, …, y n )´ o rozsazích m, resp. n, jež byly odebrány ze ZS s rozdělením, resp., kde  1,  2, a jsou neznámé hodnoty.

3 Test nulové hypotézy provedeme pomocí testového kritéria kde jsou nestranné výběrové rozptyly, pomocí nichž odhadujeme neznámé rozptyly a.

4 Za platnosti H 0 má statistika Snedecorovo F-rozdělení o f 1 = (m-1) a f 2 = (n-1) stupních volnosti. Kritický obor AlternativaKritický obor K =  F > F  /2 [(m-1), (n-1)]  K =  F > F  [(m-1), (n-1)]  Jestliže F < F  (f 1, f 2 ), není důvod, abychom nulovou hypotézu zamítali.

5 Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 30 a zjistili pro některý jejich rozměr výběrovou směrodatnou odchylku 4,081 mm. Ze zásilky od druhého dodavatele jsme vybrali 25 součástek a zjistili jsme pro stejný rozměr výběrový rozptyl 18,25. Na základě těchto údajů chceme ověřit, zda variabilita sledovaného parametru je u obou dodávek shodná. m = 30n = 25

6 F  (f 1, f 2 ) = F 0,05 (24; 29) = 1,90 F < F  (f 1, f 2 )  H 0 nezamítáme a variabilita obou dodávek je v ZS shodná.

7 Test významnosti rozdílu dvou výběrových průměrů (t-test)  t-test při známých rozptylech Budeme předpokládat, že ze dvou základních souborů, které mají rozdělení, resp. byly provedeny nezávislé náhodné výběry o rozsazích m, resp. n (vyžaduje větší rozsahy). Na základě těchto nezávislých náhodných výběrů chceme ověřit nulovou hypotézu H 0 :  1 =  2 proti alternativní hypotéze H 1 :  1   2 (event.  1 –  2 = 0). Je třeba rozhodnout, zda výběrové průměry určené z nezávislých náhodných výběrů o rozsazích m a n se liší statisticky významně nebo pouze náhodně.

8 Jako testovacího kritéria použijeme statistiky U, která má za platnosti H 0 rozdělení N(0; 1). Kritický obor AlternativaKritický obor H 1 :  1   2 K =  U  > u   H 1 :  1   2 K =  U > u 2   H 1 :  1   2 K =  U < -u 2  

9  t-test při neznámých rozptylech K dispozici máme pouze nestranné odhady rozptylů a, vypočtené z hodnot, zjištěných ve dvou nezávislých náhodných výběrech o rozsazích m a n. Před vlastním provedením testu je potřeba ověřit, zda se neznámé rozptyly a sobě rovnají nebo zda se od sebe liší. Tzn. před každým t-testem se provádí F-test (test hypotézy o shodě dvou rozptylů).

10 Test hypotézy H 0 :  1 =  2 při stejných rozptylech (dvouvýběrový t-test) Jsou-li oba rozptyly a stejné, používá se k testování hypotézy testové kritérium kde

11 Kritické obory uvádí následující přehled. AlternativaKritický obor H 1 :  1   2 K =  t  > t  (m+n-2)  H 1 :  1   2 K =  t > t 2  (m+n-2)  H 1 :  1   2 K =  t < -t 2  (m+n-2) 

12 Příklad Máme k dispozici údaje o zaměstnanosti žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti žen existuje rozdíl mezi novými a starými zeměmi EU?

13 H 0 :  1 =  2 – zaměstnanost žen je stejná H 1 :  1   2 – zaměstnanost žen je rozdílná m = 15n = 10  1 = 58,033  2 = 53,23 Nejprve je potřeba provést F-test.

14 F 0,05 (14; 10) = 2,86 F < F  (f 1, f 2 )  H 0 se nezamítá, tzn. že variabilita obou souborů v ZS je shodná Nyní pokračujeme t-testem pro variantu shodných rozptylů.

15 t 0,05 ( ) = 2,069 t = 1,327 < t  = 2,069 t < t  (f)  H 0 :  1 =  2 se nezamítá a rozdíl v průměrné zaměstnanosti žen v rámci starých a nových zemí EU lze označit za statisticky nevýznamný

16 Test hypotézy H 0 :  1 =  2 při nestejných rozptylech (Welchův t-test) Jsou-li oba rozptyly a podle F – testu rozdílné, použije se Welchův test založený na testové statistice Kritické obory pro tento test mají zcela analogický tvar jako kritické obory uvedené u předchozího testu s tím rozdílem, že počet stupňů volnosti v kritických hodnotách je potřeba stanovit samostatným výpočtem.

17 Počet stupňů volnosti pro Welchův test Jestliže t > t  (f)  H 0 :  1 =  2 se na dané hladině významnosti zamítá a platí hypotéza alternativní.

18 Kromě Welchova testu lze použít i jiný způsob provedení testu, který se nazývá Behrens-Fisherův test. Jako testové kritérium slouží statistika U tohoto testu se nestanovují stupně volnosti, nýbrž se přepočítává celá tabulková hodnota.

19 Přepočet tabulkové hodnoty Kritický obor AlternativaKritický obor H 1 :  1   2 H 1 :  1   2 H 1 :  1   2

20 Příklad Máme k dispozici údaje o zaměstnanosti mužů a žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti existuje mezi muži a ženami rozdíl?

21 H 0 :  1 =  2 – zaměstnanost mužů a žen je stejná H 1 :  1   2 – zaměstnanost mužů a žen je rozdílná m = 25n = 25  1 = 71,116  2 = 56,112 Nejprve je potřeba provést F-test.

22 F 0,05 (24; 24) = 1,98 F > F  (f 1, f 2 )  H 0 se zamítá, tzn. že variabilita obou souborů je rozdílná Nyní pokračujeme t-testem pro variantu rozdílných rozptylů. Nejprve použijeme Welchův test.

23 t 0,05 (41) = 2,021 t = 6,99 > t  = 2,021 t > t  (f)  H 0 :  1 =  2 se zamítá a rozdíl v průměrné zaměstnanosti mužů a žen v rámci EU lze označit za statisticky významný

24 Nyní použijeme druhý možný postup a to test Behrens – Fisherův. t 0,05 (24) = 2,064

25 t-test pro párové hodnoty (párový t-test) Ve všech předchozích úvahách jsme vycházeli z předpokladu nezávislosti výběrových souborů. V praxi se však často stává, že oba porovnávané soubory jsou určitým způsobem vázány a to tak, že každý prvek jednoho souboru tvoří pár s určitým prvkem druhého souboru. V těchto případech hovoříme o tzv. párových výběrech. Setkáváme s nimi např. tehdy, provádíme-li měření na jedné statistické jednotce dvakrát nebo na objektech máme párové části (oči, uši, nohy) a provedeme na nich měření.

26 Výsledkem zjišťování jsou dvojice hodnot (x i, y i ), které tvoří páry závislých pozorování. Test hypotézy, že výběry x = (x 1, x 2, …, x n )´ a y = (y 1, y 2, …, y n )´ pocházejí z rozdělení se stejnými středními hodnotami  1 a  2, lze převést na jednovýběrový t-test, aplikovaný na hodnoty d i = x i – y i. Soubor diferencí d = (d 1, d 2, …, d n )´ lze považovat za náhodný výběr o rozsahu n z rozdělení, kde  d =  1 –  2.

27 Aritmetický průměr a rozptyl tohoto výběru jsou: Testovanou nulovou hypotézu ve tvaru H 0 :  1 =  2 můžeme nyní napsat v upraveném podobě jako H 0 :  d = 0, kde  d je průměr souboru diferencí d i.

28 Testové kritérium má tvar Kritický obor AlternativaKritický obor H 1 :  1   2 K =  t  > t  (n-1)  H 1 :  1   2 K =  t > t 2  (n-1)  H 1 :  1   2 K =  t < -t 2  (n-1) 

29 Příklad Máme k dispozici údaje o výkonech žáků ve skoku do dálky při tréninku a při závodě. Je možné konstatovat, že jsou výkony žáků při tréninku a při závodě shodné? H 0 :  1 =  2 H 1 :  1   2

30

31 t  (n-1) = t 0,05 (11) = 2,201 t < t  (n-1)  H 0 se nezamítá, tzn. lze konstatovat, že výkony žáků jsou vyrovnané (nebyl prokázán statisticky významný rozdíl ve výkonech při tréninku a v závodě)

32 Test významnosti rozdílu dvou výběrových relativních čeností Přepokládejme, že jsou dány dva ZS s alternativním rozdělením s parametry p 1 a p 2. Na základě náhodných výběrů o velkých rozsazích n 1 a n 2 (n 1 > 100; n 2 > 100) je třeba ověřit hypotézu H 0 : p 1 = p 2. Test je založen na statistice

33 výběrové relativní četnosti výskytu náhodného jevu A v 1., resp. ve 2. výběru – vážený aritmetický průměr obou výběrových relativních četností

34 Pro tento test je možné použít i trochu jiné testové kritérium.

35 Kritický obor je stejný pro obě varianty testového kritéria. AlternativaKritický obor H 1 : p 1  p 2 K =  u  > u   H 1 : p 1  p 2 K =  u > u 2   H 1 : p 1  p 2 K =  u < -u 2  

36 Příklad Máme k dispozici údaje o počtu narozených dětí v rámci dvou regionů. V regionu A zjistili, že během sledovaného období se v rámci 120 dětí narodilo 51 chlapců, zatímco v regionu B se za stejné období narodilo celkem 150 dětí, z toho 66 děvčat. Je možné konstatovat, že pravděpodobnost narození chlapce je u obou regionů stejná? H 0 : p 1 = p 2 – pravděpodobnost narození chlapce je shodná H 1 : p 1  p 2 – pravděpodobnost je odlišná m 1 = 51m 2 = 84 n 1 = 120n 2 = 150

37 u  = u 0,05 = 1,96  u  > u   H 0 se zamítá, tzn. že pravděpodobnost narození chlapce je v rámci dvou sledovaných regionů odlišná

38 Nyní použijeme druhé testové kritérium.

39 Vícevýběrové testy (testy hypotéz o parametrech více než dvou rozdělení) Testy rovnosti parametrů, k > 2 normálních rozdělení Test rovnosti dvou rozptylů lze zobecnit na případ k > 2 normálně rozdělených základních souborů, z nichž pořizujeme výběry. Bartlettův test Mějme k > 2 vzájemně nezávislých náhodných výběrů ze ZS s rozdělením, kde oba parametry jsou neznámé. Rozsahy jednotlivých výběrů jsou n 1, n 2, …, n k.

40 Na základě uvedených náhodných výběrů testujeme hypotézu proti hypotéze alternativní H 1 : alespoň dva z rozptylů jsou různé. Testovacím kritériem je statistika

41 Statistika má za platnosti H 0 rozdělení  2 – rozdělení o (k-1) stupních volnosti. Jestliže se zamítá.

42 Cochranův test Vyjdeme ze stejných předpokladů jako u Bartlettova testu a předpokládejme dále, že všechny výběrové soubory mají stejné rozsahy, tzn. n 1 = n 2 =…= n k = n. Ověření nulové hypotézy lze sice i v tomto případě provést pomocí Bartlettova testu, ale výhodnější a rychlejší je zde Cochranův test. Testovací kritérium má tvar

43 kde je největší z rozptylů (i = 1, 2, …, m), které představují nestranné odhady neznámých populačních rozptylů. Kritický obor se určí z podmínky P (G  G  (k, f) / H 0 ) = , kde G  (k, f) je kritická hodnota, kterou určíme pro zvolenou hladinu významnosti , přičemž k je počet srovnávaných rozptylů a f = n–1 je počet stupňů volnosti těchto rozptylů (je stejný pro všechny rozptyly, neboť jsou vypočteny ze stejného počtu pozorování). Jestliže G  G  (k, f)  H 0 se zamítá.

44 V případě vyváženého třídění (n 1 = n 2 = … = n k = n) lze hypotézu o shodě více jak dvou rozptylů ověřit pomocí Hartleyova testu. Testové kritérium má tvar Kritický obor je vymezen takto: K=  F max  F max;  (k, f)  F max;  (k, f) – tabulková hodnota pro k – počet srovnávaných rozptylů a pro f = n – 1 stupňů volnosti

45 Příklad Tří různých vyučovacích metod bylo použito na malých skupinách žáků. Na základě závěrečného zkoušení (v bodech), které jsou uvedeny v tabulce, posuďte, zda existuje rozdíl ve variabilitě v počtu získaných bodů mezi jednotlivými metodami. Testujeme hypotézu o shodě rozptylů ZS

46 Výpočty k Bartlettovu testu Metoda A ,02,710,4330 B ,06,600,8195 C ,49,400,9731 Celkem ,018,712,2256

47 H 0 o shodě rozptylů nemůžeme zamítnout.

48 Bylo možné také použít Cochranův test. Odchylky mezi rozptyly lze pokládat za nevýznamné. Hartleyův test


Stáhnout ppt "Statistická indukce Testování statistických hypotéz."

Podobné prezentace


Reklamy Google