Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistická indukce Testování statistických hypotéz.

Podobné prezentace


Prezentace na téma: "Statistická indukce Testování statistických hypotéz."— Transkript prezentace:

1 Statistická indukce Testování statistických hypotéz

2 Testování hypotéz je forma statistického usuzování, která hledá doporučení ve formě „ano“ nebo „ne“ na určitým způsobem formulované otázky. Např. se můžeme zeptat, zda průměrný krevní tlak v celé populaci nebo zda určitá forma výuky zlepšuje úspěšnost žáků v pedagogickém testu. V těchto případech se požaduje odpověď „ano“ nebo „ne“ a testuje se určité hypotetické tvrzení pomocí dat, jež máme k dispozici. Hypotetické tvrzení, které jsme vyslovili a jehož platnost chceme pomocí testování ověřit, se nazývá statistická hypotéza.

3 Statistická hypotéza  jakýkoliv předpoklad týkající se neznámého rozdělení ZS,  každé tvrzení o tvaru nebo charakteristikách rozdělení jednoho či několika statistických znaků,  určitý předpoklad o parametrech či tvaru rozdělení zkoumaného znaku. Na základě náhodného výběru, pořízeného ze zkoumaného ZS, budeme chtít posoudit, zda vytýčená statistická hypotéza je pravdivá či nikoliv. Úkolem teorie testování (ověřování) statistických hypotéz je konstrukce adekvátních matematických metod, pomocí nichž budeme posuzovat platnost nebo neplatnost zkoumané statistické hypotézy.

4 Testování hypotéz – proces ověřování správnosti nebo nesprávnosti hypotézy pomocí výsledků získaných náhodným výběrem. Statistické hypotézy se týkají:  druhu rozdělení ZS,  parametrů rozdělení ZS,  náhodného uspořádání hodnot souboru,  extrémních hodnot souboru,  rozdílu dvou a více výběrových charakteristik stejného druhu apod.

5 Nulová hypotéza (testovaná hypotéza) H 0  předpoklad, který jsme vyslovili o určité charakteristice či tvaru rozdělení v ZS  tvrdí, že neexistuje rozdíl mezi dvěma nebo větším počtem rozdělení, resp. mezi charakteristikami rozdělení  – parametr ZS odhadovaný na základě náhodného výběru  0 – hypotetická hodnota tohoto parametru H 0 :  =  0

6  nulová hypotéza tvrdí, že parametr ZS  se statisticky významně neliší od hypotetické hodnoty  0  tvrdí, že parametr  je roven určité pevné hodnotě  0  tvrdí, že mezi sledovanými objekty neexistuje rozdíl Nulová hypotéza může být také formulována např. pro ověření shody empirického a teoretického pravděpodobnostního rozdělení. H 0 : F(x) = F 0 (x)

7 Alternativní hypotéza H 1  popírá platnost nulové hypotézy  přijímáme ji v případě zamítnutí nulové hypotézy  obvykle se vyjadřuje jako „existence diference“ mezi skupinami nebo „existence závislosti“ mezi proměnnými  nemusí jít o přesný logický opak nulové hypotézy, pokud např. pracujeme s jednostrannou alternativou

8 H 1 :    0  Oboustranná alternativa H 1 :    0  Pravostranná alternativa H 1 :    0  Levostranná alternativa jednostranná alternativa – buď pravostranná nebo levostranná alternativní hypotéza V případě testování pravděpodobnostního rozdělení se uplatňuje pouze oboustranná alternativa H 1 : F(x)  F 0 (x).

9 Test Postup, kterým – na základě náhodného výběru, který máme k dispozici – ověřujeme, zda hypotéza platí či nikoliv. Rozlišuje testy:  parametrické – vyžadují znalost typu rozdělení a parametrů ZS (hypotézy se týkají hodnot parametrů rozdělení),  neparametrické – neznáme typ ani parametry rozdělení ZS.

10 Podle počtu výběrových souborů rozlišujeme testy:  jednovýběrové – jeden výběrový soubor,  dvouvýběrové – dva výběrové soubory,  vícevýběrové – více jak dva výběrové soubory. Podle stanovení alternativní hypotézy:  testy oboustranné H 1 :    0  testy jednostranné  testy pravostranné H 1 :    0  testy levostranné H 1 :    0

11 Testové (testovací) kritérium (testovací statistika) Rozhodnutí o platnosti H 0 či H 1 zakládáme na nějakém náhodném výběru X = (x 1, x 2, …, x n )´. Postupujeme dále tak, že informaci, obsaženou v tomto výběru, shrneme pomocí nějaké statistiky T = T (x 1, x 2, …, x n ). Statistika T je funkcí výběrových hodnot x 1, x 2, …, x n, jejíž konkrétní tvar volíme podle toho, jak je formulována nulová hypotéza. Statistiku T lze chápat i jako míru nesouhlasu výsledků pokusu s testovanou hypotézou.

12 Jestliže výběrová data zcela přesně odpovídají H 0, je testové kritérium obvykle rovno nule a odchyluje se od ní (od nuly) tím více, čím více se výběrové hodnoty odklánějí od H 0 k H 1. Vyjdeme z předpokladu, že H 0 platí a za tohoto předpokladu určíme pravděpodobnostní rozdělení statistiky T. Obor možných hodnot testovacího kritéria T pak rozdělíme na dvě disjunktní množiny:  kritický obor K (obor zamítnutí H 0 ),  obor přijetí R.

13 Kritický obor je tvořen těmi možnými hodnotami testové statistiky T, jejichž výskyt je za předpokladu platnosti H 0 málo pravděpodobný. Je tedy tvořen těmi možnými hodnotami testového kritéria T, jimž je přiřazeno rozhodnutí „zamítnout nulovou hypotézu H 0 “. Obor přijetí je tvořen těmi možnými hodnotami statistiky T, které nejsou v rozporu s H 0. Hodnoty, jimiž jsou tyto dva obory odděleny, se nazývají kritické hodnoty (pro praktické potřeby jsou tabelovány).

14 Základní princip testování statistických hypotéz je možno zformulovat takto:  Padne-li vypočtená hodnota testovacího kritéria T do kritického oboru K, zamítáme H 0 a přijímáme alternativní hypotézu (T  K / H 0 ).  Padne-li vypočtená hodnota testovacího kritéria T do oboru přijetí, nebyla H 0 vyvrácena (H 0 nezamítáme). Potom platí T  K / H 0.

15 Zdůvodnění: Padnutí vypočtené hodnoty statistiky T do kritického oboru K znamená realizaci jevu, který se za platnosti H 0 prakticky neměl uskutečnit, neboť měl – za platnosti H 0 – velmi nízkou (téměř nulovou) pravděpodobnost. Protože však nastal, je tím platnost H 0 – z níž jsme při odvození zákonitostí chování veličiny T vyšli – zpochybněna, a proto ji zamítáme. Test hypotézy H 0 proti H 1 je tedy jednoznačně určen vymezením kritického oboru a úlohu testu H 0 lze pak interpretovat jako úlohu nalezení kritického oboru, který by měl určité vhodné vlastnosti.

16 Chyby testování Chyba I. druhu Spočívá v zamítnutí H 0, i když je tato správná. Padnutí hodnoty T do kritického oboru K může být totiž způsobeno ne tím, že H 0 je nesprávná, ale jinými příčinami, např. malým rozsahem výběru, nedostatky metodiky experimentu atd. (vliv náhody). Riziko tohoto mylného rozhodnutí je však zanedbatelně malé. Chyba II. druhu Spočívá v přijetí H 0, která je ve skutečnosti nesprávná (ve skutečnosti platí hypotéza alternativní).

17 Je přirozené, že ke správnému rozhodnutí při testování můžeme dospět také dvěma způsoby:  přijímá se H 0, která je ve skutečnosti správná,  zamítá se H 0, která je ve skutečnosti nesprávná. Z definice kritického oboru K vyplývá, že pro pravděpodobnost chyby 1. druhu platí: P (T  K / H 0 ) = . Tato pravděpodobnost se nazývá hladina významnosti  a udává výši rizika, s jakým se H 0 zamítá, i když platí. Pozn.: zápis vyjadřuje podmíněnou pravděpodobnost, že vypočtená hodnota testového kritéria T padne do kritického oboru K za podmínky, že H 0 je správná.

18 Pravděpodobnost chyby 2. druhu značíme symbolem  a lze ji symbolicky zapsat: P (T  K / H 1 ) = . Místo pravděpodobnosti 2. druhu se může uvažovat i pravděpodobnost P (T  K / H 1 ) = 1 - , tzn. pravděpodobnost zamítnutí H 0, jestliže je správná hypotéza H 1. Tato pravděpodobnost 1 -  se nazývá síla testu (schopnost testu odhalit neplatnost H 0, tzn. pravděpodobnost, že se nedopustíme chyby 2. druhu).

19 Vztah chyb 1. a 2. druhu a odpovídajících pravděpodobností můžeme schematicky vyjádřit v tabulce: Nulová hypotézapravdivánepravdivá přijetí správné rozhodnutí p 1 = 1 –  chyba 2. druhu p 2 =  zamítnutí chyba 1. druhu p 3 =  správné rozhodnutí p 4 = 1 – 

20 Postup testování statických hypotéz  formulace nulové a alternativní hypotézy (H 0 má být jednoduchá, tzn. jednoznačně specifikovat rozdělení studovaného znaku),  volba hladiny významnosti ,  volba testového kritéria (a testu),  určení kritického oboru K (vyhledání tabulkové hodnoty podle zvoleného testu),  výpočet hodnoty testového kritéria T z výběrových hodnot,

21  formulace výsledků testu (rozhodnutí):  Jestliže vypočtená hodnota testového kritéria T padne do kritického oboru K, zamítáme H 0.  Jestliže vypočtená hodnota testového kritéria T padne do oboru přijetí R, H 0 se nezamítá. Je vhodné na konci celého postupu formulovat slovní odpověď, tzn. k jakému výsledku jsme dospěli. Obecně lze výsledek testu interpretovat takto: „Zamítneme-li nebo nezamítneme-li H 0, neznamená to ještě, že hypotéza neplatí nebo platí, nýbrž jen, že výsledek pokusu její platnosti buď nenasvědčuje nebo je v mezích přirozeného náhodného kolísání, které by se dalo očekávat, kdyby hypotéza platila“.

22 Parametrické testy Jednovýběrové testy (testy hypotéz o parametru jednoho rozdělení) Máme k dispozici pouze jeden výběrový soubor a jeho základní charakteristiky porovnáváme s předem známou hodnotou, předpokladem, normou apod. Test hypotézy o rozptylu normálního rozdělení Předpokládejme, že X = (x 1, x 2, …, x n )´ je náhodný výběr z normálního rozdělení N(  ;  2 ), kde střední hodnota  i rozptyl  2 jsou neznámé parametry.

23 Na základě tohoto výběru je třeba testovat nulovou hypotézu kde je předpokládaná (hypotetická) hodnota rozptylu  2. Neznámý rozptyl  2 odhadneme výběrovým rozptylem s 2, který určíme ze zjištěných výběrových hodnot x 1, x 2, …, x n. Je zřejmé, že vypočtená a předpokládaná hodnota rozptylu se budou od sebe lišit. Rozdíl může být pouze nevýznamný a lze ho přičíst účinku náhodných vlivů, působících při výběru.

24 Tento rozdíl však může být i nenáhodný – nazýváme ho pak statisticky významný (signifikantní). Test H 0 tedy představuje ověření, zda výběrový rozptyl s 2 a předpokládaný rozptyl  2 se liší statisticky významně nebo pouze náhodně. Test je založen na testovém kritériu Statistika má  2 – rozdělení o (n-1) stupni volnosti.

25 Kritické obory jsou vymezeny následovně:

26 Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 40 a zjistili pro některý jejich rozměr průměr 116 mm a výběrovou směrodatnou odchylku 4,081 mm. Podle technické normy však nemá kolísání tohoto rozměru vyjádřené směrodatnou odchylkou být větší než 3,8 mm. Ověřte na hladině významnosti 0,05, zda uvedená zásilka splňuje danou normu. n = 40 s = 4,081  0 = 3,8

27 Závěr: nulová hypotéza se nezamítá, tzn. že z hlediska kolísání sledovaného rozměru dosahuje zásilka potřebné normy.

28 Test hypotézy o průměru normálního rozdělení Test při známém rozptylu ZS  2 Na základě náhodného výběru o rozsahu n, provedeného ze ZS s normálním rozdělením, máme ověřit hypotézu, že průměr  v ZS je roven určité konstantní hodnotě  0, tzn. že H 0 můžeme zapsat takto: H 0 :  =  0. Jde nám o ověření, zda výběrový průměr a průměr ZS se liší statisticky významně nebo pouze náhodně.

29 Je-li znám rozptyl ZS  2, má náhodná veličina U rozdělení N(0; 1). Jelikož známe rozdělení náhodné veličiny U, můžeme snadno určit kritický obor pro test H 0. Pro zvolenou hladinu významnosti  odečteme z tabulky kritickou hodnotu normovaného normálního rozdělení u , která má vlastnost (při H 1 :    0 ): P (U > u  / H 0 ) = .

30 Jestliže vypočtená hodnota U padne do kritického oboru K =  U  > u  , zamítáme nulovou hypotézu na hladině významnosti . Zápis značí, že kritický obor K je tvořen množinou hodnot U, které v absolutní hodnotě překračují u . Kritické obory pro tento test AlternativaKritický obor H 1 :    0 K =  u  > u   H 1 :    0 K =  u > u 2   H 1 :    0 K =  u < -u 2  

31 Test při neznámém rozptylu ZS  2 H 0 :  =  0 Testové kritérium má tvar Za platnosti H 0 má statistika t Studentovo t-rozdělení o (n-1) stupních volnosti.

32 Kritický obor je vymezen následovně: AlternativaKritický obor H 1 :    0 K =  t  > t  (n-1)  H 1 :    0 K =  t > t 2  (n-1)  H 1 :    0 K =  t < -t 2  (n-1) 

33 Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 40 a zjistili pro některý jejich rozměr průměr 116 mm a výběrovou směrodatnou odchylku 4,081 mm. Podle technické normy má tento rozměr dosahovat úrovně 118 mm. Ověřte na hladině významnosti 0,05, zda uvedená zásilka splňuje danou normu. n = 40 s = 4,081  = 118

34 H 0 :  =  0 H 1 :    0 t  (n-1) = t 0,05 (40-1) = 2,021  t  > t  (n-1)  H 0 se zamítá Závěr: nulová hypotéza se zamítá, tzn. že z hlediska sledovaného rozměru nesplňuje zásilka požadovanou normu (skutečný průměr je odlišný od normy).

35 Test hypotézy o parametru p alternativního rozdělení Předpokládejme, že v sérii n nezávislých opakováních pokusu se nějaký náhodný jev A, který má stálou, ale neznámou pravděpodobnost p, vyskytl m-krát. Výsledek takové skupiny n opakování pokusu lze považovat za náhodný výběr o rozsahu n ze ZS, který má alternativní rozdělení s parametrem p. Na základě takového náhodného výběru je třeba testovat nulovou hypotézu H 0 : p = p 0, kde p 0 je daná (předpokládaná) hodnota. Neznámou pravděpodobnost p odhadujeme výběrovou relativní četností výskytu jevu A, tzn. podílem m/n.

36 Test uvedené hypotézy H 0 lze tedy chápat jako test významnosti rozdílu výběrové relativní četnosti m/n a hypotetické pravděpodobnosti p. Pro provedení tohoto testu je potřeba zjistit, zda výběrový soubor má dostatečný rozsah a to pomocí Testové kritérium hypotézy H 0 : p = p 0 má tvar:

37 Jestliže máme k dispozici absolutní četnosti (a nikoliv relativní četnosti), lze testové kritérium u uvést ve tvaru: Kritické obory: AlternativaKritický obor H 1 : p  p 0 K =  u  > u   H 1 : p  p 0 K =  u > u 2   H 1 : p  p 0 K =  u < -u 2  

38 Příklad U 100 pojištěných aut bylo zjištěno, že 18 aut je starších než 7 let. Podle předpokladů a odhadů pojišťovny má podíl aut starších 7 let dosahovat podílu 25 %. Ověřte, zda podíl aut starších než 7 let je skutečně nižší než uvedený předpoklad o 25% podílu. f i = 0,18 p 0 = 0,25 H 0 : p = p 0 H 1 : p  p 0

39 u 2  = 1,6448  jde o levostrannou alternativu u < -u 2   H 0 se zamítá Závěr: nulová hypotéza se zamítá, tzn. že podíl aut starších 7 let nedosahuje úrovně 25 %, lze potvrdit nižší, 18% podíl aut starších 7 let (platí hypotéza alternativní).


Stáhnout ppt "Statistická indukce Testování statistických hypotéz."

Podobné prezentace


Reklamy Google