6. Testování statistických hypotéz. RNDr. Radovan Potůček, Ph.D., K-215, FVT UO, KŠ 5B/11, Radovan.Potucek@unob.cz, tel. 443056
Testování statistických hypotéz Testování statistických hypotéz je důležitou úlohou statistické indukce, pomocí níž z empirických charakteristik a zákonů rozdělení, zjištěných z datového souboru, usuzujeme na vlastnosti zkoumaného znaku v základním souboru. Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z nějakého rozdělení. Zajímáme se o to, zda pro parametr 𝛽 tohoto rozdělení platí např. nerovnost 𝛽≤ 𝛽 0 , kde 𝛽 0 je zadané (zvolené) číslo, anebo zda rozdělení, z něhož náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 pochází, je např. normální či exponenciální. Pomocí testování statistických hypotéz lze dát objektivní odpovědi např. na tyto otázky: Je rozdíl mezi dvěma skupinami studentů, měřený rozdílem průměrných známek obou skupin, průkazný nebo způsobený náhodou? Je průměrná spotřeba automobilu, vypočtená ze spotřeby během provozu, průkazně odlišná od spotřeby uváděné výrobcem? Lze považovat za průkazné, že životnost součástky má normální rozdělení?
Základní pojmy testování statistických hypotéz Statistickou hypotézou nazýváme tvrzení, týkající se parametru nebo tvaru rozdělení náhodné veličiny 𝑋 z náhodného výběru 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 . Postup, pomocí něhož, na základě informací získaných z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 , rozhodujeme o tom, zda statistická hypotéza platí či nikoliv, nazýváme testem statistické hypotézy. Statistickou hypotézu, o jejíž platnosti pomocí testu rozhodujeme, nazveme nulovou hypotézu a označíme ji 𝐻 (někdy rovněž 𝐻 0 ). Proti nulové hypotéze stavíme tzv. alternativní hypotézu, kterou označíme 𝐻 (někdy též 𝐻 𝑎 ).
Postup při testování statistických hypotéz Při testu statistické hypotézy postupujeme takto: 1. Formulujeme nulovou hypotézu 𝐻 a k ní alternativní hypotézu 𝐻 . 2. K testování hypotézy použijeme vhodnou náhodnou veličinu (statistiku) 𝐺, která je funkcí náhodného výběru 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 , a nazveme ji testovým kritériem. Z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 vypočteme její realizovanou hodnotu 𝑔. 3. Ke zvolenému číslu 𝛼 (v praxi volíme 𝛼=0,05 nebo 𝛼=0,01), které nazýváme hladinou významnosti, určíme tzv. kritický obor, který značíme 𝑊 𝛼 , v němž se při pravdivé hypotéze 𝐻 realizuje nejvýše 100𝛼% hodnot náhodné veličiny 𝐺, tj. 𝛼=𝑃 𝐺∈ 𝑊 𝛼 |𝐻 . 4. Podle toho, jak se realizuje testové kritérium v kritickém oboru, přijmeme následující rozhodnutí: a) Když 𝑔∈ 𝑊 𝛼 , pak zamítáme nulovou hypotézu ve prospěch alternativní hyp. b) Když 𝑔∉ 𝑊 𝛼 , pak přijímáme (nezamítáme) nulovou hypotézu.
---------------------------- Testování statistických hypotéz Poznamenejme, že kritický obor 𝑊 𝛼 je taková množina, v níž se hodnoty náhodné veličiny 𝐺, za předpokladu, že platí nulová hypotéza 𝐻, vyskytují s velmi malou pravděpodobností 𝛼. Pokud se NV 𝐺 v tomto intervalu realizovala, pak nastal jev, který by při platnosti nulové hypotézy měl nastat pouze s velmi malou pravděpodobností 𝛼. Proto předpoklad, že platí hypotéza 𝐻, zamítáme ve prospěch alternativní hypotézy 𝐻 . Poznamenejme dále, že přijetí nulové hypotézy 𝐻 znamená jen to, že tato hypotéza nebyla vyvrácena a že jsme tedy oprávněni ji přijmout, avšak není to důkaz její pravdivosti. Rozpor mezi nulovou hypotézou a hodnotami zjištěnými z datového souboru hodnotíme jako statisticky nevýznamný (nebo vysvětlitelný náhodně) v případě, když nulovou hypotézu přijmeme. Rozpor hodnotíme jako statisticky významný (nebo průkazný) v případě, když nulovou hypotézu zamítneme.
---------------------------- Testování statistických hypotéz Při testování mohou nastat čtyři varianty, které uvádí následující tabulka. Dvě z těchto variant dávají správný výsledek, ostatní dvě jsou chybné a nazýváme je chybou prvního druhu, resp. chybou druhého druhu. Chyba prvního druhu nastane, jestliže nulová hypotéza platí, ale zamítneme ji. Pravděpodobnost této chyby je rovna hladině významnosti 𝛼. Chyba druhého druhu nastane, platí-li alternativní hypotéza 𝐻 , ale na základě testu přijmeme nulovou hypotézu 𝐻. Její pravděpodobnost je 𝑃 𝐺∉ 𝑊 𝛼 | 𝐻 . Nyní uvedeme nejčastěji používané parametrické testy, kdy předpokládáme, že je dán náhodný výběr z rozdělení obsahujícím jeden nebo více neznámých parametrů, a na základě tohoto náhodného výběru se provede test hypotézy. Naproti tomu neparametrické testy nevycházejí z předpokladu daného tvaru rozdělení, ale z obecnější předpokladů (těmito testy se nebudeme dále zabývat). Výsledky testu Platí 𝐻 Platí 𝐻 Přijmeme 𝐻 Správný výsledek Chyba druhého druhu Zamítneme 𝐻 Chyba prvního druhu
Testy hypotéz o parametru 𝝁 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) ---------------------------- Testování statistických hypotéz. ---------------------------- 7/28 Testy hypotéz o parametru 𝝁 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z normálního rozdělení 𝑁(𝜇, 𝜎 2 ), přičemž parametr 𝜎 2 neznáme. Testujeme-li nulové hypotézy 𝐻:𝜇= 𝜇 0 , resp. 𝐻:𝜇≤ 𝜇 0 , resp. 𝐻:𝜇≥ 𝜇 0 , kde 𝜇 0 je dané číslo, pak za testové kritérium použijeme náhodnou veličinu 𝑇= 𝑋 − 𝜇 0 𝑆 𝑛 , která má Studentovo rozdělení o 𝑛−1 stupních volnosti. Kritické obory pro jednotlivé případy jsou: pro 𝐻:𝜇= 𝜇 0 je 𝐻 :𝜇≠ 𝜇 0 a 𝑊 𝛼 ={𝑡: 𝑡 ≥ 𝑡 1− 𝛼 2 𝑛−1 }, pro 𝐻:𝜇≤ 𝜇 0 je 𝐻 :𝜇> 𝜇 0 a 𝑊 𝛼 ={𝑡:𝑡≥ 𝑡 1−𝛼 𝑛−1 }, pro 𝐻:𝜇≥ 𝜇 0 je 𝐻 :𝜇< 𝜇 0 a 𝑊 𝛼 ={𝑡:𝑡≤ −𝑡 1−𝛼 𝑛−1 }, kde 𝑡 1− 𝛼 2 (𝑛−1) a 𝑡 1−𝛼 (𝑛−1) jsou kvantily Studentova rozdělení.
---------------------------- Testování statistických hypotéz Na obrázku jsou vybarvením znázorněny kritické obory pro jednotlivé tři alternativní hypotézy 𝐻 𝑎 (reject ~ odmítnutí, nepřijetí):
1. Nulová hypotéza 𝐻:𝜇=15,20, alternativní hypotéza 𝐻 :𝜇≠15,20. ---------------------------- Testování statistických hypotéz. ---------------------------- 9/28 Příklad: Byl testován měřící přístroj, který na zkušebním vzorku (neboli standardu, etalonu) s přesným rozměrem 15,20 cm naměřil těchto 8 výsledků: 15,23, 15,21, 15,19, 15,16, 15,26, 15,22, 15,23, 15,26. Vypočtěte výběrový průměr 𝑥 a výběrovou směrodatnou odchylku 𝑠 a testujte na 5%-ní hladině významnosti, zda je měřící přístroj správně nastaven. Výběrový průměr 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 8 ∙121,76=15,22, výběrová směrod. odchylka 𝑠= 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 7 1853,1952−8∙ 15,22 2 = 0,0011 =0,0338. 1. Nulová hypotéza 𝐻:𝜇=15,20, alternativní hypotéza 𝐻 :𝜇≠15,20. 2. Realizovaná hodnota 𝑡 testového kritéria 𝑇: 𝑡= 𝑥 − 𝜇 0 𝑠 𝑛 = 0,02 0,0338 8 =1,6736. 3. Pro zvolené 𝛼=0,05 najdeme v tabulkách kvantil Studentova rozdělení 𝑡 1− 𝛼 2 𝑛−1 = 𝑡 0,975 7 =2,365, tedy kritický obor 𝑊 𝛼 ={𝑡: 𝑡 ≥ 𝑡 1− 𝛼 2 𝑛−1 } je 𝑊 0,05 = 𝑡: 𝑡 ≥2,365 =(−∞,−2,36 5 ∪ 2,365,∞) . 4. 𝑡∉ 𝑊 0,05 , takže přijímáme nulovou hypotézu, že měř. přístroj je správně nastaven.
Test hypotézy o parametru 𝝈 𝟐 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) ---------------------------- Testování statistických hypotéz. ---------------------------- 10/28 Test hypotézy o parametru 𝝈 𝟐 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z normálního rozdělení 𝑁(𝜇, 𝜎 2 ). Testujeme-li nulovou hypotézu 𝐻: 𝜎 2 ≤ 𝜎 0 2 proti alternativní hypotéze 𝐻 : 𝜎 2 > 𝜎 0 2 , pak za testové kritérium použijeme náhodnou veličinu 𝑍= (𝑛−1) 𝑆 2 𝜎 0 2 , která má rozdělení 𝜒 2 o 𝑛−1 stupních volnosti. Kritický obor pro případ 𝐻: 𝜎 2 ≤ 𝜎 0 2 je 𝑊 𝛼 ={𝑧:𝑧≥ 𝜒 2 1−𝛼 𝑛−1 }, kde 𝜒 2 1−𝛼 (𝑛−1) je kvantil Pearsonova rozdělení.
---------------------------- Testování statistických hypotéz Testy hypotéz o parametrech dvou náhodných výběrů z normálních rozdělení 𝑵 𝝁 𝟏 , 𝝈 𝟏 𝟐 a 𝑵 𝝁 𝟐 , 𝝈 𝟐 𝟐 Uvažujme dva nezávislé náhodné výběry z normálních rozdělení. První náhodný výběr 𝑋 11 , 𝑋 12 ,…, 𝑋 1𝑛 z normálního rozdělení 𝑁( 𝜇 1 , 𝜎 1 2 ) o rozsahu 𝑛 1 s výběrovým průměrem 𝑋 1 2 a výběrovým rozptylem 𝑆 1 2 . Druhý náhodný výběr 𝑋 21 , 𝑋 22 ,…, 𝑋 2𝑛 z normálního rozdělení 𝑁( 𝜇 2 , 𝜎 2 2 ) o rozsahu 𝑛 2 s výběrovým průměrem 𝑋 2 2 a výběrovým rozptylem 𝑆 2 2 . Testujeme, zda rozdíly mezi výběrovými průměry, resp. výběrovými rozptyly, jsou statisticky významné nebo nevýznamné. Dále se budeme zabývat a) testem rozdílu rozptylů dvou náhodných výběrů, b) testem rozdílu středních hodnot dvou náhodných výběrů.
a) Test rozdílu rozptylů dvou náhodných výběrů ---------------------------- Testování statistických hypotéz. ---------------------------- 12/28 a) Test rozdílu rozptylů dvou náhodných výběrů K testování hypotézy 𝐻: 𝜎 1 2 = 𝜎 2 2 proti alternativní hypotéze 𝐻 : 𝜎 1 2 ≠ 𝜎 0 2 použijeme náhodnou veličinu 𝐹 1 = max 𝑆 1 2 , 𝑆 2 2 min 𝑆 1 2 , 𝑆 2 2 . Kritický obor je interval 𝑊 𝛼 = 𝑓 1 : 𝑓 1 ≥ 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 , kde 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 je kvantil Fisherova-Snedecorova rozdělení, přičemž 𝜈 1 =𝑛 1 −1 je rozsah toho z datových souborů, který má větší rozptyl, a 𝜈 2 = 𝑛 2 −1.
b) Test rozdílu středních hodnot dvou náhod. výběrů ---------------------------- Testování statistických hypotéz. ---------------------------- 13/28 b) Test rozdílu středních hodnot dvou náhod. výběrů Jsou-li rozptyly 𝜎 1 2 a 𝜎 2 2 obou rozdělení stejné nebo alespoň přibližně stejné, což zjistíme předchozím testem a), kde testujeme právě hypotézu 𝐻: 𝜎 1 2 = 𝜎 2 2 , použijeme k testování rozdílu mezi středními hodnotami 𝜇 1 a 𝜇 2 náhod. veličinu 𝑇 1 = 𝑋 1 − 𝑋 2 (𝑛 1 − 1)𝑆 1 2 +( 𝑛 2 −1)𝑆 2 2 ( 𝑛 1 + 𝑛 2 −2) 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 , která má Studentovo rozdělení o 𝑛 1 + 𝑛 2 −2 stupních volnosti. Kritické obory pro jednotlivé případy nulové a k ní alternativní hypotézy jsou: pro 𝐻: 𝜇 1 = 𝜇 2 a 𝐻 : 𝜇 1 ≠ 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≥ 𝑡 1− 𝛼 2 𝑛 1 + 𝑛 2 −2 }, pro 𝐻: 𝜇 1 ≤ 𝜇 2 a 𝐻 : 𝜇 1 > 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≥ 𝑡 1−𝛼 𝑛 1 + 𝑛 2 −2 }, pro 𝐻: 𝜇 1 ≥ 𝜇 2 a 𝐻 : 𝜇 1 < 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 1−𝛼 𝑛 1 + 𝑛 2 −2 }, kde 𝑡 1− 𝛼 2 ( 𝑛 1 + 𝑛 2 −2) a 𝑡 1−𝛼 ( 𝑛 1 + 𝑛 2 −2) jsou kvantily Studentova rozdělení.
b) Test rozdílu středních hodnot dvou náh. výběrů – pokrač. ---------------------------- Testování statistických hypotéz. ---------------------------- 14/28 b) Test rozdílu středních hodnot dvou náh. výběrů – pokrač. Jsou-li důvody k domněnce, že rozptyly 𝜎 1 2 a 𝜎 2 2 obou rozdělení se od sebe značně liší, použijeme k testování rozdílu středních hodnot 𝜇 1 a 𝜇 2 náhod. veličinu 𝑇 2 = 𝑋 1 − 𝑋 2 1 𝑛 1 𝑆 1 2 + 1 𝑛 2 𝑆 2 2 . Kritický obor nulové hypotézy 𝐻: 𝜇 1 = 𝜇 2 proti alternativní hypotéze 𝐻 : 𝜇 1 ≠ 𝜇 2 je 𝑊 𝛼 = 𝑡 2 : 𝑡 2 ≥ 𝑡 ∗ , kde číslo 𝑡 ∗ určíme ze vztahu 𝑡 ∗ = 𝑠 1 2 𝑛 1 𝑡 1− 𝛼 2 𝑛 1 −1 + 𝑠 2 2 𝑛 2 𝑡 1− 𝛼 2 𝑛 2 −1 𝑠 1 2 𝑛 1 + 𝑠 2 2 𝑛 2 , přičemž 𝑡 1− 𝛼 2 𝑛 1 −1 a 𝑡 1− 𝛼 2 𝑛 2 −1 jsou kvantily Studentova rozdělení.
Výběrové rozptyly tedy jsou: 𝑠 𝐴 2 =1024,79, 𝑠 𝐵 2 =925,79. ---------------------------- Testování statistických hypotéz. ---------------------------- 15/28 Příklad: U vojenských jednotek 𝐴 a 𝐵 byla prověřována fyzická zdatnost. Z každé jednotky bylo náhodně vybráno 12 vojáků, kteří na překážkové dráze dosáhli časů (v 𝑠): 𝐴: 60 154 122 90 105 68 160 76 73 88 92 104 𝐵: 64 59 70 60 108 97 84 68 135 125 70 142 Vypočtěte empirické charakteristiky doby proběhnutí dráhy. Za předpokladu, že tato doba má normální rozdělení, posuďte na 5%-ní hladině významnosti rozdíl ve fyzické zdatnosti vojáků. Jednotka 𝐴: výběrový průměr 𝑥 𝐴 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 12 ∙1192=99,33, výběrová směr. odchylka 𝑠 𝐴 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 11 129678−12∙ 99,33 2 =32,01. Jednotka 𝐵: výběrový průměr 𝑥 𝐵 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 12 ∙1082=90,17, výběrová směr. odchylka 𝑠 𝐵 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 11 107744−12∙ 90,17 2 =30,43. Výběrové rozptyly tedy jsou: 𝑠 𝐴 2 =1024,79, 𝑠 𝐵 2 =925,79. Dále budeme testovat: a) statistickou významnost rozdílu rozptylů, b) statistickou významnost rozdílu středních hodnot.
---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Vypočtené výběrové charakteristiky obou jednotek: 𝐴: 𝑥 𝐴 = 99,33, 𝑠 𝐴 2 =1024,79, 𝑠 𝐴 =32,01, 𝐵: 𝑥 𝐵 = 90,17, 𝑠 𝐵 2 =925,79, 𝑠 𝐴 =30,43. a) Test statistické významnosti rozdílu rozptylů 1. Nulová hypotéza 𝐻: 𝜎 𝐴 2 = 𝜎 𝐵 2 , alternativní hypotéza 𝐻 : 𝜎 𝐴 2 ≠ 𝜎 𝐵 2 . 2. Realizovaná hodnota 𝑓 1 testového kritéria 𝐹 1 : 𝑓 1 = max 𝑠 𝐴 2 , 𝑠 𝐵 2 min 𝑠 𝐴 2 , 𝑠 𝐵 2 = 1024,79 925,79 =1,11. 3. Pro zvolené 𝛼=0,05 najdeme v tabulkách hodnoty kvantilů Fisherova-Snedeco- rova rozdělení 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 : 𝐹 0,975 8,11 =3,664, 𝐹 0,975 12,11 =3,430. Lineární interpolací odhadneme hodnotu „netabulkového“ kvantilu 𝐹 0,975 11,11 𝑦= 𝑦 1 + 𝑥− 𝑥 1 𝑦 2 − 𝑦 1 𝑥 2 − 𝑥 1 =3,664+ 11−8 3,430−3,664 12−8 =3,489≐ 𝐹 0,975 11,11 , kritický obor 𝑊 𝛼 = {𝑓 1 : 𝑓 1 ≥ 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 } je 𝑊 0,05 = 𝑓 1 : 𝑓 1 ≥3,489 = 3,489,∞) . 4. Protože 𝑓 1 ∉ 𝑊 0,05 , přijímáme nulovou hypotézu, takže rozdíl mezi rozptyly časů obou jednotek lze považovat za statisticky nevýznamný.
---------------------------- Testování statistických hypotéz Příklad – pokračování 2: Vypočtené výběrové charakteristiky obou jednotek: 𝐴: 𝑥 𝐴 = 99,33, 𝑠 𝐴 2 =1024,79, 𝑠 𝐴 =32,01, 𝐵: 𝑥 𝐵 = 90,17, 𝑠 𝐵 2 =925,79, 𝑠 𝐴 =30,43. b) Test statistické významnosti rozdílu středních hodnot I. Protože výběrový průměr dosažených časů u jednotky 𝐴 je vyšší než u jednotky 𝐵, testujeme nulovou hypotézu 𝐻: 𝜇 𝐴 ≥ 𝜇 𝐵 , alternativní hypotéza 𝐻 : 𝜇 𝐴 < 𝜇 𝐵 . 2. Protože podle výsledku testu a) o rozptylech lze předpokládat, že jsou stejné, použijeme k testování testové kritérium 𝑇 1 . Její realizovaná hodnota 𝑡 1 = 𝑥 𝐴 − 𝑥 𝐵 (𝑛 𝐴 − 1)𝑠 𝐴 2 + 𝑛 𝐵 −1 𝑠 𝐵 2 ( 𝑛 𝐴 + 𝑛 𝐵 −2) 𝑛 𝐴 𝑛 𝐵 𝑛 𝐴 + 𝑛 𝐵 = 9,16 11∙1024,79+11∙925,79 ∙ 22∙12∙12 24 =0,72. 3. Pro 𝛼=0,05 je kritický obor tohoto testu 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 1−𝛼 𝑛 𝐴 + 𝑛 𝐵 −2 }, tedy 𝑊 0,05 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 0,95 22 }. V tabulkách najdeme kvantil Studentova rozdělení 𝑡 0,95 22 =1,717, takže kritický obor je interval 𝑊 0,05 =(−∞,−1,71 7 . 4. Protože 𝑡 1 ∉ 𝑊 0,05 , přijímáme nulovou hypotézu, tj. střední hodnota časů jedn. 𝐴 je větší nebo rovna střední hodnotě časů jednotky 𝐵 na 5%-ní hladině významnosti.
---------------------------- Testování statistických hypotéz Testy dobré shody Mezi testy dobré shody patří testy které zjišťují, zda náhodný výběr pochází z rozdělení určitého typu – např. z normálního nebo exponenciálního rozdělení. K testům dobré shody patří Kolmogorovův-Smirnovův test a Pearsonův test. resort = sáhnout, uchýlit se
Kolmogorovův-Smirnovův test ---------------------------- Testování statistických hypotéz. ---------------------------- 19/28 Kolmogorovův-Smirnovův test Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 ze spojitého rozdělení a stanovme hypotézu, že pochází z rozdělení s distribuční funkcí 𝐹(𝑥). K testu použijeme empirickou distribuční funkci 𝐹 𝑛 (𝑥), kterou sestrojíme z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 . 1. Nulová hypotéza 𝐻 spočívá v předpokladu, že rozdíly mezi empirickou distribuční funkcí 𝐹 𝑛 (𝑥) a distribuční funkcí 𝐹(𝑥) jsou statisticky nevýznamné. Alternativní hypotéza spočívá v tom, že tyto rozdíly jsou statisticky významné. 2. Za testové kritérium se volí náhodná veličina 𝐷= sup 𝑥 𝐹 𝑛 𝑥 −𝐹(𝑥) . 3. Kritický obor je 𝑊 𝛼 ={𝐷:𝐷> 𝐷 1−𝛼 𝑛 } , přičemž kvantily 𝐷 1−𝛼 𝑛 Kolmogorova-Smirnova testu jsou tabelizovány. 4. Je-li 𝐷∈ 𝑊 𝛼 , pak zamítneme nulovou hypotézu ve prospěch alternativní hypotézy.
Náhodná veličina 𝑋, která označuje velikost odpadu, má výběrový průměr ---------------------------- Testování statistických hypotéz. ---------------------------- 20/28 Příklad: Při měření odpadu u 10 obráběných kusů byly získány hodnoty odpadu (v %): 4,06 4,03 3,75 3,89 3,81 3,82 3,48 3,70 3,99 4,04. Vypočtěte empirické charakteristiky a empirickou distribuční funkci pro velikost odpadu a na 5%-ní hladině významnosti testujte, zda velikost odpadu má normální rozdělení. Náhodná veličina 𝑋, která označuje velikost odpadu, má výběrový průměr 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 10 ∙38,57=3,857 , výběrovou směrodatnou odchylku 𝑠= 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 9 149,0697−10∙ 3,857 2 =0,3052. I. Nulová hypotéza spočívá v předpokladu, že datový soubor je realizovanou hodnotou náhodného výběru z normálního rozdělení 𝑁(𝜇 ,𝜎 2 ), přičemž parametry 𝜇 a 𝜎 neznáme, a tedy rozdíly mezi empirickou distribuční funkcí 𝐹 𝑛 (𝑥), získanou z datového souboru, a distribuční funkcí 𝐹(𝑥) tohoto rozdělení jsou statisticky nevýznamné.
---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Dále sestavíme tabulku, v jejímž 1. sloupci jsou hodnoty různých prvků 𝑥 𝑖 datového souboru, ve 2. sloupci hodnoty empirické distribuční funkce 𝐹 𝑛 ( 𝑥 𝑖 ), ve 3. sloupci argumenty 𝑡 𝑖 = 𝑥 𝑖 − 𝑥 𝑠 = 𝑥 𝑖 −3,857 0,3052 distribuční funkce 𝐹(𝑥) náhodné veličiny s normovaným normálním rozdělením, jejíž příslušné tabelizované hodnoty 𝐹 𝑁 𝑡 𝑖 jsou ve 4. sloupci, a v 5. sloupci jsou rozdíly 𝐹 𝑛 𝑥 𝑖 − 𝐹 𝑁 𝑡 𝑖 : 𝑥 𝑖 𝐹 𝑛 ( 𝑥 𝑖 ) 𝑡 𝑖 𝐹 𝑁 ( 𝑡 𝑖 ) 𝐹 𝑛 𝑥 𝑖 − 𝐹 𝑁 𝑡 𝑖 3,48 0,1 −1,235 0,109 0,009 3,70 0,2 −0,514 0,302 0,102 3,75 0,3 −0,351 0,363 0,063 3,81 0,4 −0,154 0,439 0,039 3,82 0,5 −0,121 0,452 0,048 3,89 0,6 0,108 0,457 0,143 3,99 0,7 0,436 0,668 0,032 4,03 0,8 0,567 0,714 0,086 4,04 0,9 0,600 0,726 0,174 4,06 1,0 0,665 0,747 𝟎,𝟐𝟓𝟑
---------------------------- Testování statistických hypotéz Příklad – pokračování 2: 2. Realizovaná hodnota testového kritéria 𝐷= sup 𝑥 𝐹 𝑛 𝑥 −𝐹(𝑥) je rovna 𝑑= 0,253 pro 𝑥=4,06. 3. Pro zvolené 𝛼=0,05 najdeme v tabulce kvantilů Kolmogorova-Smirnova testu hodnotu 𝐷 1−𝛼 𝑛 = 𝐷 0,95 10 =0,409. Kritický obor pro tento test je 𝑊 𝛼 = 𝐷:𝐷> 𝐷 1−𝛼 𝑛 , tj. 𝑊 0,05 = 𝐷:𝐷> 𝐷 0,95 10 = 𝐷:𝐷>0,409 = 0,409,∞ . 4. Protože realizovaná hodnota testového kritéria 𝑑∉ 𝑊 0,05 , nulovou hypotézu přijímáme, takže na hladině významnosti 𝛼=0,05 pochází daný datový soubor z náhodného výběru s normálním rozdělením.
---------------------------- Testování statistických hypotéz Pearsonův test Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z určitého rozdělení. Předpokládejme, že datový soubor 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 má velký rozsah 𝑛 a je roztříděný do 𝑟 tříd. 1. Nulová hypotéza 𝐻 spočívá v předpokladu, že odchylky mezi absolutními třídními četnostmi 𝑓 𝑗 , určenými z datového souboru, a tzv. teoretickými třídními četnostmi, označenými 𝑛 𝑝 𝑗 , jsou náhodné. Čísla 𝑝 𝑗 jsou pravděpodobnosti, že hodnoty uvažované NV 𝑋 jsou v 𝑗-té třídě. Alternativní hypotéza spočívá v tom, že tyto odchylky jsou nenáhodné, a tedy NV 𝑋 má jiné rozdělení. 2. Jako testové kritérium se používá náhodná veličina 𝜒 2 = 𝑗=1 𝑟 𝑓 𝑗 −𝑛 𝑝 𝑗 2 𝑛 𝑝 𝑗 . Jestliže nulová hypotéza platí a pro všechny třídy je splněna nerovnost 𝑛 𝑝 𝑗 >5, má náhodná veličina 𝜒 2 Pearsonovo rozdělení o 𝑟−𝑘−1 stupních volnosti, kde 𝑘 je počet parametrů předpokládaného rozdělení, které bylo nutné odhadnout.
---------------------------- Testování statistických hypotéz 3. Kritický obor je 𝑊 𝛼 ={ 𝜒 2 : 𝜒 2 ≥ 𝜒 2 1−𝛼 𝑟−𝑘−1 } , kde 𝜒 2 1−𝛼 𝑟−𝑘−1 je kvantil tabelizovaného Pearsonova rozdělení. a) Testujeme-li normální rozdělení, pak odhady dvou neznámých parametrů jsou: 𝜇 = 1 𝑛 𝑗=1 𝑟 𝑧 𝑗 𝑓 𝑗 , 𝜎 2 = 1 𝑛 𝑗=1 𝑟 𝑧 𝑗 − 𝜇 2 𝑓 𝑗 , kde 𝑧 𝑗 , 𝑗=1,…,𝑟, jsou reprezentanty jednotlivých tříd. b) Testujeme-li exponenciální rozdělení, pak odhad parametru 𝛿 je roven 𝛿 = ℎ ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 − 𝑓 𝑟 − ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 −𝑛 , kde ℎ označuje délku tříd. 4. Je-li 𝜒 2 ∈ 𝑊 𝛼 , pak zamítneme nulovou hypotézu ve prospěch alternativní hypotézy.
---------------------------- Testování statistických hypotéz Příklad: Vraťme se k příkladu testování nového výrobku, u kterého jsme zjišťovali počet dnů 𝑋 do první poruchy. Byl získán datový soubor tvořený 𝑛=60 hodnotami, které jsme roztřídili do 𝑘=7 tříd s délkou třídy ℎ=4. Byla vytvořena následující tabulka a vypočteny empirické charakteristiky 𝑥 =9,6 a 𝑠=6,13, přičemž jsme na závěr odhadli, že rozdělení doby do poruchy by mohlo být exponenciální. Z původní tabulky jsme převzali první čtyři sloupce a přidali k ní 5. sloupec: 𝒋 𝑰 𝒋 𝒛 𝒋 𝒇 𝒋 𝒋 𝒇 𝒋 1 −∞,6 4 22 2 6, 10 8 16 32 3 10, 14 12 9 36 14, 18 6 24 5 18, 22 20 22, 26 7 26, ∞ 28 ∑ − 60 153
---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Výpočty pro test zapíšeme do nové, rozšířené tabulky. I. Nulová hypotéza spočívá v předpokladu, že NV má exponenciální rozdělení. Protože parametr 𝛿 tohoto rozdělení není zadán, nahradíme jej jeho odhadem 𝛿 = ℎ ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 − 𝑓 𝑟 − ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 −𝑛 = 4 ln 153−1 − ln 153−60 , odkud 𝛿 =8,142. Alternativní hypotéza spočívá v předpokladu, že rozdíly mezi teoretickými a absolutními třídními četnostmi jsou nenáhodné, tedy že NV 𝑋 má jiné rozdělení. 2. Pro výpočet hodnoty testového kritéria je třeba určit teoretické třídní četnosti 𝑛 𝑝 𝑗 . Vypočteme je pomocí distribuční funkce exponenciálního rozdělení, přičemž za parametr 𝛿 položíme 𝛿 =8,142. Dostaneme tak následující hodnoty, které zapíšeme do 6. sloupce dále uvedené tabulky: 𝑛 𝑝 1 =𝑛𝐹 6 =60∙ 1− e − 6 𝛿 =31,285, 𝑛 𝑝 𝑗 =𝑛 𝐹( 𝑐 𝑗+1 )−𝐹( 𝑐 𝑗 ) =60∙ e − 𝑐 𝑗 𝛿 − e − 𝑐 𝑗+1 𝛿 , 𝑗=2,3,4,5,6, 𝑛 𝑝 7 =𝑛 1−𝐹(26) =60∙ e − 26 𝛿 =2,462.
---------------------------- Testování statistických hypotéz Příklad – pokračování 2: Ověříme, zda teoretické třídní četnosti splňují podmínku 𝑛 𝑝 𝑗 >5. Tato podmínka není splněna od páté třídy. Proto utvoříme nové třídy tak, že novou pátou třídu vytvoříme sloučením páté až sedmé třídy. Indexy 𝑙 nových tříd zapíšeme do 7. sloupce. Do 8. až 10. sloupce zapíšeme postupně hodnoty nových absolutních a teoretických třídních četností a hodnoty testového kritéria: 𝒋 𝑰 𝒋 𝒛 𝒋 𝒇 𝒋 𝒋 𝒇 𝒋 𝒏 𝒑 𝒋 𝒍 𝒇 𝒍 𝒏 𝒑 𝒍 𝒇 𝒍 −𝒏 𝒑 𝒍 2 𝒏 𝒑 𝒍 1 −∞,6 4 22 31,285 2,756 2 6, 10 8 16 32 11,146 2,114 3 10, 14 12 9 36 6,820 0,697 14, 18 6 24 4,173 13 10,750 0,471 5 18, 22 20 2,553 − 22, 26 1,562 7 26, ∞ 28 2,462 ∑ 60 153 60,001 𝟔,𝟎𝟑𝟖
---------------------------- Testování statistických hypotéz Příklad – pokračování 3: 3. Pro 𝛼=0,05 určíme kvantil Pearsonova rozdělení 𝜒 2 1−𝛼 𝑟−𝑘−1 . Při počtu nových tříd 𝑟=4 a hodnotě 𝑘=1 (neboť jsme odhadli jeden parametr rozdělení) najdeme v tabulkách hodnotu 𝜒 2 0,95 2 =6,0. Tedy kritický obor je 𝑊 0,05 = 𝜒 2 : 𝜒 2 ≥6 = 6,∞) . 4. Protože hodnota testového kritéria 𝜒 2 =6,038 je prvkem kritického oboru 𝑊 0,05 = 6,∞) , považujeme odchylky mezi absolutními a teoretickými třídními četnostmi za nenáhodné. Proto nulovou hypotézu 𝐻, spočívající v předpokladu, že doba 𝑋 do první poruchy nového výrobku má exponenciální rozdělení, zamítneme.