6. Testování statistických hypotéz.

Slides:



Advertisements
Podobné prezentace
Číslo projektu CZ.1.07/1.5.00/ Název školy
Advertisements

KÓDOVANIE INFORMÁCIÍ Maroš Malý, 4.C.
Percentá Percentá každý deň a na každom kroku.
NÁZEV: VY_32_INOVACE_05_05_M6_Hanak TÉMA: Dělitelnost
Delavnica za konfiguriranje dostopovnih točk RAČUNALNIŠKA OMREŽJA
ALGORITMIZACE.
Jan Coufal, Julie Šmejkalová, Jiří Tobíšek
Obvod a obsah kruhu Prezentaci Mgr. Jan Kašpara (ZŠ Hejnice) upravila a doplnila Mgr. Eva Kaucká e.
Určitý integrál. Příklad.
Shodné zobrazení, osová souměrnost, středová souměrnost
Opakování na 4. písemnou práci
rtinzartos Napište slova, která obsahují uvedená písmena.
Cvičení Úloha 1: Rozhodněte zda posloupnost znaků v poli délky n tvoří palindrom (slovo, které je stejné při čtení zprava i zleva). Př.: [a,l,e,l,a]
Data Science aneb BigData v praxi
Slovní úlohy pro „autaře“
Emise a absorpce světla
NÁZEV ŠKOLY: Základní škola Hostouň, okres Domažlice,
Problematika spotřebitelských úvěrů
Elektrikcé pole.
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
Dynamická pevnost a životnost Přednášky
Perspektivy budoucnosti lidstva
6. PŘEDNÁŠKA Diagnostické (screeningové) testy v epidemiologii
Základy elektrotechniky
NÁZEV: VY_32_INOVACE_08_12_M9_Hanak TÉMA: Jehlan OBSAH: Objem
Změny skupenství Ing. Jan Havel.
Seminář JČMF Matematika a fyzika ve škole
Test: Mechanické vlastnosti kapalin (1. část)
4.2 Deformace pevného kontinua 4.3 Hydrostatika
A ZÁROVEŇ HNED DOKONALÉ
Tělesa –Pravidelný šestiboký hranol
NÁZEV ŠKOLY: Základní škola Hostouň, okres Domažlice,
8.1.1 Lineární kombinace aritmetických vektorů
Fyzikální veličiny - čas
Číselné soustavy a kódy
Čas a souřadnice Lekce 3 Miroslav Jagelka.
Agregátní trh práce.
Jasnosti hvězd Lekce 10 Miroslav Jagelka.
Název prezentace (DUMu): Jednoduché úročení – řešené příklady
Konstrukce překladačů
DYNAMICKÉ VLASTOSTI ZEMIN A HORNIN
E-projekt: Jak změřit výšku budovy GJŠ
Parametry vedení a stejnosměrná vedení
Martina Litschmannová
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav technicko-technologický Logistika zemního plynu v České republice Autor diplomové práce:
Martina Litschmannová, Adéla Vrtková
ROZDĚLENÍ ÚHLŮ PODLE VELIKOSTI
Rovinný úhel a jeho orientace
Měření optické aktivity 4.1 Úvod (ukázky spekter)
Ohmův zákon Praktické ověření.
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Proudy a obvody Náboje v pohybu.
Číselné soustavy a kódy
Práce s nepájivým (kontaktním) polem
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
Máme data – a co dál? (1. část)
NÁZEV: VY_32_INOVACE_06_11_M7_Hanak
Statistická indukce v praxi
NÁZEV: VY_32_INOVACE_08_01_M9_Hanak TÉMA: Soustavy lineárních rovnic
Studená válka.
Výukový materiál zpracovaný v rámci projektu
Ing. Marcela Strakošová
VZNIK ČESKOSLOVENSKA.
Škola ZŠ Masarykova, Masarykova 291, Valašské Meziříčí Autor
PRÁVNÍ ZÁKLADY STÁTU - VLAST
Je obtížnější „dělat“ marketing služby nebo hmotného produktu?
MAPA SVĚTA AFRIKA.
Dvacáté století – vznik Československa
Zakavkazsko.
Osvobození československa (1.)
Transkript prezentace:

6. Testování statistických hypotéz. RNDr. Radovan Potůček, Ph.D., K-215, FVT UO, KŠ 5B/11, Radovan.Potucek@unob.cz, tel. 443056

Testování statistických hypotéz Testování statistických hypotéz je důležitou úlohou statistické indukce, pomocí níž z empirických charakteristik a zákonů rozdělení, zjištěných z datového souboru, usuzujeme na vlastnosti zkoumaného znaku v základním souboru. Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z nějakého rozdělení. Zajímáme se o to, zda pro parametr 𝛽 tohoto rozdělení platí např. nerovnost 𝛽≤ 𝛽 0 , kde 𝛽 0 je zadané (zvolené) číslo, anebo zda rozdělení, z něhož náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 pochází, je např. normální či exponenciální. Pomocí testování statistických hypotéz lze dát objektivní odpovědi např. na tyto otázky: Je rozdíl mezi dvěma skupinami studentů, měřený rozdílem průměrných známek obou skupin, průkazný nebo způsobený náhodou? Je průměrná spotřeba automobilu, vypočtená ze spotřeby během provozu, průkazně odlišná od spotřeby uváděné výrobcem? Lze považovat za průkazné, že životnost součástky má normální rozdělení?

Základní pojmy testování statistických hypotéz Statistickou hypotézou nazýváme tvrzení, týkající se parametru nebo tvaru rozdělení náhodné veličiny 𝑋 z náhodného výběru 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 . Postup, pomocí něhož, na základě informací získaných z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 , rozhodujeme o tom, zda statistická hypotéza platí či nikoliv, nazýváme testem statistické hypotézy. Statistickou hypotézu, o jejíž platnosti pomocí testu rozhodujeme, nazveme nulovou hypotézu a označíme ji 𝐻 (někdy rovněž 𝐻 0 ). Proti nulové hypotéze stavíme tzv. alternativní hypotézu, kterou označíme 𝐻 (někdy též 𝐻 𝑎 ).

Postup při testování statistických hypotéz Při testu statistické hypotézy postupujeme takto: 1. Formulujeme nulovou hypotézu 𝐻 a k ní alternativní hypotézu 𝐻 . 2. K testování hypotézy použijeme vhodnou náhodnou veličinu (statistiku) 𝐺, která je funkcí náhodného výběru 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 , a nazveme ji testovým kritériem. Z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 vypočteme její realizovanou hodnotu 𝑔. 3. Ke zvolenému číslu 𝛼 (v praxi volíme 𝛼=0,05 nebo 𝛼=0,01), které nazýváme hladinou významnosti, určíme tzv. kritický obor, který značíme 𝑊 𝛼 , v němž se při pravdivé hypotéze 𝐻 realizuje nejvýše 100𝛼% hodnot náhodné veličiny 𝐺, tj. 𝛼=𝑃 𝐺∈ 𝑊 𝛼 |𝐻 . 4. Podle toho, jak se realizuje testové kritérium v kritickém oboru, přijmeme následující rozhodnutí: a) Když 𝑔∈ 𝑊 𝛼 , pak zamítáme nulovou hypotézu ve prospěch alternativní hyp. b) Když 𝑔∉ 𝑊 𝛼 , pak přijímáme (nezamítáme) nulovou hypotézu.

---------------------------- Testování statistických hypotéz Poznamenejme, že kritický obor 𝑊 𝛼 je taková množina, v níž se hodnoty náhodné veličiny 𝐺, za předpokladu, že platí nulová hypotéza 𝐻, vyskytují s velmi malou pravděpodobností 𝛼. Pokud se NV 𝐺 v tomto intervalu realizovala, pak nastal jev, který by při platnosti nulové hypotézy měl nastat pouze s velmi malou pravděpodobností 𝛼. Proto předpoklad, že platí hypotéza 𝐻, zamítáme ve prospěch alternativní hypotézy 𝐻 . Poznamenejme dále, že přijetí nulové hypotézy 𝐻 znamená jen to, že tato hypotéza nebyla vyvrácena a že jsme tedy oprávněni ji přijmout, avšak není to důkaz její pravdivosti. Rozpor mezi nulovou hypotézou a hodnotami zjištěnými z datového souboru hodnotíme jako statisticky nevýznamný (nebo vysvětlitelný náhodně) v případě, když nulovou hypotézu přijmeme. Rozpor hodnotíme jako statisticky významný (nebo průkazný) v případě, když nulovou hypotézu zamítneme.

---------------------------- Testování statistických hypotéz Při testování mohou nastat čtyři varianty, které uvádí následující tabulka. Dvě z těchto variant dávají správný výsledek, ostatní dvě jsou chybné a nazýváme je chybou prvního druhu, resp. chybou druhého druhu. Chyba prvního druhu nastane, jestliže nulová hypotéza platí, ale zamítneme ji. Pravděpodobnost této chyby je rovna hladině významnosti 𝛼. Chyba druhého druhu nastane, platí-li alternativní hypotéza 𝐻 , ale na základě testu přijmeme nulovou hypotézu 𝐻. Její pravděpodobnost je 𝑃 𝐺∉ 𝑊 𝛼 | 𝐻 . Nyní uvedeme nejčastěji používané parametrické testy, kdy předpokládáme, že je dán náhodný výběr z rozdělení obsahujícím jeden nebo více neznámých parametrů, a na základě tohoto náhodného výběru se provede test hypotézy. Naproti tomu neparametrické testy nevycházejí z předpokladu daného tvaru rozdělení, ale z obecnější předpokladů (těmito testy se nebudeme dále zabývat). Výsledky testu Platí 𝐻 Platí 𝐻 Přijmeme 𝐻 Správný výsledek Chyba druhého druhu Zamítneme 𝐻 Chyba prvního druhu

Testy hypotéz o parametru 𝝁 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) ---------------------------- Testování statistických hypotéz. ---------------------------- 7/28 Testy hypotéz o parametru 𝝁 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z normálního rozdělení 𝑁(𝜇, 𝜎 2 ), přičemž parametr 𝜎 2 neznáme. Testujeme-li nulové hypotézy 𝐻:𝜇= 𝜇 0 , resp. 𝐻:𝜇≤ 𝜇 0 , resp. 𝐻:𝜇≥ 𝜇 0 , kde 𝜇 0 je dané číslo, pak za testové kritérium použijeme náhodnou veličinu 𝑇= 𝑋 − 𝜇 0 𝑆 𝑛 , která má Studentovo rozdělení o 𝑛−1 stupních volnosti. Kritické obory pro jednotlivé případy jsou: pro 𝐻:𝜇= 𝜇 0 je 𝐻 :𝜇≠ 𝜇 0 a 𝑊 𝛼 ={𝑡: 𝑡 ≥ 𝑡 1− 𝛼 2 𝑛−1 }, pro 𝐻:𝜇≤ 𝜇 0 je 𝐻 :𝜇> 𝜇 0 a 𝑊 𝛼 ={𝑡:𝑡≥ 𝑡 1−𝛼 𝑛−1 }, pro 𝐻:𝜇≥ 𝜇 0 je 𝐻 :𝜇< 𝜇 0 a 𝑊 𝛼 ={𝑡:𝑡≤ −𝑡 1−𝛼 𝑛−1 }, kde 𝑡 1− 𝛼 2 (𝑛−1) a 𝑡 1−𝛼 (𝑛−1) jsou kvantily Studentova rozdělení.

---------------------------- Testování statistických hypotéz Na obrázku jsou vybarvením znázorněny kritické obory pro jednotlivé tři alternativní hypotézy 𝐻 𝑎 (reject ~ odmítnutí, nepřijetí):

1. Nulová hypotéza 𝐻:𝜇=15,20, alternativní hypotéza 𝐻 :𝜇≠15,20. ---------------------------- Testování statistických hypotéz. ---------------------------- 9/28 Příklad: Byl testován měřící přístroj, který na zkušebním vzorku (neboli standardu, etalonu) s přesným rozměrem 15,20 cm naměřil těchto 8 výsledků: 15,23, 15,21, 15,19, 15,16, 15,26, 15,22, 15,23, 15,26. Vypočtěte výběrový průměr 𝑥 a výběrovou směrodatnou odchylku 𝑠 a testujte na 5%-ní hladině významnosti, zda je měřící přístroj správně nastaven. Výběrový průměr 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 8 ∙121,76=15,22, výběrová směrod. odchylka 𝑠= 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 7 1853,1952−8∙ 15,22 2 = 0,0011 =0,0338. 1. Nulová hypotéza 𝐻:𝜇=15,20, alternativní hypotéza 𝐻 :𝜇≠15,20. 2. Realizovaná hodnota 𝑡 testového kritéria 𝑇: 𝑡= 𝑥 − 𝜇 0 𝑠 𝑛 = 0,02 0,0338 8 =1,6736. 3. Pro zvolené 𝛼=0,05 najdeme v tabulkách kvantil Studentova rozdělení 𝑡 1− 𝛼 2 𝑛−1 = 𝑡 0,975 7 =2,365, tedy kritický obor 𝑊 𝛼 ={𝑡: 𝑡 ≥ 𝑡 1− 𝛼 2 𝑛−1 } je 𝑊 0,05 = 𝑡: 𝑡 ≥2,365 =(−∞,−2,36 5 ∪ 2,365,∞) . 4. 𝑡∉ 𝑊 0,05 , takže přijímáme nulovou hypotézu, že měř. přístroj je správně nastaven.

Test hypotézy o parametru 𝝈 𝟐 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) ---------------------------- Testování statistických hypotéz. ---------------------------- 10/28 Test hypotézy o parametru 𝝈 𝟐 rozdělení 𝑵(𝝁, 𝝈 𝟐 ) Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z normálního rozdělení 𝑁(𝜇, 𝜎 2 ). Testujeme-li nulovou hypotézu 𝐻: 𝜎 2 ≤ 𝜎 0 2 proti alternativní hypotéze 𝐻 : 𝜎 2 > 𝜎 0 2 , pak za testové kritérium použijeme náhodnou veličinu 𝑍= (𝑛−1) 𝑆 2 𝜎 0 2 , která má rozdělení 𝜒 2 o 𝑛−1 stupních volnosti. Kritický obor pro případ 𝐻: 𝜎 2 ≤ 𝜎 0 2 je 𝑊 𝛼 ={𝑧:𝑧≥ 𝜒 2 1−𝛼 𝑛−1 }, kde 𝜒 2 1−𝛼 (𝑛−1) je kvantil Pearsonova rozdělení.

---------------------------- Testování statistických hypotéz Testy hypotéz o parametrech dvou náhodných výběrů z normálních rozdělení 𝑵 𝝁 𝟏 , 𝝈 𝟏 𝟐 a 𝑵 𝝁 𝟐 , 𝝈 𝟐 𝟐 Uvažujme dva nezávislé náhodné výběry z normálních rozdělení. První náhodný výběr 𝑋 11 , 𝑋 12 ,…, 𝑋 1𝑛 z normálního rozdělení 𝑁( 𝜇 1 , 𝜎 1 2 ) o rozsahu 𝑛 1 s výběrovým průměrem 𝑋 1 2 a výběrovým rozptylem 𝑆 1 2 . Druhý náhodný výběr 𝑋 21 , 𝑋 22 ,…, 𝑋 2𝑛 z normálního rozdělení 𝑁( 𝜇 2 , 𝜎 2 2 ) o rozsahu 𝑛 2 s výběrovým průměrem 𝑋 2 2 a výběrovým rozptylem 𝑆 2 2 . Testujeme, zda rozdíly mezi výběrovými průměry, resp. výběrovými rozptyly, jsou statisticky významné nebo nevýznamné. Dále se budeme zabývat a) testem rozdílu rozptylů dvou náhodných výběrů, b) testem rozdílu středních hodnot dvou náhodných výběrů.

a) Test rozdílu rozptylů dvou náhodných výběrů ---------------------------- Testování statistických hypotéz. ---------------------------- 12/28 a) Test rozdílu rozptylů dvou náhodných výběrů K testování hypotézy 𝐻: 𝜎 1 2 = 𝜎 2 2 proti alternativní hypotéze 𝐻 : 𝜎 1 2 ≠ 𝜎 0 2 použijeme náhodnou veličinu 𝐹 1 = max 𝑆 1 2 , 𝑆 2 2 min 𝑆 1 2 , 𝑆 2 2 . Kritický obor je interval 𝑊 𝛼 = 𝑓 1 : 𝑓 1 ≥ 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 , kde 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 je kvantil Fisherova-Snedecorova rozdělení, přičemž 𝜈 1 =𝑛 1 −1 je rozsah toho z datových souborů, který má větší rozptyl, a 𝜈 2 = 𝑛 2 −1.

b) Test rozdílu středních hodnot dvou náhod. výběrů ---------------------------- Testování statistických hypotéz. ---------------------------- 13/28 b) Test rozdílu středních hodnot dvou náhod. výběrů Jsou-li rozptyly 𝜎 1 2 a 𝜎 2 2 obou rozdělení stejné nebo alespoň přibližně stejné, což zjistíme předchozím testem a), kde testujeme právě hypotézu 𝐻: 𝜎 1 2 = 𝜎 2 2 , použijeme k testování rozdílu mezi středními hodnotami 𝜇 1 a 𝜇 2 náhod. veličinu 𝑇 1 = 𝑋 1 − 𝑋 2 (𝑛 1 − 1)𝑆 1 2 +( 𝑛 2 −1)𝑆 2 2 ( 𝑛 1 + 𝑛 2 −2) 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 , která má Studentovo rozdělení o 𝑛 1 + 𝑛 2 −2 stupních volnosti. Kritické obory pro jednotlivé případy nulové a k ní alternativní hypotézy jsou: pro 𝐻: 𝜇 1 = 𝜇 2 a 𝐻 : 𝜇 1 ≠ 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≥ 𝑡 1− 𝛼 2 𝑛 1 + 𝑛 2 −2 }, pro 𝐻: 𝜇 1 ≤ 𝜇 2 a 𝐻 : 𝜇 1 > 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≥ 𝑡 1−𝛼 𝑛 1 + 𝑛 2 −2 }, pro 𝐻: 𝜇 1 ≥ 𝜇 2 a 𝐻 : 𝜇 1 < 𝜇 2 je 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 1−𝛼 𝑛 1 + 𝑛 2 −2 }, kde 𝑡 1− 𝛼 2 ( 𝑛 1 + 𝑛 2 −2) a 𝑡 1−𝛼 ( 𝑛 1 + 𝑛 2 −2) jsou kvantily Studentova rozdělení.

b) Test rozdílu středních hodnot dvou náh. výběrů – pokrač. ---------------------------- Testování statistických hypotéz. ---------------------------- 14/28 b) Test rozdílu středních hodnot dvou náh. výběrů – pokrač. Jsou-li důvody k domněnce, že rozptyly 𝜎 1 2 a 𝜎 2 2 obou rozdělení se od sebe značně liší, použijeme k testování rozdílu středních hodnot 𝜇 1 a 𝜇 2 náhod. veličinu 𝑇 2 = 𝑋 1 − 𝑋 2 1 𝑛 1 𝑆 1 2 + 1 𝑛 2 𝑆 2 2 . Kritický obor nulové hypotézy 𝐻: 𝜇 1 = 𝜇 2 proti alternativní hypotéze 𝐻 : 𝜇 1 ≠ 𝜇 2 je 𝑊 𝛼 = 𝑡 2 : 𝑡 2 ≥ 𝑡 ∗ , kde číslo 𝑡 ∗ určíme ze vztahu 𝑡 ∗ = 𝑠 1 2 𝑛 1 𝑡 1− 𝛼 2 𝑛 1 −1 + 𝑠 2 2 𝑛 2 𝑡 1− 𝛼 2 𝑛 2 −1 𝑠 1 2 𝑛 1 + 𝑠 2 2 𝑛 2 , přičemž 𝑡 1− 𝛼 2 𝑛 1 −1 a 𝑡 1− 𝛼 2 𝑛 2 −1 jsou kvantily Studentova rozdělení.

Výběrové rozptyly tedy jsou: 𝑠 𝐴 2 =1024,79, 𝑠 𝐵 2 =925,79. ---------------------------- Testování statistických hypotéz. ---------------------------- 15/28 Příklad: U vojenských jednotek 𝐴 a 𝐵 byla prověřována fyzická zdatnost. Z každé jednotky bylo náhodně vybráno 12 vojáků, kteří na překážkové dráze dosáhli časů (v 𝑠): 𝐴: 60 154 122 90 105 68 160 76 73 88 92 104 𝐵: 64 59 70 60 108 97 84 68 135 125 70 142 Vypočtěte empirické charakteristiky doby proběhnutí dráhy. Za předpokladu, že tato doba má normální rozdělení, posuďte na 5%-ní hladině významnosti rozdíl ve fyzické zdatnosti vojáků. Jednotka 𝐴: výběrový průměr 𝑥 𝐴 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 12 ∙1192=99,33, výběrová směr. odchylka 𝑠 𝐴 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 11 129678−12∙ 99,33 2 =32,01. Jednotka 𝐵: výběrový průměr 𝑥 𝐵 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 12 ∙1082=90,17, výběrová směr. odchylka 𝑠 𝐵 = 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 11 107744−12∙ 90,17 2 =30,43. Výběrové rozptyly tedy jsou: 𝑠 𝐴 2 =1024,79, 𝑠 𝐵 2 =925,79. Dále budeme testovat: a) statistickou významnost rozdílu rozptylů, b) statistickou významnost rozdílu středních hodnot.

---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Vypočtené výběrové charakteristiky obou jednotek: 𝐴: 𝑥 𝐴 = 99,33, 𝑠 𝐴 2 =1024,79, 𝑠 𝐴 =32,01, 𝐵: 𝑥 𝐵 = 90,17, 𝑠 𝐵 2 =925,79, 𝑠 𝐴 =30,43. a) Test statistické významnosti rozdílu rozptylů 1. Nulová hypotéza 𝐻: 𝜎 𝐴 2 = 𝜎 𝐵 2 , alternativní hypotéza 𝐻 : 𝜎 𝐴 2 ≠ 𝜎 𝐵 2 . 2. Realizovaná hodnota 𝑓 1 testového kritéria 𝐹 1 : 𝑓 1 = max 𝑠 𝐴 2 , 𝑠 𝐵 2 min 𝑠 𝐴 2 , 𝑠 𝐵 2 = 1024,79 925,79 =1,11. 3. Pro zvolené 𝛼=0,05 najdeme v tabulkách hodnoty kvantilů Fisherova-Snedeco- rova rozdělení 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 : 𝐹 0,975 8,11 =3,664, 𝐹 0,975 12,11 =3,430. Lineární interpolací odhadneme hodnotu „netabulkového“ kvantilu 𝐹 0,975 11,11 𝑦= 𝑦 1 + 𝑥− 𝑥 1 𝑦 2 − 𝑦 1 𝑥 2 − 𝑥 1 =3,664+ 11−8 3,430−3,664 12−8 =3,489≐ 𝐹 0,975 11,11 , kritický obor 𝑊 𝛼 = {𝑓 1 : 𝑓 1 ≥ 𝐹 1− 𝛼 2 𝜈 1 , 𝜈 2 } je 𝑊 0,05 = 𝑓 1 : 𝑓 1 ≥3,489 = 3,489,∞) . 4. Protože 𝑓 1 ∉ 𝑊 0,05 , přijímáme nulovou hypotézu, takže rozdíl mezi rozptyly časů obou jednotek lze považovat za statisticky nevýznamný.

---------------------------- Testování statistických hypotéz Příklad – pokračování 2: Vypočtené výběrové charakteristiky obou jednotek: 𝐴: 𝑥 𝐴 = 99,33, 𝑠 𝐴 2 =1024,79, 𝑠 𝐴 =32,01, 𝐵: 𝑥 𝐵 = 90,17, 𝑠 𝐵 2 =925,79, 𝑠 𝐴 =30,43. b) Test statistické významnosti rozdílu středních hodnot I. Protože výběrový průměr dosažených časů u jednotky 𝐴 je vyšší než u jednotky 𝐵, testujeme nulovou hypotézu 𝐻: 𝜇 𝐴 ≥ 𝜇 𝐵 , alternativní hypotéza 𝐻 : 𝜇 𝐴 < 𝜇 𝐵 . 2. Protože podle výsledku testu a) o rozptylech lze předpokládat, že jsou stejné, použijeme k testování testové kritérium 𝑇 1 . Její realizovaná hodnota 𝑡 1 = 𝑥 𝐴 − 𝑥 𝐵 (𝑛 𝐴 − 1)𝑠 𝐴 2 + 𝑛 𝐵 −1 𝑠 𝐵 2 ( 𝑛 𝐴 + 𝑛 𝐵 −2) 𝑛 𝐴 𝑛 𝐵 𝑛 𝐴 + 𝑛 𝐵 = 9,16 11∙1024,79+11∙925,79 ∙ 22∙12∙12 24 =0,72. 3. Pro 𝛼=0,05 je kritický obor tohoto testu 𝑊 𝛼 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 1−𝛼 𝑛 𝐴 + 𝑛 𝐵 −2 }, tedy 𝑊 0,05 ={ 𝑡 1 : 𝑡 1 ≤ −𝑡 0,95 22 }. V tabulkách najdeme kvantil Studentova rozdělení 𝑡 0,95 22 =1,717, takže kritický obor je interval 𝑊 0,05 =(−∞,−1,71 7 . 4. Protože 𝑡 1 ∉ 𝑊 0,05 , přijímáme nulovou hypotézu, tj. střední hodnota časů jedn. 𝐴 je větší nebo rovna střední hodnotě časů jednotky 𝐵 na 5%-ní hladině významnosti.

---------------------------- Testování statistických hypotéz Testy dobré shody Mezi testy dobré shody patří testy které zjišťují, zda náhodný výběr pochází z rozdělení určitého typu – např. z normálního nebo exponenciálního rozdělení. K testům dobré shody patří Kolmogorovův-Smirnovův test a Pearsonův test. resort = sáhnout, uchýlit se

Kolmogorovův-Smirnovův test ---------------------------- Testování statistických hypotéz. ---------------------------- 19/28 Kolmogorovův-Smirnovův test Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 ze spojitého rozdělení a stanovme hypotézu, že pochází z rozdělení s distribuční funkcí 𝐹(𝑥). K testu použijeme empirickou distribuční funkci 𝐹 𝑛 (𝑥), kterou sestrojíme z datového souboru 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 . 1. Nulová hypotéza 𝐻 spočívá v předpokladu, že rozdíly mezi empirickou distribuční funkcí 𝐹 𝑛 (𝑥) a distribuční funkcí 𝐹(𝑥) jsou statisticky nevýznamné. Alternativní hypotéza spočívá v tom, že tyto rozdíly jsou statisticky významné. 2. Za testové kritérium se volí náhodná veličina 𝐷= sup 𝑥 𝐹 𝑛 𝑥 −𝐹(𝑥) . 3. Kritický obor je 𝑊 𝛼 ={𝐷:𝐷> 𝐷 1−𝛼 𝑛 } , přičemž kvantily 𝐷 1−𝛼 𝑛 Kolmogorova-Smirnova testu jsou tabelizovány. 4. Je-li 𝐷∈ 𝑊 𝛼 , pak zamítneme nulovou hypotézu ve prospěch alternativní hypotézy.

Náhodná veličina 𝑋, která označuje velikost odpadu, má výběrový průměr ---------------------------- Testování statistických hypotéz. ---------------------------- 20/28 Příklad: Při měření odpadu u 10 obráběných kusů byly získány hodnoty odpadu (v %): 4,06 4,03 3,75 3,89 3,81 3,82 3,48 3,70 3,99 4,04. Vypočtěte empirické charakteristiky a empirickou distribuční funkci pro velikost odpadu a na 5%-ní hladině významnosti testujte, zda velikost odpadu má normální rozdělení. Náhodná veličina 𝑋, která označuje velikost odpadu, má výběrový průměr 𝑥 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 = 1 10 ∙38,57=3,857 , výběrovou směrodatnou odchylku 𝑠= 1 𝑛−1 𝑖=1 𝑛 𝑥 𝑖 2 −𝑛∙ 𝑥 2 = 1 9 149,0697−10∙ 3,857 2 =0,3052. I. Nulová hypotéza spočívá v předpokladu, že datový soubor je realizovanou hodnotou náhodného výběru z normálního rozdělení 𝑁(𝜇 ,𝜎 2 ), přičemž parametry 𝜇 a 𝜎 neznáme, a tedy rozdíly mezi empirickou distribuční funkcí 𝐹 𝑛 (𝑥), získanou z datového souboru, a distribuční funkcí 𝐹(𝑥) tohoto rozdělení jsou statisticky nevýznamné.

---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Dále sestavíme tabulku, v jejímž 1. sloupci jsou hodnoty různých prvků 𝑥 𝑖 datového souboru, ve 2. sloupci hodnoty empirické distribuční funkce 𝐹 𝑛 ( 𝑥 𝑖 ), ve 3. sloupci argumenty 𝑡 𝑖 = 𝑥 𝑖 − 𝑥 𝑠 = 𝑥 𝑖 −3,857 0,3052 distribuční funkce 𝐹(𝑥) náhodné veličiny s normovaným normálním rozdělením, jejíž příslušné tabelizované hodnoty 𝐹 𝑁 𝑡 𝑖 jsou ve 4. sloupci, a v 5. sloupci jsou rozdíly 𝐹 𝑛 𝑥 𝑖 − 𝐹 𝑁 𝑡 𝑖 : 𝑥 𝑖 𝐹 𝑛 ( 𝑥 𝑖 ) 𝑡 𝑖 𝐹 𝑁 ( 𝑡 𝑖 ) 𝐹 𝑛 𝑥 𝑖 − 𝐹 𝑁 𝑡 𝑖 3,48 0,1 −1,235 0,109 0,009 3,70 0,2 −0,514 0,302 0,102 3,75 0,3 −0,351 0,363 0,063 3,81 0,4 −0,154 0,439 0,039 3,82 0,5 −0,121 0,452 0,048 3,89 0,6 0,108 0,457 0,143 3,99 0,7 0,436 0,668 0,032 4,03 0,8 0,567 0,714 0,086 4,04 0,9 0,600 0,726 0,174 4,06 1,0 0,665 0,747 𝟎,𝟐𝟓𝟑

---------------------------- Testování statistických hypotéz Příklad – pokračování 2: 2. Realizovaná hodnota testového kritéria 𝐷= sup 𝑥 𝐹 𝑛 𝑥 −𝐹(𝑥) je rovna 𝑑= 0,253 pro 𝑥=4,06. 3. Pro zvolené 𝛼=0,05 najdeme v tabulce kvantilů Kolmogorova-Smirnova testu hodnotu 𝐷 1−𝛼 𝑛 = 𝐷 0,95 10 =0,409. Kritický obor pro tento test je 𝑊 𝛼 = 𝐷:𝐷> 𝐷 1−𝛼 𝑛 , tj. 𝑊 0,05 = 𝐷:𝐷> 𝐷 0,95 10 = 𝐷:𝐷>0,409 = 0,409,∞ . 4. Protože realizovaná hodnota testového kritéria 𝑑∉ 𝑊 0,05 , nulovou hypotézu přijímáme, takže na hladině významnosti 𝛼=0,05 pochází daný datový soubor z náhodného výběru s normálním rozdělením.

---------------------------- Testování statistických hypotéz Pearsonův test Mějme náhodný výběr 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑛 z určitého rozdělení. Předpokládejme, že datový soubor 𝑥 1 , 𝑥 2 ,…, 𝑥 𝑛 má velký rozsah 𝑛 a je roztříděný do 𝑟 tříd. 1. Nulová hypotéza 𝐻 spočívá v předpokladu, že odchylky mezi absolutními třídními četnostmi 𝑓 𝑗 , určenými z datového souboru, a tzv. teoretickými třídními četnostmi, označenými 𝑛 𝑝 𝑗 , jsou náhodné. Čísla 𝑝 𝑗 jsou pravděpodobnosti, že hodnoty uvažované NV 𝑋 jsou v 𝑗-té třídě. Alternativní hypotéza spočívá v tom, že tyto odchylky jsou nenáhodné, a tedy NV 𝑋 má jiné rozdělení. 2. Jako testové kritérium se používá náhodná veličina 𝜒 2 = 𝑗=1 𝑟 𝑓 𝑗 −𝑛 𝑝 𝑗 2 𝑛 𝑝 𝑗 . Jestliže nulová hypotéza platí a pro všechny třídy je splněna nerovnost 𝑛 𝑝 𝑗 >5, má náhodná veličina 𝜒 2 Pearsonovo rozdělení o 𝑟−𝑘−1 stupních volnosti, kde 𝑘 je počet parametrů předpokládaného rozdělení, které bylo nutné odhadnout.

---------------------------- Testování statistických hypotéz 3. Kritický obor je 𝑊 𝛼 ={ 𝜒 2 : 𝜒 2 ≥ 𝜒 2 1−𝛼 𝑟−𝑘−1 } , kde 𝜒 2 1−𝛼 𝑟−𝑘−1 je kvantil tabelizovaného Pearsonova rozdělení. a) Testujeme-li normální rozdělení, pak odhady dvou neznámých parametrů jsou: 𝜇 = 1 𝑛 𝑗=1 𝑟 𝑧 𝑗 𝑓 𝑗 , 𝜎 2 = 1 𝑛 𝑗=1 𝑟 𝑧 𝑗 − 𝜇 2 𝑓 𝑗 , kde 𝑧 𝑗 , 𝑗=1,…,𝑟, jsou reprezentanty jednotlivých tříd. b) Testujeme-li exponenciální rozdělení, pak odhad parametru 𝛿 je roven 𝛿 = ℎ ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 − 𝑓 𝑟 − ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 −𝑛 , kde ℎ označuje délku tříd. 4. Je-li 𝜒 2 ∈ 𝑊 𝛼 , pak zamítneme nulovou hypotézu ve prospěch alternativní hypotézy.

---------------------------- Testování statistických hypotéz Příklad: Vraťme se k příkladu testování nového výrobku, u kterého jsme zjišťovali počet dnů 𝑋 do první poruchy. Byl získán datový soubor tvořený 𝑛=60 hodnotami, které jsme roztřídili do 𝑘=7 tříd s délkou třídy ℎ=4. Byla vytvořena následující tabulka a vypočteny empirické charakteristiky 𝑥 =9,6 a 𝑠=6,13, přičemž jsme na závěr odhadli, že rozdělení doby do poruchy by mohlo být exponenciální. Z původní tabulky jsme převzali první čtyři sloupce a přidali k ní 5. sloupec: 𝒋 𝑰 𝒋 𝒛 𝒋 𝒇 𝒋 𝒋 𝒇 𝒋 1 −∞,6 4 22 2 6, 10 8 16 32 3 10, 14 12 9 36 14, 18 6 24 5 18, 22 20 22, 26 7 26, ∞ 28 ∑ − 60 153

---------------------------- Testování statistických hypotéz Příklad – pokračování 1: Výpočty pro test zapíšeme do nové, rozšířené tabulky. I. Nulová hypotéza spočívá v předpokladu, že NV má exponenciální rozdělení. Protože parametr 𝛿 tohoto rozdělení není zadán, nahradíme jej jeho odhadem 𝛿 = ℎ ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 − 𝑓 𝑟 − ln 𝑗=1 𝑟 𝑗∙ 𝑓 𝑗 −𝑛 = 4 ln 153−1 − ln 153−60 , odkud 𝛿 =8,142. Alternativní hypotéza spočívá v předpokladu, že rozdíly mezi teoretickými a absolutními třídními četnostmi jsou nenáhodné, tedy že NV 𝑋 má jiné rozdělení. 2. Pro výpočet hodnoty testového kritéria je třeba určit teoretické třídní četnosti 𝑛 𝑝 𝑗 . Vypočteme je pomocí distribuční funkce exponenciálního rozdělení, přičemž za parametr 𝛿 položíme 𝛿 =8,142. Dostaneme tak následující hodnoty, které zapíšeme do 6. sloupce dále uvedené tabulky: 𝑛 𝑝 1 =𝑛𝐹 6 =60∙ 1− e − 6 𝛿 =31,285, 𝑛 𝑝 𝑗 =𝑛 𝐹( 𝑐 𝑗+1 )−𝐹( 𝑐 𝑗 ) =60∙ e − 𝑐 𝑗 𝛿 − e − 𝑐 𝑗+1 𝛿 , 𝑗=2,3,4,5,6, 𝑛 𝑝 7 =𝑛 1−𝐹(26) =60∙ e − 26 𝛿 =2,462.

---------------------------- Testování statistických hypotéz Příklad – pokračování 2: Ověříme, zda teoretické třídní četnosti splňují podmínku 𝑛 𝑝 𝑗 >5. Tato podmínka není splněna od páté třídy. Proto utvoříme nové třídy tak, že novou pátou třídu vytvoříme sloučením páté až sedmé třídy. Indexy 𝑙 nových tříd zapíšeme do 7. sloupce. Do 8. až 10. sloupce zapíšeme postupně hodnoty nových absolutních a teoretických třídních četností a hodnoty testového kritéria: 𝒋 𝑰 𝒋 𝒛 𝒋 𝒇 𝒋 𝒋 𝒇 𝒋 𝒏 𝒑 𝒋 𝒍 𝒇 𝒍 𝒏 𝒑 𝒍 𝒇 𝒍 −𝒏 𝒑 𝒍 2 𝒏 𝒑 𝒍 1 −∞,6 4 22 31,285 2,756 2 6, 10 8 16 32 11,146 2,114 3 10, 14 12 9 36 6,820 0,697 14, 18 6 24 4,173 13 10,750 0,471 5 18, 22 20 2,553 − 22, 26 1,562 7 26, ∞ 28 2,462 ∑ 60 153 60,001 𝟔,𝟎𝟑𝟖

---------------------------- Testování statistických hypotéz Příklad – pokračování 3: 3. Pro 𝛼=0,05 určíme kvantil Pearsonova rozdělení 𝜒 2 1−𝛼 𝑟−𝑘−1 . Při počtu nových tříd 𝑟=4 a hodnotě 𝑘=1 (neboť jsme odhadli jeden parametr rozdělení) najdeme v tabulkách hodnotu 𝜒 2 0,95 2 =6,0. Tedy kritický obor je 𝑊 0,05 = 𝜒 2 : 𝜒 2 ≥6 = 6,∞) . 4. Protože hodnota testového kritéria 𝜒 2 =6,038 je prvkem kritického oboru 𝑊 0,05 = 6,∞) , považujeme odchylky mezi absolutními a teoretickými třídními četnostmi za nenáhodné. Proto nulovou hypotézu 𝐻, spočívající v předpokladu, že doba 𝑋 do první poruchy nového výrobku má exponenciální rozdělení, zamítneme.