Testování hypotéz
Testování statistických hypotéz Neříkej: „Objevil jsem pravdu!“ ale raději: „Objevil jsem jednu z pravd!“ Libanonsko- americký básník Chalil Gibran (1883 –1931) v knize „The Prophet“
VO x hypotézy:
Typické zdroje hypotéz 1) Požadavek na potřebnou kvalitu produktu 2) Hypotéza je založena na předchozí zkušenosti 3) Hypotéza vychází z teorie, kterou je třeba doložit 4) Hypotéza je pouhým dohadem, založeným na náhodném pozorování
Testování – postup Formulujeme testovanou (nulovou) a alternativní hypotézu Vybereme vhodný test (testové kritérium) Zvolíme hladinu významnosti α (obvykle 0,05 = 5%) Sestrojíme kritický obor W Vypočítáme hodnotu testovacího kritéria Učiníme závěr o prokázání či neprokázání alternativní hypotézy (zamítnutí či nezamítnutí nulové hypotézy)
Testování - pojmy Nulová / alternativní hypotéza Hladina významnosti Testovací kritérium Kritický obor (obor zamítnutí), kritická hodnota, obor přijetí Jednostranné testy – dvojstranné testy
Chí - kvadrát 3 typy testů: chí-kvadrát test je statistická neparametrická metoda, která se používá k zjištění, zda mezi dvěma znaky existuje prokazatelný výrazný vztah. Základní myšlenka chí-kvadrát testu spočívá v porovnání pozorovaných a očekávaných četností. 3 typy testů: · Test homogenity – slouží pro porovnání rozložení (distribuce) kvalitativní veličiny ve dvou nebo více populacích. Test nezávislosti – používá se k posouzení závislosti dvou kvalitativních veličin měřených na prvcích téhož výběru. Test dobré shody - zjišťuje, zda sledovaná veličina má rozdělení pravděpodobnosti určitého typu.
Postup Sestavení kontingenční tabulky (min. 2x2) Pozorované četnosti zjistíme z kontingenční tabulky Očekávané četnosti je nutné vypočítat. Při výpočtu vycházíme z předpokladu, že platí nulová hypotéza. Tedy provádíme-li test homogenity, předpokládáme, že rozložení hodnot sledované kategoriální veličiny je ve všech populacích shodné. Pokud provádíme test nezávislosti, nulová hypotéza předpokládá, že mezi dvěma kvalitativními veličinami není žádná závislost. V případě testu dobré shody předpokládáme, že sledovaná veličina má rozložení daného typu.
Case I. Pozorované četnosti Sloupec1 nekuřáci kuřáci celkem muži 277 Nulová hypotéza: Podíl kuřáků je stejný u mužů i žen. Alternativní hypotéza: Podíl kuřáků u mužů a u žen se liší. Pozorované četnosti Sloupec1 nekuřáci kuřáci celkem muži 277 119 396 ženy 122 66 188 399 185 584
Přepočítané četnosti
Výsledek, tedy dosaženou hladinu statistické významnosti, porovnáme s hodnotou 0,05. Je-li dosažená hladina statistické významnosti menší než 0,05, nulovou hypotézu zamítáme, v opačném případě nulovou hypotézu zamítnout nemůžeme. V tomto příkladu p = 0,220, nulovou hypotézu tedy zamítnout nemůžeme. Nulová hypotéza: Podíl kuřáků je stejný u mužů i žen. Závěr testování zní: Podíl kuřáků je stejný v populaci mužů i žen.
Testy shody Parametrický test - Chí kvadrát test Provést: intervalové rozdělení četností Podmínky: - žádný interval s nulovou četností; maximálně 20% intervalů s četností menší než 5 Testovací kritérium: kde: Ai = pozorovaná četnost a Ei = očekávaná četnost. Pokud je hodnota testovacího kritéria vyšší, než příslušná kritická hodnota rozdělení chí-kvadrát pro ν = (r - 1) stupňů volnosti (kde r = počet intervalů), hypotézu o shodě dvou rozdělení zamítáme (na příslušné hladině významnosti)