TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny
Sledujeme jednu kategoriální veličinu X (např.): TEST א 2 DOBRÉ SHODY pohlaví (zastoupení mužů a žen); kvalita výrobku (I.jakost, II.jakost, zmetek); známka ze statistiky (1 až 4); číslo padlé na hrací kostce (1 až 6); počet šestek při hodu třemi kostkami; strana padlá při hodu mincí (rub a líc).
TEST א 2 DOBRÉ SHODY Chceme prokázat: Chceme prokázat: Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Není kostka falešná? Není kostka falešná? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod mincí podle rovnoměrného rozdělení? Chová se hod mincí podle rovnoměrného rozdělení?
Testovaná dvojice hypotéz - obecně pro veličinu X s r-kategoriemi: TEST א 2 DOBRÉ SHODY H 0 : P(x 1 ) = π 1 ; P(x 2 ) = π 2 ;…; P(x r ) = π r H 1 : non H 0 kde π 1,…,π r jsou konkr. čísla: π 1 +…+π r = 1 kde π 1,…,π r jsou konkr. čísla: π 1 +…+π r = 1 H 0 : X~ROZDĚLENÍ(PARAMETRY) nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry? nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry?
01 Testovaná dvojice hypotéz (resp. testovaná H 0, H 1 je konstantní) - konkr. u příkladu s muži a ženami: H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5 - konkr. u příkladu s jakostí: H 0 : P(x 1 ) = 0,6 ; P(x 2 ) = 0,2 ; P(x 3 ) = 0,2 TEST א 2 DOBRÉ SHODY
Testovaná nulová hypotéza - konkr. u příkladu se známkami: H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2 P(x 4 ) = 0,2 - konkr. u příkladu s kostkou: H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = = P(x 6 ) = 1/6 = P(x 6 ) = 1/6 TEST א 2 DOBRÉ SHODY
Testovaná nulová hypotéza - konkr. u příkladu s hodem třemi kostkami: H 0 : X~Bi(3, 1/6) - konkr. u příkladu s mincí: H 0 : P(x 1 ) = P(x 2 ) = 0,5 Podnět k zamyšlení: Nelze řešit pomocí jiného, nám již známého testu? TEST א 2 DOBRÉ SHODY
Z dat určíme absolutní, tzv. pozorované četnosti n 1 ; n 2 ; …; n r přičemž n 1 +…+ n r = n Pro jednotlivé kategorie spočteme tzv. očekávané četnosti (tj. četnosti, jaké by měly být, kdyby se vše chovalo dle předpokladu) o 1 ; o 2 ; …; o r a to podle vzorce: o i = n·π i (i=1,…,r) TEST א 2 DOBRÉ SHODY
Např. nechť při kontrole jakosti bylo 110 výrobků I. jakosti (n 1 = 110), 56 výrobků II. jakosti (n 2 = 56) 34 zmetků (n 3 = 34), tj. n= 200; při testu, zda π 1 = 0,6; π 2 = 0,2; π 3 = 0,2 při testu, zda π 1 = 0,6; π 2 = 0,2; π 3 = 0,2 dostaneme očekávané četnosti: o 1 = n·π 1 = 200·0,6 = 120 o 2 = n·π 2 = 200·0,2 = 40 o 3 = n·π 3 = 200·0,2 = 40 TEST א 2 DOBRÉ SHODY
Podstatou testové statistiky je porovnání četností pozorovaných s očekávanými: T = Σ (n i − o i ) 2 / o i (i=1…r) Př. (pokrač.): T = (110−120) 2 /120 + T = (110−120) 2 / (56−40) 2 / (34−40) 2 /40 = = 0,83 + 6,40 + 0,90 = 8,13 = 0,83 + 6,40 + 0,90 = 8,13 TEST א 2 DOBRÉ SHODY
Kritický obor : W = א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY Př. (pokrač.): hledáme 95% kvantil rozdělení rozdělení א 2 při 2 DF; W = 5,991; ∞ )
a) Co jsme právě zjistili v úloze s jakostí? T = 8,13; W = 5,991;∞); T W zamítáme H 0 Náš předpoklad není správný. T = 8,13; W = 5,991;∞); T W zamítáme H 0 Náš předpoklad není správný. b) Příslušná pasáž v přehledu vzorců: TEST א 2 DOBRÉ SHODY
Řešení pomocí Excelu: TEST א 2 DOBRÉ SHODY p=0,017 Zamítáme H 0 …shoda s „ručním“ postupem?
TEST א 2 DOBRÉ SHODY Př. 2 Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5 H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5
Např. nechť při průzkumu bylo 30 mužů (n 1 = 30), 40 žen (n 2 = 40), tj. n= 70; při testu, zda π 1 =0,5; π 2 =0,5; při testu, zda π 1 =0,5; π 2 =0,5; dostaneme očekávané četnosti: o 1 = n·π 1 = 70·0,5 = 35 o 2 = n·π 2 = 70·0,5 = 35 TEST א 2 DOBRÉ SHODY
testová statistika T = Σ (n i − o i ) 2 / o i (i=1…r) T = (30−35) 2 / (40−35) 2 /35 = = 0, ,7143 = 1,4286 TEST א 2 DOBRÉ SHODY
Kritický obor : W = א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 1 DF; hledáme 95% kvantil rozdělení א 2 při 1 DF; W = 3,841; ∞ ) T W nelze zamítnout H 0 průzkum nevyvrátil, že je mužů srovnatelně jako žen
TEST א 2 DOBRÉ SHODY Př. 3 Je 10% studentů s 1, 20% s 2, 50% s 3 a 20% se 4? Je 10% studentů s 1, 20% s 2, 50% s 3 a 20% se 4? H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2 H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2
Např. nechť při průzkumu známek studentů bylo 50 studentů s 1 (n 1 = 50), 70 studentů s 2 (n 2 = 70), 200 studentů s 3 (n 3 = 200), 30 studentů zkoušku neudělalo (n 4 = 30), 30 studentů zkoušku neudělalo (n 4 = 30), tj. n= 350; tj. n= 350; při testu, zda π 1 = 0,1; π 2 = 0,2; π 3 = 0,5; π 3 = 0,2 při testu, zda π 1 = 0,1; π 2 = 0,2; π 3 = 0,5; π 3 = 0,2 dostaneme očekávané četnosti: o 1 = 350·0,1 = 35 o 3 = 350·0,5 = 175 o 2 = 350·0,2 = 70 o 4 = 350·0,2 = 70 TEST א 2 DOBRÉ SHODY
Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (50−35) 2 /35 + T = (50−35) 2 / (70−70) 2 / (200−175) 2 / (30-70) 2 /70 = + (30-70) 2 /70 = = 6, , ,8571 = 32,8571 = 6, , ,8571 = 32,8571 TEST א 2 DOBRÉ SHODY
Kritický obor : W = א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 3 DF; hledáme 95% kvantil rozdělení א 2 při 3 DF; W = 7,815; ∞ ) T W zamítáme H 0 rozložení známek není dle předpokladu
TEST א 2 DOBRÉ SHODY Př. 4 Není kostka falešná? Není kostka falešná? H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = P(x 6 ) = 1/6 H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = P(x 6 ) = 1/6
Např. nechť při hodech kostkou padla 5 krát 1 (n 1 = 5), 8 krát 2 (n 2 = 8), 6 krát 3 (n 3 = 6), 10 krát 4 (n 4 = 10), 10 krát 4 (n 4 = 10), 5 krát 5 (n 5 = 7), 5 krát 5 (n 5 = 7), 6 krát 6 (n 6 = 6), tj. n= 40; 6 krát 6 (n 6 = 6), tj. n= 40; při testu, zda π 1 = π 2 = π 3 = π 4 = π 5 = π 6 = 1/6 při testu, zda π 1 = π 2 = π 3 = π 4 = π 5 = π 6 = 1/6 dostaneme očekávané četnosti: o 1 = 40·1/6 = 6,67 o 4 = 40·1/6 = 6,67 o 2 = 40·1/6 = 6,67 o 5 = 40·1/6 = 6,67 o 3 = 40·1/6 = 6,67 o 6 = 40·1/6 = 6,67 TEST א 2 DOBRÉ SHODY
Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (5−6,67) 2 /6,67 + (8−6,67) 2 /6,67 + T = (5−6,67) 2 /6,67 + (8−6,67) 2 /6, (6−6,67) 2 /6,67 + (10−6,67) 2 /6, (5−6,67) 2 /6,67 + (6−6,67) 2 /6,67 = = 2, , , , = 2, , , , , ,0673 = 7, , ,0673 = 7,6401 TEST א 2 DOBRÉ SHODY
Kritický obor : W = א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 5 DF; hledáme 95% kvantil rozdělení א 2 při 5 DF; W = 11,017; ∞ ) T W nelze zamítnout H 0 hod kostkou se chová dle rovnoměrného rozdělení
TEST א 2 DOBRÉ SHODY Př. 5 Chová se hod třemi kostkami podle binomického rozdělení s parametry n=3, =1/6? Chová se hod třemi kostkami podle binomického rozdělení s parametry n=3, =1/6? H 0 : X~Bi(3, 1/6) H 0 : X~Bi(3, 1/6)
Např. nechť při 50 hodech třemi kostkami padla 32 krát žádná šestka (n 1 = 32), 32 krát žádná šestka (n 1 = 32), 15 krát jedna šestka (n 2 = 15), 15 krát jedna šestka (n 2 = 15), 2 krát dvě šestky (n 3 = 2), 2 krát dvě šestky (n 3 = 2), 1 krát tři šestky (n 4 = 1), tj. n= 50; 1 krát tři šestky (n 4 = 1), tj. n= 50; TEST א 2 DOBRÉ SHODY
při testu, zda X ~ Bi(3,1/6) musíme nejprve vypočítat jednotlivé pravděpodobnosti π 1 ; π 2 ; π 3 ; π 4 P(0) = ( ) (1/6) 0 (5/6) 3 = 1 1 (5/6) 3 = 0,5787 P(1) = ( ) (1/6) 1 (5/6) 2 = 3 (1/6) (5/6) 2 = 0,3472 P(2) = ( ) (1/6) 2 (5/6) 1 = 3 (1/6) 2 (5/6) = 0,0694 P(3) = ( ) (1/6) 3 (5/6) 0 = 1 (1/6) 3 1 = 0,0046 dostaneme očekávané četnosti: o 1 = 50·0,5787 = 28,935 o 3 = 50·0,0694 = 3,47 o 2 = 50·0,3472 = 17,36o 4 = 50·0,0046 = 0,
Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (32−28,935) 2 /28,935 + T = (32−28,935) 2 /28, (15−17,36) 2 /17, (2−3,47) 2 /3, (1−0,23) 2 /0,23 = + (1−0,23) 2 /0,23 = = 0, , , ,5778 = 3,846 = 0, , , ,5778 = 3,846 TEST א 2 DOBRÉ SHODY
Kritický obor : W = א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 3 DF; hledáme 95% kvantil rozdělení א 2 při 3 DF; W = 7,815; ∞ ) T W nelze zamítnout H 0 hod třemi kostkami se chová dle binomického rozdělení s parametry n=3, =1/6.