TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.

Slides:



Advertisements
Podobné prezentace
Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny
Advertisements

Testování statistických hypotéz
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Náhodné veličiny, náhodné chyby
Testování hypotéz.
Testování statistických hypotéz
Pravděpodobnost 11  Zásobník úloh  Opakování, procvičení VY_32_INOVACE_21-12.
Odhady parametrů základního souboru
Pravděpodobnost a statistika opakování základních pojmů
Generování náhodných veličin (1) Diskrétní rozdělení
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
VY_32_INOVACE_21-06 Pravděpodobnost 6 Zásobník úloh Opakovací lekce.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru
Pravděpodobnost 10 Binomické rozdělení pravděpodobnosti neboli
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Diskrétní rozdělení Karel Zvára 1.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Ringier ČR - Výzkumné oddělení
Nezávislé pokusy.
Biostatistika 5. přednáška Aneta Hybšová
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pár dalších použití statistiky v přírodních vědách
Pohled z ptačí perspektivy
Kombinatorika, pravděpodobnost, statistika
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Jak statistika dokazuje závislost
Aplikovaná statistika 2. Veronika Svobodová
Příklad 1 Urči pravděpodobnost získání výhry ve Sportce pro 4 uhodnutá čísla. Řešení: Ve Sportce se losuje 6 výherních čísel ze 49 čísel v osudí. Výherní.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
TEST DOBRÉ SHODY A TEST NEZÁVISLOSTI Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
1 Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Vladimír Mikulík. Slezské gymnázium, Opava, příspěvková organizace. Vzdělávací materiál.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Induktivní statistika - úvod
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Základy statistické indukce
Neparametrické testy parametrické a neparametrické testy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Absolutní a relativní četnost
Neparametrické testy parametrické a neparametrické testy
Odhady parametrů základního souboru
Pravděpodobnost. Náhodný pokus.
Úvod do statistického testování
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny

Sledujeme jednu kategoriální veličinu X (např.): TEST א 2 DOBRÉ SHODY pohlaví (zastoupení mužů a žen); kvalita výrobku (I.jakost, II.jakost, zmetek); známka ze statistiky (1 až 4); číslo padlé na hrací kostce (1 až 6); počet šestek při hodu třemi kostkami; strana padlá při hodu mincí (rub a líc).

TEST א 2 DOBRÉ SHODY Chceme prokázat: Chceme prokázat: Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Není kostka falešná? Není kostka falešná? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod mincí podle rovnoměrného rozdělení? Chová se hod mincí podle rovnoměrného rozdělení?

Testovaná dvojice hypotéz - obecně pro veličinu X s r-kategoriemi: TEST א 2 DOBRÉ SHODY H 0 : P(x 1 ) = π 1 ; P(x 2 ) = π 2 ;…; P(x r ) = π r H 1 : non H 0 kde π 1,…,π r jsou konkr. čísla: π 1 +…+π r = 1 kde π 1,…,π r jsou konkr. čísla: π 1 +…+π r = 1 H 0 : X~ROZDĚLENÍ(PARAMETRY) nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry? nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry?

01 Testovaná dvojice hypotéz (resp. testovaná H 0, H 1 je konstantní) - konkr. u příkladu s muži a ženami: H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5 - konkr. u příkladu s jakostí: H 0 : P(x 1 ) = 0,6 ; P(x 2 ) = 0,2 ; P(x 3 ) = 0,2 TEST א 2 DOBRÉ SHODY

Testovaná nulová hypotéza - konkr. u příkladu se známkami: H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2 P(x 4 ) = 0,2 - konkr. u příkladu s kostkou: H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = = P(x 6 ) = 1/6 = P(x 6 ) = 1/6 TEST א 2 DOBRÉ SHODY

Testovaná nulová hypotéza - konkr. u příkladu s hodem třemi kostkami: H 0 : X~Bi(3, 1/6) - konkr. u příkladu s mincí: H 0 : P(x 1 ) = P(x 2 ) = 0,5 Podnět k zamyšlení: Nelze řešit pomocí jiného, nám již známého testu? TEST א 2 DOBRÉ SHODY

Z dat určíme absolutní, tzv. pozorované četnosti n 1 ; n 2 ; …; n r přičemž n 1 +…+ n r = n Pro jednotlivé kategorie spočteme tzv. očekávané četnosti (tj. četnosti, jaké by měly být, kdyby se vše chovalo dle předpokladu) o 1 ; o 2 ; …; o r a to podle vzorce: o i = n·π i (i=1,…,r) TEST א 2 DOBRÉ SHODY

Např. nechť při kontrole jakosti bylo 110 výrobků I. jakosti (n 1 = 110), 56 výrobků II. jakosti (n 2 = 56) 34 zmetků (n 3 = 34), tj. n= 200; při testu, zda π 1 = 0,6; π 2 = 0,2; π 3 = 0,2 při testu, zda π 1 = 0,6; π 2 = 0,2; π 3 = 0,2 dostaneme očekávané četnosti: o 1 = n·π 1 = 200·0,6 = 120 o 2 = n·π 2 = 200·0,2 = 40 o 3 = n·π 3 = 200·0,2 = 40 TEST א 2 DOBRÉ SHODY

Podstatou testové statistiky je porovnání četností pozorovaných s očekávanými: T = Σ (n i − o i ) 2 / o i (i=1…r) Př. (pokrač.): T = (110−120) 2 /120 + T = (110−120) 2 / (56−40) 2 / (34−40) 2 /40 = = 0,83 + 6,40 + 0,90 = 8,13 = 0,83 + 6,40 + 0,90 = 8,13 TEST א 2 DOBRÉ SHODY

Kritický obor : W =  א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY Př. (pokrač.): hledáme 95% kvantil rozdělení rozdělení א 2 při 2 DF; W =  5,991; ∞ )

a) Co jsme právě zjistili v úloze s jakostí? T = 8,13; W =  5,991;∞); T  W  zamítáme H 0  Náš předpoklad není správný. T = 8,13; W =  5,991;∞); T  W  zamítáme H 0  Náš předpoklad není správný. b) Příslušná pasáž v přehledu vzorců: TEST א 2 DOBRÉ SHODY

Řešení pomocí Excelu: TEST א 2 DOBRÉ SHODY p=0,017 Zamítáme H 0 …shoda s „ručním“ postupem?

TEST א 2 DOBRÉ SHODY Př. 2 Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5 H 0 : P(x 1 ) = 0,5 ; P(x 2 ) = 0,5

Např. nechť při průzkumu bylo 30 mužů (n 1 = 30), 40 žen (n 2 = 40), tj. n= 70; při testu, zda π 1 =0,5; π 2 =0,5; při testu, zda π 1 =0,5; π 2 =0,5; dostaneme očekávané četnosti: o 1 = n·π 1 = 70·0,5 = 35 o 2 = n·π 2 = 70·0,5 = 35 TEST א 2 DOBRÉ SHODY

testová statistika T = Σ (n i − o i ) 2 / o i (i=1…r) T = (30−35) 2 / (40−35) 2 /35 = = 0, ,7143 = 1,4286 TEST א 2 DOBRÉ SHODY

Kritický obor : W =  א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 1 DF; hledáme 95% kvantil rozdělení א 2 při 1 DF; W =  3,841; ∞ ) T  W  nelze zamítnout H 0  průzkum nevyvrátil, že je mužů srovnatelně jako žen

TEST א 2 DOBRÉ SHODY Př. 3 Je 10% studentů s 1, 20% s 2, 50% s 3 a 20% se 4? Je 10% studentů s 1, 20% s 2, 50% s 3 a 20% se 4? H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2 H 0 : P(x 1 ) = 0,1; P(x 2 ) = 0,2; P(x 3 ) = 0,5; P(x 4 ) = 0,2

Např. nechť při průzkumu známek studentů bylo 50 studentů s 1 (n 1 = 50), 70 studentů s 2 (n 2 = 70), 200 studentů s 3 (n 3 = 200), 30 studentů zkoušku neudělalo (n 4 = 30), 30 studentů zkoušku neudělalo (n 4 = 30), tj. n= 350; tj. n= 350; při testu, zda π 1 = 0,1; π 2 = 0,2; π 3 = 0,5; π 3 = 0,2 při testu, zda π 1 = 0,1; π 2 = 0,2; π 3 = 0,5; π 3 = 0,2 dostaneme očekávané četnosti: o 1 = 350·0,1 = 35 o 3 = 350·0,5 = 175 o 2 = 350·0,2 = 70 o 4 = 350·0,2 = 70 TEST א 2 DOBRÉ SHODY

Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (50−35) 2 /35 + T = (50−35) 2 / (70−70) 2 / (200−175) 2 / (30-70) 2 /70 = + (30-70) 2 /70 = = 6, , ,8571 = 32,8571 = 6, , ,8571 = 32,8571 TEST א 2 DOBRÉ SHODY

Kritický obor : W =  א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 3 DF; hledáme 95% kvantil rozdělení א 2 při 3 DF; W =  7,815; ∞ ) T  W  zamítáme H 0  rozložení známek není dle předpokladu

TEST א 2 DOBRÉ SHODY Př. 4 Není kostka falešná? Není kostka falešná? H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = P(x 6 ) = 1/6 H 0 : P(x 1 ) = P(x 2 ) = P(x 3 ) = P(x 4 ) = P(x 5 ) = P(x 6 ) = 1/6

Např. nechť při hodech kostkou padla 5 krát 1 (n 1 = 5), 8 krát 2 (n 2 = 8), 6 krát 3 (n 3 = 6), 10 krát 4 (n 4 = 10), 10 krát 4 (n 4 = 10), 5 krát 5 (n 5 = 7), 5 krát 5 (n 5 = 7), 6 krát 6 (n 6 = 6), tj. n= 40; 6 krát 6 (n 6 = 6), tj. n= 40; při testu, zda π 1 = π 2 = π 3 = π 4 = π 5 = π 6 = 1/6 při testu, zda π 1 = π 2 = π 3 = π 4 = π 5 = π 6 = 1/6 dostaneme očekávané četnosti: o 1 = 40·1/6 = 6,67 o 4 = 40·1/6 = 6,67 o 2 = 40·1/6 = 6,67 o 5 = 40·1/6 = 6,67 o 3 = 40·1/6 = 6,67 o 6 = 40·1/6 = 6,67 TEST א 2 DOBRÉ SHODY

Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (5−6,67) 2 /6,67 + (8−6,67) 2 /6,67 + T = (5−6,67) 2 /6,67 + (8−6,67) 2 /6, (6−6,67) 2 /6,67 + (10−6,67) 2 /6, (5−6,67) 2 /6,67 + (6−6,67) 2 /6,67 = = 2, , , , = 2, , , , , ,0673 = 7, , ,0673 = 7,6401 TEST א 2 DOBRÉ SHODY

Kritický obor : W =  א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 5 DF; hledáme 95% kvantil rozdělení א 2 při 5 DF; W =  11,017; ∞ ) T  W  nelze zamítnout H 0  hod kostkou se chová dle rovnoměrného rozdělení

TEST א 2 DOBRÉ SHODY Př. 5 Chová se hod třemi kostkami podle binomického rozdělení s parametry n=3,  =1/6? Chová se hod třemi kostkami podle binomického rozdělení s parametry n=3,  =1/6? H 0 : X~Bi(3, 1/6) H 0 : X~Bi(3, 1/6)

Např. nechť při 50 hodech třemi kostkami padla 32 krát žádná šestka (n 1 = 32), 32 krát žádná šestka (n 1 = 32), 15 krát jedna šestka (n 2 = 15), 15 krát jedna šestka (n 2 = 15), 2 krát dvě šestky (n 3 = 2), 2 krát dvě šestky (n 3 = 2), 1 krát tři šestky (n 4 = 1), tj. n= 50; 1 krát tři šestky (n 4 = 1), tj. n= 50; TEST א 2 DOBRÉ SHODY

při testu, zda X ~ Bi(3,1/6) musíme nejprve vypočítat jednotlivé pravděpodobnosti π 1 ; π 2 ; π 3 ; π 4 P(0) = ( )  (1/6) 0  (5/6) 3 = 1  1  (5/6) 3 = 0,5787 P(1) = ( )  (1/6) 1  (5/6) 2 = 3  (1/6)  (5/6) 2 = 0,3472 P(2) = ( )  (1/6) 2  (5/6) 1 = 3  (1/6) 2  (5/6) = 0,0694 P(3) = ( )  (1/6) 3  (5/6) 0 = 1  (1/6) 3  1 = 0,0046 dostaneme očekávané četnosti: o 1 = 50·0,5787 = 28,935 o 3 = 50·0,0694 = 3,47 o 2 = 50·0,3472 = 17,36o 4 = 50·0,0046 = 0,

Testová statistika T: T = Σ (n i − o i ) 2 / o i (i=1…r) T = (32−28,935) 2 /28,935 + T = (32−28,935) 2 /28, (15−17,36) 2 /17, (2−3,47) 2 /3, (1−0,23) 2 /0,23 = + (1−0,23) 2 /0,23 = = 0, , , ,5778 = 3,846 = 0, , , ,5778 = 3,846 TEST א 2 DOBRÉ SHODY

Kritický obor : W =  א 2 ; ∞), kde א 2 značí (1−α)·100% kvantil při r −1 DF TEST א 2 DOBRÉ SHODY hledáme 95% kvantil rozdělení při 3 DF; hledáme 95% kvantil rozdělení א 2 při 3 DF; W =  7,815; ∞ ) T  W  nelze zamítnout H 0  hod třemi kostkami se chová dle binomického rozdělení s parametry n=3,  =1/6.