TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
kvantitativních znaků
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz.
Odhady parametrů základního souboru
Test dobré shody 2 test.
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Testování hypotéz vymezení důležitých pojmů
Řízení a supervize v sociálních a zdravotnických organizacích
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Ringier ČR - Výzkumné oddělení
Biostatistika 5. přednáška Aneta Hybšová
Charakteristiky variability
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Biostatistika 4. přednáška
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
ADDS cviceni Pavlina Kuranova. Fischerův exaktní test.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
ADDS cviceni Pavlina Kuranova. Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých.
1. cvičení
Mann-Whitney U-test Wilcoxonův test Znaménkový test
TEST DOBRÉ SHODY A TEST NEZÁVISLOSTI Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Neparametrické testy  neparametrické pořadové testy  Chí-kvadrát kontingenční tabulky test dobré shody.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
… jsou bohatší lidé šťastnější?
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Opakování – přehled metod
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Základy statistické indukce
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Neparametrické testy parametrické a neparametrické testy
Induktivní statistika
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Metodologie pro ISK 2 Úvod do práce s daty
příklad: hody hrací kostkou
Statistika a výpočetní technika
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny

TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny

Sledujeme dvojici kategoriálních veličin X,Y TEST א 2 NEZÁVISLOSTI např. u každého respondenta jeho pohlaví (M-Ž) a dosažené vzdělání (ZŠ-SŠ-VŠ); nebo u každého výrobku jeho kvalitu (I.jakost, II.jakost, zmetek) a to, během jaké směny vznikl (dopolední – odpolední - noční směna);

Chceme prokázat: závisí nebo nezávisí vzdělání na pohlaví? závisí nebo nezávisí vzdělání na pohlaví? TEST א 2 NEZÁVISLOSTI (ve smyslu, zda jsou nebo nejsou mezi muži a ženami významné rozdíly v zastoupení jednotlivých vzdělanostních kategorií)

Nebo chceme prokázat: závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? TEST א 2 NEZÁVISLOSTI (ve smyslu, zda jsou nebo nejsou mezi jednotlivými směnami významné rozdíly v zastoupení jednotlivých kvalitativních kategorií)

Testovaná dvojice hypotéz: H 0 : nezávislost (mezi X a Y) H 0 : nezávislost (mezi X a Y) H 1 : non H 0 (tj. závislost mezi X a Y) TEST א 2 NEZÁVISLOSTI

Data:

Data přehledně – kontingenční tabulka pozorovaných absolutních četností: TEST א 2 NEZÁVISLOSTI r = počet „řádkových“ kategorií s = počet „sloupcových“ kategorií

Kontingenční tabulka - příklad: TEST א 2 NEZÁVISLOSTI např. n 12 = 15 n 21 = 7 n 1 = 38 n 1 = 23 n 1 = 38 n 1 = 23

TEST א 2 NEZÁVISLOSTI Očekávané četnosti Jaké by měly být hodnoty jednotlivých četností, kdyby platila nezávislost? Rozložení pravděpodobností ve všech řádcích jednotlivých kategorií by mělo být stejné jako v součtovém řádku. Co to znamená? Poměr jednotlivých četností musí být konstantní.

TEST א 2 NEZÁVISLOSTI Očekávané četnosti dopolodpolnocsuma I.jakost 38 II.jakost 27 zmetky 15 suma V 1.sloupci by měl být počet roven 23/80 z 38 (resp. 27, 15)

TEST א 2 NEZÁVISLOSTI Očekávané četnosti dopolodpolnocsuma I.jakost 38 II.jakost 27 zmetky 15 suma Tedy o 11 = 23.38/80 = 10,925; o 21 = 23.27/80 = 7,7625; o 31 = 23.15/80 = 4,3125

TEST א 2 NEZÁVISLOSTI Očekávané četnosti dopolodpolnocsuma I.jakost 10, II.jakost 7, zmetky4, suma

TEST א 2 NEZÁVISLOSTI Očekávané četnosti - zobecnění

Vytvoříme tabulku očekávaných četností: TEST א 2 NEZÁVISLOSTI o ij = i j o ij = n i ·n j / n např. o 12 = 1 2 např. o 12 = n 1 ·n 2 / n

Očekávané četnosti – příklad (pokrač.): TEST א 2 NEZÁVISLOSTI např. o 12 = 1 2 např. o 12 = n 1 ·n 2 / n = 38·29 / 80 = 13,8 ! součty stejné jako původně (až na zaokr.)!

Podstata testové statistiky : i zde porovnání četností pozorovaných s očekávanými: T = ΣΣ (n ij − o ij ) 2 / o ij (i=1…r, j=1…s) Př. (pokrač.): T = (12−10,9) 2 /10,9 + (15−13,8) 2 /13,8 + (11−13,3) 2 /13,3+ +(7 − 7,8) 2 / 7,8 + (9 − 9,8) 2 / 9,8 + (11 − 9,5) 2 /9,5 + +(4 − 4,3) 2 / 4,3 + (5 − 5,4) 2 / 5,4 +(6−5,3) 2 / 5,3 = = 1,14 = 1,14 (výsledek při nezaokrouhlených o ij : 1,17) (výsledek při nezaokrouhlených o ij : 1,17) TEST א 2 NEZÁVISLOSTI

Kritický obor : W =  א 2 ; ∞ ), kde א 2 značí: (1−α)·100% kvantil při (r −1)·(s−1) DF (1−α)·100% kvantil při (r −1)·(s−1) DF TEST א 2 NEZÁVISLOSTI Př. (pokrač.): hledáme 95% kvantil rozdělení rozdělení א 2 při 4 DF; W =  9,488; ∞ )

a) Co jsme právě zjistili v úloze s jakostí? T = 1,14; W =  9,488;∞)  T  W  nelze zamítnout H 0  průzkum neprokázal závislost kvality výroby na druhu směny b) Příslušná pasáž v přehledu vzorců: TEST א 2 NEZÁVISLOSTI

Řešení pomocí Excelu: TEST א 2 NEZÁVISLOSTI p=0,883 p=0,883…shoda s „ručním“ postupem?

Příklad 2. TEST א 2 NEZÁVISLOSTI Je obdobná struktura dosaženého vzdělání (ZŠ-SŠ-VŠ) mezi muži a mezi ženami? H 0 : nezávislost (tj. shodná struktura) H 1 : non H 0 H 1 : non H 0

TEST א 2 NEZÁVISLOSTI Průzkum M-ZŠM-SŠŽ-VŠM-ZŠM-VŠ M-SŠM-SŠŽ-SŠŽ-ZŠŽ-VŠ Ž-VŠŽ-ZŠM-SŠM-ZŠM-VŠ M-VŠM-SŠM-ZŠŽ-ZŠŽ-SŠ Ž-SŠŽ-SŠŽ-SŠM-VŠŽ-VŠ Ž-SŠŽ-SŠ M-SŠM-VŠŽ-ZŠ M-SŠŽ-SŠM-SŠŽ-ZŠŽ-VŠ Ž-VŠM-SŠŽ-ZŠŽ-VŠŽ-SŠ

TEST א 2 NEZÁVISLOSTI ČETNOSTI počet mužů – 18; počet žen – 22;tj. celkem 40 počet ZŠ – 10; počet SŠ – 18; počet VŠ – 12;tj. celkem 40

TEST א 2 NEZÁVISLOSTI Kontingenční tabulka ZŠSŠVŠCELKEM M49518 Ž69722 CELKEM

TEST א 2 NEZÁVISLOSTI ZŠSŠVŠCELKEM M n 11 n 12 n 13 n1.n1. o 11 o 12 o 13 o1.o1. (n 11 -o 11 ) 2 /o 11 (n 12 -o 12 ) 2 /o 12 (n 13 -o 13 ) 2 /o 13  Ž n 21 n 22 n 23 n2.n2. o 21 o 22 o 23 o2.o2. (n 21 -o 21 ) 2 /o 21 (n 22 -o 22 ) 2 /o 22 (n 23 -o 23 ) 2 /o 23  CELKEM n.1n.1 n.2n.2 n.3n.3 n o.1o.1 o.2o.2 o.3o.3 oo  T

TEST א 2 NEZÁVISLOSTI ZŠSŠVŠCELKEM M ,58,15,418 0, ,10,029630, Ž ,59,96,622 0, , , , CELKEM ,101010, , ,3367

TEST א 2 NEZÁVISLOSTI T = 0,3367; W =  2 0,95 (3-1).(2-1);  ) =  2 0,95 (2);  ) = =  5,991;  ) T  W Nelze zamítnout H 0 Nepotvrdila se závislost vzdělání na pohlaví, tj. muži i ženy mají srovnatelnou strukturu vzdělání

Použitelnost v praxi: pozor – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; pozor – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie TEST א 2 NEZÁVISLOSTI

SÍLA ZÁVISLOSTI Pomocí  2 testu nezávislosti rozhodujeme o závislosti, resp. nezávislosti veličin Někdy je nutno určit i sílu případné závislosti, tj. „jak moc spolu veličiny závisí“ K tomu se používají různé koeficienty míry závislosti Koeficienty míry závislosti většinou nabývají hodnot 0 až 1 Čím je hodnota koeficientu blíže 0, tím je závislost menší a naopak čím je blíže k 1, tím je závislost silnější

SÍLA ZÁVISLOSTI  2 koeficient, kde  2 značí testovou charakteristiku  2 testu nezávislosti, n značí počet pozorování Cohenova  (kapa) Pro  ≤ 0,4 není závislost, pro  ≥ 0,75 silná závislost

SÍLA ZÁVISLOSTI Příklad-pokračování:  2 =  1.14/80 = 0,1194 → 0  není závislost  = ((12+9+6)–(10,9+9,8+5,3))/(80-(10,9+9,8+5,3))= = (27-26)/(80-26) = 1/54 =0,0185 ≤ ≤ 0,4  není závislost