Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilJindřiška Kolářová
1
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání dvou hodnot pravděpodobností určitých jevů v základním souboru Test struktury nominální veličiny Test vztahu dvou nominálních veličin
2
Testování hypotéz Nulová hypotéza H0: pevně daná forma (nerozhoduje slovní formulace problému!); u parametrických testů obsahuje H0 rovnost, v jiných speciálních případech obsahuje H0 např. tvrzení o nezávislosti Alternativní hypotéza H1: doplněk k H0
3
Možnosti při testování:
Testování hypotéz a … P(chyby 1.druhu) … „hladina významnosti“ … volíme před začátkem testu, nejčastější hodnoty 5%, 10%, 1% 1-β … síla testu … pravděpodobnost, že při neplatnosti H0 dojde k jejímu zamítnutí, tedy pravděpodobnost odhalení neplatnosti H0. Platí, že čím vyšší je síla testu, tím lépe. Možnosti při testování: Doopravdy platí H0 platí H1 Dle dat vyberu H0 OK „chyba 2. druhu“ zamítnu H0 „chyba 1.
4
Testování hypotéz Postup rozhodování: a) Formulujeme dvojici stat. hypotéz H0 a H1 na základě slovních hypotéz. b) Z dat spočteme hodnotu testového kriteria T (testové statistiky). c) Pomocí tabulek kritických hodnot určíme při předem zvoleném a kritický obor W pro nulovou hypotézu (jeho doplněk nazýváme obor přijetí H0). d) Pokud T leží ve W (TW), zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní. e) Pokud naopak T neleží ve W (TW), nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní. f) Na základě (ne)zamítnutí H0 formulujeme slovní odpověď.
5
Testování hypotéz Postup rozhodování při použití statistického SW (i např. Excel) – nelze „ručně“: a) Z dat spočte počítač p-hodnotu (P-hodnota … nejnižší hladina významnosti, na které zamítáme H0; je vždy mezi 0-1) b) Porovnáme p-hodnotu s předem zvolenou a c) Pokud je p ≤ a, zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní d) Pokud naopak je p > a, nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní
6
Typy testování hypotéz
Parametrické pro střední hodnotu/y pro pravděpodobnost/i pro rozptyl/y (resp. směr.odchylku/y) Neparametrické testy dobré shody testy nezávislosti
7
PARAMETRICKÝ TEST O PRAVDĚPODOBNOSTI (PODÍLU)
8
DVOUVÝBĚROVÝ PARAMETRICKÝ TEST O SHODĚ DVOU PRAVDĚPODOBNOSTÍ (PODÍLŮ)
X,Y….nezávislé náhodné veličiny
9
TEST א2 DOBRÉ SHODY Sledujeme jednu kategoriální veličinu X (např.):
pohlaví (zastoupení mužů a žen); kvalita výrobku (I.jakost, II.jakost, zmetek); známka ze statistiky (1 až 4); číslo padlé na hrací kostce (1 až 6); počet šestek při hodu třemi kostkami; strana padlá při hodu mincí (rub a líc).
10
TEST א2 DOBRÉ SHODY Chceme prokázat: Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Není kostka falešná? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod mincí podle rovnoměrného rozdělení?
11
TEST א2 DOBRÉ SHODY Testovaná dvojice hypotéz
(obecně pro veličinu X s r-kategoriemi) H0: P(x1) = π1 ; P(x2) = π2 ;…; P(xr) = πr H1: non H0 kde π1,…,πr jsou konkr. čísla: π1+…+πr = 1 H0 : X~ROZDĚLENÍ(PARAMETRY) nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry?
12
TEST א2 DOBRÉ SHODY Z dat určíme absolutní, tzv.
pozorované četnosti n1; n2; …; nr přičemž n1+…+ nr = n Pro jednotlivé kategorie spočteme tzv. očekávané četnosti (tj. četnosti, jaké by měly být, kdyby se vše chovalo dle předpokladu) o1; o2; …; or a to podle vzorce: oi = n·πi (i=1,…,r)
13
TEST א2 DOBRÉ SHODY Testové kritérium Kritický obor
14
TEST א2 DOBRÉ SHODY Řešení pomocí Excelu: P-hodnota = 0,017
Zamítáme H0
15
TEST א2 NEZÁVISLOSTI Sledujeme dvojici kategoriálních veličin X,Y
např. u každého respondenta jeho pohlaví (M-Ž) a dosažené vzdělání (ZŠ-SŠ-VŠ); nebo u každého výrobku jeho kvalitu (I.jakost, II.jakost, zmetek) a to, během jaké směny vznikl (dopolední – odpolední - noční směna);
16
TEST א2 NEZÁVISLOSTI Chceme prokázat:
závisí nebo nezávisí vzdělání na pohlaví? (ve smyslu, zda jsou nebo nejsou mezi muži a ženami významné rozdíly v zastoupení jednotlivých vzdělanostních kategorií)
17
TEST א2 NEZÁVISLOSTI Nebo chceme prokázat:
závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? (ve smyslu, zda jsou nebo nejsou mezi jednotlivými směnami významné rozdíly v zastoupení jednotlivých kvalitativních kategorií)
18
TEST א2 NEZÁVISLOSTI Testovaná dvojice hypotéz:
H0: nezávislost (mezi X a Y) H1: non H0 (tj. závislost mezi X a Y)
19
TEST א2 NEZÁVISLOSTI Data přehledně – kontingenční tabulka pozorovaných absolutních četností: r = počet „řádkových“ kategorií s = počet „sloupcových“ kategorií
20
TEST א2 NEZÁVISLOSTI Kontingenční tabulka - příklad:
např. n12 = 15 n21= 7 n1• = 38 n•1 = 23
21
TEST א2 NEZÁVISLOSTI Očekávané četnosti
Jaké by měly být hodnoty jednotlivých četností, kdyby platila nezávislost? Rozložení pravděpodobností ve všech řádcích jednotlivých kategorií by mělo být stejné jako v součtovém řádku. Co to znamená? Poměr jednotlivých četností musí být konstantní.
22
TEST א2 NEZÁVISLOSTI oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n
Vytvoříme tabulku očekávaných četností: oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n
23
TEST א2 NEZÁVISLOSTI dopol odpol noc suma I.jakost 38 II.jakost 27
Očekávané četnosti dopol odpol noc suma I.jakost 38 II.jakost 27 zmetky 15 23 29 28 80 Tedy o11 = 23.38/80 = 10,925; o21 = 23.27/80 = 7,7625; o31 = 23.15/80 = 4,3125
24
TEST א2 nezávislosti Testové kritérium Kritický obor
25
TESTy א2 POZOR – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; Slabší kritérium: očekávané četnosti byly větší než 1 v každé kategorii očekávané četnosti byly větší než 5 v 80% kategorií. není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie V případě malého souboru a čtyřpolní tabulky lze použít Fisherův test
26
SÍLA ZÁVISLOSTI Pomocí 2 testu nezávislosti rozhodujeme o závislosti, resp. nezávislosti veličin Někdy je nutno určit i sílu případné závislosti, tj. „jak moc spolu veličiny závisí“ K tomu se používají různé koeficienty míry závislosti Koeficienty míry závislosti většinou nabývají hodnot 0 až 1 Čím je hodnota koeficientu blíže 0, tím je závislost menší a naopak čím je blíže k 1, tím je závislost silnější
27
SÍLA ZÁVISLOSTI Pearsonův kontingenční koeficient Cramerovo V
2 koeficient , kde 2 značí testovou charakteristiku 2 testu nezávislosti, n značí počet pozorování Pearsonův kontingenční koeficient Cramerovo V Cohenova (kapa) Pro ≤ 0,4 není závislost, pro ≥ 0,75 silná závislost
28
Asociační tabulka ANO NE suma n11 n12 n1. n21 n22 n2. n.1 n.2 n
zvláštní případ kontingenční závislosti pro r = s = 2, zvláštní případ korelační závislosti dvou znaků, z nichž každý nabývá pouze dvou hodnot – NE(nula) a ANO(jedna). ANO NE suma n11 n12 n1. n21 n22 n2. n.1 n.2 n
29
Síla závislosti v asociační tabulce
Koeficient asociace Čím blíže -1, tím je silnější nepřímá závislost Čím blíže 1, tím je silnější přímá závislost Pro hodnoty blízko 0 není závislost
30
MCNemarův test Obdoba párového t-testu
test pro asociační (obecně kontingenční) tabulku v případě párového uspořádání experimentu, kdy sledujeme výskyt kvalitativní náhodné veličiny X na stejném výběrovém souboru dvakrát po sobě Nulová hypotéza (Procento pozitivních výsledků jsou v obou opakováních shodné) Testové kritérium Kritický obor
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.