NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz – princip,
Testování hypotéz.
Testování statistických hypotéz
Odhady parametrů základního souboru
P‑value ano, či ne? Roman Biskup
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Biostatistika 7. přednáška
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Základy testování hypotéz
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
Měření v sociálních vědách „Měřit všechno, co je měřitelné, a snažit se učitnit měřitelným vše, co dosud měřitelné není“. (Galileo Galilei)
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
… jsou bohatší lidé šťastnější?
INDUKTIVNÍ STATISTIKA
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz párový test
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
PSY117 Statistická analýza dat v psychologii Přednáška
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání dvou hodnot pravděpodobností určitých jevů v základním souboru Test struktury nominální veličiny Test vztahu dvou nominálních veličin

Testování hypotéz Nulová hypotéza H0: pevně daná forma (nerozhoduje slovní formulace problému!); u parametrických testů obsahuje H0 rovnost, v jiných speciálních případech obsahuje H0 např. tvrzení o nezávislosti Alternativní hypotéza H1: doplněk k H0

Možnosti při testování: Testování hypotéz a … P(chyby 1.druhu) … „hladina významnosti“ … volíme před začátkem testu, nejčastější hodnoty 5%, 10%, 1% 1-β … síla testu … pravděpodobnost, že při neplatnosti H0 dojde k jejímu zamítnutí, tedy pravděpodobnost odhalení neplatnosti H0. Platí, že čím vyšší je síla testu, tím lépe. Možnosti při testování: Doopravdy platí H0 platí H1 Dle dat vyberu H0 OK „chyba 2. druhu“ zamítnu H0 „chyba 1.

Testování hypotéz Postup rozhodování: a) Formulujeme dvojici stat. hypotéz H0 a H1 na základě slovních hypotéz. b) Z dat spočteme hodnotu testového kriteria T (testové statistiky). c) Pomocí tabulek kritických hodnot určíme při předem zvoleném a kritický obor W pro nulovou hypotézu (jeho doplněk nazýváme obor přijetí H0). d) Pokud T leží ve W (TW), zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní. e) Pokud naopak T neleží ve W (TW), nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní. f) Na základě (ne)zamítnutí H0 formulujeme slovní odpověď.

Testování hypotéz Postup rozhodování při použití statistického SW (i např. Excel) – nelze „ručně“: a) Z dat spočte počítač p-hodnotu (P-hodnota … nejnižší hladina významnosti, na které zamítáme H0; je vždy mezi 0-1) b) Porovnáme p-hodnotu s předem zvolenou a c) Pokud je p ≤ a, zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní d) Pokud naopak je p > a, nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní

Typy testování hypotéz Parametrické pro střední hodnotu/y pro pravděpodobnost/i pro rozptyl/y (resp. směr.odchylku/y) Neparametrické testy dobré shody testy nezávislosti

PARAMETRICKÝ TEST O PRAVDĚPODOBNOSTI (PODÍLU)

DVOUVÝBĚROVÝ PARAMETRICKÝ TEST O SHODĚ DVOU PRAVDĚPODOBNOSTÍ (PODÍLŮ) X,Y….nezávislé náhodné veličiny

TEST א2 DOBRÉ SHODY Sledujeme jednu kategoriální veličinu X (např.): pohlaví (zastoupení mužů a žen); kvalita výrobku (I.jakost, II.jakost, zmetek); známka ze statistiky (1 až 4); číslo padlé na hrací kostce (1 až 6); počet šestek při hodu třemi kostkami; strana padlá při hodu mincí (rub a líc).

TEST א2 DOBRÉ SHODY Chceme prokázat: Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Není kostka falešná? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod mincí podle rovnoměrného rozdělení?

TEST א2 DOBRÉ SHODY Testovaná dvojice hypotéz (obecně pro veličinu X s r-kategoriemi) H0: P(x1) = π1 ; P(x2) = π2 ;…; P(xr) = πr H1: non H0 kde π1,…,πr jsou konkr. čísla: π1+…+πr = 1 H0 : X~ROZDĚLENÍ(PARAMETRY) nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry?

TEST א2 DOBRÉ SHODY Z dat určíme absolutní, tzv. pozorované četnosti n1; n2; …; nr přičemž n1+…+ nr = n Pro jednotlivé kategorie spočteme tzv. očekávané četnosti (tj. četnosti, jaké by měly být, kdyby se vše chovalo dle předpokladu) o1; o2; …; or a to podle vzorce: oi = n·πi (i=1,…,r)

TEST א2 DOBRÉ SHODY Testové kritérium Kritický obor

TEST א2 DOBRÉ SHODY Řešení pomocí Excelu: P-hodnota = 0,017 Zamítáme H0

TEST א2 NEZÁVISLOSTI Sledujeme dvojici kategoriálních veličin X,Y např. u každého respondenta jeho pohlaví (M-Ž) a dosažené vzdělání (ZŠ-SŠ-VŠ); nebo u každého výrobku jeho kvalitu (I.jakost, II.jakost, zmetek) a to, během jaké směny vznikl (dopolední – odpolední - noční směna);

TEST א2 NEZÁVISLOSTI Chceme prokázat: závisí nebo nezávisí vzdělání na pohlaví? (ve smyslu, zda jsou nebo nejsou mezi muži a ženami významné rozdíly v zastoupení jednotlivých vzdělanostních kategorií)

TEST א2 NEZÁVISLOSTI Nebo chceme prokázat: závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? (ve smyslu, zda jsou nebo nejsou mezi jednotlivými směnami významné rozdíly v zastoupení jednotlivých kvalitativních kategorií)

TEST א2 NEZÁVISLOSTI Testovaná dvojice hypotéz: H0: nezávislost (mezi X a Y) H1: non H0 (tj. závislost mezi X a Y)

TEST א2 NEZÁVISLOSTI Data přehledně – kontingenční tabulka pozorovaných absolutních četností: r = počet „řádkových“ kategorií s = počet „sloupcových“ kategorií

TEST א2 NEZÁVISLOSTI Kontingenční tabulka - příklad: např. n12 = 15 n21= 7 n1• = 38 n•1 = 23

TEST א2 NEZÁVISLOSTI Očekávané četnosti Jaké by měly být hodnoty jednotlivých četností, kdyby platila nezávislost? Rozložení pravděpodobností ve všech řádcích jednotlivých kategorií by mělo být stejné jako v součtovém řádku. Co to znamená? Poměr jednotlivých četností musí být konstantní.

TEST א2 NEZÁVISLOSTI oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n Vytvoříme tabulku očekávaných četností: oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n

TEST א2 NEZÁVISLOSTI dopol odpol noc suma I.jakost 38 II.jakost 27 Očekávané četnosti   dopol odpol noc suma I.jakost 38 II.jakost 27 zmetky 15 23 29 28 80 Tedy o11 = 23.38/80 = 10,925; o21 = 23.27/80 = 7,7625; o31 = 23.15/80 = 4,3125

TEST א2 nezávislosti Testové kritérium Kritický obor

TESTy א2 POZOR – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; Slabší kritérium: očekávané četnosti byly větší než 1 v každé kategorii očekávané četnosti byly větší než 5 v 80% kategorií. není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie V případě malého souboru a čtyřpolní tabulky lze použít Fisherův test

SÍLA ZÁVISLOSTI Pomocí 2 testu nezávislosti rozhodujeme o závislosti, resp. nezávislosti veličin Někdy je nutno určit i sílu případné závislosti, tj. „jak moc spolu veličiny závisí“ K tomu se používají různé koeficienty míry závislosti Koeficienty míry závislosti většinou nabývají hodnot 0 až 1 Čím je hodnota koeficientu blíže 0, tím je závislost menší a naopak čím je blíže k 1, tím je závislost silnější

SÍLA ZÁVISLOSTI Pearsonův kontingenční koeficient Cramerovo V 2 koeficient , kde 2 značí testovou charakteristiku 2 testu nezávislosti, n značí počet pozorování Pearsonův kontingenční koeficient Cramerovo V Cohenova  (kappa) Pro  ≤ 0,4 není závislost, pro  ≥ 0,75 silná závislost

Asociační tabulka ANO NE suma n11 n12 n1. n21 n22 n2. n.1 n.2 n zvláštní případ kontingenční závislosti pro r = s = 2, zvláštní případ korelační závislosti dvou znaků, z nichž každý nabývá pouze dvou hodnot – NE(nula) a ANO(jedna).   ANO NE suma  n11  n12 n1. n21  n22  n2. n.1 n.2 n

Síla závislosti v asociační tabulce Koeficient asociace Čím blíže -1, tím je silnější nepřímá závislost Čím blíže 1, tím je silnější přímá závislost Pro hodnoty blízko 0 není závislost

MCNemarův test Obdoba párového t-testu test pro asociační (obecně kontingenční) tabulku v případě párového uspořádání experimentu, kdy sledujeme výskyt kvalitativní náhodné veličiny X na stejném výběrovém souboru dvakrát po sobě Nulová hypotéza (Procento pozitivních výsledků jsou v obou opakováních shodné) Testové kritérium Kritický obor