NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.

Slides:



Advertisements
Podobné prezentace
Poměrní ukazatelé Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Advertisements

Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.
Období vzniku: duben _inovace_FG.9.48 Autor : Vladimír TesaříkČlověk a svět práce, finanční gramotnost, nové auto.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Funkce Lineární funkce a její vlastnosti 2. Funkce − definice Funkce je předpis, který každému číslu z definičního oboru, který je podmnožinou množiny.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Induktivní statistika
Úvod do testování hypotéz
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Interpolace funkčních závislostí
7. Statistické testování
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Lineární funkce - příklady
ČÍSLO PROJEKTU CZ.1.07/1.5.00/ ČÍSLO MATERIÁLU 1 – Množiny – teorie
Lineární rovnice a nerovnice I.
Testování hypotéz Testování hypotéz o rozdílu průměrů
Marketingový výzkum. Marketingový výzkum Organizace marketingového výzkumu Cíl výzkumu Typ výzkumu Příprava výzkumného projektu Sběr dat Analýza výsledků.
Kvadratické nerovnice
Výběrové metody (Výběrová šetření)
ADDS cviceni Pavlina Kuranova.
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Statistická analýza dat
Párový neparametrický test
Základy statistické indukce
ASTAc/01,03 Biostatistika 6. cvičení
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
Míry asociace obecná definice – síla a směr vztahu
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.
V.a1 Teoretické pozadí statistické analýzy
Opakování: Parametrické testy.
Test z Metodologie – náměty k přípravě
Spojité VELIČINY Vyšetřování normality dat
MNOŽINY.
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
XII. Binomické rozložení
ASTAc/03 Biostatistika 4. cvičení
VY_32_INOVACE_VJ36.
Úvod do praktické fyziky
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Lineární regrese.
Cauchyho rozdělení spojité náhodné veličiny
Analýza variance (ANOVA).
Běžná pravděpodobnostní rozdělení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
KOMBINACE BEZ OPAKOVÁNÍ
Teorie chyb a vyrovnávací počet 1
Náhodný jev, náhodná proměnná
Centrální limitní věta
Lineární funkce a její vlastnosti
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Více náhodných veličin
Grafy kvadratických funkcí
Teorie chyb a vyrovnávací počet 2
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání dvou hodnot pravděpodobností určitých jevů v základním souboru Test struktury nominální veličiny Test vztahu dvou nominálních veličin

Testování hypotéz Nulová hypotéza H0: pevně daná forma (nerozhoduje slovní formulace problému!); u parametrických testů obsahuje H0 rovnost, v jiných speciálních případech obsahuje H0 např. tvrzení o nezávislosti Alternativní hypotéza H1: doplněk k H0

Možnosti při testování: Testování hypotéz a … P(chyby 1.druhu) … „hladina významnosti“ … volíme před začátkem testu, nejčastější hodnoty 5%, 10%, 1% 1-β … síla testu … pravděpodobnost, že při neplatnosti H0 dojde k jejímu zamítnutí, tedy pravděpodobnost odhalení neplatnosti H0. Platí, že čím vyšší je síla testu, tím lépe. Možnosti při testování: Doopravdy platí H0 platí H1 Dle dat vyberu H0 OK „chyba 2. druhu“ zamítnu H0 „chyba 1.

Testování hypotéz Postup rozhodování: a) Formulujeme dvojici stat. hypotéz H0 a H1 na základě slovních hypotéz. b) Z dat spočteme hodnotu testového kriteria T (testové statistiky). c) Pomocí tabulek kritických hodnot určíme při předem zvoleném a kritický obor W pro nulovou hypotézu (jeho doplněk nazýváme obor přijetí H0). d) Pokud T leží ve W (TW), zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní. e) Pokud naopak T neleží ve W (TW), nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní. f) Na základě (ne)zamítnutí H0 formulujeme slovní odpověď.

Testování hypotéz Postup rozhodování při použití statistického SW (i např. Excel) – nelze „ručně“: a) Z dat spočte počítač p-hodnotu (P-hodnota … nejnižší hladina významnosti, na které zamítáme H0; je vždy mezi 0-1) b) Porovnáme p-hodnotu s předem zvolenou a c) Pokud je p ≤ a, zamítáme při daném a nulovou hypotézu ve prospěch hypotézy alternativní d) Pokud naopak je p > a, nelze při daném a zamítnout nulovou hypotézu ve prospěch hypotézy alternativní

Typy testování hypotéz Parametrické pro střední hodnotu/y pro pravděpodobnost/i pro rozptyl/y (resp. směr.odchylku/y) Neparametrické testy dobré shody testy nezávislosti

PARAMETRICKÝ TEST O PRAVDĚPODOBNOSTI (PODÍLU)

DVOUVÝBĚROVÝ PARAMETRICKÝ TEST O SHODĚ DVOU PRAVDĚPODOBNOSTÍ (PODÍLŮ) X,Y….nezávislé náhodné veličiny

TEST א2 DOBRÉ SHODY Sledujeme jednu kategoriální veličinu X (např.): pohlaví (zastoupení mužů a žen); kvalita výrobku (I.jakost, II.jakost, zmetek); známka ze statistiky (1 až 4); číslo padlé na hrací kostce (1 až 6); počet šestek při hodu třemi kostkami; strana padlá při hodu mincí (rub a líc).

TEST א2 DOBRÉ SHODY Chceme prokázat: Jsou muži a ženy zastoupeni rovnoměrně, tedy v poměru 1:1 (50:50 %)? Jsou výrobky dle jakosti zastoupeny v poměru 3:1:1 (60:20:20 %)? Je 10% studentů s 1, 20% s 2, 50% s 3 a x% se 4? Není kostka falešná? Chová se hod třemi kostkami podle binomického rozdělení? Chová se hod mincí podle rovnoměrného rozdělení?

TEST א2 DOBRÉ SHODY Testovaná dvojice hypotéz (obecně pro veličinu X s r-kategoriemi) H0: P(x1) = π1 ; P(x2) = π2 ;…; P(xr) = πr H1: non H0 kde π1,…,πr jsou konkr. čísla: π1+…+πr = 1 H0 : X~ROZDĚLENÍ(PARAMETRY) nebo-li, chová se veličina X dle předpokládaného rozdělení s předpokládanými parametry?

TEST א2 DOBRÉ SHODY Z dat určíme absolutní, tzv. pozorované četnosti n1; n2; …; nr přičemž n1+…+ nr = n Pro jednotlivé kategorie spočteme tzv. očekávané četnosti (tj. četnosti, jaké by měly být, kdyby se vše chovalo dle předpokladu) o1; o2; …; or a to podle vzorce: oi = n·πi (i=1,…,r)

TEST א2 DOBRÉ SHODY Testové kritérium Kritický obor

TEST א2 DOBRÉ SHODY Řešení pomocí Excelu: P-hodnota = 0,017 Zamítáme H0

TEST א2 NEZÁVISLOSTI Sledujeme dvojici kategoriálních veličin X,Y např. u každého respondenta jeho pohlaví (M-Ž) a dosažené vzdělání (ZŠ-SŠ-VŠ); nebo u každého výrobku jeho kvalitu (I.jakost, II.jakost, zmetek) a to, během jaké směny vznikl (dopolední – odpolední - noční směna);

TEST א2 NEZÁVISLOSTI Chceme prokázat: závisí nebo nezávisí vzdělání na pohlaví? (ve smyslu, zda jsou nebo nejsou mezi muži a ženami významné rozdíly v zastoupení jednotlivých vzdělanostních kategorií)

TEST א2 NEZÁVISLOSTI Nebo chceme prokázat: závisí nebo nezávisí kvalita výrobku na tom, během jaké směny vznikl? (ve smyslu, zda jsou nebo nejsou mezi jednotlivými směnami významné rozdíly v zastoupení jednotlivých kvalitativních kategorií)

TEST א2 NEZÁVISLOSTI Testovaná dvojice hypotéz: H0: nezávislost (mezi X a Y) H1: non H0 (tj. závislost mezi X a Y)

TEST א2 NEZÁVISLOSTI Data přehledně – kontingenční tabulka pozorovaných absolutních četností: r = počet „řádkových“ kategorií s = počet „sloupcových“ kategorií

TEST א2 NEZÁVISLOSTI Kontingenční tabulka - příklad: např. n12 = 15 n21= 7 n1• = 38 n•1 = 23

TEST א2 NEZÁVISLOSTI Očekávané četnosti Jaké by měly být hodnoty jednotlivých četností, kdyby platila nezávislost? Rozložení pravděpodobností ve všech řádcích jednotlivých kategorií by mělo být stejné jako v součtovém řádku. Co to znamená? Poměr jednotlivých četností musí být konstantní.

TEST א2 NEZÁVISLOSTI oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n Vytvoříme tabulku očekávaných četností: oij = ni• ·n•j / n např. o12 = n1• ·n•2 / n

TEST א2 NEZÁVISLOSTI dopol odpol noc suma I.jakost 38 II.jakost 27 Očekávané četnosti   dopol odpol noc suma I.jakost 38 II.jakost 27 zmetky 15 23 29 28 80 Tedy o11 = 23.38/80 = 10,925; o21 = 23.27/80 = 7,7625; o31 = 23.15/80 = 4,3125

TEST א2 nezávislosti Testové kritérium Kritický obor

TESTy א2 POZOR – u obou typů testu (dobré shody i nezávislosti) musí být všechny kategorie dostatečně zastoupeny, aneb všechny očekávané četnosti mají být aspoň 5; Slabší kritérium: očekávané četnosti byly větší než 1 v každé kategorii očekávané četnosti byly větší než 5 v 80% kategorií. není-li splněno, doporučuje se sloučit některé (obvykle sousední) kategorie V případě malého souboru a čtyřpolní tabulky lze použít Fisherův test

SÍLA ZÁVISLOSTI Pomocí 2 testu nezávislosti rozhodujeme o závislosti, resp. nezávislosti veličin Někdy je nutno určit i sílu případné závislosti, tj. „jak moc spolu veličiny závisí“ K tomu se používají různé koeficienty míry závislosti Koeficienty míry závislosti většinou nabývají hodnot 0 až 1 Čím je hodnota koeficientu blíže 0, tím je závislost menší a naopak čím je blíže k 1, tím je závislost silnější

SÍLA ZÁVISLOSTI Pearsonův kontingenční koeficient Cramerovo V 2 koeficient , kde 2 značí testovou charakteristiku 2 testu nezávislosti, n značí počet pozorování Pearsonův kontingenční koeficient Cramerovo V Cohenova  (kapa) Pro  ≤ 0,4 není závislost, pro  ≥ 0,75 silná závislost

Asociační tabulka ANO NE suma n11 n12 n1. n21 n22 n2. n.1 n.2 n zvláštní případ kontingenční závislosti pro r = s = 2, zvláštní případ korelační závislosti dvou znaků, z nichž každý nabývá pouze dvou hodnot – NE(nula) a ANO(jedna).   ANO NE suma  n11  n12 n1. n21  n22  n2. n.1 n.2 n

Síla závislosti v asociační tabulce Koeficient asociace Čím blíže -1, tím je silnější nepřímá závislost Čím blíže 1, tím je silnější přímá závislost Pro hodnoty blízko 0 není závislost

MCNemarův test Obdoba párového t-testu test pro asociační (obecně kontingenční) tabulku v případě párového uspořádání experimentu, kdy sledujeme výskyt kvalitativní náhodné veličiny X na stejném výběrovém souboru dvakrát po sobě Nulová hypotéza (Procento pozitivních výsledků jsou v obou opakováních shodné) Testové kritérium Kritický obor