Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Statistika Ing. Jan Popelka, Ph.D. odborný asistent
Testování neparametrických hypotéz
Náhodné veličiny, náhodné chyby
Testování hypotéz – princip,
Testování hypotéz.
Testování statistických hypotéz
Náhodné veličiny, náhodné chyby
Matematické metody vyhodnocování experimentů
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
4EK211 Základy ekonometrie Autokorelace Cvičení /
P‑value ano, či ne? Roman Biskup
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Základy ekonometrie Cvičení října 2010.
Odhady parametrů základního souboru
Inference jako statistický proces 1
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Pohled z ptačí perspektivy
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Sledujeme (např.): Chceme prokázat: závisí plat na dosaženém vzdělání? závisí plat na dosaženém vzdělání? je u všech čtyř strojů délka výlisků srov- natelná.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
INDUKTIVNÍ STATISTIKA
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Testování hypotéz párový test
Základy statistické indukce
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
- váhy jednotlivých studií
Odhady parametrů základního souboru
Úvod do statistického testování
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)

Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že nezaměstnanost (tj.  ) …činí 10 % (= 0,1) …nepřesahuje 10 % (≤ 0,1)

Testování hypotéz Otestujte,… Ověřte,… Prokažte,… zda plat …závisí na vzdělání …nezávisí na pohlaví

Testování hypotéz Otestujte,… Ověřte,… Prokažte,… zda je rozložení známek dle předpokladu že hrací kostka není falešná že se náhodná veličina „výška osoby“ řídí dle normálního rozdělení s danými parametry

Testování hypotéz Nulová hypotéza H 0 : pevně daná forma (nerozhoduje slovní formulace problému!); u parametrických testů obsahuje H 0 rovnost, v jiných speciálních případech obsahuje H 0 např. tvrzení o nezávislosti Alternativní hypotéza H 1 : doplněk k H 0

Testování hypotéz  = P(chyby 1.druhu) … „hladina významnosti“  … volíme před začátkem testu, nejčastější hodnoty 5%, 10%, 1% Možnosti při testování:Doopravdy platí H 0 Doopravdy platí H 1 Dle dat vyberu H 0 OK „chyba 2. druhu“ Dle dat zamítnu H 0 „chyba 1. druhu“ OK

Testování hypotéz Postup rozhodování: a) Formulujeme dvojici stat. hypotéz H 0 a H 1 na základě slovních hypotéz. b) Z dat spočteme hodnotu testového kriteria T (testové statistiky). c) Pomocí tabulek kritických hodnot určíme při předem zvoleném  kritický obor W pro nulovou hypotézu (jeho doplněk nazýváme obor přijetí H 0 ). d) Pokud T leží ve W (T  W), zamítáme při daném  nulovou hypotézu ve prospěch hypotézy alternativní. e) Pokud naopak T neleží ve W (T  W), nelze při daném  zamítnout nulovou hypotézu ve prospěch hypotézy alternativní. f) Na základě (ne)zamítnutí H 0 formulujeme slovní odpověď.

Testování hypotéz Postup rozhodování při použití statistického SW (i např. Excel) – nelze „ručně“: a) Z dat spočte počítač p-hodnotu (je vždy mezi 0-1) b) Porovnáme p-hodnotu s předem zvolenou  : c) Pokud je p ≤ , zamítáme při daném  nulovou hypotézu ve prospěch hypotézy alternativní d) Pokud naopak je p > , nelze při daném  zamítnout nulovou hypotézu ve prospěch hypotézy alternativní

Typy testování hypotéz Parametrické pro střední hodnotu/y pro pravděpodobnost/i pro rozptyl/y (resp. směr.odchylku/y) Neparametrické testy dobré shody testy nezávislosti

Testování hypotéz Pro střední hodnotu μ : a) H 0 : μ = μ 0 H 1 : μ ≠ μ 0 (oboustranná alternativa) b) H 0 : μ = μ 0 H 1 : μ > μ 0 c) H 0 : μ = μ 0 H 1 : μ < μ 0 (jednostranné alternativy) Vždy μ 0 je konkrétní testovaná hodnota.

Testování hypotéz Pro střední hodnotu μ při známém σ : a) W = (-∞ ; -u 1- α /2  U  u 1- α /2 ; ∞) b) W =  u 1- α ; ∞) c) W = (-∞ ; -u 1- α 

Testování hypotéz Pro μ při známém σ - vzorce:

Testování hypotéz Pro střední hodnotu μ při neznámém σ : a) W = (-∞ ; -t 1- α /2 (n-1)  U  t 1- α /2 (n-1) ; ∞) b) W =  t 1- α (n-1) ; ∞) c) W = (-∞ ; -t 1- α (n-1) 

Testování hypotéz Pro μ při neznámém σ - vzorce:

Testování hypotéz Pro pravděpodobnost  : a) H 0 :  =  0 H 1 :  ≠  0 (oboustranná alternativa) b) H 0 :  =  0 H 1 :  >  0 c) H 0 :  =  0 H 1 :  <  0 (jednostranné alternativy) Vždy  0 je konkrétní testovaná hodnota.

Testování hypotéz Pro pravděpodobnost π : a) W = (-∞ ; -u 1- α /2  U  u 1- α /2 ; ∞) b) W =  u 1- α ; ∞) c) W = (-∞ ; -u 1- α 

Testování hypotéz Pro pravděpodobnost π - vzorce:

Testování hypotéz Příklad: Dle věku osmi náhodně vybraných čtenářů dětského časopisu ověřte pravdivost tvrzení, že střední věk čtenářů tohoto časopisu je 14 let. Věky popořadě (viz interval spolehlivosti): 12, 14, 15, 12, 15, 14, 12, 15. H 0 : μ=14H 1 : μ≠14

Testování hypotéz Příklad (řešení): průměrný věk=109/8=13,625; s = 1,408 T = (13,625–14)·  8 / 1,408 = -0,753 t 0,975 (7) = 2,365, takže: W = (-∞; -2,365    2,365; ∞)

Testování hypotéz Příklad (výsledek): T  W  nelze zamítnout H 0 Příklad (odpověď): Na 5% hladině významnosti nelze na základě dat zamítnout tvrzení, že střední věk čtenářů činí 14 let. Příklad (k zamyšlení): Je nějaký vztah mezi tímto výsledkem a intervalem spolehlivosti  12,448; 14,802  ?

Testování hypotéz Příklad: V novinách tvrdí, že více než 30% rodin nemá žádné úspory. Ověřte toto tvrzení na 10% hladině významnosti. V novinách tvrdí, že více než 30% rodin nemá žádné úspory. Ověřte toto tvrzení na 10% hladině významnosti. Z 250 oslovených rodin odpovědělo 76 odpovědělo, že nemá uspořeno žádné peníze. Z 250 oslovených rodin odpovědělo 76 odpovědělo, že nemá uspořeno žádné peníze.

Testování hypotéz Příklad (řešení): H 0 :  = 0,3 H 1 :  > 0,3  = 0,1; p = 76/250 = 0,304 T = (0,304 – 0,3).  250/  (0,3.0,7) = 0,138 u 1- α = u 0,9 = 1,28 W =  1,28 ; ∞) T  W … nelze zamítnout H 0

Testování hypotéz Příklad (odpověď): Na 10% hladině významnosti jsme neprokázali, že by více než 30% rodin nemělo žádné úspory.

Testování hypotéz Příklad – jiná varianta: V novinách tvrdí, že alespoň 30% rodin nemá žádné úspory. Ověřte toto tvrzení na 10% hladině významnosti. V novinách tvrdí, že alespoň 30% rodin nemá žádné úspory. Ověřte toto tvrzení na 10% hladině významnosti. Z 250 oslovených rodin odpovědělo 76 odpovědělo, že nemá uspořeno žádné peníze. Z 250 oslovených rodin odpovědělo 76 odpovědělo, že nemá uspořeno žádné peníze.

Testování hypotéz Příklad (řešení): H 0 :  = 0,3 H 1 :  < 0,3  = 0,1; p = 76/250 = 0,304 T = (0,304 – 0,3).  250/  (0,3.0,7) = 0,138 u 1- α = u 0,9 = 1,28 W = (-∞ ; -u 1- α  T  W … nelze zamítnout H 0

Testování hypotéz Příklad (odpověď): Na 10% hladině významnosti jsme prokázali, že alespoň 30% rodin nemá žádné úspory.

Testování hypotéz Srovnání výsledků obou příkladů (odpověď): Na 10% hladině významnosti jsme prokázali, že alespoň 30% rodin nemá žádné úspory, ale nepotvrdili jsme, že více než 30% rodin nemá žádné úspory. To znamená, že přesně 30% rodin nemá žádné úspory (možno dokázat oboustranným testem).

Testování hypotéz Příklad (řešení – oboustranná alternativa): H 0 :  = 0,3 H 1 :  ≠ 0,3  = 0,1; p = 76/250 = 0,304 T = (0,304 – 0,3).  250/  (0,3.0,7) = 0,138 u 1- α/2 = u 0,95 = 1,64 W = (-∞ ; -1,64    1,64 ; ∞) T  W … nelze zamítnout H 0, potvrzeno, že 30% rodin nemá úspory