Testování hypotéz přednáška.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Testování statistických hypotéz
Statistika.
Statistická indukce Teorie odhadu.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Úvod do analýzy rozptylu
Testování parametrických hypotéz
Statistika Ing. Jan Popelka, Ph.D. odborný asistent
Testování hypotéz – princip,
Testování hypotéz.
Testování statistických hypotéz
Odhady parametrů základního souboru
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Cvičení 6 – 25. října 2010 Heteroskedasticita
P‑value ano, či ne? Roman Biskup
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Obecný postup při testování souborů
Tloušťková struktura porostu
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Odhady odhady bodové a intervalové odhady
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Samostatný úkol: Jednovýběrový t-test Dvouvýběrový nepárový t-test
Metrologie   Přednáška č. 5 Nejistoty měření.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Jednovýběrový a párový t - test
Biostatistika Opakování – základy testování hypotéz
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Základy statistické indukce
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Induktivní statistika
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

Testování hypotéz přednáška

Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H0 Hypotéza, jejíž platnost ověřujeme. Značíme je H0. Alternativní hypotéza H1 Říká, co bude platit, když nebude platit nulová hypotéza H0. Říkáme, že testujeme H0 proti H1.

Základní pojmy Testy jednostranné a dvoustranné záleží na formulaci alternativní hypotézy Nulová hypotéza H0: A = B Dvourstranná H1: Jednostranná H1: H1:

Základní pojmy Statistický test Jednoznačné pravidlo, které určuje podmínky, za kterých hypotézu H0 zamítneme nebo nezamítneme. Testovací kritérium (Z) Je funkce náhodného výběru, jejíž tvar je závislý na: testované hypotéze a rozdělení pravděpodobností základního souboru. Kritická oblasti (KO) Je množina hodnot testovacího kritéria, které neptaří do oblasti přípustných hodnot. Oblast přípustných hodnot (OPH) Je množina hodnot testovacího kritéria, které nepatří do kritické oblasti.

Základní pojmy Kritická hranice (KH) Odděluje kritickou oblast od oblasti přípustných hodnot.   Hladina významnosti testu Je pravděpodobnost kritické oblasti Postup testování hypotézy získání údajů (například měřením), stanovení statistického testu s příslušnou kritickou oblastí, dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z zjistíme, kam padla hodnota testovacího kritéria: zda do kritické oblasti nebo do oblasti přípustných hodnot.

Postup testování hypotéz získání údajů (například měřením), stanovení statistického testu s příslušnou kritickou oblastí, dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z zjistíme, kam padla hodnota testovacího kritéria: zda do kritické oblasti nebo = nulovou hypotézu zamítáme do oblasti přípustných hodnot. = nulovou hypotézu nezamítáme

Postup testování hypotéz Pokud Z KO ……… hypotéza H0 se zamítá Říkáme: pokud hodnota testovacího kritéria padne do kritické oblasti, hypotézu H0 zamítáme.   Pokud Z KO ……… hypotéza H0 se nezamítá Říkáme: pokud hodnota testovacího kritéria padne oblasti přípustných hodnot, hypotézu H0 nezamítáme.

Dělení testů hypotéz podle toho zda známe RP Parametrické testy Rozdělení pravděpodobností základního souboru je známé. Testování se týká pouze hodnot parametrů. Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností. Neparametrické testy Neznáme rozdělení pravděpodobností

Dělení testů hypotéz Testy významnosti Rozdělení pravděpodobností je známé. Testované hypotézy se týkají pouze parametrů základního souboru. Jednovýb. testy významnosti pro střední hodnotu N-RP Známe δ, Neznáme δ. Jednovýb. Testy významnosti pro rozptyl   Testy shody Týkají se typu rozdělení pravděpodobností základního souboru.

Test pro střední hodnotu pokud: známe δ a soubor má normální RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) δ = směrodatná odchylka náhodného výběru

Test pro střední hodnotu pokud: známe δ a soubor má normální RP Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k  W =

Příklad Podle jízdního řádu je jízdní doba nedělního posilového spoje číslo 13 mezi Strakonicemi a Prahou 100 minut. Po deset neděl byl sledován příjezd tohoto spoje do Prahy a za předpokladu, že autobus vyjel ze Strakonic včas, byly zaznamenány tyto jízdní doby: Na hladině významnosti testujete, zda jízdní doba uvedená v jízdním řádu odpovídá skutečnosti, jestliže víte, že hodnoty pocházejí ze základního souboru s normálním rozložením pravděpodobností se směrodatnou odchylkou δ = 10,3. Datum 7.3. 14.3. 21.3. 28.3 4.4. 11.4. 18.4. 25.4. 2.5. 9.5. Doba 90 112 103 86 98 100 120 89 95

Test pro střední hodnotu pokud: neznáme δ, studentovo RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) s = směrodatná odchylka náhodného výběru (musí se dopočítat)

Test pro střední hodnotu pokud: neznáme δ, studentovo RP Kritická oblast a) dvoustranná alternativní hypotéza H0: EX= k proti H1: EX k  W =

Příklad 10 majitelů vozů Škoda Octavia sledovalo spotřebu paliva, hodnoty jejich měření jsou uvedeny v tabulce. Výrobce udává průměrnou spotřebu tohoto typu automobilu Octavita 8,9 l/100km. Předpokládejme, že spotřeba má normální rozdělení pravděpodobnosti. a) Otestuje na hladině významnosti 0,05, zda se liší spotřeba naměřená majiteli vozů od střední hodnoty dané výrobcem.   b) Otestujte na hladině významnosti 0,05, zda je spotřeba naměřená majiteli vozů významně vyšší než hodnota udaná výrobcem. Majitel 1 2 3 4 5 6 7 8 9 10 Spotř. 10,0 9,3 8,8 9,0 8,85 9,05 8,9 8,95 10,2

Test pro rozptyl Testovací kritérium = rozptyl daný v zadání = výběrový rozptyl

Test pro rozptyl Kritická oblast a) dvoustranná alternativní hypotéza H0: DX= k2 proti H1: DX k2  W =

Příklad Automat vyrábí pístové kroužky o daném průměru. Výrobce udává, že směrodatná odchylka průměru kroužků je 0,05 mm. K ověření této informace bylo vybráno náhodně 80 kroužků a vypočtena směrodatná odchylka jejich průměru s = 0,04 mm. Lze tento rozdíl považovat za významný? Na 5% hladině významnosti testujte hypotézu, že směrodatná odchylka průměru kroužků je rovna 0,05 mm.