Testování hypotéz.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
A5M33IZS – Informační a znalostní systémy Testování modelů.
Testování hypotéz – princip,
Testování statistických hypotéz
Matematické metody vyhodnocování experimentů
Statistické metody v ochraně kulturního dědictví
P‑value ano, či ne? Roman Biskup
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Kontingenční tabulky.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
PSY717 – statistická analýza dat
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Úvod do testování hypotéz
INDUKTIVNÍ STATISTIKA
Testování hypotéz Testování hypotéz o rozdílu průměrů
Homogenita meteorologických pozorování
Interpolace funkčních závislostí
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Testování hypotéz vymezení základních pojmů
Neparametrické testy parametrické a neparametrické testy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Testování hypotéz Testování hypotéz o rozdílu průměrů
Neparametrické testy parametrické a neparametrické testy
Výběrové metody (Výběrová šetření)
Základy zpracování geologických dat testování statistických hypotéz
Základy zpracování geologických dat testování statistických hypotéz
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Spojité VELIČINY Vyšetřování normality dat
Neparametrické testy pro porovnání polohy
XII. Binomické rozložení
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Úvod do induktivní statistiky
příklad: hody hrací kostkou
T-testy, neparametrické metody a analýza rozptylu (lekce 5-6)
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Testování hypotéz

Testování statistických hypotéz Neříkej: „Objevil jsem pravdu!“ ale raději: „Objevil jsem jednu z pravd!“ Libanonsko- americký básník Chalil Gibran (1883 –1931) v knize „The Prophet“

VO x hypotézy:

Typické zdroje hypotéz 1) Požadavek na potřebnou kvalitu produktu 2) Hypotéza je založena na předchozí zkušenosti 3) Hypotéza vychází z teorie, kterou je třeba doložit 4) Hypotéza je pouhým dohadem, založeným na náhodném pozorování

Testování – postup Formulujeme testovanou (nulovou) a alternativní hypotézu Vybereme vhodný test (testové kritérium) Zvolíme hladinu významnosti α (obvykle 0,05 = 5%) Sestrojíme kritický obor W Vypočítáme hodnotu testovacího kritéria Učiníme závěr o prokázání či neprokázání alternativní hypotézy (zamítnutí či nezamítnutí nulové hypotézy)

Testování - pojmy Nulová / alternativní hypotéza Hladina významnosti Testovací kritérium Kritický obor (obor zamítnutí), kritická hodnota, obor přijetí Jednostranné testy – dvojstranné testy

Chí - kvadrát 3 typy testů: chí-kvadrát test je statistická neparametrická metoda, která se používá k zjištění, zda mezi dvěma znaky existuje prokazatelný výrazný vztah. Základní myšlenka chí-kvadrát testu spočívá v porovnání pozorovaných a očekávaných četností. 3 typy testů: · Test homogenity – slouží pro porovnání rozložení (distribuce) kvalitativní veličiny ve dvou nebo více populacích. Test nezávislosti – používá se k posouzení závislosti dvou kvalitativních veličin měřených na prvcích téhož výběru. Test dobré shody - zjišťuje, zda sledovaná veličina má rozdělení pravděpodobnosti určitého typu.

Postup Sestavení kontingenční tabulky (min. 2x2) Pozorované četnosti zjistíme z kontingenční tabulky Očekávané četnosti je nutné vypočítat. Při výpočtu vycházíme z předpokladu, že platí nulová hypotéza. Tedy provádíme-li test homogenity, předpokládáme, že rozložení hodnot sledované kategoriální veličiny je ve všech populacích shodné. Pokud provádíme test nezávislosti, nulová hypotéza předpokládá, že mezi dvěma kvalitativními veličinami není žádná závislost. V případě testu dobré shody předpokládáme, že sledovaná veličina má rozložení daného typu.

Case I. Pozorované četnosti Sloupec1 nekuřáci kuřáci celkem muži 277 Nulová hypotéza: Podíl kuřáků je stejný u mužů i žen. Alternativní hypotéza: Podíl kuřáků u mužů a u žen se liší. Pozorované četnosti Sloupec1 nekuřáci kuřáci celkem muži 277 119 396 ženy 122 66 188 399 185 584

Přepočítané četnosti

Výsledek, tedy dosaženou hladinu statistické významnosti, porovnáme s hodnotou 0,05. Je-li dosažená hladina statistické významnosti menší než 0,05, nulovou hypotézu zamítáme, v opačném případě nulovou hypotézu zamítnout nemůžeme. V tomto příkladu p = 0,220, nulovou hypotézu tedy zamítnout nemůžeme. Nulová hypotéza: Podíl kuřáků je stejný u mužů i žen. Závěr testování zní: Podíl kuřáků je stejný v populaci mužů i žen.

Testy shody Parametrický test - Chí kvadrát test Provést: intervalové rozdělení četností Podmínky: - žádný interval s nulovou četností; maximálně 20% intervalů s četností menší než 5 Testovací kritérium: kde: Ai = pozorovaná četnost a Ei = očekávaná četnost. Pokud je hodnota testovacího kritéria vyšší, než příslušná kritická hodnota rozdělení chí-kvadrát pro ν = (r - 1) stupňů volnosti (kde r = počet intervalů), hypotézu o shodě dvou rozdělení zamítáme (na příslušné hladině významnosti)