A5M33IZS – Informační a znalostní systémy Testování modelů.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz Distribuce náhodných proměnných
Testování hypotéz.
Testování statistických hypotéz
A5M33IZS – Informační a znalostní systémy Datová analýza I.
Odhady parametrů základního souboru
Test dobré shody 2 test.
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK211 Základy ekonometrie Heteroskedasticita Cvičení – 8
Lineární regresní analýza Úvod od problému
Statistika II Michal Jurajda.
ZPRACOVÁVÁME KVANTITATIVNÍ DATA II.
Testování závislosti kvalitativních znaků
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Princip testování hypotéz, c2 testy.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
MUDr. Michal Jurajda, PhD. ÚPF LF MU
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Ringier ČR - Výzkumné oddělení
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Lineární regrese.
Závislost dvou kvantitativních proměnných
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Princip maximální entropie
Pohled z ptačí perspektivy
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
PSY717 – statistická analýza dat
Jak statistika dokazuje závislost
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Stručný přehled modelových rozložení I.
Statistické testování – základní pojmy
Test dobré shody Fisherův přesný test McNemar test
Neparametrické testy parametrické a neparametrické testy
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Neparametrické testy parametrické a neparametrické testy
Normální rozdělení a ověření normality dat Modelová rozdělení
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Neparametrické testy pro porovnání polohy
Koncepce normality/normálnosti v medicíně
Úvod do induktivní statistiky
příklad: hody hrací kostkou
Teorie chyb a vyrovnávací počet 1
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Testování hypotéz - pojmy
Transkript prezentace:

A5M33IZS – Informační a znalostní systémy Testování modelů

Testování log-lineárních modelů ||x|| … “ naměřená“ kontingenční tabulka ||m|| … kontingenční tabulka “ odhadnutá ” pro model M Přijměme hypotézu, že daná data uspokojivě popisuje model M A B ||x|| x(A) = (18, 17) x(B) = (15, 20) N = 35 M = (A, B) x(A,B) = x(A). x(B) N 7,710,3 7,39,7 A B ||m|| Hypotézu přijmeme nebo zamítneme? Jsou odlišnosti mezi ||x|| a ||m|| pouze dílem náhody nebo svědčí o neplatnosti naší hypotézy?

Testování log-lineárních modelů Pearsonova statistika Chi-Square test - viz Jsou odlišnosti mezi ||x|| a ||m|| pouze dílem náhody nebo svědčí o neplatnosti naší hypotézy? V našem příkladu: Je to hodně nebo málo ? (tedy ||x|| a ||m|| jsou odlišné) (tedy ||x|| a ||m|| jsou si podobné)

Χ 2 [Chí-square] rozložení Nechá se dokázat, že Pearsonova statistika má χ 2

df = 4 df = 10 X2X2 P(X 2, df) χ 2 rozložení Frekvenční funkce χ 2 rozložení je parametrizována parametrem df (počet stupňů volnosti).

X2X2 P(X 2, df) χ 2 rozložení Dočasně ponechme počet stupňů volnosti stranou

X2X2 P(X 2, df) χ 2 rozložení Dočasně ponechme počet stupňů volnosti stranou Vyšrafovaná oblast = pravděpodobnost chyby prvního druhu = hladina významnosti α X 2 krit (α)

Model přijmeme, když hodnota Pearsonovy statistiky vyšla menší než X 2 krit (α). Při tom se můžeme dopustit dvou druhů chyby: Chyba prvního druhu – zamítneme správnou hypotézu Chyba druhého druhu – přijmeme nesprávnou hypotézu Práh X 2 krit (α) volíme tak, abychom minimalizovali oba druhy chyb Empirie: když volíme hladinu významnosti α (t.j. pravdě- podobnost chyby prvního druhu) v intervalu (0.01 až 0.1), bude i pravděpodobnost chyby druhého druhu “rozumná”. Chyba prvního a druhého druhu

Počet stupňů volnosti odpovídá počtu nezávislých parametrů, které v daném log-lineárním modelu “chybí”, t.j. položili jsme je rovné nulovému vektoru. Počet stupňů volnosti