Jak statistika dokazuje závislost

Slides:



Advertisements
Podobné prezentace
Testování hypotéz Jana Zvárová
Advertisements

Testování neparametrických hypotéz
Náhodné veličiny, náhodné chyby
Testování hypotéz Distribuce náhodných proměnných
Testování hypotéz – princip,
Testování statistických hypotéz
Náhodné veličiny, náhodné chyby
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Diskrétní rozdělení Karel Zvára 1.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Kontingenční tabulky.
Analýza variance (ANOVA).
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Princip testování hypotéz, c2 testy.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
PSY717 – statistická analýza dat
Základy testování hypotéz
Inferenční statistika - úvod
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Princip testování hypotéz,  2 testy. Příklad. V dané populaci nejsme schopni v daném okamžiku zjistit počet samců a samic. Předpokládá se (= je teoreticky.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Odhady odhady bodové a intervalové odhady
INDUKTIVNÍ STATISTIKA
Etapy stat.šetření Plán šetření Sběr dat
Statistické testování – základní pojmy
Induktivní statistika - úvod
Test dobré shody Fisherův přesný test McNemar test
Základy statistické indukce
Induktivní statistika
Induktivní statistika
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
- váhy jednotlivých studií
Odhady parametrů základního souboru
Induktivní statistika
Proč statistika ? Dva důvody Popis Inference
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Úvod do induktivní statistiky
příklad: hody hrací kostkou
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Základy statistiky.
Testování hypotéz - pojmy
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Jak statistika dokazuje závislost Karel Zvára katedra pravděpodobnosti a matematické statistiky MFF UK Karel.Zvara@mff.cuni.cz http://www.karlin.mff.cuni.cz/~zvara Jak statistika dokazuje závislost (Pardubice 040916)

teorie pravděpodobnosti  matematická statistika  - pravděpodobnost šestky na hrací kostce TP:  =1/6 (symetrie) MS: na základě pokusu odhadnout pst  nebo rozhodnout o tvrzení, např.  =1/6 např. 15 šestek z 60 hodů: bodový odhad je 0,25, 95% intervalový odhad (0,147; 0,379) Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) příklad 1 Šestnáctileté slečny nosí náušnice častěji než stejně staří hoši náušnice bez náušnic celkem hoši 2 8 10 dívky 3 11 21 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) příklad 2 IQ souvisí se školním prospěchem Jak statistika dokazuje závislost (Pardubice 040916)

princip statistického usuzování (indukce) na základě dat (výběru) soudíme o všech možných datech (populaci) populaci si zpravidla jen představujeme výběr je podmnožinou populace, má být reprezentativní nejlépe to zaručí náhodný výběr rozsah výběru ~ přesnost odhadu Jak statistika dokazuje závislost (Pardubice 040916)

možné populace (náušnice) všechny šestnáctileté dívky (hoši) u nás všechny šestnáctileté studentky (studenti) u nás všechny šestnáctileté studentky (studenti) gymnázií u nás všechny šestnáctileté studentky (studenti) dané třídy dané školy Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) možné výběry náhodný výběr ze seznamu všech náhodný výběr školy, tam náhodný výběr ze seznamu všech (riziko nereprezentativnosti) informace u účastnících celostátního kola ... olympiády (riziko nereprezentativnosti) Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) populace vers. výběr populace výběr pravděpodobnost relativní četnost populační průměr výběrový průměr parametr statistika platnost nulové hypotézy H0 rozhodnutí o nulové hypotéze neznámé, pevné známé, náhodné Jak statistika dokazuje závislost (Pardubice 040916)

statistické rozhodování H0 – tvrzení o populaci, jehož popřením něco dokážeme, (nulová) hypotéza H1 – alternativa, zpravidla (vědecky) dokazované tvrzení o populaci nechceme příliš často něco falešně dokázat (prokázat) předem zvolíme pravděpodobnost takové chyby (hladinu , zpravidla =5%) Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) schéma rozhodování rozhodnutí H0 platí H0 neplatí zamítnout H0 chyba 1. druhu (pst  ) správné rozhodnutí (pst … síla testu) nezamítnout H0 (přijmout) správné rozhodnutí chyba 2. druhu Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) příklad s náušnicemi  d – pst náušnic u dívek  h – pst náušnic u hochů H1:  d >  h H0:  d =  h (pro  d   h bychom dostali stejná pravidla rozhodování) Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) náušnice bez náušnic celkem hoši a b a+b dívky c d c+d a+c b+d n hypotéze H0 svědčí, když podíly osob s náušnicemi jsou podobné: OR – poměr šancí (odds ratio) tj. Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) náušnice bez náušnic celkem hoši a b a+b dívky c d c+d a+c b+d n alternativě svědčí, když podíl hochů s náušnicemi je podst. menší než u dívek: tj. Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) úvaha nutno zachovat hladinu   nechť hypotéza platí fixujme počty hochů, dívek, náušnic (marginální četnosti) pa – pst, že a hochů má náušnice (při pevných marginálních četnostech jsou b, c, d volbou a určeny také) výpočet pravděpodobnosti pa kombinatorickou úvahou Jak statistika dokazuje závislost (Pardubice 040916)

kombinatorický výpočet kolika způsoby lze rozdělit a+c náušnic mezi n osob: kolik z nich dá a náušnic u hochů pa = počet příznivých/počet možných (klasická pravděpodobnost) Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) původní tabulka (a = 2) + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 1 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 1 9 p1 = 0,00156 9 2 ln OR = –3,701 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 0 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 10 p = 0,00003 10 1 ln OR = –  Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 10 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 10 p = 0,00000 11 ln OR =  Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 9 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 9 1 p = 0,0031 1 10 ln OR = 4,500 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 8 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 8 2 p = 0,00702 2 9 ln OR = 2,890 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) tabulka a = 7 + - hoši 2 8 10 dívky 3 11 21 p2 = 0,02105 ln OR = –2,367 7 3 p = 0,05614 3 8 ln OR = 1,828 Jak statistika dokazuje závislost (Pardubice 040916)

shrnutí (Fisherův test) p2+p1+p0=0,02264 a pa OR ln OR 0,00003 0,000 -  1 0,00156 0,025 -3,701 2 0,02105 0,094 -2,367 3 0,11227 0,245 -1,410 7 0,05614 2,625 1,828 8 0,00702 6,222 2,890 9 0,00031 18,000 4,500 10 0,00000 90,000  na 5% hladině zamítáme H0 p2+p1+p0+p8+p9+p10=0,02997 zamítli bychom pro oboustrannou alternativu Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) poznámky pro jakou populaci lze zjištění zobecnit? jiný postup – chí-kvadrát test příklad s IQ – zcela jiný postup, neboť data jsou ve spojitém měřítku, použije se regrese Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) chí-kvadrát test porovnává empirické četnosti nij (skutečně nastaly) s teoretickými četnostmi oij (očekávané na H0) počítá statistiku kde Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) hodnocení H0 zamítá, je-li 2 příliš velké vlastnosti 2 asymptoticky, použitelné, pokud oij dost velké (aspoň 5) jinak Yatesova korekce zmenšením abs. hodnoty každého čitatele před umocněním o 0,5 Jak statistika dokazuje závislost (Pardubice 040916)

Jak statistika dokazuje závislost (Pardubice 040916) náušnice Jak statistika dokazuje závislost (Pardubice 040916)