Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jak statistika dokazuje závislost (Pardubice 040916) 1 Jak statistika dokazuje závislost Karel Zvára katedra pravděpodobnosti a matematické statistiky.

Podobné prezentace


Prezentace na téma: "Jak statistika dokazuje závislost (Pardubice 040916) 1 Jak statistika dokazuje závislost Karel Zvára katedra pravděpodobnosti a matematické statistiky."— Transkript prezentace:

1 Jak statistika dokazuje závislost (Pardubice ) 1 Jak statistika dokazuje závislost Karel Zvára katedra pravděpodobnosti a matematické statistiky MFF UK

2 Jak statistika dokazuje závislost (Pardubice ) 2 teorie pravděpodobnosti  matematická statistika  - pravděpodobnost šestky na hrací kostce TP:  =1/6 (symetrie) MS: na základě pokusu odhadnout pst  nebo rozhodnout o tvrzení, např.  =1/6 např. 15 šestek z 60 hodů: bodový odhad je 0,25, 95% intervalový odhad (0,147; 0,379)

3 Jak statistika dokazuje závislost (Pardubice ) 3 příklad 1 Šestnáctileté slečny nosí náušnice častěji než stejně staří hoši náušnicebez náušnic celkem hoši2810 dívky8311 celkem101121

4 Jak statistika dokazuje závislost (Pardubice ) 4 příklad 2 IQ souvisí se školním prospěchem

5 Jak statistika dokazuje závislost (Pardubice ) 5 princip statistického usuzování (indukce) na základě dat (výběru) soudíme o všech možných datech (populaci) populaci si zpravidla jen představujeme výběr je podmnožinou populace, má být reprezentativní nejlépe to zaručí náhodný výběr rozsah výběru ~ přesnost odhadu

6 Jak statistika dokazuje závislost (Pardubice ) 6 možné populace (náušnice) všechny šestnáctileté dívky (hoši) u nás všechny šestnáctileté studentky (studenti) u nás všechny šestnáctileté studentky (studenti) gymnázií u nás všechny šestnáctileté studentky (studenti) dané třídy dané školy

7 Jak statistika dokazuje závislost (Pardubice ) 7 možné výběry náhodný výběr ze seznamu všech náhodný výběr školy, tam náhodný výběr ze seznamu všech (riziko nereprezentativnosti) informace u účastnících celostátního kola... olympiády (riziko nereprezentativnosti)

8 Jak statistika dokazuje závislost (Pardubice ) 8 populace vers. výběr populacevýběr pravděpodobnostrelativní četnost populační průměrvýběrový průměr parametrstatistika platnost nulové hypotézy H 0 rozhodnutí o nulové hypotéze neznámé, pevnéznámé, náhodné

9 Jak statistika dokazuje závislost (Pardubice ) 9 statistické rozhodování H 0 – tvrzení o populaci, jehož popřením něco dokážeme, (nulová) hypotéza H 1 – alternativa, zpravidla (vědecky) dokazované tvrzení o populaci nechceme příliš často něco falešně dokázat (prokázat) předem zvolíme pravděpodobnost takové chyby (hladinu , zpravidla  =5%)

10 Jak statistika dokazuje závislost (Pardubice ) 10 schéma rozhodování rozhodnutíH 0 platíH 0 neplatí zamítnout H 0 chyba 1. druhu (pst   ) správné rozhodnutí (pst … síla testu) nezamítnout H 0 (přijmout) správné rozhodnutí chyba 2. druhu

11 Jak statistika dokazuje závislost (Pardubice ) 11 příklad s náušnicemi  d – pst náušnic u dívek  h – pst náušnic u hochů H 1 :  d >  h H 0 :  d =  h (pro  d   h bychom dostali stejná pravidla rozhodování)

12 Jak statistika dokazuje závislost (Pardubice ) 12 náušnicebez náušnic celkem hoši aba+b dívky cdc+d celkem a+cb+dn hypotéze H 0 svědčí, když podíly osob s náušnicemi jsou podobné: tj. OR – poměr šancí (odds ratio)

13 Jak statistika dokazuje závislost (Pardubice ) 13 náušnicebez náušnic celkem hoši aba+b dívky cdc+d celkem a+cb+dn alternativě svědčí, když podíl hochů s náušnicemi je podst. menší než u dívek: tj.

14 Jak statistika dokazuje závislost (Pardubice ) 14 úvaha nutno zachovat hladinu   nechť hypotéza platí fixujme počty hochů, dívek, náušnic (marginální četnosti) p a – pst, že a hochů má náušnice (při pevných marginálních četnostech jsou b, c, d volbou a určeny také) výpočet pravděpodobnosti p a kombinatorickou úvahou

15 Jak statistika dokazuje závislost (Pardubice ) 15 kolika způsoby lze rozdělit a + c náušnic mezi n osob: kolik z nich dá a náušnic u hochů p a = počet příznivých/počet možných (klasická pravděpodobnost) kombinatorický výpočet

16 Jak statistika dokazuje závislost (Pardubice ) 16 původní tabulka ( a = 2) +- hoši2810 dívky p 2 = 0,02105 ln OR = –2,367

17 Jak statistika dokazuje závislost (Pardubice ) 17 tabulka a = 1 +- hoši2810 dívky p 1 = 0,00156 ln OR = –3, p 2 = 0,02105 ln OR = –2,367

18 Jak statistika dokazuje závislost (Pardubice ) 18 tabulka a = 0 +- hoši2810 dívky p = 0,00003 ln OR = –  p 2 = 0,02105 ln OR = –2,367

19 Jak statistika dokazuje závislost (Pardubice ) 19 tabulka a = hoši2810 dívky p = 0,00000 ln OR =  p 2 = 0,02105 ln OR = –2,367

20 Jak statistika dokazuje závislost (Pardubice ) 20 tabulka a = 9 +- hoši2810 dívky p = 0,0031 ln OR = 4, p 2 = 0,02105 ln OR = –2,367

21 Jak statistika dokazuje závislost (Pardubice ) 21 tabulka a = 8 +- hoši2810 dívky p = 0,00702 ln OR = 2, p 2 = 0,02105 ln OR = –2,367

22 Jak statistika dokazuje závislost (Pardubice ) 22 tabulka a = 7 +- hoši2810 dívky p = 0,05614 ln OR = 1, p 2 = 0,02105 ln OR = –2,367

23 Jak statistika dokazuje závislost (Pardubice ) 23 shrnutí (Fisherův test) apapa ORln OR 00,000030,000 -  10,001560,025-3,701 20,021050,094-2,367 30,112270,245-1,410 70,056142,6251,828 80,007026,2222,890 90, ,0004, , ,000  p 2 +p 1 +p 0 = 0,02264 na 5% hladině zamítáme H 0 p 2 +p 1 +p 0 +p 8 +p 9 +p 10 = 0,02997 zamítli bychom pro oboustrannou alternativu

24 Jak statistika dokazuje závislost (Pardubice ) 24 poznámky pro jakou populaci lze zjištění zobecnit? jiný postup – chí-kvadrát test příklad s IQ – zcela jiný postup, neboť data jsou ve spojitém měřítku, použije se regrese

25 Jak statistika dokazuje závislost (Pardubice ) 25 chí-kvadrát test porovnává empirické četnosti n ij (skutečně nastaly) s teoretickými četnostmi o ij (očekávané na H 0 ) počítá statistiku kde

26 Jak statistika dokazuje závislost (Pardubice ) 26 hodnocení H 0 zamítá, je-li  2 příliš velké vlastnosti  2 asymptoticky, použitelné, pokud o ij dost velké (aspoň 5) jinak Yatesova korekce zmenšením abs. hodnoty každého čitatele před umocněním o 0,5

27 Jak statistika dokazuje závislost (Pardubice ) 27 náušnice


Stáhnout ppt "Jak statistika dokazuje závislost (Pardubice 040916) 1 Jak statistika dokazuje závislost Karel Zvára katedra pravděpodobnosti a matematické statistiky."

Podobné prezentace


Reklamy Google