Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Testování hypotéz Distribuce náhodných proměnných.

Podobné prezentace


Prezentace na téma: "Testování hypotéz Distribuce náhodných proměnných."— Transkript prezentace:

1 Testování hypotéz Distribuce náhodných proměnných

2 Dominantní mládě ve snůšce: samec nebo samice? Domnívám se, že šanci stát se dominantním mládětem nemají samci a samice stejnou Získal jsem údaje z dvaceti náhodně vybraných hnízd Ve 13 případech byl dominantním mládětem samec, v 7 hnízdech to byla samice Jsou tyto údaje ve shodě s mojí hypotézou?

3 Nulová hypotéza - 1 Ani jasně formulovanou hypotézu nemohu dokázat. Pokud je ale ve zjevném rozporu s daty, mohu ji zamítnout (nemusí to být správné rozhodnutí) Užívám proto „trik“ a formuluji tzv. nulovou hypotézu (H 0 ), která je opakem (doplňkem) mé odborné hypotézy H 0 bývá jednoznačnější než výzkumná hypotéza, např. „neliší se“ – „není změna“: zde „četnost samců i samic je shodná“ P(samec) = P(samice) = 0.5

4 Nulová hypotéza - 2 Pokud by byla H 0 správná, stejně nemohu očekávat, že ve výběru 20 hnízd bude vždy 10 hnízd s dominantní samicí / samcem Potřebuji zjistit, s jakou pravděpodobností se tak velká odlišnost (13 : 7) objeví, pokud H 0 platí Je-li ta pravděpodobnost (P) malá, dám přednost H A (zamítnu H 0 ), s rizikem chyby rovným P Pokud H 0 zamítnu, zvýším tím důvěru ve „svoji“ odbornou hypotézu (H A nebo H 1 )

5 Shoda výsledku 13:7 s H 0 Shodu svých dat s H 0 vyjádřím číselně pomocí testové statistiky (test statistic, testovací kritérium). V mém případě je to: X 2 = (13-10) 2 /10 + (7-10) 2 /10 = 1.8 f - absolutní frekvence, tj. počty nezávislých pozorování k – počet kategorií (zde 2)

6 Pravděpodobnost takové shody Tuto pravděpodobnost mohu určit například „počítačovým experimentem“ H 0 „předstírám“ tak, že volím mezi 1 (samice) a 0 (samec) s p=0.5 dvacetkrát. Získám tak jeden výběr, o kterém vím, že odpovídá H 0 – odpovídá nulovému modelu Pro tento výběr také spočítám testovou statistiku X 2 a celý proces opakuji třeba stokrát...

7 Simulace nulového modelu nebo taky milionkrát... a v tom případě můžeme zúžit intervaly... pokud bychom v každém výběru měli místo 20 třeba 35 hnízd, histogram X 2 se nezmění, tvar závisí jen na k – počtu kategorií

8 Densitní distribuční funkce Histogram konverguje do densitní distribuční funkce, pod její křivkou je plocha rovna 1 To je pravděpodobnost, že X 2 bude >= 0 Mne ale zajímá, jak pravděpodobná je hodnota >= 1.8 Kumulativní densitní distribuční funkce: P = 1.0 – 0.82 = 0.18 Chi-square distribuce s 1 stupněm volnosti  2 1

9 Lze H 0 zamítnout? P = 1.0 – 0.82 = 0.18 (0.1797) Pokud bych H 0 zamítl, je pravděpodobnost, že jsem se tím dopustil chyby, rovna 0.18 – proto H 0 nezamítám. Nemohu ale říct, že jsem ji „dokázal“. Data s ní jen nejsou v rozporu Kdybych v přírodě našel mezi 20 hnízdy patnáct, ve kterých je dominantní samec, hodnota X 2 by byla (25/10)+(25/10) = 5.0 Odpovídající P by bylo 0.025: zamítl bych H 0

10 Tradiční testování hypotéz Dříve, než znám výsledek testu, si zvolím hladinu významnosti  Jen pokud je P <= , zamítám H 0 Tento postup lze alternativně popsat tak, že si pro zvolené  najdu odpovídající hodnotu distribuce, ze které testová statistika pochází za platnosti H 0 – tzv. kritickou hodnotu Pokud je testová statistika větší než kritická hodnota, zamítám H 0

11 Chyba 1. a 2. druhu Dosažená hladina významnosti P představuje pravděpodobnost, že udělám chybu zamítnutím H 0, která je ve skutečnosti správná (pravdivá): chyba 1. druhu Pozor! Z toho nevyplývá, že by 1-P byla pravděpodobnost, že se rozhodnu správně – protože P je podmíněno pravdivostí H 0 Mohu udělat chybu i tím, že H 0 nezamítnu, přestože ve skutečnosti není pravdivá: chyba 2. druhu

12 Chyby v rozhodování o H 0 Pravděpodobnost chyby 2. druhu (  ) obvykle neznáme. 1-  je síla testu Čím větší nároky kladu na  (0.05  0.01  0.001), tím vyšší bude   klesá i s rostoucím počtem pozorování H 0 je ve skutečnosti: Já se rozhodnu takto  správnánesprávná Zamítám H 0 Chyba 1. druhu Správné rozhodnutí Chyba 2. druhu Nezamítám H 0

13 Co se může stát: házím korunou (1) Skutečnost: koruna je OK, tj. P 0 =P 1 =0,5 (ALE TO MY NEVÍME) Ze 100 hodů dostávám 55:45 Kritická hodnota  2 1 je pro  = 0.05 rovna 3,84 X 2 =(55-50) 2 /50+(45-50) 2 /50 = 1.0 (t.j. < 3,84) Nemohu zamítnout nulovou hypotézu. A to je správné rozhodnutí.

14 Skutečnost: koruna je OK, tj. P 0 =P 1 =0,5 (ALE TO MY NEVÍME) Ze 100 hodů dostávám 60:40 Potom X 2 =(60-50) 2 /50+(40-50) 2 /50 = 4,0 (t.j. > 3,84) Zamítám nulovou hypotézu na 5%-ní hladině významnosti. Udělal jsem chybu prvního druhu - Type I error (a pověsím nevinnýho). Pravděpodobnost této chyby známe: je to . Hladina významnosti  je tedy podmíněná pravděpodobnost zamítnutí nulové hypotézy – podmíněná tím, že nulová hypotéza platí. Co se může stát: házím korunou (2)

15 Skutečnost: koruna je falešná, P 0 =0,6; P 1 =0,4 (ALE TO MY NEVÍME) Ze 100 hodů dostávám 60:40 Potom X 2 =(60-50) 2 /50 + (40-50) 2 /50 = 4,0 (t.j. > 3,84) Zamítám nulovou hypotézu na 5%-ní hladině významnosti Správné rozhodnutí (a pověsím lumpa) Co se může stát: házím korunou (3)

16 Skutečnost: koruna je falešná, P 0 =0,6; P 1 =0,4 (ALE TO MY NEVÍME) Ze 100 hodů dostávám 55:45 Potom X 2 =(55-50) 2 /50+(45-50) 2 /50 = 1,0 (t.j. < 3,84) Nemohu zamítnout nulovou hypotézu. Udělal jsem chybu druhého druhu - Type II error (a osvobodím lumpa). 1 -  je síla testu (power of the test). Obecně platí, že síla testu roste s odchylkou od nulové hypotézy a s počtem pozorování. Protože  neznáme, je správnou formulací výsledku: Na základě dat nemůžeme zamítnout nulovou hypotézu. Formulace Dokázali jsme nulovou hypotézu je nesprávná! Co se může stát: házím korunou (4)

17 Síla testu Pokud bych místo 20 hnízd sledoval třeba 200, distribuce X 2 při platnosti H 0 se nezmění (pořád to bude  2 1 ), ale síla testu vzroste 13 samců z 20: X 2 = (13-10)^2/10+(7-10)^2/10 = 1.8, p = 0.18 (hypotézu nezamítám) 130 samců z 200: X 2 =( )^2/100+(70-100)^2/100 = 18.0, p = (hypotézu zamítám) Proto musíme pracovat se skutečnými počty případů, ne s procenty!

18 Přestávka...

19 Příklady použití: štěpné poměry 3:1 9:3:3:1 Počet stupňů volnosti je počet kategorií - 1, (pro apriorně danou hypotézu), tedy DF=3

20 Příklady použití: poměr pohlaví H 0 - 1:1 Pozor na předpoklady! Nezávislost pozorování Stejná pravděpodobnost V praxi tedy může být zamítnutí nulové hypotézy důsledkem tří věcí: (1) Nulová hypotéza neplatí (2) Nulová hypotéza platí, ale dopustili jsme se chyby 1. druhu. (3) Nulová hypotéza platí, ale nejsou splněny všechny předpoklady pro užití testu

21 Příklady použití: etologie Orientace včel podle barvy terče H 0 - 1:1:1 Jak zajistit nezávislost? Pevná velikost výběru

22 Příklady použití: populační genetika Hardy-Weinbergovská rovnováha: (p+q) 2 = p 2 + 2pq + q 2 Pozor: odečítáme ještě jeden stupeň volnosti na parametr, který odhadujeme z dat, takže DF= = 1

23 Náš první statistický test Všechny uváděné příklady srovnávají počty případů ve 2 nebo více kategoriích s teoretickými počty, vypočtenými na základě apriorní hypotézy a znalosti celkového N (s výjimkou H.-W. rovnováhy) Tento test se nazývá test dobré shody (chi-square goodness of fit test)

24 Jak výsledky tohoto testu prezentuji „výsledek je průkazný při  = 0.05“ („result is significant at the level  = 0.05“) „četnosti pohlaví mezi dominantními mláďaty se průkazně neliší (  2 = 1.8, df=1, n.s.)“ nebo – pro jiná data – „rozdíl v četnostech je průkazný (  2 = 6.66, df=1, P<0.05)“ případně... „df=1, P= )“

25 Pro všechny testy Míra odchylky našich dat od hodnot očekávaných při platnosti H0 je měřená testovou statistikou Distribuce hodnot testové statistiky za platnosti H0 a splnění dalších předpokladů (přinejmenším nezávislosti pozorování) je známá (  2, t, F distribuce) Je-li málo pravděpodobné, že pro naše data spočtená testová statistika z této distribuce pochází, je také malá šance, že uděláme chybu zamítnutím H0

26 Užití  2 pro celá čísla Tento histogram ve skutečnosti shrnuje hodnoty proměnné s  2 distribucí, nikoliv hodnoty vytvářené „simulací“ 20 pozorování Ten by vypadal takto: vliv na distribuci, => p Tento problém je výrazný pro malé očekávané četnosti (< 5), v takových případech se doporučuje tzv. Yatesova korekce

27 Distribuční funkce obecněji Kvantil  2 5 (0.5) Kritická hodnota  2 5 (0.95) – pro  =0.05 Tail area probability

28 Too good to be true Někdy je hodnota testové statistiky překvapivě nízká – např. zde P=0.99 Nešlo by takovou situaci považovat za „důkaz pravdivosti“ H 0 ? „Too good to be true“: málo pravděpodobné, že tak dobrou shodu dostanu...

29 Too good to be true... Děkuji za pozornost...


Stáhnout ppt "Testování hypotéz Distribuce náhodných proměnných."

Podobné prezentace


Reklamy Google