Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Testování hypotéz Jana Zvárová. Testování hypotéz je statistickým nástrojem, pomocí něhož lze na základě naměřených dat objektivně ověřit pravdivost nebo.

Podobné prezentace


Prezentace na téma: "Testování hypotéz Jana Zvárová. Testování hypotéz je statistickým nástrojem, pomocí něhož lze na základě naměřených dat objektivně ověřit pravdivost nebo."— Transkript prezentace:

1 Testování hypotéz Jana Zvárová

2 Testování hypotéz je statistickým nástrojem, pomocí něhož lze na základě naměřených dat objektivně ověřit pravdivost nebo nepravdivost nějakého tvrzení o populaci, z níž naměřená data (tj. výběr) pocházejí. Testování hypotéz

3 - při sestavování nulové a alternativní hypotézy pro účely statistické analýzy vycházíme z medicínské hypotézy – tu vyslovuje lékař - statistik poté tuto medicínskou hypotézu převádí na dvě statistické hypotézy - nulovou a alternativní hypotézu Krok 1: Formulace nulové a alternativní hypotézy

4 Nulová hypotéza (H 0 ) Alternativní hypotéza (H 1 ) Tvrzení o populaci, z níž pocházejí analyzovaná data. Situace, která nastane v případě neplatnosti nulové hypotézy. Nulovou a alternativní hypotézu vyslovujeme před shromažďováním dat.  Nulová a alternativní hypotéza

5 •Formulujeme nulovou hypotézu H 0 a alternativu H 1. •Zvolíme hladinu významnosti α. •Získáme data. •Vybereme vhodný statistický test. •Spočteme hodnotu testové statistiky. •Najdeme v tabulkách příslušnou kritickou hodnotu. •Provedeme statistické rozhodování následujícím způsobem: Je-li hodnota testového kritéria větší než kritická hodnota, zamítneme nulovou hypotézu H 0 ve prospěch alternativy H 1 na hladině významnosti α. Obecný postup při testování hypotéz

6 Obecné schéma statistického rozhodování

7 •hladina testu α : pravděpodobnost chyby 1. druhu, tj. zamítnutí platné nulové hypotézy •kritický obor : výsledky pokusu, při nichž se zamítá nulová hypotéza •síla testu (1-β): pravděpodobnost zamítnutí nulové hypotézy, jestliže nulová hypotéza neplatí •kritický obor i hladina testu se volí před pokusem, nezávisle na jeho výsledku Pravidla statistického rozhodování

8 Určíme pravděpodobnost p, s jakou bychom mohli obdržet pozorovaná data nebo data stejně nebo více odporující nulové hypotéze za předpokladu, že je nulová hypotéza pravdivá, tato hodnota se nazývá dosažená hladina významnosti. Čím menší p, tím méně důvěryhodné je H 0. Pro účely statistické analýzy volíme hladinu významnosti a a zamítneme H 0, je-li: Alternativní postup při rozhodnutí o platnosti či neplatnosti hypotézy: ! Dosažená hladina významnosti

9 Chí-kvadrát testy

10 H 0 : P(A i ) = p i, i=1,2,...k (A i tvoří úplný systém vzájemně neslučitelných jevů) H 1 : Ostatní případy Chí-kvadrát test dobré shody

11 H 0 : P(A i ) = 1/6, i=1,2,...6 (A i je náhodný jev, ze na hrací kostce padne číslo i) H 1 : Ostatní případy Zvolíme hladinu významnosti α=5% Test hypotézy o symetrii hrací kostky

12 Provedeme náhodný výběr o rozsahu n=60 : pozorované četnosti očekáváné četnosti Test hypotézy o symetrii hrací kostky

13 Kritická hodnota pro 5 stupňů volnosti 11,07 Nezjistili jsme, že by kostka byla asymetrická na 5% hladině. Test hypotézy o symetrii hrací kostky (pozorovaná četnost – očekávaná četnost) 2 očekávaná četnost       df 

14 ... pozorované (absolutní) četnosti v jednotlivých skupinách Čtyřpolní tabulka

15 Příklad Chceme ověřit, zda progresivní polyartritida (PAP) souvisí s výskytem antigenu HLA-DR4. Domníváme se, že ano (to je naše medicínská hypotéza). Sestavíme tedy nulovou a alternativní hypotézu (nezapomeňte, že nulovou hypotézu volíme opačně, než je dokazované tvrzení). Tedy: H 0 : PAP nesouvisí s výskytem HLA-DR4 H 1 : PAP souvisí s výskytem HLA-DR4

16 - hladina významnosti (α) je předepsaná hodnota, kterou pravděpodobnost chyby I. druhu nesmí překročit Krok 2: Volba hladiny významnosti Obvykle α = 0,05 (zamítáme na 5% hladině - významný výsledek, *), nebo α = 0,01 (zamítáme na hladině 1% - velmi významný výsledek, **), nebo α = 0,001 (zamítáme na hladině 0,1% - velmi vysoce významný výsledek, ***). - hladina významnosti souvisí s chybou I. druhu, které se při rozhodnutí můžeme dopustit (vyjadřuje pravděpodobnost, že zamítneme nulovou hypotézu, která je ve skutečnosti správná).

17 - tato fáze je velmi důležitá a měla by být konzultována se statistikem - sebraný vzorek dat musí být objektivní, reprezentativní a dostatečně velký Příklad - pokračování : Nasbíraná data – pozorované četnosti ve čtyřpolní tabulce Krok 3: Sběr dat

18 Rozhodnutí o platnosti nebo neplatnosti hypotézy činíme na základě vhodného statistického testu. Příklad: Každý statistický test je charakterizován testovou statistikou - funkcí, která ze sesbíraných dat "vytvoří" jediné číslo. Krok 4: Volba vhodného testu

19 Sesbíraná data je třeba zpracovat a dosadit do předpisu testové statistiky. Krok 5: Výpočet hodnoty testové statistiky

20 Výpočet očekávaných hodnot: Výskyt antigenu je rozdělen v poměru 96 : 308 v celém souboru. V případě platnosti hypotézy nezávislosti obou znaků očekáváme, že ve stejném poměru bude rozdělen i výskyt antigenu u osob s PAP a bez PAP. Tedy pro osoby s PAP, u kterých je současně antigen přítomen, tedy políčko (1,1): Očekávaný počet = 96/ = 23 Příklad – pokračování:

21 Naměřené a očekávané hodnoty Bíle jsou vyznačeny četnosti očekávané v případě, že platí hypotéza nezávislosti. Po dosazení: Antigen HLA-DR4 Výskyt PAPAnoNeCelkem Ano Ne Celkem

22 Po dosazení zjištěných hodnot do testové statistiky zamítáme hypotézu, pokud výsledná hodnota přesáhne jistou mez, nazývanou kritická hodnota. Jak tuto hodnotu určit? ? Kritické hodnoty jsou tabelovány. Kritickou hodnotou testu je takové číslo, které testová statistika T překročí v případě, že nulová hypotéza je pravdivá, s pravděpodobností nejvýše a. Krok 5: Určení kritické hodnoty

23 Testová statistika: Rozhodnutí: H 0 zamítáme na 5% hladině významnosti Příklad (dokončení) Zjistili jsme významnou souvislost mezi výskytem antigenu HLA-DR4 a PAP na 5% hladině významnosti.

24 Statistická významnost Klinická významnost Je-li statistický test zamítnut (významný) na předepsané hladině α (hladina významnosti). Je-li efekt významný z hlediska klinické praxe (např. překročení prahové hodnoty). Pojmy statistické a klinické významnosti bývají často ztotožňovány. Toto ztotožnění je však třeba provádět opatrně, neboť bývá nepřesné.  Statistická a klinická významnost

25 Kontingenční tabulky

26 - kontingenční tabulky slouží ke studování vztahů mezi dvěma znaky - kontingenční tabulka typu 2 x 2 se nazývá čtyřpolní tabulka Kontingenční tabulka r x s: Kontingenční tabulky

27 - test shodnosti pravděpodobnostní struktury nějakého znaku za různých podmínek Příklad: H 0 : Věková struktura pacientů ve dvou nemocnicích je stejná H 1 : Věková struktura pacientů se liší Test hypotézy o shodnosti struktur

28 Studie percentuálních zastoupení krevních skupin ve třech krajích severního Skotska. Je ve všech krajích stejné percentuelní zastoupení krevních skupin? Příklad

29 Testová statistika: H 0 :Pravděpodobnosti skupin jsou v jednotlivých krajích stejné. H 1 :Pravděpodobnosti skupin se v jednotlivých krajích liší. Testové kriterium: Rozhodnutí: Závěr: Nezjistili jsme rozdíl v pravděpodobnostech skupin na 5% hladině významnosti. Příklad - pokračování:

30 Hypotéza: H 0 : sledované znaky jsou nezávislé H 1 : sledované znaky jsou závislé Testová statistika: Test hypotézy o nezávislosti

31 Hypotéza: H 0 : p ij =p ji pro všechny dvojice i, j H 1 : Ostatní případy Testová statistika: V tabulce typu c x c Testové kritérium: Test hypotézy o symetrii

32 Př.:Sledujeme barvu očí otce a syna. Je pravděpodobnost, že otec má barvu i a syn barvu j, stejná jako pravděpodobnost, že otec má barvu j a syn barvu i ? Test hypotézy o symetrii

33 Hypotéza: H 0 : pravděpodobnosti jsou stejné H 1 : pravděpodobnosti nejsou stejné Řešení: H 0 tedy zamítáme na hladině 5%. Test hypotézy o symetrii - řešení

34 Mc Nemarův test Test symetrie pro čtyřpolní tabulku Příklad: Máme náhodný výběr 18 pacientů, kteří byli léčeni dvěma různými antihypertenzívy A a B. Každý pacient dostával po dobu 1 měsíce lék A a po odeznění jeho případných účinků dostával po dobu 1 měsíce lék B.

35 Mc Nemarův test

36 H 0 : Procenta úspěšnosti jsou u obou léků shodná H 1 : Procenta úspěšnosti se u obou léků liší Zvolme 5% hladinu významnosti. Testová statistika je = (b-c) 2 /(b+c) Kritickou hodnotu hledáme pro 1 stupeň volnosti.

37 = (b-c) 2 /(b+c)= (3-9) 2 /(3+9)= 36/12=3. Neprokázali jsme tedy významný rozdíl mezi léky na 5% hladině. = 3,84. Mc Nemarův test

38 Kritické hodnoty  2 rozdělení

39 Hustota rozdělení  2


Stáhnout ppt "Testování hypotéz Jana Zvárová. Testování hypotéz je statistickým nástrojem, pomocí něhož lze na základě naměřených dat objektivně ověřit pravdivost nebo."

Podobné prezentace


Reklamy Google