Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Porovnání dvou vzorků F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)

Podobné prezentace


Prezentace na téma: "Porovnání dvou vzorků F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)"— Transkript prezentace:

1

2 Porovnání dvou vzorků F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)

3 Mám dva vzorky, a chci vědět, jestli se liší Deset krys krmených standardní a deset krmených obohacenou stravou, na jednom roce zjišťuji váhu (nebo počet červených krvinek) Mám x individuí jednoho a y individuí druhého druhu, a chci vědět, jestli se liší druhy délkami zobáků (a věřím, že jsou to náhodné výběry individuí daných druhů)

4 Mám dva vzorky Ty (jejich mateřská rozdělení) se mohou lišit buď variancí nebo střední hodnotou nebo obojím... I dva vzorky z téhož základního souboru se mi vždy budou lišit jak variancí, tak průměrem. Proto mě zajímá, jestli se dva vzorky liší tak moc, že je nepravděpodobné, že by byly vzaty z téhož základního souboru

5 F-test - test shody variancí H 0 :  1 2 =  2 2, alternativa H A :  1 2   2 2 Předpokládáme (tj. určíme, který je vzorek 1, aby: Kritická hodnota pro test na 5% je tedy 97.5% kvantil numerator denominator d.f. POZOR – při prezentaci jakéhokoliv F-testu uvádím vždy df čitatele i df jmenovatele

6 Hodnotu této plochy musím násobit dvěma, abych dostal dosaženou hladinu významnosti

7 Příklad: Kritická hodnota, závisí na dvojích stupních volnosti Dvoustranný test na poměr variancí pro hypotézy H 0 :  1 2 =  2 2 a H A :  1 2  2 2 Data jsou počty můr chycených během noci jedenácti lapači jednoho nebo osmi lapači druhého typu. H 0 :  1 2 =  2 2 H A :  1 2  2 2  =0.05 Lapač typu 1: 41, 34, 33, 36, 40, 25, 31, 37, 34, 30, 38 Lapač typu 2: 52, 57, 62, 55, 64, 57, 56, 55 n 1 = 11, df 1 = 10 n 2 = 8, df 2 = 7 s 1 2 = můr 2 s 2 2 = můr 2 F = 1.42 F 0.05(2),10,7 = 4.76 Nezamítáme proto H 0. P(F  1.42) > 0.50

8 Pokud dojdu k názoru, že se variance neliší, můžu odhadnout společnou varianci Pro můry s p 2 =( ) / (10 + 7) = můr 2. Pozor, neprůkazný výsledek mohl ale být i slabým testem (když je málo pozorování)!

9 Častěji než variance ale porovnáváme střední hodnoty Testujeme nulovou hypotézu H 0 :  1 =  2 proti alternativní H A :  1   2. Klasický t-test Rozdíl průměrů Střední chyba rozdílu průměrů

10 Střední chybu rozdílu průměrů spočítám pomocí odhadu společné variance s 2 p Předpokládám tedy homogenitu variancí Výsledný vzorec potom je

11 Předpoklady t-testu tedy jsou Normalita dat (tj.data mají normální rozdělení v rámci každé skupiny) Homogenita variancí Pozor, nezávislost pozorovnání je předpokladem prakticky pro všechno (nebo ji musím v testu zohlednit), takže i tady

12 Všimněte si, že velikost střední chyby klesá (a síla testu tak stoupá) s počty pozorování ve skupinách; máme-li konstantní celkový počet pozorování, pak je chyba nejmenší při stejné velikosti skupin. Na druhou stranu, stejná velikost skupin je výhodná, ale vůbec není nutná!!!

13 Počet stupňů volnosti je součtem počtu stupňů volnosti pro oba výběry, tedy (n 1 -1) + (n 2 -1) = n 1 + n

14 Dvouvýběrový t-test pro oboustranné hypotézy H 0 :  1 =  2 a H A :  1   2 (které lze také vyjádřit jako H 0 :  1 -  2 = 0 a H A :  1 -  2  0). Data jsou sedimentační časy (v minutách) lidské krve po podání dvou různých léků (B, G). Podán lék B: 8.8, 8.4, 7.9, 8.7, 9.1, 9.6 Podán lék G: 9.9, 9.0, 11.1, 9.6, 8.7, 10.4, 9.5 n 1 = 6n 2 = 7 df 1 = 5df 2 = 6 X 1 = 8.75 minX 2 = 9.74 min SS 1 = minSS 2 = min s p 2 = min2 t 0.05(2), =t 0.05(2),11 = Zamítáme proto H < P(  t   2.475) < 0.05

15 Dnes spíše najdeme plochu “ocásku” a (protože se jedná o dvoustranný test), výsledek znásobíme dvěma. tato plocha má velikost 0, platí tedy že P=0.0308

16 Pokud je narušena homogenita variancí, lze užít aproximaci Welchovo přibližné t s přibližným počtem stupňů volnosti Existují i jiné aproximace t-testu pro různé variance

17 Stejný počet pozorování v obou skupinách není předpokladem t- testu Ale robustnost testu vůči narušení homogenity variancí klesá při výrazně nevyváženém počtu pozorování (a test na homogenitu bude zoufale slabý)

18 Stejný počet pozorování v obou skupinách není předpokladem t- testu Také síla testu klesá s nevyvážeností skupin

19 Narušení normality dat Do vzorce pro t-test vstupují průměry - tedy ony musí mít normální rozdělení Centrální limitní věta – průměry budou mít normální rozdělení, pokud budou založeny na velkém počtu pozorování S vzrůstajícím počtem pozorování roste nejen síla testu, ale i robustnost

20 Podobně jako pro jednovýběrový (párový) t-test, i tady můžeme provést jednostranný test Oboustranný test - testuji nulovou hypotézu H 0 :  1 =  2 proti alternativní H A :  1   2. Jednostranný test - testuji nulovou hypotézu H 0 :  1 >  2 proti alternativní H A :  1 <  2 (nebo opačným směrem)

21 ROZLIŠUJ test jednostranný - oboustranný - jak formuluji nulovou hypotézu t-test jednovýběrový (párový) a dvouvýběrový - jaké je uspořádání pokusu nebo pozorování

22 Párový vs. dvouvýběrový test


Stáhnout ppt "Porovnání dvou vzorků F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)"

Podobné prezentace


Reklamy Google