Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.

Podobné prezentace


Prezentace na téma: "T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední."— Transkript prezentace:

1 t - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední hodnota sjetí vlevo (m2) H1: střední hodnota sjetí vpravo ≠ střední hodnota sjetí vlevo Náhodný výběr 6 aut daného typu: Předpoklady: Náhodné proměnné „sjetí vpravo“ a „sjetí vlevo“ pocházejí z normálního rozdělení. rozptyly obou proměnných se rovnají.

2 Předpoklad normality dat se neověřuje
Pokud první soubor pochází z N (m1, s2) a druhý má rozdělení N(m2, s2), pak rozdíl obou náhodných proměnných má rozdělení N(1 - 2, s2). Hodnoty m1, m2, s2 neznáme, víme však, že platnost H0 znamená 1 - 2 = 0 a známe výběrový odhad variance S2 . Jestliže provedeme náhodný výběr s výběrovou střední hodnotou 𝑋 , pak 𝑋 ≈𝑁(1 - 2, S.E.) ≈𝑁(1 - 2, 𝜎 2 𝑛 ). Odtud 𝑛 𝑋 − 𝜇 1 + 𝜇 2 𝜎 ≈𝑁 0, 1 . V našem případě za platnosti H0 je 1 - 2 = 0, ale s2 neznáme. Známe však odhad, výběrovou varianci, 𝑆 2 . Pak ale 𝑋 𝑛 𝑆 ≈ 𝑡 𝑛−1 . Původní testování, zda 1 - 2 = 0 se mění na 𝑋 𝑛 𝑆 = 0, tedy na testování 𝑋 𝑛 𝑆 pomocí Studentovo t-rozdělení s n-1 stupni volnosti.

3 Poznámka. Konfindenční interval = interval spolehlivosti pro 𝜇 na hladině 1-𝛼 je interval s náhodnými konci, který s jistotou 1- 𝛼 překryje 𝜇. Jestliže první soubor pochází z N (m1, s2) a druhý má rozdělení N(m2, s2), pak rozdíl obou náhodných proměnných má rozdělení N(1 - 2, s2) , v našem případě je to N(0, 𝜎 2 ). Obecně, pokud 1 - 2 = 𝜇 ≠0, pak 𝑛 𝜇 𝜎 ≈𝑁 0, 1 . Nulovou hypotézu H0: 1 - 2 = 𝜇 nezamítáme na hladině 𝛼, pokud existuje kritická hodnota K (𝛼) taková, že −𝐾 𝛼 ≤ 𝑛 𝜎 𝑋 −𝜇 ≤𝐾(𝛼), neboli 𝑋 ∈ <𝜇 − 𝜎𝐾 𝛼 𝑛 , 𝜇+ 𝜎𝐾 𝛼 𝑛 >. H0 naopak zamítáme, pokud 𝑋  (𝜇 − 𝜎𝐾(𝛼) 𝑛 , 𝜇+ 𝜎𝐾(𝛼) 𝑛 ). Jinými slovy pro 1 - 2 = 𝜇=0 je interval spolehlivosti na hladině 1-𝛼 tvaru (− 𝜎𝐾(𝛼) 𝑛 , 𝜎𝐾(𝛼) 𝑛 ). Pokud interval „překryje 0“, H0 nezamítáme, jinak ano.

4 Náš příklad. P2 P1

5 Příklad. Byla sledována hmotnost lidí před a po absolvování diety: H0: před = po H1: před ≠ po Oboustranný test P2 = P1 =

6 Proto: H1: před – po > 0, tedy před > po H0: před ≤ po Jednostranný test t(7) = 2,277, P = P1 = / 2 = Postup. Oboustranný test stanovení H0 stanovení H1 t-hodnota, P Jednostranný test t-hodnota, P/2 Zamítám jednostranný test (P < 0.025) nezamítám oboustranný test (P ≥ 0.05) Zamítám oboustranný test (P < < 0.05) nezamítám jednostranný test (P ≥ 0.05 ≥ 0.025)

7 Jednovýběrový t-test Automat plní sáčky moukou. V každém sáčku by měl být 1 kg. Při testu automatu byly získány následující hodnoty: 0.98, 1.05, 1.03, 0.995, 1.1, 0.998, 1.002,1.03, 0.99,0.99. Vykazuje automat systematickou chybu? H0: automat nevykazuje systematickou chybu H1: automat vykazuje systematickou chybu Střední hodnota , t (9) = , P = ≥ 0.05 Nezamítám, že automat nevykazuje systematickou chybu.

8 Dvouvýběrový t-test H0: střední hodnota přírůstku diety A = střední hodnota přírůstku diety B H1: nerovnost Předpoklady: oba soubory pocházejí z normálního rozdělení, N(m1, s12), N(m2, s22) Porušení rovnosti s1 = s2 vede ke snížení citlivosti testu korekce na nerovnost variancí Porušení rovnosti n1 = n2 vede ke snížení citlivosti testu korekce na nestejný počet pozorování.

9 Pokud m1 = m2 = 0, SX = SY = S, n1 = n2 = n, dostáváme
F - test pro rovnost variancí (homogenity variancí). H0: s1 = s2  s1 / s2 = 1 H1: nerovnost  s1 / s2 ≠ 1

10 K příkladu. Dieta A: Výběrová střední hodnota 570 g, výběrová S.E. 14.6 Dieta B: 95% interval spolehlivosti pro střední hodnotu (konfindenční interval) je interval s náhodnými konci,který s jistotou 95% překryje teoretickou střední hodnotu (kterou neznám). 95% konfindenční interval pro Dietu A je (532.45, ) Dietu B je (482.45, )

11 Pokud se konfindenční intervaly nepřekrývají, prokážeme rozdíl středních hodnot.
I když se lehce překrývají, můžeme odhalit rozdíl (jako v tomto příkladu). Jednostranný t-test: H1: střední hodnota přírůstku diety A > střední hodnota přírůstku diety B H0: střední hodnota přírůstku diety A ≤ střední hodnota přírůstku diety B t (9) = 2.77 , P = < 0.05 Tvrdím, že strava A dává větší přírůstky než strava B

12 Neparametrické testy. Doposud se testování týkalo střední hodnoty (variance) normálního nebo t-rozdělení, neboli Testovala se shoda výběrových a teoretických parametrů známých rozdělení náhodných veličin. Takové testy se nazývají parametrické. Jejich předpokladem je, že výběrové Soubory pocházejí ze známého, většinou normálního rozdělení. Normalita dat se testuje, jak bylo uvedeno,  2 testem, který je velmi citlivý. Proto normalitu dat nezamítáte pouze v případě malého souboru dat. Parametrické testy nejsou citlivé na (slabé) porušení normality (jsou robustní). Z výše uvedeného vyplývá, že se normalita dat netestuje. Víme-li, že typ dat nepochází z normálního rozdělení, pak se snažíme data transformovat do normálního rozdělení můžeme na originální data použít neparametrické testy.

13 Transformace dat. Jestliže jsou data procentuální, pak nemají normální rozdělení. Jestliže jsou procenta v intervalu <10, 90>%, pak je možno použít parametrické testy bez úprav dat. Jestliže je rozsah dat vně intervalu <10, 90>%, pak se používá arcussinová t transformace dat: 𝑦= arcsin 𝑝/100 , pokud 𝑝∈<0,10> nebo 𝑝∈<90,100> . Standardně (pro použití parametrických testů) předpokládá, že pro měření Vyhovuje model 𝑥= 𝜇 + 𝜀, kde x je měření, 𝜇 je teoretická střední hodnota a 𝜀 je chyba měření. Pokud 𝑥= 𝜇 𝜀, pak log 𝑥= log 𝜇 + log 𝜀 a použije se standardní parametrický test. Závislost 𝑥= 𝜇 𝜀 umějí odhalit balíky statistických programů. Existují další transformace dat – viz například

14 Neparametrické testy. Pokud nemůžeme použít parametrické testy, ani nám není známa transformace dat do normálního rozdělení, lze použít neparametrické testy. Jejich výhodou je, že nemají předpoklad na rozdělení dat, jejich nevýhodou je, že jsou slabé, tj. Že ve srovnání s parametrickými testy odhalí mnohem méně rozdílů. Výpočty jsou založeny na pořadí dat vzestupně (sestupně) uspořádaných. Rozdělení výsledných testových charakteristik často není známo. Aby se získala signifikance (konfindenční interval) pro tyto charakteristiky, provádí se transformace do známých rozdělení, nejčastěji N(0, 1), (ale také t-rozdělení nebo  2 rozdělení). Obdobou párového t-testu je Wilcoxonův párový test, obdobou 2-výběrového t-testu je například Mann Whitney U-test.


Stáhnout ppt "T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední."

Podobné prezentace


Reklamy Google