T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.

Slides:



Advertisements
Podobné prezentace
Číslo projektu CZ.1.07/1.5.00/ Název školy
Advertisements

KÓDOVANIE INFORMÁCIÍ Maroš Malý, 4.C.
Percentá Percentá každý deň a na každom kroku.
NÁZEV: VY_32_INOVACE_05_05_M6_Hanak TÉMA: Dělitelnost
Delavnica za konfiguriranje dostopovnih točk RAČUNALNIŠKA OMREŽJA
ALGORITMIZACE.
Jan Coufal, Julie Šmejkalová, Jiří Tobíšek
Obvod a obsah kruhu Prezentaci Mgr. Jan Kašpara (ZŠ Hejnice) upravila a doplnila Mgr. Eva Kaucká e.
Určitý integrál. Příklad.
Shodné zobrazení, osová souměrnost, středová souměrnost
Opakování na 4. písemnou práci
rtinzartos Napište slova, která obsahují uvedená písmena.
Cvičení Úloha 1: Rozhodněte zda posloupnost znaků v poli délky n tvoří palindrom (slovo, které je stejné při čtení zprava i zleva). Př.: [a,l,e,l,a]
Data Science aneb BigData v praxi
Slovní úlohy pro „autaře“
Emise a absorpce světla
NÁZEV ŠKOLY: Základní škola Hostouň, okres Domažlice,
Problematika spotřebitelských úvěrů
Elektrikcé pole.
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
Dynamická pevnost a životnost Přednášky
Perspektivy budoucnosti lidstva
6. PŘEDNÁŠKA Diagnostické (screeningové) testy v epidemiologii
Základy elektrotechniky
NÁZEV: VY_32_INOVACE_08_12_M9_Hanak TÉMA: Jehlan OBSAH: Objem
Změny skupenství Ing. Jan Havel.
Seminář JČMF Matematika a fyzika ve škole
Test: Mechanické vlastnosti kapalin (1. část)
4.2 Deformace pevného kontinua 4.3 Hydrostatika
A ZÁROVEŇ HNED DOKONALÉ
Tělesa –Pravidelný šestiboký hranol
NÁZEV ŠKOLY: Základní škola Hostouň, okres Domažlice,
8.1.1 Lineární kombinace aritmetických vektorů
Fyzikální veličiny - čas
Číselné soustavy a kódy
Čas a souřadnice Lekce 3 Miroslav Jagelka.
Agregátní trh práce.
Jasnosti hvězd Lekce 10 Miroslav Jagelka.
Název prezentace (DUMu): Jednoduché úročení – řešené příklady
Konstrukce překladačů
DYNAMICKÉ VLASTOSTI ZEMIN A HORNIN
E-projekt: Jak změřit výšku budovy GJŠ
Parametry vedení a stejnosměrná vedení
Martina Litschmannová
Vysoká škola technická a ekonomická v Českých Budějovicích Ústav technicko-technologický Logistika zemního plynu v České republice Autor diplomové práce:
Martina Litschmannová, Adéla Vrtková
ROZDĚLENÍ ÚHLŮ PODLE VELIKOSTI
Rovinný úhel a jeho orientace
Měření optické aktivity 4.1 Úvod (ukázky spekter)
Ohmův zákon Praktické ověření.
Proudy a obvody Náboje v pohybu.
Číselné soustavy a kódy
Práce s nepájivým (kontaktním) polem
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
Máme data – a co dál? (1. část)
NÁZEV: VY_32_INOVACE_06_11_M7_Hanak
Statistická indukce v praxi
NÁZEV: VY_32_INOVACE_08_01_M9_Hanak TÉMA: Soustavy lineárních rovnic
Studená válka.
Výukový materiál zpracovaný v rámci projektu
Ing. Marcela Strakošová
VZNIK ČESKOSLOVENSKA.
Škola ZŠ Masarykova, Masarykova 291, Valašské Meziříčí Autor
PRÁVNÍ ZÁKLADY STÁTU - VLAST
Je obtížnější „dělat“ marketing služby nebo hmotného produktu?
MAPA SVĚTA AFRIKA.
Dvacáté století – vznik Československa
Zakavkazsko.
Osvobození československa (1.)
Protektorát Čechy a Morava
Transkript prezentace:

t - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední hodnota sjetí vlevo (m2) H1: střední hodnota sjetí vpravo ≠ střední hodnota sjetí vlevo Náhodný výběr 6 aut daného typu: Předpoklady: Náhodné proměnné „sjetí vpravo“ a „sjetí vlevo“ pocházejí z normálního rozdělení. rozptyly obou proměnných se rovnají.

Předpoklad normality dat se neověřuje Pokud první soubor pochází z N (m1, s2) a druhý má rozdělení N(m2, s2), pak rozdíl obou náhodných proměnných má rozdělení N(1 - 2, s2). Hodnoty m1, m2, s2 neznáme, víme však, že platnost H0 znamená 1 - 2 = 0 a známe výběrový odhad variance S2 . Jestliže provedeme náhodný výběr s výběrovou střední hodnotou 𝑋 , pak 𝑋 ≈𝑁(1 - 2, S.E.) ≈𝑁(1 - 2, 𝜎 2 𝑛 ). Odtud 𝑛 𝑋 − 𝜇 1 + 𝜇 2 𝜎 ≈𝑁 0, 1 . V našem případě za platnosti H0 je 1 - 2 = 0, ale s2 neznáme. Známe však odhad, výběrovou varianci, 𝑆 2 . Pak ale 𝑋 𝑛 𝑆 ≈ 𝑡 𝑛−1 . Původní testování, zda 1 - 2 = 0 se mění na 𝑋 𝑛 𝑆 = 0, tedy na testování 𝑋 𝑛 𝑆 pomocí Studentovo t-rozdělení s n-1 stupni volnosti.

Poznámka. Konfindenční interval = interval spolehlivosti pro 𝜇 na hladině 1-𝛼 je interval s náhodnými konci, který s jistotou 1- 𝛼 překryje 𝜇. Jestliže první soubor pochází z N (m1, s2) a druhý má rozdělení N(m2, s2), pak rozdíl obou náhodných proměnných má rozdělení N(1 - 2, s2) , v našem případě je to N(0, 𝜎 2 ). Obecně, pokud 1 - 2 = 𝜇 ≠0, pak 𝑛 𝜇 𝜎 ≈𝑁 0, 1 . Nulovou hypotézu H0: 1 - 2 = 𝜇 nezamítáme na hladině 𝛼, pokud existuje kritická hodnota K (𝛼) taková, že −𝐾 𝛼 ≤ 𝑛 𝜎 𝑋 −𝜇 ≤𝐾(𝛼), neboli 𝑋 ∈ <𝜇 − 𝜎𝐾 𝛼 𝑛 , 𝜇+ 𝜎𝐾 𝛼 𝑛 >. H0 naopak zamítáme, pokud 𝑋  (𝜇 − 𝜎𝐾(𝛼) 𝑛 , 𝜇+ 𝜎𝐾(𝛼) 𝑛 ). Jinými slovy pro 1 - 2 = 𝜇=0 je interval spolehlivosti na hladině 1-𝛼 tvaru (− 𝜎𝐾(𝛼) 𝑛 , 𝜎𝐾(𝛼) 𝑛 ). Pokud interval „překryje 0“, H0 nezamítáme, jinak ano.

Náš příklad.   P2 P1

Příklad. Byla sledována hmotnost lidí před a po absolvování diety: H0: před = po H1: před ≠ po Oboustranný test   P2 = 0.0285 P1 = 0.0285

Proto: H1: před – po > 0, tedy před > po H0: před ≤ po Jednostranný test t(7) = 2,277, P = P1 = 0.057 / 2 = 0.0285   Postup. Oboustranný test stanovení H0 stanovení H1 t-hodnota, P Jednostranný test t-hodnota, P/2 Zamítám jednostranný test (P < 0.025) nezamítám oboustranný test (P ≥ 0.05) Zamítám oboustranný test (P < 0.025 < 0.05) nezamítám jednostranný test (P ≥ 0.05 ≥ 0.025)

Jednovýběrový t-test Automat plní sáčky moukou. V každém sáčku by měl být 1 kg. Při testu automatu byly získány následující hodnoty: 0.98, 1.05, 1.03, 0.995, 1.1, 0.998, 1.002,1.03, 0.99,0.99. Vykazuje automat systematickou chybu? H0: automat nevykazuje systematickou chybu H1: automat vykazuje systematickou chybu Střední hodnota 1.0165, t (9) = 1.416571, P = 0.190277 ≥ 0.05 Nezamítám, že automat nevykazuje systematickou chybu.

Dvouvýběrový t-test   H0: střední hodnota přírůstku diety A = střední hodnota přírůstku diety B H1: nerovnost Předpoklady: oba soubory pocházejí z normálního rozdělení, N(m1, s12), N(m2, s22) Porušení rovnosti s1 = s2 vede ke snížení citlivosti testu korekce na nerovnost variancí Porušení rovnosti n1 = n2 vede ke snížení citlivosti testu korekce na nestejný počet pozorování.

Pokud m1 = m2 = 0, SX = SY = S, n1 = n2 = n, dostáváme F - test pro rovnost variancí (homogenity variancí). H0: s1 = s2  s1 / s2 = 1 H1: nerovnost  s1 / s2 ≠ 1

K příkladu. Dieta A: Výběrová střední hodnota 570 g, výběrová S.E. 14.6 Dieta B: 95% interval spolehlivosti pro střední hodnotu (konfindenční interval) je interval s náhodnými konci,který s jistotou 95% překryje teoretickou střední hodnotu (kterou neznám). 95% konfindenční interval pro Dietu A je (532.45, 607.55) Dietu B je (482.45, 549.55)

Pokud se konfindenční intervaly nepřekrývají, prokážeme rozdíl středních hodnot. I když se lehce překrývají, můžeme odhalit rozdíl (jako v tomto příkladu).   Jednostranný t-test: H1: střední hodnota přírůstku diety A > střední hodnota přírůstku diety B H0: střední hodnota přírůstku diety A ≤ střední hodnota přírůstku diety B t (9) = 2.77 , P = 0.011 < 0.05 Tvrdím, že strava A dává větší přírůstky než strava B

Neparametrické testy. Doposud se testování týkalo střední hodnoty (variance) normálního nebo t-rozdělení, neboli Testovala se shoda výběrových a teoretických parametrů známých rozdělení náhodných veličin. Takové testy se nazývají parametrické. Jejich předpokladem je, že výběrové Soubory pocházejí ze známého, většinou normálního rozdělení. Normalita dat se testuje, jak bylo uvedeno,  2 testem, který je velmi citlivý. Proto normalitu dat nezamítáte pouze v případě malého souboru dat. Parametrické testy nejsou citlivé na (slabé) porušení normality (jsou robustní). Z výše uvedeného vyplývá, že se normalita dat netestuje. Víme-li, že typ dat nepochází z normálního rozdělení, pak se snažíme data transformovat do normálního rozdělení můžeme na originální data použít neparametrické testy.

Transformace dat. Jestliže jsou data procentuální, pak nemají normální rozdělení. Jestliže jsou procenta v intervalu <10, 90>%, pak je možno použít parametrické testy bez úprav dat. Jestliže je rozsah dat vně intervalu <10, 90>%, pak se používá arcussinová t transformace dat: 𝑦= arcsin 𝑝/100 , pokud 𝑝∈<0,10> nebo 𝑝∈<90,100> . Standardně (pro použití parametrických testů) předpokládá, že pro měření Vyhovuje model 𝑥= 𝜇 + 𝜀, kde x je měření, 𝜇 je teoretická střední hodnota a 𝜀 je chyba měření. Pokud 𝑥= 𝜇 𝜀, pak log 𝑥= log 𝜇 + log 𝜀 a použije se standardní parametrický test. Závislost 𝑥= 𝜇 𝜀 umějí odhalit balíky statistických programů. Existují další transformace dat – viz například https://meloun.upce.cz/docs/publication/247.pdf

Neparametrické testy. Pokud nemůžeme použít parametrické testy, ani nám není známa transformace dat do normálního rozdělení, lze použít neparametrické testy. Jejich výhodou je, že nemají předpoklad na rozdělení dat, jejich nevýhodou je, že jsou slabé, tj. Že ve srovnání s parametrickými testy odhalí mnohem méně rozdílů. Výpočty jsou založeny na pořadí dat vzestupně (sestupně) uspořádaných. Rozdělení výsledných testových charakteristik často není známo. Aby se získala signifikance (konfindenční interval) pro tyto charakteristiky, provádí se transformace do známých rozdělení, nejčastěji N(0, 1), (ale také t-rozdělení nebo  2 rozdělení). Obdobou párového t-testu je Wilcoxonův párový test, obdobou 2-výběrového t-testu je například Mann Whitney U-test.