Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.

Podobné prezentace


Prezentace na téma: "T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám."— Transkript prezentace:

1 t - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám. Z předchozího zkoumání, nebo z teoretických úvah plyne, že m = m0. Na základě našich pokusů se však zdá, že poslední rovnost neplatí. H0: m = m0. H1: m  m0. V předchozí přednášce byl vysvětlen význam chyby 1. a 2. druhu. V pokusu byl proveden náhodný výběr z N(m, s2) o rozsahu n. Označíme ho X1, …, Xn. Výběrový průměr může při dostatečném rozsahu výběru Dobře aproximovat střední hodnotu m. S.E. = Pokud data pocházejí z normálního rozdělení N(m, s2), pak za platnosti H0 platí, že pochází rovněž z normálního rozdělení

2 To znamená, že Ideální pro platnost H0 je stav , neboli Podle principu statistického testování existuje tedy kritická hodnota k > 0 tak, že H0 nezamítám, jestliže Úpravou této nerovnosti dostáváme , při tom k je voleno tak, aby se nazývá hladina testu. Platí-li předchozí nerovnost, nezamítáme H0 na hladině a, neplatí-li nerovnost, zamítáme H0 na hladině a. Při tom hodnoty k  u(a) byly pro daná a tabelovány. Z historických důvodů se tabelovaly hodnoty pro a = 0.05, 0.025, 0.01, Dnes se z dat vypočítá hodnota , při známých hodnotách m a s se vypočte hodnota výrazu Statistický SW vypočítá příslušnou hodnotu P, tj. pravděpodobnost

3 P se nazývá dosažená hladina významnosti.
Je na tom, kdo pokus vyhodnocuje, kdy zamítne H0 a kdy H0 nezamítne. Z historických důvodů H0 zamítáme, pokud P  0.05. Nerovnost , definuje pro dané a konfindenční interval, neboli interval spolehlivosti pro m na hladině a. Pravděpodobnost, že konfindenční interval překryje m, je 1-a. 2. Neznáme předem hodnotu parametru s. Jestliže X1, …, Xn je náhodný výběr z N (m, s2). Pak Nestranným odhadem parametru s je náhodná veličina Náhodná veličina má Studentovo t-rozdělení s n-1 stupni volnosti (označení tn-1). Interval spolehlivosti pro m při neznámém s je , kde je kritická hodnota t-rozdělení s n-1 stupni volnosti na hladině a, tj.

4 Jednovýběrový t - test. Příklad. Při kontrole balícího automatu na cukr, který plní sáčky o hmotnosti 1 kg, byly zjištěny následující odchylky od 1 kg (v gramech): -3, 2, -2, 0, -1, 2, 5, -4, 2, 0. Vykazuje automat systematickou odchylku? Odchylky představují náhodný výběr a předpokládáme, že pochází z normálního Rozdělení se střední hodnotou m a variabilitou s. Rozsah výběru n = 10. Smyslem pokusu je ukázat, že automat vykazuje odchylku, tj, že m  0 Proto H0: m = 0 H1: m  0

5 Kritická hodnota t9(0.05) = 2.262 2.262 > T = 0.348 Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Příklad. Stejně jako v předchozím, pouze s jiným náhodným výběrem. -3, 10, -1, 0, 20, 4, 10, 0, 10, -1. , , S = 7,355, T = 2.106, t9(0.05) = > T = 2.106 Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Při zpracování na počítači je dosažená hladina významnosti P = > 0.05 H1: m  0 znamená, m > 0 nebo m < 0 ( jedná se o oboustranný test). Podle znaménka usuzujeme, že by mohlo platit m > 0. Znovu formulujeme jednostranný test: H1: m > 0 (alternativní hypotézu formulujeme nejdříve) H0: m  0 (doplněk k H1) Při zpracování na počítači je dosažená hladina významnosti P = /2 < 0.05 Závěr: S pravděpodobností (1- P) > 0.95 lze tvrdit, že automat váží více než 1 kg.

6 Alternativní hypotéza představuje jasný závěr statistického testování, proto při
zpřesňování formulace nejprve formulujeme ji. Statistické balíky programů nejsou zbytečné. Umožňují vytvářet přesnější závěry. Párový t - test. Provádíme 2 měření téže veličiny na jednom objektu. Měření závisejí na měřeném objektu. Výhodou je, že se předpokládá stejnávariabilita 1. i 2. souboru měření. Nevýhodou je závislost na měřeném objektu, tj. ve skutečnosti máme pouze 1 náhodný výběr. Párový t-test se převádí na jednovýběrový t-test odečtením obou hodnot na daném objektu. Příklad. Na 10 myších se testoval vliv léku na změnu hmotnosti. Myši byly zváženy před podáním léku a 12 hodin po podání léku. Před podáním léku [g]: 50, 60, 20, 100, 80, 30, 50, 40, 70, 90. Po podání léku [g]: 55, 55, 20, 95, 75, 40, 52, 35, 68, 88. Před podáním – po podání [g]: -5, 5, 0, 5, 5, -10, -2, 5, 2, 2. T = 0.435, P = > 0.05. Nemohu zamítnout, že lék nemá vliv na hmotnost myší.

7 Dvouvýběrový t - test. Dva nezávislé výběry, jeden z N(m1, s2), druhý z N (m2, s2). Předpokládejme stejnou variabilitu obou souborů. První výběr X1, …, Xn, druhý výběr Y1, …, Ym. Náhodná veličina má rozdělení tn+m-2. V případě, že nelze předpokládat stejnou variabilitu obou souborů, provádí se korekce na nestejnou variabilitu: Označíme: Nulovou hypotézu m1 – m2 = 0 v oboustranném testu zamítáme na hladině a, jestliže

8 Test rovnosti variancí (dvouvýběrový t – test).
Nechť X1, …, Xn je náhodný výběr z N(m1, s12) a Y1, …, Ym je náhodný výběr z N(m2, s22), nechť jsou výběry nezávislé. Pak Jestliže s1 = s2, pak , kde Fn-1, m-1 je Fisherovo-Snedecorovo rozdělení s m, n stupni volnosti. Pro informaci, hustota Fn,m je rovna Prakticky. Test rovnosti variancí: H0: s12 = s22 proti H1: s12  s22. Platnost H0 znamená =1. H0 bude zamítnuta, pokud bude příliš vzdálen od 1(bude menší nebo větší než 1).

9 Neparametrické testy. Základní předpoklad pro provádění t-testů je, že výběry pocházejí z normálního rozdělení. t-testy nejsou citlivé na porušení normality (jsou robustní). Jestliže můžeme provést transformaci dat do normálního rozdělení, je lepší ji provést. pokud střední hodnota lineárně závisí na průměru, provádí se logaritmická transformace. pokud máme procentuální data v rozsahu 10% - 90%, není transformace nutná. pokud máme procentuální data, v nichž se vyskytují čísla menší než 10% nebo větší než 90%, pak se použije transformace Jsou k dispozici neparametrické testy (nepoužívají k výpočtům parametry normálního rozdělení). neparametrickými ekvivalenty párového t-testu či jednovýběrového t-testu je například Wilcoxonův test. neparametrickým ekvivalentem 2-výběrového t-testu je například Mann-Whitne test. Neparametrické testy jsou slabší než parametrické, tj. neodhalí rozdíly, které by t-test odhalil. V praxi se příliš nepoužívají. Výsledky se často navíc aproximují normovaným normálním rozdělením.

10 Wilcoxonův test. Nechť náhodný výběr X1, …, Xn pochází z rozdělení s distribuční funkcí F (x). Testujeme nulovou hypotézu, že 0 je mediánem tohoto rozdělení. Seřadíme hodnoty náhodného výběru do rostoucí posloupnosti podle absolutních hodnot. Každé hodnotě přiřadíme pořadí při tomto uspořádání. Označíme S+ (resp. S-) součet pořadí, které náležejí kladným (resp. záporným) Hodnotám Xi. má asymptoticky normované normální rozdělení. Test na nulový medián se tak transformuje na test, že U je blízko 0. Příklad. U 8 osob byl měřen krevní tlak před a po podání léku. Systolické tlaky byly: Před pokusem: 130,185, 162, 136, 147, 181, 138, 139 Po pokusu: 139, 190, 175, 135, 155, 175, 158, 149 Rozdíly: 9, 5, 13, -1, 8, -6, 20, 10 Má lék vliv na změnu krevního tlaku?

11 Příklad lze spočítat párovým t-testem.
H0: TK před = TK po H1: TK před  TK po , T = -2,542, P = 0.039 Závěr: podaný lék ovlivňuje krevní tlak. Protože T < 0, lze výpověď zpřesnit: H1: TK před < TK po H0: TK před  TK po P = Závěr: podaný lék zvyšuje krevní tlak. Výpočet Wilcoxonovým testem. Rozdíly tlaků: 9, 5, 13, -1, 8, -6, 20, 10 Pořadí absolutních hodnot rozdílů: 5, 2, 7, 1, 4, 3, 8, 6 S+= = 32 S- = = 4 U = < u(0.025) = -1.95 Závěr: zamítám nulovou hypotézu. Avšak jedná se o mezní hodnotu. Test je mnohem méně citlivý než t-test.

12 Mann-Whitneyův test. Máme 2 nezávislé výběry, X1, .., Xn a Y1, …, Ym, ze 2 spojitých rozdělení. Testujeme hypotézu, že distribuční funkce obou rozdělení se rovnají. Všech m + n hodnot uspořádáme vzestupně. Zjistíme součet pořadí pro X1, …, Xn a označíme ho T1. Součet pořadí pro Y1, …, Ym označíme T2. Platí

13 Příklad. 4 plochy byly hnojeny novým hnojivem, 6 ploch bylo ošetřeno starým způsobem. Je rozdíl mezi hektarovým výnosem plodiny? Nový způsob: 51, 52, 49, 55 Starý způsob: 45, 54, 48, 44, 53, 50. Je možno použít 2-výběrový t-test. Nejprve test homogenity variancí (Levenův): H0: =1, H1: 1 F 1,8 = 2.02, P =  nelze zamítnout homogenitu variancí. Použijeme 2-výběrový test pro rovnost variancí. H0: starý = nový, H1: starý  nový t8 = 1.19, P = 0.27  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos. Jednostranný test nic na tomto závěru nezmění, protože P/2 > 0.05. Neparametrický Mann-Whitneyův test. U = 0.959, P =  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos.


Stáhnout ppt "T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám."

Podobné prezentace


Reklamy Google