Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(  2 )). 1.Předpokládejme, že parametr  rozdělení je.

Podobné prezentace


Prezentace na téma: "T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(  2 )). 1.Předpokládejme, že parametr  rozdělení je."— Transkript prezentace:

1 t - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(  2 )). 1.Předpokládejme, že parametr  rozdělení je znám. Z předchozího zkoumání, nebo z teoretických úvah plyne, že    Na základě našich pokusů se však zdá, že poslední rovnost neplatí. H0:  =  0. H1:    0. V předchozí přednášce byl vysvětlen význam chyby 1. a 2. druhu. V pokusu byl proveden náhodný výběr z N( ,  2 ) o rozsahu n. Označíme ho X 1, …, X n. Výběrový průměr může při dostatečném rozsahu výběru Dobře aproximovat střední hodnotu . S.E. = Pokud data pocházejí z normálního rozdělení N( ,  2 ), pak za platnosti H 0 platí, že pochází rovněž z normálního rozdělení.

2 To znamená, že Ideální pro platnost H 0 je stav, neboli. Podle principu statistického testování existuje tedy kritická hodnota k > 0 tak, že H 0 nezamítám, jestliže. Úpravou této nerovnosti dostáváme, při tom k je voleno tak, aby.  se nazývá hladina testu. Platí-li předchozí nerovnost, nezamítáme H0 na hladině , neplatí-li nerovnost, zamítáme H0 na hladině . Při tom hodnoty k  u(  ) byly pro daná  tabelovány. Z historických důvodů se tabelovaly hodnoty pro  = 0.05, 0.025, 0.01, Dnes se z dat vypočítá hodnota, při známých hodnotách  a  se vypočte hodnota výrazu. Statistický SW vypočítá příslušnou hodnotu P, tj. pravděpodobnost

3 P se nazývá dosažená hladina významnosti. Je na tom, kdo pokus vyhodnocuje, kdy zamítne H 0 a kdy H 0 nezamítne. Z historických důvodů H 0 zamítáme, pokud P  Nerovnost, definuje pro dané  konfindenční interval, neboli interval spolehlivosti pro  na hladině . Pravděpodobnost, že konfindenční interval překryje  je 1- . 2. Neznáme předem hodnotu parametru . 1.Nestranným odhadem parametru  je náhodná veličina. 2.Náhodná veličina má Studentovo t-rozdělení s n-1 stupni volnosti (označení t n-1 ). Jestliže X 1, …, X n je náhodný výběr z N ( ,  2 ). Pak Interval spolehlivosti pro  při neznámém  je, kde je kritická hodnota t-rozdělení s n-1 stupni volnosti na hladině  tj.

4 Jednovýběrový t - test. Příklad. Při kontrole balícího automatu na cukr, který plní sáčky o hmotnosti 1 kg, byly zjištěny následující odchylky od 1 kg (v gramech): -3, 2, -2, 0, -1, 2, 5, -4, 2, 0. Vykazuje automat systematickou odchylku? Odchylky představují náhodný výběr a předpokládáme, že pochází z normálního Rozdělení se střední hodnotou  a variabilitou . Rozsah výběru n = 10. Smyslem pokusu je ukázat, že automat vykazuje odchylku, tj, že   0 Proto H0:  = 0 H1:   0

5 Kritická hodnota t 9   Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Příklad. Stejně jako v předchozím, pouze s jiným náhodným výběrem. -3, 10, -1, 0, 20, 4, 10, 0, 10, -1.,, S = 7,355, T = 2.106, t 9 (0.05) = > T = Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Při zpracování na počítači je dosažená hladina významnosti P = > 0.05 H 1 :   0 znamená,  > 0 nebo  < 0 (  jedná se o oboustranný test). Podle znaménka usuzujeme, že by mohlo platit  > 0. Znovu formulujeme jednostranný test: H 1 :  > 0 (alternativní hypotézu formulujeme nejdříve) H 0 :   0 (doplněk k H 1 ) Při zpracování na počítači je dosažená hladina významnosti P = /2 < 0.05 Závěr: S pravděpodobností (1- P) > 0.95 lze tvrdit, že automat váží více než 1 kg.

6 Statistické balíky programů nejsou zbytečné. Umožňují vytvářet přesnější závěry. Alternativní hypotéza představuje jasný závěr statistického testování, proto při zpřesňování formulace nejprve formulujeme ji. Párový t - test. Provádíme 2 měření téže veličiny na jednom objektu. Měření závisejí na měřeném objektu.  Výhodou je, že se předpokládá stejnávariabilita 1. i 2. souboru měření.  Nevýhodou je závislost na měřeném objektu, tj. ve skutečnosti máme pouze 1 náhodný výběr. Párový t-test se převádí na jednovýběrový t-test odečtením obou hodnot na daném objektu. Příklad. Na 10 myších se testoval vliv léku na změnu hmotnosti. Myši byly zváženy před podáním léku a 12 hodin po podání léku. Před podáním léku [g]: 50, 60, 20, 100, 80, 30, 50, 40, 70, 90. Po podání léku [g]: 55, 55, 20, 95, 75, 40, 52, 35, 68, 88. Před podáním – po podání [g]: -5, 5, 0, 5, 5, -10, -2, 5, 2, 2. T = 0.435, P = > Nemohu zamítnout, že lék nemá vliv na hmotnost myší.

7 Dvouvýběrový t - test. Dva nezávislé výběry, jeden z N(  1,    druhý z N (  2,  2 ). Předpokládejme stejnou variabilitu obou souborů. První výběr X 1, …, X n, druhý výběr Y 1, …, Y m. Náhodná veličina má rozdělení t n+m-2. V případě, že nelze předpokládat stejnou variabilitu obou souborů, provádí se korekce na nestejnou variabilitu: Označíme: Nulovou hypotézu  1 –  2 = 0 v oboustranném testu zamítáme na hladině , jestliže

8 Test rovnosti variancí (dvouvýběrový t – test). Nechť X 1, …, X n je náhodný výběr z N(  1,   2 ) a Y 1, …, Y m je náhodný výběr z N(  2,   2 ), nechť jsou výběry nezávislé. Pak   Jestliže  1 =  2, pak, kde F n-1, m-1 je Fisherovo-Snedecorovo rozdělení s m, n stupni volnosti. Pro informaci, hustota F n,m je rovna Prakticky. Test rovnosti variancí: H 0 :  1 2 =  2 2 proti H 1 :  1 2   2 2. Platnost H 0 znamená =1. H 0 bude zamítnuta, pokud bude příliš vzdálen od 1(bude menší nebo větší než 1).

9 Neparametrické testy. Základní předpoklad pro provádění t-testů je, že výběry pocházejí z normálního rozdělení. t-testy nejsou citlivé na porušení normality (jsou robustní).  Jestliže můžeme provést transformaci dat do normálního rozdělení, je lepší ji provést. pokud střední hodnota lineárně závisí na průměru, provádí se logaritmická transformace. pokud máme procentuální data v rozsahu 10% - 90%, není transformace nutná. pokud máme procentuální data, v nichž se vyskytují čísla menší než 10% nebo větší než 90%, pak se použije transformace.  Jsou k dispozici neparametrické testy (nepoužívají k výpočtům parametry normálního rozdělení). neparametrickými ekvivalenty párového t-testu či jednovýběrového t-testu je například Wilcoxonův test. neparametrickým ekvivalentem 2-výběrového t-testu je například Mann-Whitne test. Neparametrické testy jsou slabší než parametrické, tj. neodhalí rozdíly, které by t-test odhalil. V praxi se příliš nepoužívají. Výsledky se často navíc aproximují normovaným normálním rozdělením.

10 Wilcoxonův test. Nechť náhodný výběr X 1, …, X n pochází z rozdělení s distribuční funkcí F (x). Testujeme nulovou hypotézu, že 0 je mediánem tohoto rozdělení. Seřadíme hodnoty náhodného výběru do rostoucí posloupnosti podle absolutních hodnot. Každé hodnotě přiřadíme pořadí při tomto uspořádání. Označíme S + (resp. S - ) součet pořadí, které náležejí kladným (resp. záporným) Hodnotám X i. má asymptoticky normované normální rozdělení. Test na nulový medián se tak transformuje na test, že U je blízko 0. Příklad. U 8 osob byl měřen krevní tlak před a po podání léku. Systolické tlaky byly: Před pokusem: 130,185, 162, 136, 147, 181, 138, 139 Po pokusu: 139, 190, 175, 135, 155, 175, 158, 149 Rozdíly: 9, 5, 13, -1, 8, -6, 20, 10 Má lék vliv na změnu krevního tlaku?

11 Příklad lze spočítat párovým t-testem., T = -2,542, P = Závěr: podaný lék ovlivňuje krevní tlak. Protože T < 0, lze výpověď zpřesnit: H 1 : TK před < TK po H 0 : TK před  TK po P = Závěr: podaný lék zvyšuje krevní tlak. H0: TK před = TK po H1: TK před  TK po Výpočet Wilcoxonovým testem. Rozdíly tlaků: 9, 5, 13, -1, 8, -6, 20, 10 Pořadí absolutních hodnot rozdílů: 5, 2, 7, 1, 4, 3, 8, 6 S + = = 32 S - = = 4 U = < u(0.025) = Závěr: zamítám nulovou hypotézu. Avšak jedná se o mezní hodnotu. Test je mnohem méně citlivý než t-test.

12 Mann-Whitneyův test. Máme 2 nezávislé výběry, X 1,.., X n a Y 1, …, Y m, ze 2 spojitých rozdělení. Testujeme hypotézu, že distribuční funkce obou rozdělení se rovnají. Všech m + n hodnot uspořádáme vzestupně. Zjistíme součet pořadí pro X 1, …, X n a označíme ho T 1. Součet pořadí pro Y 1, …, Y m označíme T 2. Platí

13 Příklad. 4 plochy byly hnojeny novým hnojivem, 6 ploch bylo ošetřeno starým způsobem. Je rozdíl mezi hektarovým výnosem plodiny? Nový způsob: 51, 52, 49, 55 Starý způsob: 45, 54, 48, 44, 53, 50. Je možno použít 2-výběrový t-test. Nejprve test homogenity variancí (Levenův): H0: =1, H1:  1 F 1,8 = 2.02, P =  nelze zamítnout homogenitu variancí. Použijeme 2-výběrový test pro rovnost variancí. H 0 : starý = nový, H 1 : starý  nový t 8 = 1.19, P = 0.27  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos. Jednostranný test nic na tomto závěru nezmění, protože P/2 > Neparametrický Mann-Whitneyův test. U = 0.959, P =  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos.


Stáhnout ppt "T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(  2 )). 1.Předpokládejme, že parametr  rozdělení je."

Podobné prezentace


Reklamy Google