Testování statistických hypotéz

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistická indukce Teorie odhadu.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Úvod do analýzy rozptylu
Testování parametrických hypotéz
Testování neparametrických hypotéz
Testování statistických hypotéz
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
F-test a dvouvýběrový t-test (oba testy předpokládají normalitu dat)
Lineární regresní analýza Úvod od problému
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Testování závislosti kvalitativních znaků
Porovnání průměrů více než dvou normálních rozdělení
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Tloušťková struktura porostu
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Řízení a supervize v sociálních a zdravotnických organizacích
Odhady parametrů základního souboru
Inference jako statistický proces 1
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Odhady odhady bodové a intervalové odhady
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Biostatistika 5. přednáška Aneta Hybšová
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Zpracování dat z kvantitativního výzkumu. Na základní škole se uskutečnil výzkum, kde se měřila hmotnost žáků 8.tříd. Výzkumu se účastnilo 33 žáků. Byly.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Jednovýběrový a párový t - test
INDUKTIVNÍ STATISTIKA
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Testování hypotéz párový test
Základy statistické indukce
Induktivní statistika
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
Autor: Honnerová Helena
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Náhodné výběry a jejich zpracování
Testování hypotéz - pojmy
Transkript prezentace:

Testování statistických hypotéz Statistická indukce Testování statistických hypotéz

Dvouvýběrové testy (testy hypotéz o parametrech dvou rozdělení) Máme k dispozici dva výběrové soubory a na základě jejich porovnání provádíme úsudky o základních charakteristikách dvou ZS, z nichž byly výběry provedeny. Test významnosti rozdílu dvou výběrových rozptylů (F-test) Uvažujme dva nezávislé náhodné výběry X = (x1, x2, …, xm)´ a Y = (y1, y2, …, yn)´ o rozsazích m, resp. n, jež byly odebrány ze ZS s rozdělením , resp. , kde 1 , 2 , a jsou neznámé hodnoty.

Test nulové hypotézy provedeme pomocí testového kritéria kde jsou nestranné výběrové rozptyly, pomocí nichž odhadujeme neznámé rozptyly a .

Za platnosti H0 má statistika Snedecorovo F-rozdělení o f1 = (m-1) a f2 = (n-1) stupních volnosti. Kritický obor Alternativa Kritický obor K = F > F/2 [(m-1), (n-1)] K = F > F [(m-1), (n-1)] Jestliže F < F (f1, f2), není důvod, abychom nulovou hypotézu zamítali.

Příklad Z velké zásilky součástek jsme jich náhodným výběrem vybrali 30 a zjistili pro některý jejich rozměr výběrovou směrodatnou odchylku 4,081 mm. Ze zásilky od druhého dodavatele jsme vybrali 25 součástek a zjistili jsme pro stejný rozměr výběrový rozptyl 18,25. Na základě těchto údajů chceme ověřit, zda variabilita sledovaného parametru je u obou dodávek shodná. m = 30 n = 25

F (f1, f2) = F0,05 (24; 29) = 1,90 F < F (f1, f2)  H0 nezamítáme a variabilita obou dodávek je v ZS shodná.

Test významnosti rozdílu dvou výběrových průměrů (t-test) t-test při známých rozptylech Budeme předpokládat, že ze dvou základních souborů, které mají rozdělení , resp. byly provedeny nezávislé náhodné výběry o rozsazích m, resp. n (vyžaduje větší rozsahy). Na základě těchto nezávislých náhodných výběrů chceme ověřit nulovou hypotézu H0: 1 = 2 proti alternativní hypotéze H1: 1  2 (event. 1 – 2 = 0). Je třeba rozhodnout, zda výběrové průměry určené z nezávislých náhodných výběrů o rozsazích m a n se liší statisticky významně nebo pouze náhodně.

Jako testovacího kritéria použijeme statistiky U, která má za platnosti H0 rozdělení N(0; 1). Kritický obor Alternativa Kritický obor H1: 1  2 K = U> u H1: 1  2 K = U > u2 H1: 1  2 K = U < -u2

t-test při neznámých rozptylech K dispozici máme pouze nestranné odhady rozptylů a , vypočtené z hodnot, zjištěných ve dvou nezávislých náhodných výběrech o rozsazích m a n. Před vlastním provedením testu je potřeba ověřit, zda se neznámé rozptyly a sobě rovnají nebo zda se od sebe liší. Tzn. před každým t-testem se provádí F-test (test hypotézy o shodě dvou rozptylů).

Test hypotézy H0: 1 = 2 při stejných rozptylech (dvouvýběrový t-test) Jsou-li oba rozptyly a stejné , používá se k testování hypotézy testové kritérium kde

Kritické obory uvádí následující přehled. Alternativa Kritický obor H1: 1  2 K = t> t (m+n-2) H1: 1  2 K = t > t2 (m+n-2) H1: 1  2 K = t < -t2 (m+n-2)

Příklad Máme k dispozici údaje o zaměstnanosti žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti žen existuje rozdíl mezi novými a starými zeměmi EU?

H0: 1 = 2 – zaměstnanost žen je stejná H1: 1  2 – zaměstnanost žen je rozdílná m = 15 n = 10 1 = 58,033 2 = 53,23 Nejprve je potřeba provést F-test.

F0,05 (14; 10) = 2,86 F < F (f1, f2)  H0 se nezamítá, tzn. že variabilita obou souborů v ZS je shodná Nyní pokračujeme t-testem pro variantu shodných rozptylů.

t0,05 (15+10-2) = 2,069 t = 1,327 < t = 2,069 t < t (f)  H0: 1 = 2 se nezamítá a rozdíl v průměrné zaměstnanosti žen v rámci starých a nových zemí EU lze označit za statisticky nevýznamný

Test hypotézy H0: 1 = 2 při nestejných rozptylech (Welchův t-test) Jsou-li oba rozptyly a podle F–testu rozdílné , použije se Welchův test založený na testové statistice Kritické obory pro tento test mají zcela analogický tvar jako kritické obory uvedené u předchozího testu s tím rozdílem, že počet stupňů volnosti v kritických hodnotách je potřeba stanovit samostatným výpočtem.

Počet stupňů volnosti pro Welchův test Jestliže t > t (f)  H0: 1 = 2 se na dané hladině významnosti zamítá a platí hypotéza alternativní.

Behrens-Fisherův test. Kromě Welchova testu lze použít i jiný způsob provedení testu, který se nazývá Behrens-Fisherův test. Jako testové kritérium slouží statistika U tohoto testu se nestanovují stupně volnosti, nýbrž se přepočítává celá tabulková hodnota.

Přepočet tabulkové hodnoty Kritický obor Alternativa Kritický obor H1: 1  2 H1: 1  2 H1: 1  2

Příklad Máme k dispozici údaje o zaměstnanosti mužů a žen (v %) v jednotlivých zemích EU. Je možné konstatovat, že z hlediska zaměstnanosti existuje mezi muži a ženami rozdíl?

H0: 1 = 2 – zaměstnanost mužů a žen je stejná H1: 1  2 – zaměstnanost mužů a žen je rozdílná m = 25 n = 25 1 = 71,116 2 = 56,112 Nejprve je potřeba provést F-test.

F0,05 (24; 24) = 1,98 F > F (f1, f2)  H0 se zamítá, tzn. že variabilita obou souborů je rozdílná Nyní pokračujeme t-testem pro variantu rozdílných rozptylů. Nejprve použijeme Welchův test.

t0,05 (41) = 2,021 t = 6,99 > t = 2,021 t > t (f)  H0: 1 = 2 se zamítá a rozdíl v průměrné zaměstnanosti mužů a žen v rámci EU lze označit za statisticky významný

Nyní použijeme druhý možný postup a to test Behrens – Fisherův.

t-test pro párové hodnoty (párový t-test) Ve všech předchozích úvahách jsme vycházeli z předpokladu nezávislosti výběrových souborů. V praxi se však často stává, že oba porovnávané soubory jsou určitým způsobem vázány a to tak, že každý prvek jednoho souboru tvoří pár s určitým prvkem druhého souboru. V těchto případech hovoříme o tzv. párových výběrech. Setkáváme s nimi např. tehdy, provádíme-li měření na jedné statistické jednotce dvakrát nebo na objektech máme párové části (oči, uši, nohy) a provedeme na nich měření.

Výsledkem zjišťování jsou dvojice hodnot (xi, yi), které tvoří páry závislých pozorování. Test hypotézy, že výběry x = (x1, x2, …, xn)´ a y = (y1, y2, …, yn)´ pocházejí z rozdělení se stejnými středními hodnotami 1 a 2, lze převést na jednovýběrový t-test, aplikovaný na hodnoty di = xi – yi. Soubor diferencí d = (d1, d2, …, dn)´ lze považovat za náhodný výběr o rozsahu n z rozdělení , kde d = 1 – 2.

Aritmetický průměr a rozptyl tohoto výběru jsou: Testovanou nulovou hypotézu ve tvaru H0: 1 = 2 můžeme nyní napsat v upraveném podobě jako H0: d = 0, kde d je průměr souboru diferencí di.

Testové kritérium má tvar Kritický obor Alternativa Kritický obor H1: 1  2 K = t> t (n-1) H1: 1  2 K = t > t2 (n-1) H1: 1  2 K = t < -t2 (n-1)

Příklad Máme k dispozici údaje o výkonech žáků ve skoku do dálky při tréninku a při závodě. Je možné konstatovat, že jsou výkony žáků při tréninku a při závodě shodné? H0: 1 = 2 H1: 1  2

t(n-1) = t0,05 (11) = 2,201 t < t (n-1)  H0 se nezamítá, tzn. lze konstatovat, že výkony žáků jsou vyrovnané (nebyl prokázán statisticky významný rozdíl ve výkonech při tréninku a v závodě)

Test významnosti rozdílu dvou výběrových relativních čeností Přepokládejme, že jsou dány dva ZS s alternativním rozdělením s parametry p1 a p2. Na základě náhodných výběrů o velkých rozsazích n1 a n2 (n1 > 100; n2 > 100) je třeba ověřit hypotézu H0: p1 = p2. Test je založen na statistice

výběrové relativní četnosti výskytu náhodného jevu A v 1. , resp. ve 2 výběrové relativní četnosti výskytu náhodného jevu A v 1., resp. ve 2. výběru – vážený aritmetický průměr obou výběrových relativních četností

Pro tento test je možné použít i trochu jiné testové kritérium.

Kritický obor je stejný pro obě varianty testového kritéria. Alternativa Kritický obor H1: p1  p2 K = u> u H1: p1  p2 K = u > u2 H1: p1  p2 K = u < -u2

Příklad Máme k dispozici údaje o počtu narozených dětí v rámci dvou regionů. V regionu A zjistili, že během sledovaného období se v rámci 120 dětí narodilo 51 chlapců, zatímco v regionu B se za stejné období narodilo celkem 150 dětí, z toho 66 děvčat. Je možné konstatovat, že pravděpodobnost narození chlapce je u obou regionů stejná? H0: p1 = p2 – pravděpodobnost narození chlapce je shodná H1: p1  p2 – pravděpodobnost je odlišná m1 = 51 m2 = 84 n1 = 120 n2 = 150

u = u0,05 = 1,96 u> u  H0 se zamítá, tzn. že pravděpodobnost narození chlapce je v rámci dvou sledovaných regionů odlišná

Nyní použijeme druhé testové kritérium.

Testy rovnosti parametrů , k > 2 normálních rozdělení Vícevýběrové testy (testy hypotéz o parametrech více než dvou rozdělení) Testy rovnosti parametrů , k > 2 normálních rozdělení Test rovnosti dvou rozptylů lze zobecnit na případ k > 2 normálně rozdělených základních souborů, z nichž pořizujeme výběry. Bartlettův test Mějme k > 2 vzájemně nezávislých náhodných výběrů ze ZS s rozdělením , kde oba parametry jsou neznámé. Rozsahy jednotlivých výběrů jsou n1, n2, …, nk.

H1: alespoň dva z rozptylů jsou různé. Na základě uvedených náhodných výběrů testujeme hypotézu proti hypotéze alternativní H1: alespoň dva z rozptylů jsou různé. Testovacím kritériem je statistika

Statistika má za platnosti H0 rozdělení 2 – rozdělení o (k-1) stupních volnosti. Jestliže se zamítá.

Cochranův test Vyjdeme ze stejných předpokladů jako u Bartlettova testu a předpokládejme dále, že všechny výběrové soubory mají stejné rozsahy, tzn. n1 = n2 =…= nk = n. Ověření nulové hypotézy lze sice i v tomto případě provést pomocí Bartlettova testu, ale výhodnější a rychlejší je zde Cochranův test. Testovací kritérium má tvar

Jestliže G  G (k, f)  H0 se zamítá. kde je největší z rozptylů (i = 1, 2, …, m), které představují nestranné odhady neznámých populačních rozptylů . Kritický obor se určí z podmínky P (G  G (k, f) / H0) = , kde G(k, f) je kritická hodnota, kterou určíme pro zvolenou hladinu významnosti , přičemž k je počet srovnávaných rozptylů a f = n–1 je počet stupňů volnosti těchto rozptylů (je stejný pro všechny rozptyly, neboť jsou vypočteny ze stejného počtu pozorování). Jestliže G  G (k, f)  H0 se zamítá.

V případě vyváženého třídění (n1 = n2 = … = nk = n) lze hypotézu o shodě více jak dvou rozptylů ověřit pomocí Hartleyova testu. Testové kritérium má tvar Kritický obor je vymezen takto: K=Fmax  Fmax;  (k, f) Fmax;  (k, f) – tabulková hodnota pro k – počet srovnávaných rozptylů a pro f = n – 1 stupňů volnosti

Testujeme hypotézu o shodě rozptylů ZS Příklad Tří různých vyučovacích metod bylo použito na malých skupinách žáků. Na základě závěrečného zkoušení (v bodech), které jsou uvedeny v tabulce, posuďte, zda existuje rozdíl ve variabilitě v počtu získaných bodů mezi jednotlivými metodami. Testujeme hypotézu o shodě rozptylů ZS

Výpočty k Bartlettovu testu Metoda A 1853 27225 1815,0 2,71 0,4330 B 2706 39204 2613,0 6,60 0,8195 C 3242 46656 3110,4 9,40 0,9731 Celkem 7801 113085 7539,0 18,71 2,2256

H0 o shodě rozptylů nemůžeme zamítnout.

Bylo možné také použít Cochranův test. Odchylky mezi rozptyly lze pokládat za nevýznamné. Hartleyův test