Testovanie štatistických hypotéz

Slides:



Advertisements
Podobné prezentace
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Advertisements

9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Testování hypotéz Testování hypotéz o rozdílu průměrů
Interpolace funkčních závislostí
Sčítanie a odčítanie výrazov
Testování hypotéz vymezení základních pojmů
Testování hypotéz Testování hypotéz o rozdílu průměrů
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
Základy statistické indukce
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
Spojité VELIČINY Vyšetřování normality dat
PaedDr. Jozef Beňuška
EKONÓMIA spoločenská veda, ktorá skúma motívy
Skladanie síl (vektorov):
Daňová sústava Slovenska
SYSTÉMY SIEŤOVÉHO PLÁNOVANIA Metóda CPM
Tolerancie rozmerov Kód ITMS projektu:
Množiny.
L1 cache Pamäť cache.
Stredná odborná škola automobilová Moldavská cesta 2, Košice
„Brutácia“ nepeňažného príjmu
… je osou, okolo ktorej sa točí pochopenie politickej ekonómie …
Kreslenie v textovom dokumente 1.časť
T.Zamborská L.Nedbalová 8.A
Slovné úlohy Zdroj: Križalkovič, K. a kol.: 500 riešených slovných úloh z matematiky.
Početnosť, relatívna početnosť, aritmetický priemer
MATURITA Miroslava Drahošová
Časti počítača von Neumannovského typu
PaedDr. Jozef Beňuška
7. Princíp náhradného aktívneho dvojpólu
Kľúč na určovanie rastlín
Slovné druhy PODSTATNÉ MENÁ.
Informácia – definícia a výpočet
Sociálna interakcia,medziosob- ná percepcia
Ochrana potravín Tréningový kurz Co-financiado.
Regresná a korelačná analýza (RaKA) resp. Korelačný počet
Deliť celok na rovnaké časti / opakovanie /.
PaedDr. Jozef Beňuška
Poznámky z teórie kriviek a plôch Margita Vajsáblová
Organizačná štruktúra podniku
Elektronické voltmetre
Mechanika kvapalín.
Cabri geometry II Mgr. Róbert Truchan ZŠ Sačurov.
Normálne rozdelenie N(,2).
Divergentné úlohy v matematike
ŠTATISTIKA.
Viacrozmerné štatistické metódy Faktorová analýza (FA)
Katedra štatistiky FHI EU v Bratislave
Trh výrobných faktorov
PaedDr. Jozef Beňuška
Výskumný súbor.
Hardware Pamäťové média.
Čo a skrýva v atómovom jadre
PaedDr. Jozef Beňuška
PaedDr. Jozef Beňuška
PaedDr. Eva Kulfasová ZŠ, P. Jilemnického 1035/2, Zvolen
VLOOKUP (po česky SVYHLEDAT)
Vznik chemickej väzby..
RIEŠENIE LINEÁRNYCH ROVNÍC A NEROVNÍC
ELDP Evidenčný List Dôchodkového Poistenia
4. Algoritmy a programovanie v jazyku Pascal Cykly a riadenie
Stredná odborná škola automobilová Moldavská cesta 2, Košice
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

Testovanie štatistických hypotéz

Parametre základného súboru nepoznáme. Môžeme však o nich vysloviť určité predpoklady, ktoré formulujeme ako hypotézy a overujeme štatistickými postupmi - testovanie štitistických hypotéz (TH). Overovať možno nielen predpoklady o parametroch (napríklad strednej hodnote, rozptyle, smerodajnej odchylke), ale aj o tvare rozdelenia štatistického znaku (napr. testovanie zhody empirického rozdelenia s normálnym.

Príklady: Chceme overiť, či sa priemerné výdavky na potraviny v r. 2007 významne zvýšili oproti r.2006, pričom na základe výberového skúmania predstavovali v r. 2006 34% a v r. 2007 36% Výrobca reflektorov uvádza, že ich životnosť predstavuje 70 hodín. Za tým účelom sa uskutočnilo výberové skúmanie a na vzorke 20 reflektorov sa zistila priemerná životnosť 67 hodín a výberová smerodajná odchýlka 2 hodiny. Má výrobca pravdu ???

Základné pojmy H0 :  = 0, , všeobecne H0 : G= G0 Formulujeme východiskovú - nulovú hypotézu H0 , ktorá vždy tvrdí zhodu toho čo porovnávame - testujeme Oproti nulovej hypotéze formulujeme alternatívnu hypotézu H1, napr. H1 :   0, , všeobecne H1 : G  G0, obojstranný test resp. H1 : G > G0 jednostranné H1 : G <G0 testy Nulová a alternatívna hypotéza sa musia vzájomne vylučovať

Parameter základného súboru G, o ktorom máme určitú hypotézu, nepoznáme, iba ho odhadujeme na základe výberového súboru, pomocou výberovej charkteristiky un . Rozhodnutie o zamietnutí resp. nezamietnutí nulovej hypotézy uskutočňujeme na základe náhodného výberu. Nemôžme ho urobiť s absolútnou presnosťou. Existuje riziko odhadu. Za predpokladu, že platí nulová hypotéza , rovná sa parameter G predpokladanej veličine G0. Keďže est. G = un, potom rozdiel  = un - G0 je iba náhodnou chybou , spôsobenou náhodným výberom.

Ak však H0 neplatí , t.j. G  G0 , potom sa rozdiel môže skladať z náhodnej chyby systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom základného súboru G a jeho predpokladanou veľkosťou G0  = un - G0 = (un - G) + (G - G0 ) Náhodná chyba Systematická chyba - rozdiel V praxi nemožno zistiť , či rozdiel  obsahuje iba náhodnú chybu, alebo aj systematickú. Ak je však  malé pripisujeme ho iba náhodnosti výberu, ak prekročí určitú veľkosť, predpokladáme, že zahrňuje aj systematickú chybu - rozdiel.

Rozhodnutie o zamietnutí, resp. nezamietnutí H0 predpokladá znalosť kritickej hodnoty, ktorá všetky možné výsledky  rozdelí na dve časti : pri rozdieloch menších ako kritická hodnota H0 nezamietame, pri rozdieloch  ako kritická hodnota, H0 zamietame. Veľkosť  v konkrétnych prípadoch kolíše, je náhodnou veličinou,. Preto sa snažíme transformovať , ktoré je funkciou un a parametra základného súboru G na veličinu G, ktorá má známe teoretické rozdelenie (napr. Normované normálne, res. Studentovo či iné rozdelenie). G = f() pričom funkcia hustoty náhodnej premennej G je f(g) Vychádzame z platnosti H0:G = G0 a vypočítame testovaciu charakteristiku g = f(un , G0)

Rozhodnutie o výsledku testu:Môžeme potom nájsť také kritické hodnoty g1 a g2 náhodnej veličiny G , pre ktoré platí: P(g1  G  g2) = 1 -  alebo P(g1  G  g2) =  /2 1 -  g1 Obor prijatia hypotézy H0  - hladina významnosti, základná hodnota je 0.05 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0 kritický obor, obor zamietnutia H0

Rozhodnutie o výsledku testu, zamietnutí resp Rozhodnutie o výsledku testu, zamietnutí resp. nezamietnutí nulovej hypotézy H0 závisí od voľby hladiny významnosti , hladina významnosti  rozdeľuje obor hodnôt veličiny G na obor prijatia a obory zamietnutia H0

1 -  … pravdepodobnosť prijatia správnej hypotézy Pri testovaní sa všeobecne dopúšťame dvoch chýb: Chyba prvého druhu  chyba druhého druhu  1 -  … pravdepodobnosť prijatia správnej hypotézy 1 -  …sila testu f(H0) f(H1) 1 -  1 -   = P(H1/H0) = P(H0/H1)

- chyba prvého druhu, ktorá vzniká pri zamietnutí správnej hypotézy Schematicky môžeme možné výsledky rozhodovacieho procesu pri testovaní štatistických hypotéz znázorniť takto:   Hypotéza Rozhodnutie Správna Nesprávna   Nezamietam Správne rozhodnutie Chyba 2.druhu Zamietam Chyba 1.druhu   -  chyba prvého druhu, ktorá vzniká pri zamietnutí správnej hypotézy - chyba druhého druhu, ktorá vzniká pri prijatí nesprávnej hypotézy

Všeobecný algoritmus testovania:   na základe vecne logického rozboru úlohy formulujeme nulovú (základnú) a alternatívnu hypotézu. na základe naformulovaných hypotéz volíme testovacie kritérium výpočet hodnoty testovacieho kritéria z údajov náhodného výberu určíme obor prijatia a obor zamietnutia nulovej hypotézy, tj. vyhľadáme v tabuľkách alebo vypočítame kvantily rozdelenia testovacieho kritéria. formulujeme záver a vyhodnotenie testu, na základe porovnania vypočítanej hodnoty testovacieho kritéria a kritických hodnôt.

Testy hypotéz o strednej hodnote Testy zhody strednej hodnoty so známou konštantou H0 : = 0 Nech štatistický znak X má v základnom súbore približne normálne rozdelenie ….N(, 2) Predpokladajme, že odhadovaná stredná hodnota  sa rovná známej konštante  0, t.j. H0 : = 0 oproti alternatívnej hypotéze - pri obostrannom teste H1 :   0 -         pri pravostrannom teste H1 :  > 0 -         pri ľavostrannom teste H1 :  < 0

a) predpokladajme, že poznáme rozptyl základného súboru 2 (teoretický predpoklad) a n je väčšie ako 30 Potom vytvoríme ako testovaciu chrakteristiku náhodnú veličinu: má …N(0,1)

Rozhodnutie o výsledku testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test

b) Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n > 30 môžme použiť N(0,1) Vyhodnotenie testu je rovnaké ako v predchádzajúcom prípade.

Rozhodnutie o výsledku testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test

c) Ak nepoznáme rozptyl základného súboru, est 2 = s12 , a rozsah výberového súboru n  30 t má Studentovo rozdelenie s v = (n-1) stupňami voľnosti

Schéma vyhodnotenia testu: H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný Pravostranný Ľavostranný Rozhodnutie Test Ak znázorníme obor možných hodnôt testovacieho kritéria v absolútnej hodnote úsečkou takto:   OP – OZ + OZ + +

Testy hypotéz o rozptyle Test zhody rozptylu s konštantou Testujeme nulovú hypotézu o zhode rozptylu základného súboru so známou konštantou , čo sformulujeme do zápisu: H0 : oproti alternatívnej hypotéze   -         pri obojstrannom teste H1 :

Schéma vyhodnotenia testu: Testovacie kritérium má chí kvadrát rozdelenie s (n-1) stupňami voľnosti. Obor prijatia a obor zamietnutia nulovej hypotézy pre stupne voľnosti v  = n-1 a hladinu významnosti, sú nasledovné:   Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný a

Test zhody dvoch rozptylov Uvažujeme, dva náhodné výbery z normálnym rozdelením prvý o veľkosti n1 s výberovým rozptylom   druhý s rozsahom n2 s výberovým rozptylom . Predpokladajme zhodu rozptylov dvoch základných súborov tj:   H0 : oproti alternatívnej hypotéze pri obojstrannom teste H1 : Testovacím kritériom je veličina    ktorá má rozdelenie F so stupňami voľnosti v = (n1 – 1);(n2 – 1) a hladinou významnosti .

Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný a

Testy zhody viac ako dvoch rozptylov   Ak porovnávame zhodu viac ako dvoch rozptylov navzájom nezávislých náhodných výberov pochádzajúcich zo základných súborov s normálnym rozdelením , pričom parametre základných súborov nepoznáme, formulujme nulovú hypotézu v tvare: H0 : kde k je počet náhodných výberov s rozsahmi Nulovú hypotézu overujeme pomocou Bartlettovho, Cochranovho a Hartteyovho testu. Bartlettov test vychádza z predpokladu, že všetkých k  výberov pochádza zo základného súboru s normálnym rozdelením  s rovnakým rozptylom, je založený na výpočte testovacieho kritéria

Kde ( ) je nestranný výberový rozptyl i-teho výberu, Veličina B má pri platnosti H0 približne rozdelenie s stupňami voľnosti (pokiaľ ni > 6, pre ). Nulovú hypotézu o zhode rozptylov na hladine významnosti prijímame, ak testovacie kritérium je menšie ako kritická hodnota . Bartlettov test je veľmi citlivý na dodržanie predpokladu normality rozdelenia náhodných chýb.

Ak majú všetky výberové súbory rovnaké rozsahy tj. = n, je k testovaniu nulovej hypotézy lepšie použiť Cochranov test, založený na testovacom kritériu:   pričom ak je vypočítaná hodnota testovacieho kritéria G menšia ako kritická hodnota pre Cochranov test , nulovú hypotézu o zhode rozptylov prijímame (k je počet porovnávaných rozptylov, sú stupne voľnosti, je zvolená hladina významnosti).

Hartleyov test vychádza z tých istých predpokladov o zhode rozsahov výberových súborov a predpoklade normality rozdelenia a testovacie kritérium je definované vzťahom   nulovú hypotézu prijímame ak vypočítaná hodnota je menšia ako kritická hodnota pre Hartleyov test , (k je počet porovnávaných rozptylov, sú stupne voľnosti, je zvolená hladina významnosti).

Testy hypotéz o zhode dvoch stredných hodnôt Pred samotným popisom testov parametrov z niekoľkých súborov je potrebné rozlíšiť či robíme úsudky z nezávislých alebo závislých súborov. U nezávislých súborov predpokladáme, že výber štatistických jednotiek z jedného základného súboru nezávisí na výbere štatistických jednotiek z druhého súboru. U závislých súborov naopak výber jednotiek z prvého súboru závisí na výbere jednotiek zo súboru druhého, pričom sa vytvára logický pár z jednotiek oboch súborov ( často sa používa označenie párový test ). Niekedy môže byť vytvorenie takéhoto páru dané priamo tým, že skúmame rovnaké jednotky za rôznych okolností, v rôznych obdobiach (napr. tržby pred a po reklame ) a pod.

Testy hypotéz o zhode dvoch stredných hodnôt pre nezávislé súbory Nech štatistický znak X1 má v prvom základnom súbore približne normálne rozdelenie ….N(1, 12) Štatistický znak X2 má v druhom základnom súbore tiež približne normálne rozdelenie ….N(2, 22) Predpokladajme, že odhadované stredné hodnoty 1 a 2 sú zhodné, t.j. testujeme H0 :1 = 2 oproti alternatívnej hypotéze H1 :1  2 pri obostrannom teste est 1 = … N(1, 12/n1) est 2 = … N(2, 22/n2)

základných súborov , čo je však vzácne a výberové súbory ► ďalší postup závisí na tom, čo platí pre rozptyly. Ak poznáme rozptyly základných súborov , čo je však vzácne a výberové súbory sú veľké (rozsahy výberových súborov sú väčšie ako 30), použijeme pre testovacie kritérium veličinu ktorá má normované normálne rozdelenie s parametrami 0,1 Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

ktorá má normované normálne rozdelenie s parametrami 0,1 ► ak nepoznáme rozptyly základných súborov a a výberové súbory sú veľké, použijeme ako testovacie kritérium veličinu u, v ktorej nahradíme rozptyly základných súborov ich odhadmi pomocou výberových rozptylov . ktorá má normované normálne rozdelenie s parametrami 0,1 Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

► ak nepoznáme rozptyly základných súborov, ale môžeme aspoň predpokladať ich zhodu (o reálnosti tohto predpokladu sa presvedčíme testom o zhode rozptylov) a výberové súbory sú malé (rozsahy sú menšie ako 30), použijeme ako testovacie kritérium   ktorá má Studentovo t rozdelenie s (n1 + n2 – 2) stupňami voľnosti. Vypočítané testovacie kritérium t porovnávame s kvantilmi Studentovho t rozdelenia pre zvolenú hladinu významnosti a  v = ( n – 1 ) stupňov voľnosti. Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný

Zhoda dvoch stredných hodnôt pre závislé súbory. Predpokladajme, že máme dva závislé súbory s normálnym rozdelením a rovnakými rozsahmi n1 = n2 = n. Pre každú dvojicu ( pár ) údajov vypočítame rozdiel a vypočítame aritmetický priemer a rozptyl : Nulovú hypotézu pre posúdenie zhody dvoch stredných hodnôt pre závislé súbory naformulujeme v tvare H0 :

oproti alternatívnej hypotéze - H1 :   -         H1 : Testovacím kritériom je veličina   ktorá má Studentovo t rozdelenie s  v = (n – 1) stupňami voľnosti. Obory prijatia a zamietnutia nulovej hypotézy sú definované takto: Schéma vyhodnotenia testu: Rozhodnutie Test H0 prijímame H1 zamietame H0 zamietame H1 prijímame Obojstranný