Přednáška č. 3 – Posouzení nahodilosti výběrového souboru

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Testování statistických hypotéz
Statistika.
Statistická indukce Teorie odhadu.
Testování parametrických hypotéz
Testování statistických hypotéz
Matematické metody vyhodnocování experimentů
Statistické metody v ochraně kulturního dědictví
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
P‑value ano, či ne? Roman Biskup
Rozbory přesnosti v jednotlivých fázích vytyčení
Testování hypotéz (ordinální data)
DATA  INFORMACE Statistická analýza je založena na zhušťování informace – tj. jak s co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních.
Obecný postup při testování souborů
Testování hypotéz přednáška.
Tloušťková struktura porostu
Náhodná proměnná Rozdělení.
MUDr. Michal Jurajda, PhD. ÚPF LF MU
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
T - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). Předpokládejme, že parametr s rozdělení je znám.
Odhady parametrů základního souboru
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Charakteristiky variability
Inženýrská geodézie 2009 Ing. Rudolf Urban
Biostatistika 6. přednáška
Biostatistika 7. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
Matematická statistika 1.přednáška. Statistická indukce Náš cíl: získat informace o základním souboru (o populaci) Provedeme výběrové šetření Z dat získáme.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) a  x  b distribuční.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Základy zpracování geologických dat R. Čopjaková.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
INDUKTIVNÍ STATISTIKA
Homogenita meteorologických pozorování
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
t-test Počítání t-testu t statistika Měření velikosti efektu
Induktivní statistika
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
Úvod do induktivní statistiky
Statistika a výpočetní technika
Plánování přesnosti měření v IG Úvod – základní nástroje TCHAVP
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Náhodné výběry a jejich zpracování
Testování hypotéz - pojmy
Transkript prezentace:

Přednáška č. 3 – Posouzení nahodilosti výběrového souboru Lubomír Moc – KVM – Inženýrská statistika a spolehlivost 22.10.2014

Lubomír Moc - Inženýrská statistika Posouzení nahodilosti výběrového souboru – testy náhodnosti Při statistických výpočtech je důležité posouzení základní vlastnosti výběrového souboru, zda je výběr vhodným představitelem základního souboru. Tato vlastnost výběrového souboru souvisí se způsobem výběru jednotlivých prvků do souboru. K ověření nahodilosti výběru se používají různé postupy - neparametrické testy. Typy testů: Waldův-Wolfowitzův (mediánový), Kendalův test (test kritických bodů), Znaménkový test, Koeficient pořadové korelace, Spearmanův koeficient pořadové korelace. 21.4.2018

a) Waldův-Wolfowitzův test 1) Formulace hypotéz Nulová hypotéza Ho: výběrový soubor je náhodný Alternativní hypotéza H1: výběrový soubor není náhodný hladina významnosti testu  (1%, 5%) 2) Charakteristiky výběrového souboru Testovaný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. - uspořádáme hodnoty výběrového souboru do vzestupné variační řady. Pokud n je liché vyřadíme jednu hodnotu nejbližší ke střední hodnotě. - vypočteme střední hodnotu výběrového souboru a označíme: symbolem X hodnotu v řadě pokud platí symbolem Y hodnotu v řadě pokud platí číselné hodnoty výběrového souboru jsou nahrazeny řadou symbolů se stejným počtem k = n/2 symbolů X a Y např. : Y XX Y XXX YY X YYY X …….

řadu symbolů rozdělíme na úseky obsahující pouze X či Y získaná charakteristika pro posouzení je celkový počet úseků X a Y. Počet úseků je diskrétní náhodná veličina, pro popis použijeme střední hodnotu a střední směrodatnou odchylku. Hodnoty parametrů náhodné veličiny závisí pouze na počtu hodnot ve výběru: střední hodnota u = 1 + k střední směrodatná odchylka 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), test je oboustranný a proto kritické kvantily jsou 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu Tkr1 ≤ T ≤ Tkr2

4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), test je oboustranný a proto mezní hodnoty jsou 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

b) Kendalův test kritických bodů Test používá pro posouzení počet kritických bodů. Kritickým bodem souboru hodnot: x1, x2, x3, …. , xn nazýváme každou hodnotu xk, jestliže platí pro okolí této hodnoty xk-1 a xk+1 , že obě hodnoty jsou buď větší nebo menší než hodnota xk. Veličina t, která udává počet kritických bodů v souboru je náhodná a má normální rozdělení. 1) Formulace hypotéz Nulová hypotéza Ho: výběrový soubor je náhodný Alternativní hypotéza H1: výběrový soubor není náhodný hladina významnosti testu  (1%, 5%)

2) Charakteristiky výběrového souboru Testovaný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. - určíme počet kritických bodů t v souboru (soubor po výběru nesmí být upravován, hodnotí se stav po výběru). Okolí kritického bodu má stejný charakter číselných hodnot - vypočteme teoretické charakteristiky výběrového souboru střední hodnota střední směrodatná odchylka

3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), test je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

c) Znaménkový test Test používá při posuzování diference v netříděném výběrovém souboru. 1) Formulace hypotéz Nulová hypotéza Ho: výběrový soubor je náhodný Alternativní hypotéza H1: výběrový soubor není náhodný hladina významnosti testu  (1%, 5%) 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. Ze  souboru odstraníme stejně velké sousední hodnoty. - určíme diference mezi hodnotami a vypočteme náhodnou veličinu počet kladných diferencí k - vypočteme teoretické charakteristiky pro počet kladných diferencí souboru o četnosti n střední hodnota střední směrodatná odchylka

3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), test je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

d) Test Kendalovým koeficientem pořadové korelace Test vyhodnocuje počet dvojic v neupravené posloupnosti hodnot. 1) Formulace hypotéz Nulová hypotéza Ho: výběrový soubor je náhodný Alternativní hypotéza H1: výběrový soubor není náhodný hladina významnosti testu  (1%, 5%) 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. - určíme počet dvojic k , které splňují při porovnání mezi hodnotami vztah xi, xi+1 ………xi  xi+1 - vypočteme charakteristiku vztahu hodnot koeficientem pořadové korelace

a střední směrodatnou odchylku 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), testu je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

e) Test Spearmanovým koeficientem pořadové korelace Test vyhodnocuje vztah mezi pořadím vzorku v netříděném souboru a pořadím hodnoty vzorku pomocí Spearmanova koeficient pořadové korelace. 1) Formulace hypotéz Nulová hypotéza Ho: výběrový soubor je náhodný Alternativní hypotéza H1: výběrový soubor není náhodný hladina významnosti testu  (1%, 5%) 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. - určíme pořadí hodnot podle velikosti

Pořadí i Hodnota Pořadí podle velikosti 1 X1 p5 2 X2 p3 3 p1 i Xi pj n Xn pk - vypočteme charakteristiku vztahu hodnot koeficientem pořadové korelace

3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), testu je jednostranný a proto kritická hodnota 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  (1%, 5%), test je jednostranný a proto kritická hodnota 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí při splnění vztahu

Příklady řešení Pro kontrolu rozměrů pístních čepů byl vybrán soubor o četnosti 16 vzorků a naměřené hodnoty průměrů netříděného souboru byly: Pořadí 1 2 3 4 5 6 7 8 hodnota 25,05 25,07 25,10 25,03 25,08 25,04 25,09 Pořadí 9 10 11 12 13 14 15 16 hodnota 25,04 25,03 25,06 25,02 25,07 Posuďte při hladině významnosti 5%, zda se jedná o výběr splňující podmínky náhodného výběru. Hypotéza Ho výběr je náhodný a H1 výběr není náhodný.

a) Waldův-Wolfowitzův test 2) Charakteristiky souboru - střední hodnota - označení symbolů - posloupnost symbolů X YY X Y X YY XX Y XX YY X počet úseků - střední hodnota počtu úseků u = k + 1= 8 + 1 = 9 - střední směrodatná odchylka

test je oboustranný a proto 3) Testovací kritérium 4) Kritická hodnota testovacího kritéria T na hladině významnosti = 5%, test je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí -1,96  1,035  1,96

25,04 25,03 25,06 25,02 25,07 KB b) Kendalův test kritických bodů 2) Charakteristiky výběrového souboru Testovaný výběrový soubor má 16 hodnot - určíme počet kritických bodů t v souboru t = 9 25,05 25,07 25,10 25,03 25,08 25,04 25,09 KB 25,04 25,03 25,06 25,02 25,07 KB

- vypočteme teoretické charakteristiky výběrového souboru střední hodnota střední směrodatná odchylka 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má rozdělení normální normované.

test je oboustranný a proto 5) Hypotéza platí -1,96  -0,242  1,96 4) Kritická hodnota testovacího kritéria T na hladině významnosti  = 5%, test je oboustranný a proto 5) Hypotéza platí -1,96  -0,242  1,96 c) Znaménkový test 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má hodnoty: x1, x2, x3, ……..x16. V souboru nejsou stejně velké sousední hodnoty – vylučování hodnot se neprovádí. určíme kladné diference mezi hodnotami a vypočteme náhodnou veličinu - počet kladných diferencí = 7

- vypočteme teoretické charakteristiky pro počet kladných diferencí souboru o četnosti n = 16 střední hodnota střední směrodatná odchylka 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované.

xi, xi+1 ………xi  xi+1 počet dvojic 7 4) Kritická hodnota testovacího kritéria T na hladině významnosti  = 5%), test je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza platí -1,96  0,420  1,96 d) Test Kendalovým koeficientem pořadové korelace 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má hodnoty: x1, x2, x3, ……..xn. - určíme počet dvojic , které splňují při porovnání mezi hodnotami vztah xi, xi+1 ………xi  xi+1 počet dvojic 7

- vypočteme charakteristiku vztahu hodnot koeficientem pořadové korelace a střední směrodatnou odchylku 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru. Testovací kritérium má pro větší soubory rozdělení normální normované.

2) Charakteristiky výběrového souboru 4) Kritická hodnota testovacího kritéria T na hladině významnosti  5%, test je oboustranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza neplatí -1,96  -4,772 1,96 e) Test Spearmanovým koeficientem pořadové korelace 2) Charakteristiky výběrového souboru Testovaný netříděný výběrový soubor má 16 hodnot. - určíme pořadí hodnot podle velikosti

Pořadí odběru (i) Hodnota (x) Pořadí podle velikosti (p) Diference (i-p) 1 25,05 8 -7 2 25,07 12 -10 3 25,10 16 -13 4 25,03 3,5 0,5 5 25,08 14 9 6 25,04 7 25,09 15 -8 -4 10 6,5 11 25,06 9,5 1,5 13 25,02 11,5 4,5 14,5 Součet -

- vypočteme charakteristiku vztahu hodnot koeficientem pořadové korelace 3) Testovací kritérium Popisuje odlišnost skutečného výběrového souboru od teoretického náhodného souboru.Testovací kritérium má pro větší soubory rozdělení normální normované. 4) Kritická hodnota testovacího kritéria T na hladině významnosti  = 5%, test je jednostranný a proto 5) Rozhodnutí o platnosti hypotézy Ho Hypotéza Ho platí 1,483  1,96