7. Statistické testování

Slides:

Advertisements

Podobné prezentace

8. Kontingenční tabulky a χ2 test

Advertisements

Základy testování hypotéz

Mann-Whitney U-test Wilcoxonův test Znaménkový test

Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)

Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.

10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.

Testy hypotéz - shrnutí Testy parametrické Testy neparametrické.

© Institut biostatistiky a analýz SPEKTRÁLNÍ ANALÝZA Č ASOVÝCH Ř AD prof. Ing. Jiří Holčík, CSc.

Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.

STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.

Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.

9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.

Induktivní statistika

Úvod do testování hypotéz

Analýza variance (ANOVA).

Testování hypotéz Testování hypotéz o rozdílu průměrů

Pravděpodobnostní hodnocení vstupních parametrů zemin a hornin a spolehlivostní analýza geotechnických konstrukcí.

Interpolace funkčních závislostí

Statistické testování – základní pojmy

„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“

Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina

Testování hypotéz vymezení základních pojmů

Evaluace předmětů studenty (Anketky)

Lineární rovnice a nerovnice I.

Testování hypotéz Testování hypotéz o rozdílu průměrů

Marketingový výzkum. Marketingový výzkum Organizace marketingového výzkumu Cíl výzkumu Typ výzkumu Příprava výzkumného projektu Sběr dat Analýza výsledků.

Charakteristiky variability

Výběrové metody (Výběrová šetření)

Jedno-indexový model a určení podílů cenných papírů v portfoliu

Základy zpracování geologických dat testování statistických hypotéz

Testování hypotéz o rozdílu průměrů: Analýza rozptylu

Normální rozdělení a ověření normality dat Modelová rozdělení

Logika a metody výběru vzorku

Statistická analýza dat

Biostatistika Opakování Modelová rozložení náhodné veličiny

Párový neparametrický test

Základy statistické indukce

ASTAc/01,03 Biostatistika 6. cvičení

Základy zpracování geologických dat testování statistických hypotéz

Parametry polohy Modus Medián

Míry asociace obecná definice – síla a směr vztahu

FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace

Kvadratické nerovnice

Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.

Opakování Analýza kontingenčních tabulek Základy korelační analýzy

NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.

V.a1 Teoretické pozadí statistické analýzy

Parametrická analýza rozptylu Kruskal-Wallisův test

BIBS Informatika pro ekonomy přednáška 2

Opakování: Parametrické testy.

Spojité VELIČINY Vyšetřování normality dat

PSY252 Statistická analýza dat v psychologii II

Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.

XII. Binomické rozložení

3. přednáška Laplaceova transformace

ASTAc/03 Biostatistika 4. cvičení

Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.

Lineární regrese.

Cauchyho rozdělení spojité náhodné veličiny

Analýza variance (ANOVA).

Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.

Matematika + opakování a upevňování učiva

Teorie chyb a vyrovnávací počet 1

7. Kontingenční tabulky a χ2 test

Centrální limitní věta

T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.

Více náhodných veličin

Vzdělávání jako hlavní složka řízení lidských zdrojů

Teorie chyb a vyrovnávací počet 2

Transkript prezentace:

7. Statistické testování Princip testování Chyby p-hodnota Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina

Statistické testy a normalita dat Normalita dat je jedním z předpokladů tzv. parametrických testů (testů založených na předpokladu nějakého rozložení) – např. t-testy Pokud data nejsou normální, neodpovídají ani modelovému rozložení, které je použito pro výpočet (t-rozložení) a test tak může lhát Řešením je tedy: Transformace dat za účelem dosažení normality jejich rozložení Neparametrické testy – tyto testy nemají žádné předpoklady o rozložení dat Typ srovnání Parametrický test Neparametrický test 2 skupiny dat nepárově: Nepárový t-test Mann-Whitneyův test 2 skupiny dat párově: Párový t-test Wilcoxonův test znaménkový test Více skupin nepárově: ANOVA Kruskal- Wallisův test Korelace: Pearsonův koeficient Spearmanův koeficient Kendallův koeficient Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Shrnutí statistických testů Typ srovnání Nulová hypotéza Parametrický test Neparametrický test 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu. jednovýběrový t-test Wilcoxonův test; znaménkový test 2 skupiny dat nepárově Obě skupiny hodnot pochází ze stejného rozdělení. nepárový t-test Mann-Whitneyův test 2 skupiny dat párově Zkoumaný efekt mezi páry hodnot je nulový. Párový t-test shoda rozdělení rozdělení dat ve skupině odpovídá teoretickému (vybranému) rozdělení. Shapiro-Wilkův test; Kolmogorovův-Smirnovův test; Lilieforsův test χ2 test, test dobré shody homoskedasticita (shoda rozptylů) rozptyl obou (všech) skupin je shodný. Levenův test více skupin nepárově Zkoumaný efekt mezi skupinami hodnot je nulový. ANOVA Kruskal- Wallisův test korelace Neexistuje (příčinná, důsledková) vazba mezi skupinami hodnot. Pearsonův koeficient Spearmanův koeficient; Kendallův koeficient

Shrnutí statistických testů ANO log arcsin Jsou data normálně rozdělená? NE Lze použít transformaci? NE ANO Kolomogorovův-Smirnovův test Shapiro-Wilkův test Kolik je skupin? Parametrické testy Kolik je skupin? více 2 2 více 1 1 Jsou data párová? Jsou data párová? Jsou data párová? Jsou data párová? ANO NE ANO NE ANO NE ANO NE Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? Co chci spočítat? test shody test shody test shody Levenův test korelaci test shody korelaci test shody korelaci korelaci test shody korelaci test shody korelaci test shody korelaci korelaci Mají skupiny stejný rozptyl? Mají skupiny stejný rozptyl? korelaci korelaci F test ANO NE ANO NE Nelze spočítat Jedno-výběro-vý t-test Pearso-nův kor. koef. Párový t-test Nelze spočítat Dvouvý běrový t-test Mann- Whitney U-test Sada Pears. kor. koef. ANOVA Kruskal-Wallisův test Nelze spočítat Wilco-xonův test Spear-manův/ Kendallův k. k. Wilco-xonův test Nelze spočítat Mann-Whitney U-test Nelze spočítat Kuskal-Wallisův test Nelze spočítat

Statistické testování – základní pojmy Nulová hypotéza HO HO: sledovaný efekt je nulový Alternativní hypotéza HA HA: sledovaný efekt je různý mezi skupinami Testová statistika Pozorovaná hodnota – Očekávaná hodnota Variabilita dat Testová statistika = * Velikost vzorku Kritický obor testové statistiky Statistické testování odpovídá na otázku zda je pozorovaný rozdíl náhodný či nikoliv. K odpovědi na otázku je využit statistický model – testová statistika. T Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 5

Možné chyby při testování hypotéz I přes dostatečnou velikost vzorku a kvalitní design experimentu se můžeme při rozhodnutí o zamítnutí/nezamítnutí nulové hypotézy dopustit chyby. Závěr testu Správné rozhodnutí Hypotézu nezamítáme Hypotézu zamítáme Chyba I. druhu H0 Platí 1- α α Skutečnost β 1- β Neplatí H0 Správné rozhodnutí Chyba II. druhu Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 6

Význam chyb při testování hypotéz Před výpočtem testu si stanovujeme maximální přípustnou pravděpodobnost. Obvykle 5 %. Pravděpodobnost chyby 1. druhu a Pravděpodobnost nesprávného zamítnutí nulové hypotézy Nemůžeme ovlivnit jinak než výběrem testu. Pravděpodobnost chyby 2. druhu b Pravděpodobnost nerozpoznání neplatné nulové hypotézy Síla testu je vlastností testu – parametrické testy mají vyšší sílu než neparametrické. Síla testu Pravděpodobnostně vyjádřená schopnost rozpoznat neplatnost hypotézy 1-b Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 7

P-hodnota Významnost hypotézy hodnotíme dle získané tzv. p-hodnoty, která vyjadřuje pravděpodobnost, s jakou číselné realizace výběru podporují H0, je-li pravdivá. P-hodnotu porovnáme s α (hladina významnosti, stanovujeme ji na 0,05, tzn., že připouštíme 5 % chybu testu, tedy, že zamítneme H0, ačkoliv ve skutečnosti platí). P-hodnotu získáme při testování hypotéz ve statistickém softwaru. Je-li p-hodnota ≤ α, pak H0 zamítáme na hladině významnosti α a přijímáme HA. Je-li p-hodnota > α, pak H0 nezamítáme na hladině významnosti α. P-hodnota vyjadřuje pravděpodobnost za platnosti H0, s níž bychom získali stejnou nebo extrémnější hodnotu testové statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Parametrické vs. neparametrické testy Mají předpoklady o rozložení vstupujících dat (např. normální rozložení) Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný Neparametrické testy Nemají předpoklady o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

One-sample vs. two sample testy Jednovýběrové testy (one-sample) Srovnávají jeden vzorek (one sample, jednovýběrové testy) s referenční hodnotou (popřípadě se statistickým parametrem cílové populace). V testu je tedy srovnáváno rozložení hodnot (vzorek) s jediným číslem (referenční hodnota, hodnota cílové populace). Otázka položená v testu může být vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek. Dvouvýběrové testy (two-sample) Srovnávají navzájem dva vzorky (two sample, dvouvýběrové testy). V testu jsou srovnávány dvě rozložení hodnot. Otázka položená v testu může být opět vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek. Kromě testů pro dvě skupiny hodnot existují samozřejmě i testy pro více skupin dat. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Nepárový vs. párový design Nepárový design Skupiny srovnávaných dat jsou na sobě zcela nezávislé (též nezávislý, independent design), např. lidé z různých zemí, nezávislé skupiny pacientů s odlišnou léčbou atd. Při výpočtu je nezbytné brát v úvahu charakteristiky obou skupin dat Párový design Mezi objekty v srovnávaných skupinách existuje vazba, daná např. člověkem před a po operaci, reakce stejného kmene krys atd. Vazba může být buď přímo dána nebo pouze předpokládána (v tom případě je nutné ji ověřit) Test je v podstatě prováděn na diferencích skupin, nikoliv na jejich původních datech Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 11

Normalita dat Normální rozdělení pravděpodobnosti je definováno rovnicí: Kde f(x) značí hustotu pravděpodobnosti, μ značí střední hodnotu (aritmetický průměr), σ značí směrodatnou odchylku a x hodnotu zkoumané veličiny. Dosazením s za σ a x̅ za μ získáme křivku idealizovaného rozdělení pro daný výběr. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 12