Základy zpracování geologických dat testování statistických hypotéz

Slides:



Advertisements
Podobné prezentace
Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Advertisements

Ukazatele kvality Metodika pro tvorbu a testování ukazatelů kvality zdravotních služeb - B.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Ekonomicko-matematické metody č. 11 Prof. RNDr. Jaroslav Ramík, CSc.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, J. Kalina Pearsonova korelace Kolomogorovův-Smirnovův (Lilieforsův)
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ.
Genetické parametry Heritabilita, korelace. primární GP genetický rozptyl prostřeďový rozptyl kovariance sekundární GP heritabilita opakovatelnost genetické.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
Doprava ROZMĚRY Který obrázek je největší? Který obrázek je nejmenší?
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně AUTOR: Ing. Oldřich Vavříček NÁZEV: Podpora výuky v technických oborech TEMA: Základy elektrotechniky.
Základní škola a Mateřská škola, Liberec, Barvířská 38/6, příspěvková organizace Název : VY_32_inovace_18 Informatika - MS Excel – Typy grafů Autor: Pavlína.
Test dobré shody a testy nezávislosti, regresní analýza 2.přednáška.
STATISTICKÉ METODY V GEOGRAFII. Odhady parametrů intervaly spolehlivosti.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
9. SEMINÁŘ INDUKTIVNÍ STATISTIKA 2. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ.
Úvod do testování hypotéz
Analýza variance (ANOVA).
Testování hypotéz Testování hypotéz o rozdílu průměrů
Indukce Definice: nalezení obecných zákonitostí z příkladů.
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Pravděpodobnostní hodnocení vstupních parametrů zemin a hornin a spolehlivostní analýza geotechnických konstrukcí.
Interpolace funkčních závislostí
7. Statistické testování
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Testování hypotéz vymezení základních pojmů
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
PSY117 Statistická analýza dat v psychologii Přednáška
Testování hypotéz Testování hypotéz o rozdílu průměrů
Marketingový výzkum. Marketingový výzkum Organizace marketingového výzkumu Cíl výzkumu Typ výzkumu Příprava výzkumného projektu Sběr dat Analýza výsledků.
Výběrové metody (Výběrová šetření)
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Základy zpracování geologických dat testování statistických hypotéz
GENETIKA POPULACÍ KVANTITATIVNÍCH ZNAKŮ 8
Logika a metody výběru vzorku
Statistická analýza dat
Biostatistika Opakování Modelová rozložení náhodné veličiny
Párový neparametrický test
Základy statistické indukce
Parametry polohy Modus Medián
Rozšířené modely časových řad
APLIKACE MATEMATIKY A FYZIKY A Matematická část 2
Kvadratické nerovnice
Želvy H0 = není rozdíl mezi délkou želv na Marshallových ostrovech a délkou celé populace karet obrovských H1 = je rozdíl mezi délkou karet obrovských.
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Statistické metody a zpracování dat 1 (podzim 2016) Klára Čížková
Integrovaná střední škola, Hodonín, Lipová alej 21, Hodonín
BIBS Informatika pro ekonomy přednáška 2
Spojité VELIČINY Vyšetřování normality dat
Meteorologický preprocesor CALMET a jeho využití pro objektivizaci konstrukce větrných růžic Radostovice Hana Škáchová, OME.
XII. Binomické rozložení
ASTAc/03 Biostatistika 4. cvičení
Úvod do praktické fyziky
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Lineární regrese.
Cauchyho rozdělení spojité náhodné veličiny
Analýza variance (ANOVA).
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie chyb a vyrovnávací počet 1
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
Testování hypotéz H0 – nulová hypotéza
Centrální limitní věta
T - testy Párový t - test Existuje podezření, že u daného typu auta se přední pneumatiky nesjíždějí stejně. H0: střední hodnota sjetí vpravo (m1) = střední.
Více náhodných veličin
Teorie chyb a vyrovnávací počet 2
Seminář o stavebním spoření
Teorie chyb a vyrovnávací počet 2
Transkript prezentace:

Základy zpracování geologických dat testování statistických hypotéz R. Čopjaková

Testování statistických hypotéz Při zpracování dat jsou časté úvahy typu: Liší se hodnoty naměřené na stejných přístrojích v různých laboratořích? (např. data z EMP v Brně a Barrandově) Liší se výsledky získané různými analytickými metodami (např. hodnoty naměřené přenosným terénním gama-spektrometrem a laboratorním gama-spektrometrem) Liší se hodnoty naměřené v různých časových intervalech (sezónní vlivy v hydrogeologii) Liší se hodnoty naměřené v různých místech (např. srovnání chemického složení – protolitu- ortorul sněžnických a gieraltovských orlicko-kladského krystalinika) Liší se hodnoty naměřené látky od deklarované hodnoty (např. prověřování standardů, či kontrola kvality analýz)

Existuje závislost mezi soubory dat. (např Existuje závislost mezi soubory dat? (např. vyšetřování substitucí v minerálech) Je některá hodnota souboru odlehlá? (Mám ji ze souboru vyřadit a nepracovat s ní při výpočtu dalších parametrů – střední hodnoty, Sx…?) 4,0; 4,2; 4,4; 4,5; 4,5; 4,6; 4,7; 4,9; 5,1; 5,8 ? Chovají se naměřená data podle normálního rozdělení? rxy = O,6

K řešení těchto problémů lze ve statistice využít metody testování statistických hypotéz, s jejichž pomocí lze hledat odpovědi na tyto otázky a činit závěry.

Testování statistických hypotéz Základní pojmy hypotéza H0 – nulová (testovaná) hypotéza, kterou testujeme hypotéza HA – alternativní hypotéza, kterou přijmeme, zamítneme-li hypotézu Ho a – hladina významnosti – volí se malá do 0,05; nejčastěji 0,05 - tedy 5-ti% pravděpodobnost chyby 1. druhu; vysoce významné výsledky testování pro a = 0,005 a méně kritická hodnota pro test nulové hypotézy = hodnota kvantilu hraniční pro oblast zamítání H0 na zvolené hladině významnosti a (kde a vyjadřuje pravděpodobnost, že náhodná veličina překročí tuto hodnotu).

Chyby při testování Chyba 1. druhu zamítneme-li platící hypotézu H0, dopustíme se chyby I. druhu je spojena se zamítnutím nulové hypotézy, která ve skutečnosti platí; její pravděpodobnost se nazývá hladina významnosti a platí-li hypotéza alternativní HA a testovanou hypotézu H0 nezamítáme, dopouštíme se chyby II. Druhu Chyba 2. druhu Značí se b je pravděpodobnost nesprávného přijetí nulové hypotézy 1- b se nazývá síla testu závisí na velikosti výběru (s větším souborem klesá)

oboustranná hypotéza (oboustranný test) jednostranná hypotéza (jednostranný test) a obráceně

V případě oboustranného testu: musíme rozdělit danou hladinu významnosti a na dvě časti reprezentující dva možné konce distribuce. Značíme ka(2), např. t0,05(2) V případě jednostranného testu: uvažujeme pouze jeden konec distribuce a danou hladinu významnosti proto nedělíme. Značíme ka(1), např. t0,05(1)

Testování statistických hypotéz Obecný postup testování  zvolíme hladinu významnosti a  formulujeme nulovou hypotézu H0 a alternativní hypotézu HA  zvolíme vhodné testovací kritérium   vypočteme velikost test. kritéria T stanovíme kritickou hodnotu (hodnotu kvantilu hraniční pro oblast zamítání H0) pro zvolenou hladinu významnosti - ka porovnáme velikost testovacího kritéria s kritickou hodnotou jestliže T ≤ ka, akceptujeme nulovou hypotézu na námi zvolené hladině významnosti jestliže T > ka, zamítneme nulovou hypotézu a říkáme, že platí H1 zamítnutí hypotézy H0 neznamená, že tato hypotéza neplatí, jen dáváme najevo, že ji nedůvěřujeme

Testování statistických hypotéz Testy: parametrické neparametrické parametrický test – pro soubory s normálním rozdělením nebo téměř normálním rozdělením pravděpodobností Známe-li rozdělení pravděpodobností základního souboru neparametrický test – i pro soubory a jiným než normálním rozložením pravděpodobností Neznáme-li rozdělení pravděpodobností základního souboru - širší použití než parametrické - řešení nezávisí na typu rozdělení základního souboru - lze použít i pro silně nenormální rozdělení, kdy parametrické testy předpokládající normální rozdělení selhávají

Test hypotéz o korelačním koeficientu Otázka – je spočtená hodnota korelačního koeficientu statisticky významná? Když rxy se blíží 1 či -1 pak jistě ano Ale co když rxy je např. 0,5? – závislé na počtu měření ověření předpokladu o nulové hodnotě korelačního koeficientu Ho: rxy = 0   Spočtení testovacího kritéria Stanovení kritické hodnoty pro zvolenou hladinu významnosti a a počet stupňů volnosti n-2; Tk(a; n-2) V excelu stanovím pomocí funkce TINV Pokud t ≤Tk pak přijmeme Ho a tedy existenci lineární závislosti mezi veličinami v souboru považujeme za neprokázanou.