IV..

Slides:



Advertisements
Podobné prezentace
Testování parametrických hypotéz
Advertisements

Kontrola kvality,“Westgardova pravidla“
Statistické metody v ochraně kulturního dědictví
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
MUDr. Michal Jurajda, PhD. ÚPF LF MU
SPC v případě autokorelovaných dat
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení září 2010.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
Základy ekonometrie Cvičení 3 4. října 2010.
Toolbox analýzy a modelování stochastických systémů b Ústav teorie informace a automatizace, AVČR b Oddělení stochastické informatiky b Ing. Petr Salaba.
Statistická analýza únavových zkoušek
Lineární regrese.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
1 Nedodržení předpokladu normality v regulačním diagramu.
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Princip maximální entropie
Experimentální fyzika I. 2
V. Analýza rozptylu ANOVA.
Metrologie   Přednáška č. 5 Nejistoty měření.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
8. Kontingenční tabulky a χ2 test
Normální rozdělení a ověření normality dat
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Pearsonův test dobré shody chí kvadrát
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Systémy vnitřní kontroly kvality
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Aplikovaná statistika 2.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Základy zpracování geologických dat R. Čopjaková.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Stručný přehled modelových rozložení I.
Statistické testování – základní pojmy
PSY117 Statistická analýza dat v psychologii Přednáška
Analýza časových řad Klasický přístup k analýze ČŘ
PSY117 Statistická analýza dat v psychologii Přednáška
Popisná analýza v programu Statistica
Normální rozdělení a ověření normality dat Modelová rozdělení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Parciální korelace Regresní analýza
Typy proměnných Kvalitativní/kategorická binární - ano/ne
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

IV.

Jednoduchá lineární regrese Lineární závislost koeficienty lineární regrese a, b = odhady koeficientů pomocí MNČ

Regresní rezidua Reziduální hodnota predikce (chyba predikce) – e: MNČ: minimalizace reziduální sumy čtverců (RSC) Reziduální rozptyl

Předpoklady použití metody nejmenších čtverců Mezi proměnnými x a y je lineární vztah. Náhodné chyby e mají normální rozdělení, nulovou střední hodnotu a konstantní rozptyl (homoskedasticita). Náhodné chyby e jsou vzájemně nekorelované: cov (ei, ej) = 0. Hodnoty yi mají pro dané hodnoty přesně určených xi normální rozdělení. Hodnoty y jsou vzájemně nekorelované: cov (yi, yj) = 0.

Ověřování předpokladů regresní analýzy Grafická analýza reziduí Normalita reziduí: histogram, QQplot, PPplot Vhodnost modelu (znaménkový test) Testování regresních koeficientů analýzy testy významnosti regresních koeficientů testy shody regresních koeficientů (srovnání dvou přímek)

Regresní rezidua Grafická analýza Osa x: hodnoty x Osa y: rezidua (e) Splněn předpoklad lineárního vztahu Heteroskedasticita Nelinearita Časová závislost Odlehlé hodnoty

Testování významnosti regresních koeficientů Pomocí t-testu

Test shody regresních přímek RSCc reziduální suma čtverců všech M skupin dat F rozdělení s 2M-2 a n-2M stupni volnosti.

Interval spolehlivosti predikovaných hodnot

Fiktivní proměnné - používají se v případě nespojitostí; jsou zpravidla celočíselné, nejčastěji 0/1 Lineární lomená regrese

Neparametrická regrese Chyby u „závisle“ i „nezávisle“ proměnné

Neparametrická regrese Ortogonální regrese

Neparametrická regrese Demingova regrese Vztah mezi dvěma metodami pomocí vážené regrese

Neparametrická regrese Pasing-Bablokova regrese medián částečných odhadů regresního koeficientu (j<i)

Srovnání dvou metod Youdenova metoda

Srovnání dvou metod Bland-Altmanův graf Poměrový graf Osa y: x1i / x2i Osa x: x1i, x2i nebo (x1i + x2i)/2 Poměrový graf Osa y: x1i / x2i Osa x: x1i nebo x2i

Regulační diagramy Diagramy pro posouzení střední hodnoty (správnost): průměr, medián (Shewhart) Diagramy pro posouzení variability (přesnost): směr. odchylka, var. rozpětí Diagramy kumulativních součtů (CUSUM) Diagramy na bázi lokálního vyhlazování: pohyblivý geometrický průměr (EWMA).

Regulační diagramy - Shewhart Slouží k dlouhodobému sledování správnosti produkovaných výsledků Po dlouhou dobu jsou zaznamenávány opakované výsledky analýzy jednoho parametru referenčního materiálu Regulační diagram ukazuje, zda je celý analytický systém ve statistické rovnováze

Shewhartův diagram Nenormalita: transformace dat, empirická distribuční funkce/hustota pravděpodobnosti. Nestejné velikosti výběru: úprava mezí. Autokorelace: roste počet případů překročení regulační meze, korekce – zvětšení mezí o Vybočující měření: využití kvantilových charakteristik.

Regulační diagramy - CUSUM Postupně se sčítají odchylky sledovaných hodnot od střední hodnoty. Citlivější než Shewhart x více ovlivněn odchylkami od normality a autokorelací.

Srovnání více metod pro dva vzorky Youdenova metoda

Vícenásobná lineární regrese Závislost na několika faktorech Interakce mezi x1 a x2 Logistická regrese: y = dichotomická proměnná

Vícenásobná lineární regrese Předpoklady: Homoskedasticita (konstantní rozptyl reziduí) Nezávislost reziduí (autokorelace = korelace mezi rezidui) Normalita reziduí Multikolinearita = závislost mezi proměnnými xi Grafy: Parciální regresní Parciální reziduální

Nelineární regrese Mocninná funkce Exponenciální funkce Logaritmická funkce Logistická funkce

Linearizace nelineárních závislostí

Polynomická regrese y = k0 + k1x + k2x2 + … + knxn

Vyrovnávání dat (v histogramu) Funkcí rozdělení binomické, Poissonovo, normální, lognormální). Empirickou funkcí (KDE, ortogonálními polynomy, FFT, Savitzky – Golay)

Vyrovnávání časových závislostí Metoda klouzavých průměrů (moving averages) Metoda vážených klouzavých průměrů Metoda Savitzky - Golay Spliny Rychlá Fourierova transformace (FFT) Jádrové odhady

Klouzavé průměry Hodnota závisle proměnné je nahrazena dílčím průměrem z dané hodnoty, n předchozích a n následujících hodnot.