Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.

Slides:



Advertisements
Podobné prezentace
Testování statistických hypotéz
Advertisements

Korelace a regrese Karel Zvára 1.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Testování neparametrických hypotéz
Testování hypotéz.
Testování statistických hypotéz
Cvičení 6 – 25. října 2010 Heteroskedasticita
Lineární regresní analýza Úvod od problému
P‑value ano, či ne? Roman Biskup
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Generování náhodných veličin (1) Diskrétní rozdělení
Testování hypotéz přednáška.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Testování statistických hypotéz
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Data s diskrétním rozdělením
Lineární regrese.
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regresní analýza
Další spojitá rozdělení pravděpodobnosti
Test dobré shody Fisherův přesný test McNemar test
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
Experimentální fyzika I. 2
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
8. Kontingenční tabulky a χ2 test
Hodnoty tP pro různé pravděpodobnosti P
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
V experimentu měníme hodnotu jedné nebo několika veličin x i a studujeme závislost veličiny y. - např. měníme, ostatní x i bereme jako parametry ( , ,
Poissonovo rozdělení diskrétní náhodné veličiny
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Aritmetický průměr - střední hodnota
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
TESTY א 2 (CHÍ-kvadrát) TEST DOBRÉ SHODY TEST DOBRÉ SHODY TEST NEZÁVISLOSTI TEST NEZÁVISLOSTI Testy pro kategoriální veličiny Testy pro kategoriální veličiny.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Interpolace funkčních závislostí
Interpolace funkčních závislostí
Statistické testování – základní pojmy
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Úvod do praktické fyziky
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
příklad: hody hrací kostkou
Rozdělení pravděpodobnosti
Lineární regrese.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
7. Kontingenční tabulky a χ2 test
Interpolace funkčních závislostí
Základy statistiky.
Testování hypotéz - pojmy
Princip max. věrohodnosti - odhad parametrů
NOMINÁLNÍ VELIČINY Odhad hodnoty pravděpodobnosti určitého jevu v základním souboru Test hodnoty pravděpodobnosti určitého jevu v základním souboru Srovnání.
Transkript prezentace:

Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese Interpolace a vyhlazování (spline) Regresní analýza a extrapolace Softwarové nástroje - Excel, Origin, Sigmaplot, ... - gnuplot, Octave, R, ... metoda největšího spádu Gaussova-Newtonova metoda algoritmus Levenberg–Marquardt simplex

Metoda nejmenších čtverců - lineární fit lineární fit, y = mx minimalizace c2: disperze m: problém: co když neznáme x 5 10 15 20 y -10 30 40 50 60 m = 2.48  0.03

Metoda nejmenších čtverců - lineární fit Pokud jsou neznámé, ale stejné, potom Pro neznámou disperzi pak lze spočítat odhad: ozn. - nevychýlený odhad: Odhad disperze m je tedy: ... minimální suma čtverců odchylek

Testování hypotéz - pojmy Statistická hypotéza - tvrzení o tom, jaké je rozdělení pozorované náhodné veličiny Test hypotézy - pravidlo, pomocí kterého hypotézu zamítneme nebo nezamítneme. - obvykle: tzv. nulová hypotéza H0 vs. alternativní hypotéza H1. Chyba: - pokud je platná hypotéza zamítnuta (chyba 1. druhu) - pokud neplatná hypotéza zamítnuta není (chyba 2. druhu) - pravděpodobnost výskytu chyb určuje kvalitu našeho testu. Hladina významnosti a: pravděpodobnost chyby 1. druhu nepřekročí hodnotu a Síla testu: 1-(pravděpodobnost chyby 2. druhu) Testovací kritérium (testovací statistika) p-hodnota: jak často nastává situace svědčící proti testované hypotéze. hypotézu H0 zamítáme na hladině pravděpodobnosti a, pokud je p-hodnota < a (kritický obor - množina hodnot, pro které test hypotézu zamítá)

Testování hypotéz, příklad Z 30 hodů mincí padl 19x orel a 11x panna. Je mince poctivá? a=5% nulová hypotéza H0: mince je poctivá (výsledky se řídí binomickým rozdělením) alternativní hypotéza H1: mince není poctivá (nemá binomické rozdělení) spočítáme p-hodnotu: pravděpodobnost, že poctivá mince dá tento výsledek p-hodnota je pravděpodobnost, že: padne 19x a více orel nebo padne 19x a více panna p-hodnota = 2x 0,100244 ~ 0,2 p-hodnota je větší než hladina významnosti 5%, hypotézu tedy nezamítneme. např. pro 21x orel a 9x panna už by p-hodnota byla 0,043 a H0 bychom zamítli.

Testování hypotéz, c2-test testy střední hodnoty, rozptylu, párové testy, testy (ne)závislosti, trendů, optimality, ... c2-test dobré shody (c2-test kvality fitu, Pearsonův c2-test) testuje nulovou hypotézu, která říká, že rozdělení četnosti zkoumané náhodné veličiny odpovídá nějakému konkrétnímu rozdělení (normální, rovnoměrné, ...) náhodný pokus nám dává k výsledků při N nezávislých opakování pokusu: - pozorujeme četnosti: n1, ..., nk - výsledky nastávají s pravděpodobnostmi: p1, ..., pk. - očekávané četnosti jsou: Np1, ..., Npk Tedy: H0: H1: alespoň pro jedno i platí: c2-test dobré shody je založen na statistice: většinou požadujeme ni > 5

Testování hypotéz, c2-test Testovací statistika: - srovnáváme ji s hodnotou rozdělení c2 s (k-N) stupni volnosti. Použijeme stejný postup: spočítáme p-hodnotu hypotézu H0 zamítneme, je-li p-hodnota menší než hladina významnosti a, (typicky a = 0.01 až 0.05) tj. pokud:

c2-test kvality fitu k = 10

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804 N = 6, k-N = 4 c2 = 11.32612 c2 / (k-N) = 2.83153 R = 0.96998 adj. R2 = 0.86693

c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804 N = 6, k-N = 4 c2 = 11.32612 c2 / (k-N) = 2.83153 R = 0.96998 adj. R2 = 0.86693 N = 9, k-N = 1 c2 = 2.21477 c2 / (k-N) = 2.21477 R = 0.99905 adj. R2 = 0.98287 R2, residual, …