Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese Interpolace a vyhlazování (spline) Regresní analýza a extrapolace Softwarové nástroje - Excel, Origin, Sigmaplot, ... - gnuplot, Octave, R, ... metoda největšího spádu Gaussova-Newtonova metoda algoritmus Levenberg–Marquardt simplex
Metoda nejmenších čtverců - lineární fit lineární fit, y = mx minimalizace c2: disperze m: problém: co když neznáme x 5 10 15 20 y -10 30 40 50 60 m = 2.48 0.03
Metoda nejmenších čtverců - lineární fit Pokud jsou neznámé, ale stejné, potom Pro neznámou disperzi pak lze spočítat odhad: ozn. - nevychýlený odhad: Odhad disperze m je tedy: ... minimální suma čtverců odchylek
Testování hypotéz - pojmy Statistická hypotéza - tvrzení o tom, jaké je rozdělení pozorované náhodné veličiny Test hypotézy - pravidlo, pomocí kterého hypotézu zamítneme nebo nezamítneme. - obvykle: tzv. nulová hypotéza H0 vs. alternativní hypotéza H1. Chyba: - pokud je platná hypotéza zamítnuta (chyba 1. druhu) - pokud neplatná hypotéza zamítnuta není (chyba 2. druhu) - pravděpodobnost výskytu chyb určuje kvalitu našeho testu. Hladina významnosti a: pravděpodobnost chyby 1. druhu nepřekročí hodnotu a Síla testu: 1-(pravděpodobnost chyby 2. druhu) Testovací kritérium (testovací statistika) p-hodnota: jak často nastává situace svědčící proti testované hypotéze. hypotézu H0 zamítáme na hladině pravděpodobnosti a, pokud je p-hodnota < a (kritický obor - množina hodnot, pro které test hypotézu zamítá)
Testování hypotéz, příklad Z 30 hodů mincí padl 19x orel a 11x panna. Je mince poctivá? a=5% nulová hypotéza H0: mince je poctivá (výsledky se řídí binomickým rozdělením) alternativní hypotéza H1: mince není poctivá (nemá binomické rozdělení) spočítáme p-hodnotu: pravděpodobnost, že poctivá mince dá tento výsledek p-hodnota je pravděpodobnost, že: padne 19x a více orel nebo padne 19x a více panna p-hodnota = 2x 0,100244 ~ 0,2 p-hodnota je větší než hladina významnosti 5%, hypotézu tedy nezamítneme. např. pro 21x orel a 9x panna už by p-hodnota byla 0,043 a H0 bychom zamítli.
Testování hypotéz, c2-test testy střední hodnoty, rozptylu, párové testy, testy (ne)závislosti, trendů, optimality, ... c2-test dobré shody (c2-test kvality fitu, Pearsonův c2-test) testuje nulovou hypotézu, která říká, že rozdělení četnosti zkoumané náhodné veličiny odpovídá nějakému konkrétnímu rozdělení (normální, rovnoměrné, ...) náhodný pokus nám dává k výsledků při N nezávislých opakování pokusu: - pozorujeme četnosti: n1, ..., nk - výsledky nastávají s pravděpodobnostmi: p1, ..., pk. - očekávané četnosti jsou: Np1, ..., Npk Tedy: H0: H1: alespoň pro jedno i platí: c2-test dobré shody je založen na statistice: většinou požadujeme ni > 5
Testování hypotéz, c2-test Testovací statistika: - srovnáváme ji s hodnotou rozdělení c2 s (k-N) stupni volnosti. Použijeme stejný postup: spočítáme p-hodnotu hypotézu H0 zamítneme, je-li p-hodnota menší než hladina významnosti a, (typicky a = 0.01 až 0.05) tj. pokud:
c2-test kvality fitu k = 10
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804 N = 6, k-N = 4 c2 = 11.32612 c2 / (k-N) = 2.83153 R = 0.96998 adj. R2 = 0.86693
c2-test kvality fitu k = 10 N = 2, k-N = 8 c2 = 179.53923 c2 / (k-N) = 22.4424 R = 0.25003 adj. R2 = -0.05467 N = 3, k-N = 7 c2 = 55.0369 c2 / (k-N) = 7.86241 R = 0.84417 adj. R2 = 0.63051 N = 4, k-N = 6 c2 = 35.08879 c2 / (k-N) = 5.84813 R = 0.90376 adj. R2 = 0.72517 N = 5, k-N = 5 c2 = 11.91223 c2 / (k-N) = 2.38245 R = 0.96840 adj. R2 = 0.88804 N = 6, k-N = 4 c2 = 11.32612 c2 / (k-N) = 2.83153 R = 0.96998 adj. R2 = 0.86693 N = 9, k-N = 1 c2 = 2.21477 c2 / (k-N) = 2.21477 R = 0.99905 adj. R2 = 0.98287 R2, residual, …