Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese Interpolace a vyhlazování (spline) Regresní analýza a extrapolace Softwarové nástroje - Excel, Origin, Sigmaplot, ... - gnuplot, Octave, R, ... metoda největšího spádu Gaussova-Newtonova metoda algoritmus Levenberg–Marquardt simplex
c2-test kvality fitu k = 20
c2-test kvality fitu k = 20 N = 2, k-N = 18 c2 = 22.00433 c2 / (k-N) = 1.22246 R = 0.95264 R2 = 0.90752 adj. R2 = 0.90239
c2-test kvality fitu k = 20 N = 2, k-N = 18 c2 = 22.00433 c2 / (k-N) = 1.22246 R = 0.95264 R2 = 0.90752 adj. R2 = 0.90239 N = 3, k-N = 17 c2 = 3.55677 c2 / (k-N) = 0.20922 R = 0.99502 R2 = 0.99007 adj. R2 = 0.9889
c2-test kvality fitu k = 20 N = 2, k-N = 18 c2 = 22.00433 c2 / (k-N) = 1.22246 R = 0.95264 R2 = 0.90752 adj. R2 = 0.90239 N = 3, k-N = 17 c2 = 3.55677 c2 / (k-N) = 0.20922 R = 0.99502 R2 = 0.99007 adj. R2 = 0.9889 N = 4, k-N = 16 c2 = 3.08821 c2 / (k-N) = 0.19301 R = 0.99568 R2 = 0.99138 adj. R2 = 0.98976
c2-test kvality fitu k = 20 N = 2, k-N = 18 c2 = 22.00433 c2 / (k-N) = 1.22246 R = 0.95264 R2 = 0.90752 adj. R2 = 0.90239 N = 3, k-N = 17 c2 = 3.55677 c2 / (k-N) = 0.20922 R = 0.99502 R2 = 0.99007 adj. R2 = 0.9889 N = 4, k-N = 16 c2 = 3.08821 c2 / (k-N) = 0.19301 R = 0.99568 R2 = 0.99138 adj. R2 = 0.98976 N = 7, k-N = 13 c2 = 1.63299 c2 / (k-N) = 0.12561 R = 0.99544 R2 = 0.99544 adj. R2 = 0.99334
c2-test kvality fitu k = 20 N = 2, k-N = 18 c2 = 22.00433 c2 / (k-N) = 1.22246 R = 0.95264 R2 = 0.90752 adj. R2 = 0.90239 N = 3, k-N = 17 c2 = 3.55677 c2 / (k-N) = 0.20922 R = 0.99502 R2 = 0.99007 adj. R2 = 0.9889 N = 4, k-N = 16 c2 = 3.08821 c2 / (k-N) = 0.19301 R = 0.99568 R2 = 0.99138 adj. R2 = 0.98976 N = 7, k-N = 13 c2 = 1.63299 c2 / (k-N) = 0.12561 R = 0.99544 R2 = 0.99544 adj. R2 = 0.99334 k = 10 N = 1, k-N = 9 c2 = 0.59918 c2 / (k-N) = 0.06658 R = 0.99948 R2 = 0.99896 adj. R2 = 0.99884 Residuální analýza, …
Testování hypotéz - pojmy Statistická hypotéza - tvrzení o tom, jaké je rozdělení pozorované náhodné veličiny Test hypotézy - pravidlo, pomocí kterého hypotézu zamítneme nebo nezamítneme. - obvykle: tzv. nulová hypotéza H0 vs. alternativní hypotéza H1. Chyba: - pokud je platná hypotéza zamítnuta (chyba 1. druhu) - pokud neplatná hypotéza zamítnuta není (chyba 2. druhu) - pravděpodobnost výskytu chyb určuje kvalitu našeho testu. Hladina významnosti a: pravděpodobnost chyby 1. druhu nepřekročí hodnotu a Síla testu: 1-(pravděpodobnost chyby 2. druhu) Testovací kritérium (testovací statistika) p-hodnota: jak často nastává situace svědčící proti testované hypotéze. hypotézu H0 zamítáme na hladině pravděpodobnosti a, pokud je p-hodnota < a (kritický obor - množina hodnot, pro které test hypotézu zamítá)
Testování hypotéz, příklad Z 30 hodů mincí padl 19x orel a 11x panna. Je mince poctivá? a=5% nulová hypotéza H0: mince je poctivá (výsledky se řídí binom. rozdělením s p=½) alternativní hypotéza H1: mince není poctivá (nemá binomické rozdělení s p=½) spočítáme p-hodnotu: pravděpodobnost, že poctivá mince dá tento výsledek p-hodnota je pravděpodobnost, že: padne 19x a více orel nebo padne 19x a více panna p-hodnota = 2x 0,100244 ~ 0,2 p-hodnota je větší než hladina významnosti 5%, hypotézu tedy nezamítneme. např. pro 21x orel a 9x panna už by p-hodnota byla 0,043 a H0 bychom zamítli.
Testování hypotéz, c2-test testy střední hodnoty, rozptylu, párové testy, testy (ne)závislosti, trendů, optimality, ... c2-test dobré shody (c2-test kvality fitu, Pearsonův c2-test) testuje nulovou hypotézu, která říká, že rozdělení četnosti zkoumané náhodné veličiny odpovídá nějakému konkrétnímu rozdělení (normální, rovnoměrné, ...) náhodný pokus nám dává k výsledků při N nezávislých opakování pokusu: - pozorujeme četnosti: n1, ..., nk - výsledky nastávají s pravděpodobnostmi: p1, ..., pk. - očekávané četnosti jsou: Np1, ..., Npk Tedy: H0: H1: alespoň pro jedno i platí: c2-test dobré shody je založen na statistice: většinou požadujeme ni > 5
Testování hypotéz, c2-test Testovací statistika: - srovnáváme ji s hodnotou rozdělení c2 s (k-N) stupni volnosti. Použijeme stejný postup: spočítáme p-hodnotu hypotézu H0 zamítneme, je-li p-hodnota menší než hladina významnosti a, (typicky a = 0.01 až 0.05) tj. pokud: F-test (Fisher), t-test (Gosset, aka Student), … Benfordův zákon