Popisná statistika - pokračování Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.
Postup tvorby histogramu Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů Zjisti četnosti v jednotlivých intervalech
Histogramy (= rozdělení četností) mohou mít různý tvar normální Příklady zešikmené bimodální
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Míry parametrické (momentové) Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU
Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru
Definice výběrového průměru pomocí pravděpodobnosti Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností: Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot
Výpočet aritmetického průměru
Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi
Vážený průměr - pokračování Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X
Geometrický průměr GEOMETRICKÝ PRŮMĚR Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR
Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = 0.607. Zpětným odlogaritmováním (100.607) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:
Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:
Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4
Výpočet parametrických měr variability Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Aritmetický průměr vypočtený pomocí pravděpodobnosti
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Aritmetický průměr vypočtený pomocí pravděpodobnosti
Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Aritmetický průměr vypočtený pomocí pravděpodobnosti
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický
Aritmetický průměr vypočtený pomocí pravděpodobnosti
Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
On-line statistická modelace http://fltbw2.rug.ac.be/iloapp/Applets/Ap4a.html http://pbil.univ-lyon1.fr/Rweb/ Statlet: Calculate and plot probability distributions: http://www.statlets.com/free/pdist.htm