Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Popisná statistika - pokračování
Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.
4
Postup tvorby histogramu
Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů Zjisti četnosti v jednotlivých intervalech
7
Histogramy (= rozdělení četností) mohou mít různý tvar
normální Příklady zešikmené bimodální
8
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
9
Míry parametrické (momentové)
Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU
10
Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru
11
Definice výběrového průměru pomocí pravděpodobnosti
Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností: Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot
12
Výpočet aritmetického průměru
13
Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi
14
Vážený průměr - pokračování
Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X
15
Geometrický průměr GEOMETRICKÝ PRŮMĚR
Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR
16
Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = Zpětným odlogaritmováním ( ) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:
17
Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:
18
Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4
19
Výpočet parametrických měr variability
Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:
20
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
21
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
22
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
23
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
24
Parametrické míry polohy
Průměry - aritmetický - geometrický - harmonický
25
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
26
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
27
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
28
Parametrické míry polohy
Průměry - aritmetický - geometrický - harmonický
29
Aritmetický průměr vypočtený pomocí pravděpodobnosti
30
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
31
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
32
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
33
Parametrické míry polohy
Průměry - aritmetický - geometrický - harmonický
34
Aritmetický průměr vypočtený pomocí pravděpodobnosti
35
Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce
36
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
37
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
38
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
39
Parametrické míry polohy
Průměry - aritmetický - geometrický - harmonický
40
Aritmetický průměr vypočtený pomocí pravděpodobnosti
41
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
42
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
43
Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean
44
Parametrické míry polohy
Průměry - aritmetický - geometrický - harmonický
45
Aritmetický průměr vypočtený pomocí pravděpodobnosti
46
Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:
47
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
48
Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27 = 1,44 2 = 0,75
49
On-line statistická modelace
Statlet: Calculate and plot probability distributions:
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.