Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Popisná statistika - pokračování

Podobné prezentace


Prezentace na téma: "Popisná statistika - pokračování"— Transkript prezentace:

1 Popisná statistika - pokračování
Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.

2

3

4 Postup tvorby histogramu
Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů Zjisti četnosti v jednotlivých intervalech

5

6

7 Histogramy (= rozdělení četností) mohou mít různý tvar
normální Příklady zešikmené bimodální

8 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

9 Míry parametrické (momentové)
Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU

10 Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru

11 Definice výběrového průměru pomocí pravděpodobnosti
Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností:    Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot

12 Výpočet aritmetického průměru

13 Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi

14 Vážený průměr - pokračování
Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X

15 Geometrický průměr GEOMETRICKÝ PRŮMĚR
Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR

16 Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = Zpětným odlogaritmováním ( ) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:

17 Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:

18 Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4

19 Výpočet parametrických měr variability
Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:

20 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

21 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

22 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

23 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

24 Parametrické míry polohy
Průměry -         aritmetický -         geometrický -        harmonický

25 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

26 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

27 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

28 Parametrické míry polohy
Průměry -         aritmetický -         geometrický -        harmonický

29 Aritmetický průměr vypočtený pomocí pravděpodobnosti

30 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

31 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

32 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

33 Parametrické míry polohy
Průměry -         aritmetický -         geometrický -        harmonický

34 Aritmetický průměr vypočtený pomocí pravděpodobnosti

35 Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce

36 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

37 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

38 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

39 Parametrické míry polohy
Průměry -         aritmetický -         geometrický -        harmonický

40 Aritmetický průměr vypočtený pomocí pravděpodobnosti

41 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

42 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

43 Neparametrické charakteristiky polohy
Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

44 Parametrické míry polohy
Průměry -         aritmetický -         geometrický -        harmonický

45 Aritmetický průměr vypočtený pomocí pravděpodobnosti

46 Definice statistických momentů pomocí pravděpodobnosti
Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

47 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

48 Příklad - výpočet střední hodnoty a rozptylu
Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27  = 1,44 2 = 0,75

49 On-line statistická modelace
Statlet: Calculate and plot probability distributions:


Stáhnout ppt "Popisná statistika - pokračování"

Podobné prezentace


Reklamy Google