Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Popisná statistika - pokračování statistika. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.

Podobné prezentace


Prezentace na téma: "Popisná statistika - pokračování statistika. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika."— Transkript prezentace:

1 Popisná statistika - pokračování statistika. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.

2

3

4 Postup tvorby histogramu Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů Zjisti četnosti v jednotlivých intervalech

5

6

7 Histogramy (= rozdělení četností) mohou mít různý tvar normální zešikmené bimodální Příklady

8 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

9 Míry parametrické (momentové) Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU

10 Aritmetický průměr Kde X i jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru

11 Definice výběrového průměru pomocí pravděpodobnosti Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot

12 Výpočet aritmetického průměru

13 Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - w i

14 Vážený průměr - pokračování Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X

15 Geometrický průměr Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR

16 Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = Zpětným odlogaritmováním ( ) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:

17 Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:

18 Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4

19 Výpočet parametrických měr variability Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl:

20 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

21 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

22 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

23 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

24 Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický

25 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

26 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

27 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

28 Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický

29 Aritmetický průměr vypočtený pomocí pravděpodobnosti

30 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

31 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

32 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

33 Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický

34 Aritmetický průměr vypočtený pomocí pravděpodobnosti

35 Vážený průměr Mějme několik nezávislých nevychýlených měření X 1, X 2, …, X n veličiny λ, se směrodatnými odchylkami σ 1, σ 2,…, σ n a vahami w 1, w 2, …, w n. Jsou-li váhy w i nezávislé na hodnotách X i, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce

36 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

37 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

38 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

39 Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický

40 Aritmetický průměr vypočtený pomocí pravděpodobnosti

41 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

42 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

43 Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

44 Parametrické míry polohy Průměry - aritmetický - geometrický - harmonický

45 Aritmetický průměr vypočtený pomocí pravděpodobnosti

46 Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností: Výběrový průměr: Výběrový rozptyl:

47 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

48 Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet  2 pomocí (2) xp(x)x.p(x) (x -  )(x -  ) 2 (x -  ) 2.p(x) 00,140-1,442,070,29 10,39 -0,440,190,08 20,360,720,560,310,11 3 0,331,562,430,27  = 1,44  2 = 0,75

49 On-line statistická modelace Statlet: Calculate and plot probability distributions:


Stáhnout ppt "Popisná statistika - pokračování statistika. Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika."

Podobné prezentace


Reklamy Google