Popisná statistika - pokračování

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Statistická indukce Teorie odhadu.
Charakteristiky úrovně
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Testování parametrických hypotéz
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Pravděpodobnost a statistika opakování základních pojmů
Statistika Vypracoval: Mgr. Lukáš Bičík
Statistika Střední hodnoty
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
PRAVDĚPODOBNOST A STATISTIKA
Tloušťková struktura porostu
Charakteristiky polohy
Obsah statistiky Jana Zvárová
Statistika 8. ročník Autorem materiálu je Mgr. Jana Čulíková
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Odhady parametrů základního souboru
Statistický soubor, jednotka, znak.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Základní statistické charakteristiky
Statistika Ukazatelé variability
Jevy a náhodná veličina
Charakteristiky variability
Statistické výpočty v MATLABu
Popisná statistika III
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Metrologie   Přednáška č. 5 Nejistoty měření.
Na co ve výuce statistiky není čas
2. Vybrané základní pojmy matematické statistiky
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Biostatistika 8. přednáška
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
Základy statistiky Autor: Jana Buršová.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Popisná analýza v programu Statistica
1. cvičení
Statistika Statistika je matematická disciplína, která zpracovává výsledky hromadného pozorování (o objemu výroby, dovozu či vývozu zboží, výdajích a příjmech.
K OMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Charakteristiky variability VY_32_INOVACE_M4r0120 Mgr. Jakub Němec.
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Zlepšení podmínek pro vzdělávání na středních školách Operačního programu Vzdělávání pro konkurenceschopnost Název a adresa školy: Integrovaná střední.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Odhady odhady bodové a intervalové odhady
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Odhady parametrů základního souboru
Popisná statistika: přehled
Popisná analýza v programu Statistica
Základy zpracování geologických dat Rozdělení pravděpodobnosti
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Výukový materiál zpracován v rámci projektu EU peníze školám
Střední škola obchodně technická s. r. o.
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Analýza kardinálních proměnných
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

Popisná statistika - pokračování Jeden mrtvý je tragédie. Desítka mrtvých je masakr. Tisíce mrtvých je statistika.

Postup tvorby histogramu Urči šířku intervalu Urči hranice intervalů (Sturgersovo pravidlo nebo h = 0,08*R) Zařaď vzorky do jednotlivých intervalů Zjisti četnosti v jednotlivých intervalech

Histogramy (= rozdělení četností) mohou mít různý tvar normální Příklady zešikmené bimodální

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Míry parametrické (momentové) Jsou založeny na všech hodnotách základního či výběrového souboru. Základní parametrickou mírou je PRŮMĚR – ZASTUPUJE STŘED, STŘEDNÍ HODNOTU SOUBORU

Aritmetický průměr Kde Xi jsou jednotlivé hodnoty veličiny X, N je celkový počet hodnot v souboru

Definice výběrového průměru pomocí pravděpodobnosti Výběrový průměr: Vyjádření výběrových momentů pomocí relativních četností:    Kde x – hodnota třídního znaku (střed intervalu), f – počet hodnot v tomto intervalu, n – celkový počet hodnot

Výpočet aritmetického průměru

Vážený průměr Máme-li dva či více výběrových souborů s výrazně rozdílnými N, ze kterých chcete vypočítat „celkový průměr“, musíme zohlednit tyto rozdílné počty „váhami“ - wi

Vážený průměr - pokračování Vzorek Průměr Počet hodnot Instinkt by vám mohl našeptávat: udělej aritmetický průměr z průměrů. TO NEDĚLEJTE !! Správný postup: X (Špatný postup: (3,85 + 5,21 + 4,7)/3 = 4,58) X

Geometrický průměr GEOMETRICKÝ PRŮMĚR Pokud jsme naměřené hodnoty před výpočtem průměru transformovali logaritmováním (při základě = 10), a vypočteme aritmetický průměr těchto logaritmů, jeho zpětným „odlogaritmováním“ nedostaneme aritmetický průměr původních naměřených hodnot, ale GEOMETRICKÝ PRŮMĚR

Geometrický průměr Příklad: naměřili jsme hodnoty 2, 3, 3, 4, 15 (N = 5). Aritmetický průměr by dal („nesprávnou“) hodnotu 5.4 Lepší bude data nejprve transformovat logaritmováním (na hodnoty 0.301, 0.477, 0.477, 0.622, 1,176) a teprve z těchto logaritmů vypočítat průměr = 0.607. Zpětným odlogaritmováním (100.607) dostaneme hodnotu 4.043, která je správným vyjádřením střední hodnoty našeho souboru. Lze ji též vypočítat ze vzorce pro GEOMETRICKÝ PRŮMĚR:

Harmonický průměr Je-li vhodnější transformací původních dat jejich převedení na převrácené hodnoty, pak správným vyjádřením střední hodnoty je harmonický průměr:

Harmonický průměr Příklad výpočtu: (data z předchozího příkladu): suma převrácených hodnot vydělená N=5 je 0,297. Převrácená hodnota tohoto výsledku = 3.37 je HARMONICKÝ PRŮMĚR N.B.: aritmetický průměr z týchž dat = 5.4

Výpočet parametrických měr variability Vyjádření rozptylu pomocí pravděpodobnosti Výběrový rozptyl: nebo: Vyjádření výběrového rozptylu pomocí relativních četností: Výběrový rozptyl:

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Parametrické míry polohy Průměry -         aritmetický   -         geometrický -        harmonický

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Parametrické míry polohy Průměry -         aritmetický   -         geometrický -        harmonický

Aritmetický průměr vypočtený pomocí pravděpodobnosti

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Parametrické míry polohy Průměry -         aritmetický   -         geometrický -        harmonický

Aritmetický průměr vypočtený pomocí pravděpodobnosti

Vážený průměr Mějme několik nezávislých nevychýlených měření X1, X2, …, Xn veličiny λ, se směrodatnými odchylkami σ1, σ2,…, σn a vahami w1, w2, …, wn. Jsou-li váhy wi nezávislé na hodnotách Xi, je nevychýleným odhadem střední hodnoty vážený průměr Rozptyl váženého průměru se vypočte dle vzorce

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Parametrické míry polohy Průměry -         aritmetický   -         geometrický -        harmonický

Aritmetický průměr vypočtený pomocí pravděpodobnosti

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Neparametrické charakteristiky polohy Modus – nejčetnější hodnota. V geologii nás modus zajímá tehdy, když např. chceme znát nejčastěji se vyskytující rozměr zrn písku, nejpravděpodobnější velikost chyby stanovení a j. Důležitý u bimodálních rozdělení - směsná rozdělení. Medián ( = 50%-ní kvantil): Výběrový medián je tou hodnotou náhodné veličiny, která dělí celou oblast pozorovaných hodnot, uspořádaných podle rostoucí velikosti, na dvě poloviny se stejnou četností výskytu (střed variačního oboru). Trimean

Parametrické míry polohy Průměry -         aritmetický   -         geometrický -        harmonický

Aritmetický průměr vypočtený pomocí pravděpodobnosti

Definice statistických momentů pomocí pravděpodobnosti Výběrový průměr: Výběrový rozptyl: nebo: Vyjádření výběrových momentů pomocí relativních četností:   

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

Příklad - výpočet střední hodnoty a rozptylu Výpočet střední hodnoty a rozptylu pro počet děvčat (x) v rodinách se třemi dětmi Dané rozdělení pravděpodobností Výpočet  pomocí (1) Výpočet 2 pomocí (2) x p(x) x.p(x) (x - ) (x - )2 (x - )2.p(x) 0,14 -1,44 2,07 0,29 1 0,39 -0,44 0,19 0,08 2 0,36 0,72 0,56 0,31 0,11 3 0,33 1,56 2,43 0,27    = 1,44 2 = 0,75

On-line statistická modelace http://fltbw2.rug.ac.be/iloapp/Applets/Ap4a.html   http://pbil.univ-lyon1.fr/Rweb/ Statlet: Calculate and plot probability distributions: http://www.statlets.com/free/pdist.htm