POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Okna vesmíru statistiky dokořán
Statistické charakteristiky variability
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
Popisná statistika - pokračování
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Tloušťková struktura porostu
Obsah statistiky Jana Zvárová
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Základní statistické charakteristiky
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09C17 AutorMgr. Monika Chvostková Období vytvořeníŘíjen.
Charakteristiky variability
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o. Osvoboditelů 380, Louny Číslo projektu CZ.1.07/1.5.00/ Číslo sady30Číslo DUM17.
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Pohled z ptačí perspektivy
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Výběrová šetření, Exploratorní analýza
Biostatistika 8. přednáška
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
© Tom Vespa STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
… jak jsem na tom ve srovnání s ostatními?
Popisná analýza v programu Statistica
Příjemce podpory – škola: Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice, Benešovo náměstí 1, p.o. Číslo projektu:CZ.1.07/1.5.00/
Systémy vnitřní kontroly kvality
Popisná statistika úvod rozdělení hodnot míry centrální tendence
Základy popisné statistiky
Výběrová šetření, Exploratorní analýza
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Zlepšení podmínek pro vzdělávání na středních školách Operačního programu Vzdělávání pro konkurenceschopnost Název a adresa školy: Integrovaná střední.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Kontingenční tabulky v Excelu Základní popisné statistiky.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Statistika 1 Ústav lékařské informatiky, 2. LF UK 2008.
Popisná statistika I tabulky četností
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná statistika: přehled
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
Spojitá a kategoriální data Základní popisné statistiky
Název: Chyby měření Autor: Petr Hart, DiS.
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Rozložení nadpisu Podnadpis.
Kapitola 3: Centrální tendence a variabilita
Výukový materiál zpracován v rámci projektu EU peníze školám
Rozložení obrázku s titulkem
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
F-Pn-P062-Odchylky_mereni
Charakteristiky polohy
Transkript prezentace:

POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní obrázek. Martina Litschmannová MÁME DATA – A CO DÁL? (II.)

Obsah:  Exploratorní (popisná) analýza kvantitativních dat  Číselné charakteristiky  Odlehlá pozorování  Grafické zobrazení  Exploratorní (popisná) analýza kvantitativních dat s využitím statistického software

Exploratorní analýza kvantitativní proměnné Číselné charakteristiky A)Míry polohy (úrovně) B)Míry variability C)Míry šikmosti a špičatosti

Míry polohy -Odhadují skutečnou populační střední hodnotu na základě výběrového souboru. -Patří mezi ně: výběrový aritmetický průměr, výběrový geometrický průměr, výběrový medián a modus. -Dalšími mírami polohy, které se týkají popisu i polohy jiných hodnot než středních, jsou kvantily.

Statistik, který má hlavu v sauně a nohy v ledničce, hovoří o příjemné průměrné teplotě. Autor neznámý Ošidný průměr

Aritmetický průměr

Ošidnost průměru Zdroj: [1]

Ošidnost průměru Země K Průměrná produkce kuřat (na osobu): 1,0 (denně)

Ošidnost průměru „Průměrná rodina má 2,2 dítěte.“ Zdroj: [1]

Ošidnost průměru

 V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže. $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. ($31 830)  Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $ $ $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. ($ )

Ošidnost průměru Zdroj: Blesk,

Aritmetický průměr

Výběrové kvantily

Význačné výběrové kvantily

Kde se s kvantily setkáme v praxi? Zdroj: Vyhodnocení Národních srovnávacích zkoušek, …

Kde se s kvantily setkáme v praxi? vyhodnocení Národních srovnávacích zkoušek, … růstové grafy

Růstové grafy

Jak se výběrové kvantily určují?

MN (%) 8,7 7,8 6,8 7,8 9,7 15,7 6,8 4,9 6,8 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 1

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 1

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 1

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 1

Míry variability -Charakteristiky hodnotící rozptýlenost hodnot statistického souboru kolem nějaké míry polohy. -Patří mezi ně: (variační) rozpětí, mezikvartilové (interkvartilové) rozpětí, rozptyl, směrodatná odchylka a variační koeficient.

Zásahy střelce AZásahy střelce B Průměr?? K čemu potřebujeme míry variability?

Zásahy střelce AZásahy střelce B Průměr?? K čemu potřebujeme míry variability? Zdroj: [1]

Firma vyrábějící tabulové sklo vyvinula méně nákladnou technologii pro zlepšení odolnosti skla vůči žáru. Pro testování bylo vybráno 100 tabulí skla a rozřezáno na polovinu. Jedna polovina pak byla ošetřena novou technologií, zatímco druhá byla ponechána jako kontrolní. Výsledky jsou prezentovány v následujícím grafu. Lze doporučit zavedení nové technologie do výroby? K čemu potřebujeme míry variability?

Firma vyrábějící tabulové sklo vyvinula méně nákladnou technologii pro zlepšení odolnosti skla vůči žáru. Pro testování bylo vybráno 100 tabulí skla a rozřezáno na polovinu. Jedna polovina pak byla ošetřena novou technologií, zatímco druhá byla ponechána jako kontrolní. Výsledky jsou prezentovány v následujícím grafu. Lze doporučit zavedení nové technologie do výroby? K čemu potřebujeme míry variability?

Výběrový rozptyl Na co si dát pozor? Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

Výběrová směrodatná odchylka

Jakou představu o variabilitě dat nám dává sm. odchylka? Empirické pravidlo 3 sigma k 10,682 20,954 30,998 k 1>0>0 2>0,75 3>0,89

Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) Čím nižší var. koeficient, tím homogennější soubor. V x > 50% značí silně rozptýlený soubor. Proč potřebujeme bezrozměrnou míru variability? Umožňuje srovnání variability proměnných, které mají různé jednotky.

Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

Odlehlá pozorování

 ty hodnoty proměnné, které se mimořádně liší od ostatních hodnot a tím ovlivňují např. vypovídací hodnotu průměru. Jak postupovat v případě, že v datech identifikujeme odlehlá pozorování?  V případě, že odlehlost pozorování je způsobena:  hrubými chybami, překlepy, prokazatelným selháním lidí či techniky...  důsledky poruch, chybného měření, technologických chyb... tzn., známe-li příčinu odlehlosti a předpokládáme-li, že již nenastane, jsme oprávněni tato pozorování vyloučit z dalšího zpracování.  V ostatních případech je nutno zvážit, zda se vyloučením odlehlých pozorování nepřipravíme o důležité informace o jevech vyskytujících se s nízkou četností.

Metoda vnitřních hradeb Dolní mez vnitřních hradeb Horní mez vnitřních hradeb Identifikace odlehlých pozorování

Metoda vnějších hradeb Dolní mez vnějších hradeb Horní mez vnějších hradeb Identifikace extrémních pozorování

MN [%] 4,9 6,8 7,8 8,7 9,7 15,7 MN 0,5 =7,3 MN 0,25 =6,8 MN 0,75 =8,7 IQR=MN 0,75 -MN 0,25 =1,9 Vnitřní hradby: Dolní mez: 6,8-2,85=3,95 Horní mez: 8,7+2,85=11,55 1,5.IQR=2,85 V předložených datech identifikujte odlehlá pozorování: 2

MN [%] 4,9 6,8 7,8 8,7 9,7 15,7 MN 0,5 =7,3 MN 0,25 =6,8 MN 0,75 =8,7 IQR=MN 0,75 -MN 0,25 =1,9 Vnitřní hradby: Dolní mez: 6,8-2,85=3,95 Horní mez: 8,7+2,85=11,55 1,5.IQR=2,85 V předložených datech identifikujte odlehlá pozorování: 2

Míry šikmosti a špičatosti

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008

Výběrová šikmost (standardizovaná) Symetrická dataPozitivně zešikmená data Negativně zešikmená data empirické pravidlo

Výběrová špičatost (standardizovaná) míra koncentrace kolem průměru

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g 1, angl. skewness) a špičatost (g 2, angl. kurtosis). Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008

Přesnost číselných charakteristik

Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný?

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst. 3 platné cifry u směrodatné odchylky.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst. 3 platné cifry u směrodatné odchylky. Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Oprava Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,68117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? 3 platné cifry u směrodatné odchylky. Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Oprava Délka (m)Váha (kg)Teplota ( 0 C) Průměr2, Medián2, Směrodatná odchylka 0, (před zaokrouhlením 1235) Proč je zápis chybný? Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Správný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823,71 300

Grafické znázornění kvantitativní proměnné

Krabicový graf (Box plot)

Na co si dát pozor? Histogram

Na co si dát pozor? MS Excel 2007, funkce Histogram Výpočetní applet Explorační analýza 59 Histogram

Literatura  Litschmannová, M. (2012), Úvod do statistiky, elektronická skripta a doplňkové interaktivní materiály (kapitola Explorační analýza proměnných)Úvod do statistiky  Zvárová, J. (1999), Základy statistiky pro biomedicínské obory, dostupné on-line: (kapitola 5)  Pavlík, T., Dušek, L. (2012), Biostatistika, Akademické nakladatelství CERM, ISBN (kapitola 2)Biostatistika

POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní obrázek. DĚKUJI ZA POZORNOST!