POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.

Slides:



Advertisements
Podobné prezentace
Poměrní ukazatelé Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Advertisements

Rovnice a nerovnice Slovní úlohy VY_32_INOVACE_RONE_15.
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
Mgr. Renáta Davidová.  Hrací plocha je rozdělena do 2 sloupců, které představují různé kategorie otázek.  Každé otázce ve sloupci je přiřazeno bodové.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Slouží ke grafickému znázorn ě ní množin, vztah ů mezi množinami a operací s množinami. Vennovy diagramy Projekt OP VK - CZ.1.07/1.1.26/ „Matematika.
Základy zpracování geologických dat Rozdělení pravděpodobnosti R. Čopjaková.
NÁZEV ŠKOLY: Základní škola Strančice, okres Praha - východ AUTOR: RNDr.Ivana Řehková NÁZEV:VY_32_INOVACE_ R12_ Měřítko TEMA: Matematika 7. ročník.
Mgr. Bedřich Myšička vrchní ředitel sekce ekonomické Sekce ekonomická 10. dubna 2014.
Práce se spojnicovým diagramem Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín Tematická oblastMATEMATIKA - Finanční matematika a statistika.
Statistika Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc.
Inf Vizualizace dat a tvorba grafů. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Grafy Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Metodologie ISK Základy statistického zpracování dat Ladislava Suchá, 28. dubna 2011.
Induktivní statistika
Slovní úlohy o pohybu Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Jan Syblík. Dostupné z Metodického portálu ISSN:
Rovnice ve slovních úlohách II.
SLOVNÍ ÚLOHY ŘEŠENÉ ROVNICEMI.
Měření délky pevného tělesa
Martina Litschmannová
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
Jak modelovat výsledky náh. pokusů?
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Návod na tvorbu prezentace diplomové / bakalářské práce
MATEMATIKA Čísla celá základní pojmy.
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Lineární funkce - příklady
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně
Základní škola Děčín VI, Na Stráni 879/2 – příspěvková organizace
STATISTICKÉ METODY V GEOGRAFII
Marketingový výzkum. Marketingový výzkum Organizace marketingového výzkumu Cíl výzkumu Typ výzkumu Příprava výzkumného projektu Sběr dat Analýza výsledků.
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
Sloupkový diagram Tematická oblast
2. cvičení
Charakteristiky variability
Charakteristiky variability
Základní škola a Praktická škola Dvůr Králové nad Labem
Výběrové metody (Výběrová šetření)
Hra k zopakování a procvičení učiva (Test znalostí)
ASTAc/01 Biostatistika 2. cvičení
Základy zpracování geologických dat testování statistických hypotéz
Poměr Co je poměr. Změna v daném poměru..
Popisná /deskriptivní/ statistika
Poměr v základním tvaru.
Základy statistické indukce
2. seminární úkol - projekt
MATEMATIKA Poměr, úměra.
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
FSS MUNI, katedra SPSP Kvantitativní výzkum x118 Téma 11: Korelace
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Slovní úlohy o pohybu Pohyby stejným směrem..
Digitální učební materiál zpracovaný v rámci projektu
STATISTIKA Exaktní věda Úkoly statistiky zjišťovat data
STATISTIKA PRO EKONOMY (kombinovaná forma)
Jiří Vyskočil, Marko Genyg-Berezovskyj 2010
Základní statistické pojmy
Úvod do praktické fyziky
Teorie chyb a vyrovnávací počet 1
Kontrolní test znalostí
TŘÍDĚNÍ DAT je základní způsob zpracování dat.
Metody sociálních výzkumů
Poměr v základním tvaru.
Matematická gramotnost napříč vzděláváním
Teorie chyb a vyrovnávací počet 1
Jiří Šafr jiri.safr(zavináč)seznam.cz
Informatika – Základní operace s buňkami
… jak přesně počítat s nepřesnými čísly
Konstrukce trojúhelníku
Transkript prezentace:

POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní obrázek. Martina Litschmannová MÁME DATA – A CO DÁL?

Obsah:  Co je to statistika?  Jak provést statistické šetření?  Jak analyzovat data?  Exploratorní (popisná) analýza kategoriálních dat  Exploratorní (popisná) analýza kvantitativních dat

Co je to statistika? Google – odkazů (čeština), odkazů (angličtina) Uspořádaný datový soubor (statistika přístupů na web. stránky, statistika střel na branku, statistika nehodovosti, ekonomické statistiky, …) Český statistický úřad, Real Time Statistics ProjectČeský statistický úřadReal Time Statistics Project Teoretická disciplína, která se zabývá metodami sběru a analýzy dat (matematická statistika vs. aplikovaná statistika) Číselný údaj „syntetizující“ vlastnosti datových souborů (četnost, průměr, rozptyl, …)

Co vypovídá statistika o jednotlivci? Lukáš Pavlásek (jednotlivec) skaut občan ČR Statistika nezkoumá jednotlivce jako individualitu, ale jako anonymního nositele některého znaku (činnosti, vlastnosti). Statistika je nauka o hromadných jevech. tanečník

Jak provést statistické šetření? statistické znaky – údaje, které u statistických znaků sledujeme (např. váha, výška, IQ, …) úplné šetření = ZÁKLADNÍ SOUBOR statistická jednotka výběrové šetření REPREZENTATIV NÍ výběr

Jak analyzovat data? Exploratorní (popisná) statistika Statistická indukce

Exploratorní analýza dat Grafická prezentace a uspořádání dat do názornější formy a jejich popis několika málo hodnotami, které by obsahovaly co největší množství informací obsažených v původním souboru.

Typy statistických znaků (proměnných) Typy proměnných Kvalitativní proměnná (kategoriální, slovní...) Kvantitativní proměnná (numerická, číselná...)

EDA pro kvalitativní veličinu

Číselné charakteristiky + Modus (název nejčetnější varianty) TABULKA ROZDĚLENÍ ČETNOSTI x1x1 Celkem:

Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéraAbsolutní četnosti Relativní četnosti (%) Muž 7737,37864 Žena 8541,26214 Dítě 4421,35922 Celkem: , % … 2,06 osob 0,00001%... 0, osob 0,1% … 0,206 osob Jak zaokrouhlovat relativní četnost?

Číselné charakteristiky POZOR na zaokrouhlovací chybu! TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž 7737,4 Žena 8541,3 Dítě 4421,4 Celkem: ,1

Číselné charakteristiky Dopočet do 100%! TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž 7737,4 Žena 8541,3 Dítě 4421,3 Celkem: ,0

Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Typ pasažéra Absolutní četnosti Relativní četnosti (%) Muž ?37,4 Žena ?41,3 Dítě ?21,3 Celkem: ,0 Relativní četnosti uvádějme vždy pouze jako doplněk absolutních četností, nikoliv samostatně!

Grafické znázornění A)Sloupcový graf (bar chart) „…můžete vytvořit sloupcový graf a dodat mu zcela nový a přitažlivý vzhled“

Grafické znázornění A)Sloupcový graf (bar chart)

Grafické znázornění A)Sloupcový graf (bar chart)

Grafické znázornění A)Sloupcový graf (bar chart)

Grafické znázornění A)Sloupcový graf (bar chart)

Grafické znázornění A)Sloupcový graf (bar chart)

Grafické znázornění Na co si dát pozor? Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých „sloupců“.

A)Sloupcový graf (bar chart) Grafické znázornění Na co si dát pozor? zdroj dat:

A)Sloupcový graf (bar chart) Grafické znázornění Na co si dát pozor? Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých „sloupců“. Nadbytečné názvy grafu, legendy, … Neefektivní nuly A na co ještě?

Který z grafů je „správný“?

Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný. Zdroj: Testové příklady určené žákům 9. tříd.

Určete pravdivost tvrzení: V žádných dvou letech nebyl počet studentů stejný. Zdroj: Testové příklady určené žákům 9. tříd ?

Grafické znázornění Na co si dát pozor? Subjektivně vnímáme plochu (objem), nikoliv výšku jednotlivých „sloupců“. Nadbytečné názvy grafu, legendy, … Neefektivní nuly Informativní hodnota grafu A)Sloupcový graf (bar chart)

B) Výsečový graf – koláčový graf (pie chart) Jaký je poměr mezi velikostí výsečí A a C? Jaký je poměr mezi velikostí výsečí B a D? Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart) Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart) Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart) Grafické znázornění

B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor? Grafické znázornění

Anketa Jste pro navýšení hodinové dotace Biostatistiky? TAKHLE NE!!!

B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor? Neuvádění absolutních četností, resp. celkového počtu respondentů v „blízkosti“ grafu Nadbytečné názvy grafu Grafické znázornění

Krevní skupina Rh faktor Celkem Rh+Rh A34640 B9211 AB314 Celkem Výskyt krevních skupin a Rh faktoru v USA Procentuální zastoupení krevních skupin v populaci USA

B) Výsečový graf – koláčový graf (pie chart) Na co si dát pozor? Neuvádění absolutních četností, resp. celkového počtu respondentů v „blízkosti“ grafu Nadbytečné názvy grafu, legendy, … Ne vždy je graf přehlednější než tabulka Grafické znázornění

Určete pravdivost tvrzení: a)Místo otazníku patří 20%. b)Místo otazníku patří 126 Kč. c)Část C je dvojnásobkem části D. Co je to A, B, C, D? Jsou výseče odpovídající variantám B a D stejně velké? Lze velikosti jednotlivých výsečí charakterizovat v absolutních číslech i v procentech? Rozdělení četností kvalitativního znaku se znázorňuje kruhovým diagramem, kde různým hodnotám znaku odpovídají kruhové výseče, jejichž plošné obsahy jsou úměrné četnostem. (Prometheus) Zdroj: Testové příklady určené žákům 9. tříd.

Grafické znázornění A)Sloupcový graf (bar chart) B)Výsečový graf – koláčový graf (pie chart)  Obrázkové grafy

Obrázkové grafy – užiteční pomocníci? Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR ( $) a Irsku ( $)

Obrázkové grafy – užiteční pomocníci? Srovnání průměrných ročních nástupních platů učitelů středních škol v ČR ( $) a Irsku ( $)

Několik praktických příkladů aneb „To přece bylo v novinách…“

Obrázkové grafy – užiteční pomocníci? (Zdroj: Mf Dnes, : Zemědělci si rozdělí miliardy. Krávy a vepři se budou mít lépe. infografika

„Úžasná infografika o výdajích státního rozpočtu České republiky v roce 2013“ Zdroj:

Příklad s klobásou

Souboj vyhledávačů Zdroj: /default.aspx

Souboj vyhledávačů Zdroj: /default.aspx

Jak výsledky šetření zobrazit správně?

Průzkum o představách studentů o budoucím zaměstnání Mimořádná příloha Mf Dnes, – výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: „přes tisíc vysokoškoláků ze všech ročníků po celé republice“)

Průzkum o představách studentů o budoucím zaměstnání Mimořádná příloha Mf Dnes, – výsledky šetření spol. Studenta Media (typ šetření: online dotazování, specifikace výběru: „přes tisíc vysokoškoláků ze všech ročníků po celé republice“) S přesností na setinu procenta… 1000 studentů … 100% 10 studentů … 1% 0,1 studentů … 0,01% Proč není součet 100%? Čemu odpovídá velikost jednotlivých částí prstence?

Jak výsledky šetření zobrazit správně? Co je pro Vás důležité při výběru zaměstnání? (vyberte 3 pro Vás nejdůležitější faktory) četnostrel. četnost (%) rel. četnost (%) vzhledem k počtu respondentů plat profesní růst atraktivita pracovní pozice pracovní prostředí work-life balance benefity reputace společnosti celkem %---

Jak výsledky šetření zobrazit správně?

Zdroj: (20. srpna 2015)

Zdroj: Dotyk, týdeník, 34. číslo, , ISSN:

Pozor na logaritmické měřítko!

Zdroj: Nemíchejme jabka s hruškami!!!

EDA pro kvantitativní veličinu

Číselné charakteristiky A)Míry polohy (úrovně) B)Míry variability C)Míry šikmosti a špičatosti

Míry polohy -Odhadují skutečnou populační střední hodnotu na základě výběrového souboru. -Patří mezi ně: výběrový aritmetický průměr, výběrový geometrický průměr, výběrový medián a modus. -Dalšími mírami polohy, které se týkají popisu i polohy jiných hodnot než středních, jsou kvantily.

Statistik, který má hlavu v sauně a nohy v ledničce, hovoří o příjemné průměrné teplotě. Autor neznámý Ošidný průměr

Aritmetický průměr

Ošidnost průměru Zdroj: [1]

Ošidnost průměru Země K Průměrná produkce kuřat (na osobu): 1,0 (denně)

Ošidnost průměru „Průměrná rodina má 2,2 dítěte.“ Zdroj: [1]

Ošidnost průměru

 V malé vesnici někde v Americe žije 6 lidí, jejichž roční plat je uveden níže. $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. ($31 830)  Do vesnice se přistěhoval Bill Gates, jehož roční příjem je $ $ $ $ $ $ $ $ Určete průměrný plat obyvatel této vesnice. ($ )

Ošidnost průměru Zdroj: Blesk,

Ošidnost průměru Zdroj: Blesk,

Ošidnost průměru Zdroj:

Ošidnost průměru Zdroj:

Ošidnost průměru

Aritmetický průměr

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že  vzdálenost všech úseků je stejná – 5 km. ABCD ABBCCD Dráha (km)555 Rychlost (km/h)

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že  vzdálenost všech úseků je stejná – 5 km. ABCD ABBCCD Dráha (km)555 Rychlost (km/h) Čas (h)5/405/505/60 1

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že  vzdálenost všech úseků je stejná – 5 km. ABCD ABBCCDAD Dráha (km)555 Rychlost (km/h) Čas (h)5/405/505/60 1

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že  vzdálenost všech úseků je stejná – 5 km. ABCD ABBCCDAD Dráha (km)55515 Rychlost (km/h) Čas (h)5/405/505/605/40 + 5/50 + 5/60 Harmonický průměr 1

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b)Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. ABBCCD Dráha (km) 0,15AD0,25AD0,60AD Rychlost (km/h) ABCD

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b)Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. ABBCCD Dráha (km) 0,15AD0,25AD0,60AD Rychlost (km/h) Čas (h) 0,15AD/400,25AD/500,60AD/60 1 ABCD

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b)Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. ABBCCDAD Dráha (km) 0,15AD0,25AD0,60AD Rychlost (km/h) Čas (h) 0,15AD/400,25AD/500,60AD/60 1 ABCD

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b)Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. ABBCCDAD Dráha (km) 0,15AD0,25AD0,60ADAD Rychlost (km/h) Čas (h) 0,15AD/400,25AD/500,60AD/600,15AD/40 + 0,25AD/50 + 0,60AD/60 1 ABCD

Nákladní automobil jel z města A do města B rychlostí 40 km/h, z města B do města C rychlostí 50 km/h a z města C do města D rychlostí 60 km/h. Vypočítejte průměrnou rychlost, které dosáhl automobil na celé trase, víte-li, že b)Vzdálenost z A do B je 15% trasy a vzdálenost z C do D je 60% trasy. ABBCCDAD Dráha (km) 0,15AD0,25AD0,60ADAD Rychlost (km/h) Čas (h) 0,15AD/400,25AD/500,60AD/600,15AD/40 + 0,25AD/50 + 0,60AD/60 1 ABCD Vážený harmonický průměr

Cena jedné akcie energetické společnosti vzrostla na burze XY v období od 13. do 15. března téhož roku z 952,50 Kč na 982,00 Kč. Jaký byl průměrný denní relativní přírůstek ceny této akcie? 2 Cena akcie (Kč)Koeficient růstu 13. března 952, března ??/952,5 15. března 982,0982,0/? Geometrick ý průměr Průměrný denní relativní přírůstek ceny akcie byl 1,5%.

Výběrové kvantily

Význačné výběrové kvantily

Kde se s kvantily setkáme v praxi? Zdroj: Vyhodnocení Národních srovnávacích zkoušek, …

Kde se s kvantily setkáme v praxi? vyhodnocení Národních srovnávacích zkoušek, … růstové grafy

Růstové grafy

Jak se výběrové kvantily určují?

MN (%) 8,7 7,8 6,8 7,8 9,7 15,7 6,8 4,9 6,8 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 3

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 3

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 3

MN (%)MN (%) (seřazeno) 8,74,9 7,86,8 7,86,8 9,77,8 15,77,8 6,88,7 4,99,7 6,816 V předložených datech určete 0,3 kvantil (30-ti procentní kvantil). 3

Míry variability -Charakteristiky hodnotící rozptýlenost hodnot statistického souboru kolem nějaké míry polohy. -Patří mezi ně: (variační) rozpětí, mezikvartilové (interkvartilové) rozpětí, rozptyl, směrodatná odchylka a variační koeficient.

Zásahy střelce AZásahy střelce B Průměr55 K čemu potřebujeme míry variability?

Zásahy střelce AZásahy střelce B Průměr55 K čemu potřebujeme míry variability? Zdroj: [1]

Firma vyrábějící tabulové sklo vyvinula méně nákladnou technologii pro zlepšení odolnosti skla vůči žáru. Pro testování bylo vybráno 100 tabulí skla a rozřezáno na polovinu. Jedna polovina pak byla ošetřena novou technologií, zatímco druhá byla ponechána jako kontrolní. Výsledky jsou prezentovány v následujícím grafu. Lze doporučit zavedení nové technologie do výroby? K čemu potřebujeme míry variability?

Firma vyrábějící tabulové sklo vyvinula méně nákladnou technologii pro zlepšení odolnosti skla vůči žáru. Pro testování bylo vybráno 100 tabulí skla a rozřezáno na polovinu. Jedna polovina pak byla ošetřena novou technologií, zatímco druhá byla ponechána jako kontrolní. Výsledky jsou prezentovány v následujícím grafu. Lze doporučit zavedení nové technologie do výroby? K čemu potřebujeme míry variability?

Výběrový rozptyl Na co si dát pozor? Rozměr rozptylu je druhou mocninou rozměru proměnné.

Výběrová směrodatná odchylka

Jakou představu o variabilitě dat nám dává sm. odchylka? Empirické pravidlo 3 sigma k 10,682 20,954 30,998 k 1>0>0 2>0,75 3>0,89

Variační koeficient Proč potřebujeme bezrozměrnou míru variability? Umožňuje srovnání variability proměnných, které mají různé jednotky.

Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

Odlehlá pozorování  ty hodnoty proměnné, které se mimořádně liší od ostatních hodnot a tím ovlivňují např. vypovídací hodnotu průměru. Jak postupovat v případě, že v datech identifikujeme odlehlá pozorování?  V případě, že odlehlost pozorování je způsobena:  hrubými chybami, překlepy, prokazatelným selháním lidí či techniky...  důsledky poruch, chybného měření, technologických chyb... tzn., známe-li příčinu odlehlosti a předpokládáme-li, že již nenastane, jsme oprávněni tato pozorování vyloučit z dalšího zpracování.  V ostatních případech je nutno zvážit, zda se vyloučením odlehlých pozorování nepřipravíme o důležité informace o jevech vyskytujících se s nízkou četností.

Metoda vnitřních hradeb Dolní mez vnitřních hradeb Horní mez vnitřních hradeb Identifikace odlehlých pozorování

Metoda vnějších hradeb Dolní mez vnějších hradeb Horní mez vnějších hradeb Identifikace extrémních pozorování

MN (%) 4,9 6,8 7,8 8,7 9,7 15,7 V předložených datech identifikujte odlehlá pozorování: 4

MN (%) 4,9 6,8 7,8 8,7 9,7 15,7 V předložených datech identifikujte odlehlá pozorování: 4

Identifikace odlehlých pozorování Zase nový vzorec?

Identifikace odlehlých pozorování

Míry šikmosti a špičatosti

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008

Výběrová šikmost (standardizovaná) Symetrická dataPozitivně zešikmená data Negativně zešikmená data empirické pravidlo

Výběrová špičatost (standardizovaná) míra koncentrace kolem průměru

Jsou míry polohy a míry variability dostatečné pro posouzení rozdělení sledovaných veličin? Všech pět ukázek má stejné charakteristiky polohy i variability (průměry i směrodatné odchylky jsou shodné). Přesto na první pohled vidíme, že tvary rozdělení dat jsou různé. K číselnému vyjádření těchto rozdílů nám slouží další charakteristiky - šikmost (g 1, angl. skewness) a špičatost (g 2, angl. kurtosis). Zdroj: TVRDÍK, J.: Základy matematické statistiky, Ostravská univerzita, 2008

Přesnost číselných charakteristik

Směrodatnou odchylku jakožto míru nejistoty měření zaokrouhlujeme nahoru na jednu, maximálně dvě platné cifry a míry polohy (průměr, kvantily…) zaokrouhlujeme tak, aby nejnižší zapsaný řád odpovídal nejnižšímu zapsanému řádu směrodatné odchylky.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný?

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst. 3 platné cifry u směrodatné odchylky.

Chybný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? Různý počet des. míst. 3 platné cifry u směrodatné odchylky. Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Oprava Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,68117, Směrodatná odchylka 0,7823, (před zaokrouhlením 1235) Proč je zápis chybný? 3 platné cifry u směrodatné odchylky. Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Oprava Délka (m)Váha (kg)Teplota ( 0 C) Průměr2, Medián2, Směrodatná odchylka 0, (před zaokrouhlením 1235) Proč je zápis chybný? Nejnižší zapsaný řád průměru (jednotky) neodpovídá nejnižšímu zapsanému řádu směrodatné odchylky (stovky)+ směr. odch. není zaokrouhlena nahoru.

Správný zápis číselných charakteristik Délka (m)Váha (kg)Teplota ( 0 C) Průměr2,26127, Medián2,675117, Směrodatná odchylka 0,7823,71 300

Grafické znázornění kvantitativní proměnné

Krabicový graf (Box plot)

Na co si dát pozor? Histogram

Na co si dát pozor? MS Excel 2007, funkce Histogram Výpočetní applet Explorační analýza Histogram

Souvislost mezi číselnými charakteristikami a grafy V java appletu Výběrové charakteristiky sledujte souvislost mezi číselnými charakteristikami a grafy numerické proměnné.Výběrové charakteristiky

POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní obrázek. DĚKUJI ZA POZORNOST!