Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
EXPLORATORNÍ STATISTIKA
2
Co je to statistika? Číselné údaje o hromadných jevech.
Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy.
3
Základní pojmy Hromadný jev - jev vyskytující se v masovém měřítku u velkého počtu prvků (statistických jednotek). Vlastnosti statistických jednotek vyjadřují statistické znaky (proměnné).
4
Typy proměnných Typy proměnných
Kvalitativní proměnná (kategoriální, slovní...) Dělení podle možnosti uspořádání variant Nominální proměnná (nelze uspořádat) Ordinální proměnná (lze uspořádat) Dělení podle počtu variant Alternativní proměnná (2 varianty) Množná proměnná (více než 2 varianty) Kvantitativní proměnná (numerická, číselná ...) Diskrétní proměnná Spojitá proměnná
5
Kategoriální proměnná nominální (nemá smysl uspořádání)
6
Číselné charakteristiky
TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty xi Absolutní četnosti ni Relativní četnosti pi x1 n1 x2 n2 xk nk Celkem: 1 + Modus
7
Histogram – sloupcový graf (bar chart)
Grafické znázornění Histogram – sloupcový graf (bar chart)
8
Co lze vyčíst z histogramu
Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/ /0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)
9
B) Výsečový graf – koláčový graf (pie chart)
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)
10
Výsledky prezentuje následující graf:
Příklad Minulý týden jsme zpracovali anketu týkající se názoru na zavedení školného na vysokých školách. Výsledky prezentuje následující graf:
11
Příklad Níže uvedená data představují částečný výsledek zaznamenaný při průzkumu zatížení jedné z ostravských křižovatek, a to barvu projíždějících automobilů. Data vyhodnoťte a graficky znázorněte.
12
Řešení
13
Kategoriální proměnná ordinální
(má smysl uspořádání)
14
TABULKA ROZDĚLENÍ ČETNOSTI
Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty xi Absolutní četnosti ni Relativní četnosti pi Kumulativní četnosti mi Kumulativní relativní četnosti Fi x1 n1 x2 n2 xk nk Celkem: 1 + Modus
15
Histogram – sloupcový graf (bar chart)
Grafické znázornění Histogram – sloupcový graf (bar chart)
16
B) Výsečový graf – koláčový graf (pie chart)
Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)
17
Polygon kumulativních četností
Grafické znázornění Polygon kumulativních četností (Galtonova ogiva, S-křivka)
18
Grafické znázornění D) Paretův graf
19
Doc. Ing. Milan Hutyra, CSc. : Managment jakosti
Paretův graf Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/ /0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)
20
Příklad Následující data představují velikosti triček prodaných při výprodeji firmy TRIKO. S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M Data vyhodnoťte a graficky znázorněte. Určete kolik procent lidí si koupilo tričko velikosti nejvýše L.
21
Řešení
22
Kvantitativní (numerická) proměnná
23
Číselné charakteristiky
Míry polohy Míry variability
24
Míry polohy
25
Aritmetický průměr
26
Vlastnosti aritmet. průměru
neboli: Součet odchylek od průměru je 0. neboli: Přičteme-li ke každé hodnotě dat. souboru konstantu, průměr se o tuto konstantu změní. 3. neboli: Vynásobíme-li každou hodnotu dat. souboru konstantou, průměr se změní také s násobkem této konstanty.
27
Průměr není rezistentní vůči
odlehlým pozorováním !!!!
28
Kvantily 100p %-ní kvantil xp
odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)
29
Jak se kvantily určují Výběrový soubor uspořádáme podle velikosti
Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) 100p%- ní kvantil je roven hodnotě proměnné s pořadím zp, kde: , přičemž zp zaokrouhlujeme na celá čísla !!!!!
30
Význačné kvantily Kvartily Dolní kvartil x0,25
Medián x0,5 Horní kvartil x0,75 Decily – x0,1; x0,2; ... ; x0,9 Percentily – x0,01; x0,02; …; x0,99 Minimum xmin a Maximum xmax
31
Příklad Následující data představují věk hudebníků vystupujících na přehlídce dechových orchestrů. Proměnnou věk považujte za spojitou. Určete: Medián Dolní kvartil Horní kvartil První decil
32
Interkvartilové rozpětí
Užití: např. při identifikaci odlehlých pozorování
33
MAD Medián absolutních odchylek od mediánu
Pomocná proměnná sloužící k identifikaci odlehlých pozorování
34
Příklad Pro data z předcházejícího příkladu určete MAD.
35
Identifikace odlehlých pozorování
1,5 násobek IQR Z-souřadnice Mediánová souřadnice
36
Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování:
Vnitřní hradby a) Pomocí IQR Odlehlé pozorování: 82
37
Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování:
b) Pomocí z-souřadnice, resp. med.-souřadnice
38
v němž leží alespoň 50% hodnot proměnné
Shorth nejkratší interval, v němž leží alespoň 50% hodnot proměnné
39
Příklad Pro data z předcházejícího příkladu určete shorth.
40
Modus střed shorthu
41
Příklad: Pro data z předcházejícího příkladu určete modus.
Shorth = Modus: Modus = 38,5 let, tj. typický věk hudebníka vystupujícího na přehlídce dech. orchestrů je 38,5 let.
42
Míry variability
43
Výběrový rozptyl
44
Vlastnosti výběrového rozptylu
Výběrový rozptyl konstanty je roven 0, neboli: jsou-li všechny hodnoty proměnné stejné, soubor má nulovou rozptýlenost. neboli: přičteme-li ke všem hodnotám proměnné konstantu, výběrový rozptyl se nezmění. neboli: vynásobíme-li všechny hodnoty proměnné konstantou, výběrový rozptyl se zvětší kvadrátem této konstanty (b2 krát)
45
Nevýhoda výběrového rozptylu
Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.
46
Výběrová směrodatná odchylka
47
Nevýhody výb. směr. odchylky a výb. rozptylu
Neumožňují srovnání rozptylu proměnných, které mají různé rozměry (jednotky).
48
Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) - Čím nižší var. koeficient, tím homogennější soubor. - Vx>50% značí silně rozptýlený soubor.
49
Výběrová šikmost a=0 a>0 a<0
50
Jaký je vztah mezi šikmostí, mediánem a průměrem?
Úkoly: V appletu generujte histogram odpovídající dat. souboru symetrickému (b=0), pozitivně zešikmenému (b>0) a negativně zešikmenému (b<0) a sledujte: Průměrnou odchylku od průměru a průměrnou odchylku od mediánu. Vztah mezi průměrem a mediánem. David M. Lane – Rice Virtual Lab in Statistics, Mean and Median
51
Jaký je vztah mezi šikmostí, mediánem a průměrem?
Symetrická data Pozitivně zešikmená data Negativně zešikmená data Průměr = medián Průměr > medián Průměr < medián Polovina dat.souboru je menší než průměr Nadpoloviční většina dat.souboru je menší než průměr Nadpoloviční většina dat.souboru je větší než průměr
52
Výběrová špičatost (normovaná)
53
Grafické znázornění num. proměnné
A.) Krabicový graf (Box plot) průměr Odlehlé pozorování Min (po odstranění odlehlých pozorování) Max (po odstranění odlehlých pozorování) X0,5 X0,25 X0,75
54
Grafické znázornění num. proměnné
B.) Číslicový histogram (Stem and leaf)
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.