Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

EXPLORATORNÍ STATISTIKA. Co je to statistika? Číselné údaje o hromadných jevech. Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína,

Podobné prezentace


Prezentace na téma: "EXPLORATORNÍ STATISTIKA. Co je to statistika? Číselné údaje o hromadných jevech. Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína,"— Transkript prezentace:

1 EXPLORATORNÍ STATISTIKA

2 Co je to statistika? Číselné údaje o hromadných jevech. Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy. 2

3 Základní pojmy Hromadný jev - jev vyskytující se v masovém měřítku u velkého počtu prvků (statistických jednotek). Vlastnosti statistických jednotek vyjadřují statistické znaky (proměnné). 3

4 Typy proměnných Kvalitativní proměnná (kategoriální, slovní...) Dělení podle možnosti uspořádání variant Nominální proměnná (nelze uspořádat) Ordinální proměnná (lze uspořádat) Dělení podle počtu variant Alternativní proměnná (2 varianty) Množná proměnná (více než 2 varianty) Kvantitativní proměnná (numerická, číselná...) Diskrétní proměnnáSpojitá proměnná 4

5 Kategoriální proměnná nominální (nemá smysl uspořádání) 5

6 Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty x i Absolutní četnosti n i Relativní četnosti p i x1x1 n1n1 x2x2 n2n2 xkxk nknk Celkem:1 + Modus 6

7 7 Grafické znázornění A)Histogram – sloupcový graf (bar chart)

8 Co lze vyčíst z histogramu Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/ /0326 E-learningové prvky pro podporu výuky odborných a technických předmětů) 8

9 9 Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

10 10 Příklad Minulý týden jsme zpracovali anketu týkající se názoru na zavedení školného na vysokých školách. Výsledky prezentuje následující graf:

11 11 Příklad Níže uvedená data představují částečný výsledek zaznamenaný při průzkumu zatížení jedné z ostravských křižovatek, a to barvu projíždějících automobilů. Data vyhodnoťte a graficky znázorněte.

12 12 Řešení

13 13 Kategoriální proměnná ordinální (má smysl uspořádání)

14 14 Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty x i Absolutní četnosti n i Relativní četnosti p i Kumulativní četnosti m i Kumulativní relativní četnosti F i x1x1 n1n1 x2x2 n2n2 xkxk nknk Celkem:1 + Modus

15 15 Grafické znázornění A)Histogram – sloupcový graf (bar chart)

16 16 Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

17 17 Grafické znázornění C)Polygon kumulativních četností (Galtonova ogiva, S-křivka)

18 18 Grafické znázornění D) Paretův graf

19 Paretův graf Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/ /0326 E-learningové prvky pro podporu výuky odborných a technických předmětů) 19

20 20 Příklad Následující data představují velikosti triček prodaných při výprodeji firmy TRIKO. S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M a)Data vyhodnoťte a graficky znázorněte. b)Určete kolik procent lidí si koupilo tričko velikosti nejvýše L.

21 21 Řešení

22 Kvantitativní (numerická) proměnná 22

23 23 Číselné charakteristiky A)Míry polohy B)Míry variability

24 24 Míry polohy

25 25 Aritmetický průměr

26 26 Vlastnosti aritmet. průměru 1. neboli: Součet odchylek od průměru je neboli: Přičteme-li ke každé hodnotě dat. souboru konstantu, průměr se o tuto konstantu změní. 3. neboli: Vynásobíme-li každou hodnotu dat. souboru konstantou, průměr se změní také s násobkem této konstanty.

27 27 Průměr není rezistentní vůči odlehlým pozorováním !!!!

28 28 Kvantily 100p %-ní kvantil x p odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)

29 29 Jak se kvantily určují Výběrový soubor uspořádáme podle velikosti Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) 100p%- ní kvantil je roven hodnotě proměnné s pořadím z p, kde:, přičemž z p zaokrouhlujeme na celá čísla !!!!!

30 30 Význačné kvantily Kvartily Dolní kvartil x 0,25 Medián x 0,5 Horní kvartil x 0,75 Decily – x 0,1 ; x 0,2 ;... ; x 0,9 Percentily – x 0,01 ; x 0,02 ; …; x 0,99 Minimum x min a Maximum x max

31 31 Příklad Následující data představují věk hudebníků vystupujících na přehlídce dechových orchestrů. Proměnnou věk považujte za spojitou. Určete: a)Medián b)Dolní kvartil c)Horní kvartil d)První decil

32 32 Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

33 33 MAD Medián absolutních odchylek od mediánu Pomocná proměnná sloužící k identifikaci odlehlých pozorování

34 34 Příklad Pro data z předcházejícího příkladu určete MAD. MAD = 8

35 35 Identifikace odlehlých pozorování 1,5 násobek IQR Z-souřadnice Mediánová souřadnice

36 36 Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování: a) Pomocí IQR Odlehlé pozorování: 82 Vnitřní hradby

37 37 b) Pomocí z-souřadnice, resp. med.-souřadnice Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování:

38 38 Shorth nejkratší interval, v němž leží alespoň 50% hodnot proměnné

39 39 Příklad Pro data z předcházejícího příkladu určete shorth. Shorth =

40 40 Modus střed shorthu

41 41 Příklad: Pro data z předcházejícího příkladu určete modus. Shorth = Modus: Modus = 38,5 let, tj. typický věk hudebníka vystupujícího na přehlídce dech. orchestrů je 38,5 let.

42 42 Míry variability

43 43 Výběrový rozptyl

44 44 Vlastnosti výběrového rozptylu 1.Výběrový rozptyl konstanty je roven 0, neboli: jsou-li všechny hodnoty proměnné stejné, soubor má nulovou rozptýlenost. 2. neboli: přičteme-li ke všem hodnotám proměnné konstantu, výběrový rozptyl se nezmění. 3. neboli: vynásobíme-li všechny hodnoty proměnné konstantou, výběrový rozptyl se zvětší kvadrátem této konstanty (b 2 krát)

45 45 Nevýhoda výběrového rozptylu Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

46 46 Výběrová směrodatná odchylka

47 47 Nevýhody výb. směr. odchylky a výb. rozptylu Neumožňují srovnání rozptylu proměnných, které mají různé rozměry (jednotky).

48 48 Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) - Čím nižší var. koeficient, tím homogennější soubor. - V x >50% značí silně rozptýlený soubor.

49 49 Výběrová šikmost a=0a>0a<0

50 Jaký je vztah mezi šikmostí, mediánem a průměrem? Úkoly: V appletu generujte histogram odpovídající dat. souboru symetrickému (b=0), pozitivně zešikmenému (b>0) a negativně zešikmenému (b<0) a sledujte: 1.Průměrnou odchylku od průměru a průměrnou odchylku od mediánu. 1.Vztah mezi průměrem a mediánem. David M. Lane – Rice Virtual Lab in Statistics, Mean and MedianMean and Median 50

51 Jaký je vztah mezi šikmostí, mediánem a průměrem? 51 Symetrická dataPozitivně zešikmená data Negativně zešikmená data Průměr = medián Polovina dat.souboru je menší než průměr Průměr > mediánPrůměr < medián Nadpoloviční většina dat.souboru je menší než průměr Nadpoloviční většina dat.souboru je větší než průměr

52 52 Výběrová špičatost (normovaná) b=0b>0b<0

53 53 Grafické znázornění num. proměnné A.) Krabicový graf (Box plot) Odlehlé pozorování Min (po odstranění odlehlých pozorování) Max (po odstranění odlehlých pozorování) X 0,25 X 0,75 X 0,5 průměr

54 54 Grafické znázornění num. proměnné B.) Číslicový histogram (Stem and leaf)


Stáhnout ppt "EXPLORATORNÍ STATISTIKA. Co je to statistika? Číselné údaje o hromadných jevech. Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína,"

Podobné prezentace


Reklamy Google