EXPLORATORNÍ STATISTIKA

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Základní statistické pojmy
Přijímací zkoušky na SŠ MATEMATIKA Připravil PhDr. Ivo Horáček, PhD.
Charakteristiky úrovně
Města ČR – orientace na mapě
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Okna vesmíru statistiky dokořán
Statistika (D360P03Z) akademický rok 2004/2005
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Výzkumy volebních preferencí za ČR a kraje od
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
Charakteristiky variability
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Zábavná matematika.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
KVANTILY OA a VOŠ Příbram.
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
Jazyk vývojových diagramů
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
PRAVDĚPODOBNOST A STATISTIKA
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Únorové počítání.
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Obsah statistiky Jana Zvárová
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
Statistika 8. ročník Autorem materiálu je Mgr. Jana Čulíková
charakteristiky polohy (5)
Pojmy a interpretace.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Technické kreslení.
Úkoly nejen pro holky.
DĚLENÍ ČÍSLEM 5 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 50.
Slovní úlohy řešené soustavou rovnic
Jevy a náhodná veličina
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Základy zpracování geologických dat
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Statistika Statistika je matematická disciplína, která zpracovává výsledky hromadného pozorování (o objemu výroby, dovozu či vývozu zboží, výdajích a příjmech.
Základy popisné statistiky
Výběrová šetření, Exploratorní analýza
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Statistika 1.cvičení. Základní informace Ing. Daniela Krbcová Materiály ze cvičení, přednášky Skripta k předmětu,
Statistika 2.cvičení
METODICKÝ LIST PRO ZŠ Pro zpracování vzdělávacích materiálů (VM)v rámci projektu EU peníze školám Operační program Vzdělávání pro konkurenceschopnost   
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Základní zpracování dat Příklad
Analýza kardinálních proměnných
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

EXPLORATORNÍ STATISTIKA

Co je to statistika? Číselné údaje o hromadných jevech. Sběr, zpracování a vyhodnocování stat. údajů. Teoretická disciplína, která se zabývá metodami sloužícími k popisu odhalování zákonitosti při působení podstatných činitelů na hromadné jevy.

Základní pojmy Hromadný jev - jev vyskytující se v masovém měřítku u velkého počtu prvků (statistických jednotek). Vlastnosti statistických jednotek vyjadřují statistické znaky (proměnné).

Typy proměnných Typy proměnných Kvalitativní proměnná (kategoriální, slovní...) Dělení podle možnosti uspořádání variant Nominální proměnná (nelze uspořádat) Ordinální proměnná (lze uspořádat) Dělení podle počtu variant Alternativní proměnná (2 varianty) Množná proměnná (více než 2 varianty) Kvantitativní proměnná (numerická, číselná ...) Diskrétní proměnná Spojitá proměnná

Kategoriální proměnná nominální (nemá smysl uspořádání)

Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty xi Absolutní četnosti ni Relativní četnosti pi x1 n1 x2 n2 xk nk Celkem: 1 + Modus

Histogram – sloupcový graf (bar chart) Grafické znázornění Histogram – sloupcový graf (bar chart)

Co lze vyčíst z histogramu Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

B) Výsečový graf – koláčový graf (pie chart) Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

Výsledky prezentuje následující graf: Příklad Minulý týden jsme zpracovali anketu týkající se názoru na zavedení školného na vysokých školách. Výsledky prezentuje následující graf:

Příklad Níže uvedená data představují částečný výsledek zaznamenaný při průzkumu zatížení jedné z ostravských křižovatek, a to barvu projíždějících automobilů. Data vyhodnoťte a graficky znázorněte.

Řešení

Kategoriální proměnná ordinální (má smysl uspořádání)

TABULKA ROZDĚLENÍ ČETNOSTI Číselné charakteristiky TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty xi Absolutní četnosti ni Relativní četnosti pi Kumulativní četnosti mi Kumulativní relativní četnosti Fi x1 n1 x2 n2 xk nk Celkem: 1 + Modus

Histogram – sloupcový graf (bar chart) Grafické znázornění Histogram – sloupcový graf (bar chart)

B) Výsečový graf – koláčový graf (pie chart) Grafické znázornění B) Výsečový graf – koláčový graf (pie chart)

Polygon kumulativních četností Grafické znázornění Polygon kumulativních četností (Galtonova ogiva, S-křivka)

Grafické znázornění D) Paretův graf

Doc. Ing. Milan Hutyra, CSc. : Managment jakosti Paretův graf Doc. Ing. Milan Hutyra, CSc. : Managment jakosti (CZ.O4.01.3/3.2.15.2/0326 E-learningové prvky pro podporu výuky odborných a technických předmětů)

Příklad Následující data představují velikosti triček prodaných při výprodeji firmy TRIKO.   S, M, L, S, M, L, XL, XL, M, XL, XL, L, M, S, M, L, L, XL, XL, XL, L, M Data vyhodnoťte a graficky znázorněte. Určete kolik procent lidí si koupilo tričko velikosti nejvýše L.

Řešení

Kvantitativní (numerická) proměnná

Číselné charakteristiky Míry polohy Míry variability

Míry polohy

Aritmetický průměr

Vlastnosti aritmet. průměru neboli: Součet odchylek od průměru je 0. neboli: Přičteme-li ke každé hodnotě dat. souboru konstantu, průměr se o tuto konstantu změní. 3. neboli: Vynásobíme-li každou hodnotu dat. souboru konstantou, průměr se změní také s násobkem této konstanty.

Průměr není rezistentní vůči odlehlým pozorováním !!!!

Kvantily 100p %-ní kvantil xp odděluje 100p% menších hodnot od zbytku souboru (100p% hodnot datového souboru je menších než toto číslo.)

Jak se kvantily určují Výběrový soubor uspořádáme podle velikosti Jednotlivým hodnotám proměnné přiřadíme pořadí, a to tak, že nejmenší hodnota bude mít pořadí 1 a nejvyšší hodnota pořadí n (rozsah souboru) 100p%- ní kvantil je roven hodnotě proměnné s pořadím zp, kde: , přičemž zp zaokrouhlujeme na celá čísla !!!!!

Význačné kvantily Kvartily Dolní kvartil x0,25 Medián x0,5 Horní kvartil x0,75 Decily – x0,1; x0,2; ... ; x0,9 Percentily – x0,01; x0,02; …; x0,99 Minimum xmin a Maximum xmax

Příklad Následující data představují věk hudebníků vystupujících na přehlídce dechových orchestrů. Proměnnou věk považujte za spojitou. Určete: Medián Dolní kvartil Horní kvartil První decil

Interkvartilové rozpětí Užití: např. při identifikaci odlehlých pozorování

MAD Medián absolutních odchylek od mediánu Pomocná proměnná sloužící k identifikaci odlehlých pozorování

Příklad Pro data z předcházejícího příkladu určete MAD.

Identifikace odlehlých pozorování 1,5 násobek IQR Z-souřadnice Mediánová souřadnice

Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování: Vnitřní hradby a) Pomocí IQR Odlehlé pozorování: 82

Příklad V datech z předcházejícího příkladu identifikujte odlehlá pozorování: b) Pomocí z-souřadnice, resp. med.-souřadnice

v němž leží alespoň 50% hodnot proměnné Shorth nejkratší interval, v němž leží alespoň 50% hodnot proměnné

Příklad Pro data z předcházejícího příkladu určete shorth.

Modus střed shorthu

Příklad: Pro data z předcházejícího příkladu určete modus. Shorth = Modus: Modus = 38,5 let, tj. typický věk hudebníka vystupujícího na přehlídce dech. orchestrů je 38,5 let.

Míry variability

Výběrový rozptyl

Vlastnosti výběrového rozptylu Výběrový rozptyl konstanty je roven 0, neboli: jsou-li všechny hodnoty proměnné stejné, soubor má nulovou rozptýlenost. neboli: přičteme-li ke všem hodnotám proměnné konstantu, výběrový rozptyl se nezmění. neboli: vynásobíme-li všechny hodnoty proměnné konstantou, výběrový rozptyl se zvětší kvadrátem této konstanty (b2 krát)

Nevýhoda výběrového rozptylu Rozměr rozptylu charakteristiky je druhou mocninou rozměru proměnné.

Výběrová směrodatná odchylka

Nevýhody výb. směr. odchylky a výb. rozptylu Neumožňují srovnání rozptylu proměnných, které mají různé rozměry (jednotky).

Variační koeficient (Směrodatná odchylka v procentech aritmetického průměru) - Čím nižší var. koeficient, tím homogennější soubor. - Vx>50% značí silně rozptýlený soubor.

Výběrová šikmost a=0 a>0 a<0

Jaký je vztah mezi šikmostí, mediánem a průměrem? Úkoly: V appletu generujte histogram odpovídající dat. souboru symetrickému (b=0), pozitivně zešikmenému (b>0) a negativně zešikmenému (b<0) a sledujte: Průměrnou odchylku od průměru a průměrnou odchylku od mediánu. Vztah mezi průměrem a mediánem. David M. Lane – Rice Virtual Lab in Statistics, Mean and Median

Jaký je vztah mezi šikmostí, mediánem a průměrem? Symetrická data Pozitivně zešikmená data Negativně zešikmená data Průměr = medián Průměr > medián Průměr < medián Polovina dat.souboru je menší než průměr Nadpoloviční většina dat.souboru je menší než průměr Nadpoloviční většina dat.souboru je větší než průměr

Výběrová špičatost (normovaná)

Grafické znázornění num. proměnné A.) Krabicový graf (Box plot) průměr Odlehlé pozorování Min (po odstranění odlehlých pozorování) Max (po odstranění odlehlých pozorování) X0,5 X0,25 X0,75

Grafické znázornění num. proměnné B.) Číslicový histogram (Stem and leaf)