STATISTIKA 1. DISTRIBUČNÍ FUNKCE Slouží k popisu rozdělení (distribuce) číselných dat Je zobecněním relativních četností F(y) = p(Y≤ y) F(y) … udává podíl.

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Statistická indukce Teorie odhadu.
Charakteristiky úrovně
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Název školy Střední škola pedagogická, hotelnictví a služeb,
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
Popisná statistika - pokračování
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Tloušťková struktura porostu
Obsah statistiky Jana Zvárová
Nechť (, , P) je pravděpodobnostní prostor:
Statistický soubor, jednotka, znak.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
1. Derivace Derivace je míra rychlosti změny funkce.
Charakteristiky variability
Průměry aritmetický průměr: geometrický průměr: harmonický průměr:
Chyby jednoho měření když známe
Charakteristiky variability
Popisná statistika III
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Pavel Najman. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
MATEMATICKÁ STATISTIKA
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Pavel Najman. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
(Popis náhodné veličiny)
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Kurzy eura v roce 2009 k prvnímu dni v měsíci zaokrouhlené na celé Kč Kč28.
K OMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Charakteristiky variability VY_32_INOVACE_M4r0120 Mgr. Jakub Němec.
Inferenční statistika - úvod
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Charakteristiky úrovně Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Statistika Statistický soubor, jednotka, znak.. Statistický soubor a znak Pro statistiku je charakteristické zkoumání jevů na dostatečně rozsáhlém souboru.
STATISTIKA 1 RNDr. M. Žambochová, Ph.D. (KMS, M308) zápočet.
Popisná statistika Přednáška č.1. Požadavky k zápočtu Na Tamtéž studijní literatura.
Odhady odhady bodové a intervalové odhady
Induktivní statistika - úvod
Základy statistické indukce
Induktivní statistika
Induktivní statistika
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
Induktivní statistika
Statistika 2.cvičení
Popisná statistika: přehled
Induktivní statistika
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
RNDr. M. Žambochová, Ph.D. (KMS, M308) zápočet
Výukový materiál zpracován v rámci projektu EU peníze školám
Analýza kardinálních proměnných
Autor: Honnerová Helena
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

STATISTIKA 1

DISTRIBUČNÍ FUNKCE Slouží k popisu rozdělení (distribuce) číselných dat Je zobecněním relativních četností F(y) = p(Y≤ y) F(y) … udává podíl pozorování s hodnotou nejvýše y, viz graf pro data z příkladu 1: 3, 4, 2, 3, 2, 3, 3, 3.

KVANTILY Udávají pro číselnou veličinu Y hodnotu y, pod níž leží požadovaný podíl pozorování Značíme ỹ p, kde p je onen podíl (údaj mezi 0 – 1) p=0,5 … 50% kvantil – medián (odděluje polovinu nižších od zbytku vyšších pozorování; značen obvykle jen ỹ ) p=0,25 … 25% kvantil – dolní kvartil ỹ 0,25 p=0,75 … 75% kvantil – horní kvartil ỹ 0,75 p=0,1 … 10% kvantil – dolní decil ỹ 0,1 p=0,9 … 90% kvantil – horní decil ỹ 0,9

VYUŽITÍ KVARTILŮ Kvartilové rozpětí : ỹ 0,75 - ỹ 0,25

DECILY Rozdělují soubor na 10 části, je tedy 9 decilů Nejpoužívanější: Dolní decil (10% kvantil) Horní decil (90% kvantil)

KVANTILY 1. Určení pomocí distribuční funkce Najdeme bod y, v němž poprvé F(y) dosáhne úroveň p. Příklad 1 – pokračování: Nalezněte medián známek žáka. Medián…tj. p=0,5. Kde poprvé příslušná F(y) dosáhla úroveň 0,5? Podle grafu je mediánem hodnota ỹ =3. Interpretace: Polovina známek měla hodnotu nejvýše 3 (tj. 3 nebo nižší)

KVANTILY 2. Určení přímo pomocí dat a) Data uspořádáme vzestupně dle velikosti b) Nalezneme celočíselné z vyhovující nerovnicím: n·p < z < n·p +1 c) Hledaným kvantilem je hodnota s pořadovým číslem z. Příklad 1 – pokračování: Nalezněte 60% kvantil známek žáka. Známky seřadíme: 2, 2, 3, 3, 3, 3, 3, 4. Jelikož n=8 a p=0,6, vyjde n·p=4,8, takže hledáme z : 4,8 < z < 5,8 Tudíž z=5, aneb hledaným kvantilem je 5. známka, čili trojka: ỹ 0, 60 =3.

KVANTILY Příklad 1 – pokračování: Interpretujte nalezený výsledek: ỹ 0,60 =3. Znamená to, že 60 % zjištěných známek mělo hodnotu nejvýše 3 (tj. 3 nebo nižší). Podobně interpretujte to, kdyby pro veličinu plat měl např. horní kvartil hodnotu 32 tis. Kč: Znamenalo by to, že 75 % zjištěných platů mělo hodnotu nejvýše 32 tis. Kč (tj. zbylých 25 % platů bylo jakých?)

KVANTILY 2. Určení přímo pomocí dat – možný problém a) Data uspořádáme vzestupně dle velikosti b) Nenalezneme celočíselné z vyhovující nerovnicím: n·p < z < n·p +1 Stane se to tehdy, když obě hodnoty (n·p ; n·p+1) vyjdou přesně celočíselně. c) Nalezneme hodnotu s pořadovým číslem n·p a s následujícím pořadovým číslem n·p+1. d) Za hledaný kvantil prohlásíme průměr obou nalezených hodnot, respektive menší z obou hodnot.

KVANTILY 2. Určení přímo pomocí dat – možný problém Příklad 1 – pokračování: Nalezněte medián známek žáka. Známky seřadíme: 2, 2, 3, 3, 3, 3, 3, 4. Jelikož n=8 a p=0,5, vyjde n·p =4, takže hledáme z : 4 < z < 5 (neexistuje) Najdeme tedy jak 4., tak 5. známku. Jelikož jsou obě trojky, jejich průměrem je také trojka a to je hledaný medián: ỹ=3.

KVANTILY Poznámka 1: Není chybou, že nám pro tato data vyšly 50% a 60% kvantil shodně (=3), ale na druhou stranu to není pravidlo. Pro jiná data můžou tyto kvantily vyjít různě – v takovém případě pak ale určitě bude ỹ < ỹ 0,60. Poznámka 2: Může se stát, že postup pomocí distribuční funkce a postup přímo z dat skončí různými výsledky (v případě problému s neexistencí z, a to kdyby se hodnoty s pořadím n·p a n·p+1 lišily). Rozdíl však obvykle bývá zanedbatelný.

MOMENTY

Obecné momenty – prosté tvary momenty kolem 0 První obecný moment: aritmetický průměr, „těžiště“ dat Druhý obecný moment: aritmetický průměr druhých mocnin

Obecné momenty – prosté tvary Příklad 1 – pokračování: 3, 4, 2, 3, 2, 3, 3, 3. _ y = ( )/8 = 23/8 = 2,875 _ y 2 = ( )/8 = = ( )/8 = 69/8= 8,625

Obecné momenty – prosté tvary Příklad 1 – Poznámka: Hodnota SOUČTU všech pozorování ( ) = 23 je tzv. ÚHRN (úhrnná hodnota). Platí: průměr = úhrn / počet aneb:úhrn = průměr · počet aneb: počet = úhrn / průměr

Obecné momenty – vážené tvary Při výpočtu lze využít četností absolutních:

Obecné momenty – vážené tvary Příklad 1 - pokračování: _ y = (2·2+3·5+4·1)/8 = 23/8 = 2,875 _ y 2 = (2 2 ·2+3 2 ·5+4 2 ·1)/8 = (4·2+9·5+16·1)/8 = = 69/8= 8,625 = 69/8= 8,625 yiyiyiyi234 nininini251 pipipipi0,2500,6250,125

Obecné momenty – vážené tvary Při výpočtu lze využít také četností relativních:

Obecné momenty – vážené tvary Příklad 1 - pokračování: _ y = 2·0,250+3·0,625+4·0,125 = 2,875 _ y 2 = 2 2 ·0, ·0, ·0,125 = = 4·0,250+9·0,625+16·0,125 = 8,625 yiyiyiyi234 nininini251 pipipipi0,2500,6250,125

Centrované momenty - prosté tvary První centrovaný moment: První centrovaný moment je vždy roven 0!

Centrované momenty - prosté tvary Druhý centrovaný moment = ROZPTYL aneb „průměrná čtvercová odchylka od aritmetického průměru“ : Směrodatná odchylka: Variační koeficient:

Centrované momenty prosté tvary Příklad 1 - pokračování: M 2 (y)=[(3−2,875) 2 +(4−2,875) 2 +(2−2,875) 2 + +(3 −2,875) 2 +(2 −2,875) 2 +(3 −2,875) 2 + +(3 −2,875) 2 +(2 −2,875) 2 +(3 −2,875) 2 + +(3 −2,875) 2 +(3 −2,875) 2 ] / 8 = 0,359 +(3 −2,875) 2 +(3 −2,875) 2 ] / 8 = 0,359 √ M 2 (y) = √0,359 = 0,599 Známky byly zhruba v rozmezí 2,875±0,599 aneb v rozmezí 2,276 až 3,474.

Centrované momenty vážené tvary K výpočtu lze užít četností absolutních: nebo četností relativních:

Centrované momenty vážené tvary Příklad 1 - pokračování: M 2 (y) =[(2−2,875) 2 ·2+ +(3−2,875) 2 ·5+ +(3−2,875) 2 ·5+ +(4−2,875) 2 ·1] / 8 = 0,359 +(4−2,875) 2 ·1] / 8 = 0,359 M 2 (y) =(2−2,875) 2 ·0,250+ +(3−2,875) 2 ·0,625+ +(3−2,875) 2 ·0,625+ +(4−2,875) 2 ·0,125 = 0,359 +(4−2,875) 2 ·0,125 = 0,359

MOMENTY ROZPTYL – rychlý výpočetní tvar Příklad 1 - pokračování: M 2 (y) = 8,625–2,875 2 = 0,359 Poznámka: Vždy musí vyjít M 2 (y)≥0 !

MOMENTY Mají smysl jen u číselných veličin (diskrétních či spojitých) Vážené tvary má smysl používat jen tehdy, jsou-li k dispozici četnosti (tj. u diskrétních veličin) Použití prostého i váženého tvaru musí dát stejný výsledek (jde o totéž, jen jinak počítáno)

GRAFICKÉ ZNÁZORNĚNÍ DAT Spojité veličiny – krabičkový graf (box plot)

MOMENTY Chování při aditivní lineární transformaci: Známe průměr a rozptyl. Každé pozorování změníme o stejnou konstantu c. Průměr se tak změní o tutéž konstantu c, rozptyl se nezmění.

MOMENTY Příklad 1 - pokračování: Pokud bychom žákovi všechny udělené známky o jeden stupeň zlepšili (c= -1), průměrná známka se změní z hodnoty 2,875 na hodnotu 1,875, ale rozptyl zůstane 0,359 (ověřte výpočtem).

MOMENTY Chování při multiplikativní lineární transformaci: Známe průměr a rozptyl. Každé pozorování vynásobíme stejnou konstantou c. Průměr se také musí vynásobit konstantou c, rozptyl se musí vynásobit její druhou mocninou c 2.

MOMENTY Příklad 2: Byly měřeny délky vyrobených trubek v centimetrech. Průměrná délka činí 49 cm a rozptyl 144 (cm 2 ). Nyní je nutno všechna měření převést na decimetry. Jak se změní hodnoty momentů? Jelikož c=0,1, průměr bude činit 4,90 dm a rozptyl 1,44 (dm 2 ).

MOMENTY Chování při aditivní lineární transformaci: Známe průměr a rozptyl. Každé pozorování změníme o stejnou konstantu c. Průměr se tak změní o tutéž konstantu c, rozptyl se nezmění.

MOMENTY Příklad 1 - pokračování: Pokud bychom žákovi všechny udělené známky o jeden stupeň zlepšili (c= -1), průměrná známka se změní z hodnoty 2,875 na hodnotu 1,875, ale rozptyl zůstane 0,359 (ověřte výpočtem). yiyiyiyi234 nininini251 pipipipi0,2500,6250,125

MOMENTY Chování při multiplikativní lineární transformaci: Známe průměr a rozptyl. Každé pozorování vynásobíme stejnou konstantou c. Průměr se také musí vynásobit konstantou c, rozptyl se musí vynásobit její druhou mocninou c 2.

MOMENTY Příklad 2: Byly měřeny délky vyrobených trubek v centimetrech. Průměrná délka činí 49 cm a rozptyl 144 (cm 2 ). Nyní je nutno všechna měření převést na decimetry (tj. vydělit 10, nebo-li vynásobit 0,1). Jak se změní hodnoty momentů? Jelikož c=0,1, průměr bude činit 4,90 dm a rozptyl 1,44 (dm 2 ).

MOMENTY Příklad 3: Ve firmě je průměrná mzda Kč a rozptyl mezd je Jak se změní obě charakteristiky, pokud vedení firmy zvýší plat každému zaměstnanci o 10%?

Pokračování Pokračování: Co znamená zvýšení platu o 10%? X + 10% z X = X + 0,1X = 1,1X Každý plat násobíme konstantou 1,1. Průměrná mzda se tedy změní stejně – tj. zvýší se o 10%. Rozptyl se zvýší 1,1 2 krát, tedy 1,21 krát, tedy se zvýší o 21%.

Parametry polohy Mají smysl jen u číselných veličin (diskrétních či spojitých) Vážené tvary má smysl používat jen tehdy, jsou-li k dispozici četnosti (tj. u diskrétních veličin) Použití prostého i váženého tvaru musí dát stejný výsledek (jde o totéž, jen jinak počítáno)

Parametry polohy ModusMedián Aritmetický průměr (pokud má smysl sčítání) Geometrický průměr (pokud má smysl násobení) Harmonický průměr (pro veličiny s jednotkami ve tvaru zlomku)

Geometrický průměr

Příklad: V průběhu let proběhlo několikrát zdražení využívané služby. Poprvé na dvojnásobek, poté na trojnásobek a nakonec na čtyřnásobek. Jaké bylo celkové zdražení? Jaké bylo průměrné zdražení?

Geometrický průměr Příklad - pokračování: Je celkové zdražení vypočteno následovně? 2+3+4=9 … Celkové zdražení je na devítinásobek? A je průměrné zdražení vypočteno následovně? ? Pokud naše služba původně stála 100, pak po prvním zdražení 100.2=200, po druhém 200.3=600 a po posledním zdražení 600.4=2400. Celkové zdražení je tedy na 24 násobek.

Geometrický průměr Příklad - dokončení: Pokud tedy nemá smysl celkové zdražení počítat 2+3+4=9, ale 2.3.4=24, je zřejmé, nemá smysl sčítání, ale násobení. K výpočtu průměrného zdražení je nutno použít geometrický průměr:

Příklad Peníze v bance jsme měli úrokovány v prvním roce 10%, v druhém 20% a v třetím 30%. Jaká byla průměrná úroková sazba? Byla ? Ověření: V bance jsme měli původně 100, tedy po prvním roce 110, po druhém 132 a po třetím 171,6. V případě využití průměrné úrokové sazby máme po prvním roce 120, po druhém 144 a po třetím 172,8. Tedy výpočet je chybný.

Příklad - pokračování Použijeme k výpočtu geometrický průměr následovně? Ověření: Po prvním roce této průměrné sazby máme 118,17, po druhém 139,64 a po třetím 165,01. Tedy opět špatně. NUTNO SI UVĚDOMIT, ŽE PŘIČÍTÁNÍ % ZNAMENÁ NÁSOBENÍ KONSTANTOU!!!

Příklad - dokončení Tedy správný výpočet je: Ověření: Po prvním roce této úrokové sazby máme 119,72, po druhém 143,33 a po třetím 171,60. Tedy máme konečně správný výsledek!!!

Harmonický průměr

Příklad 1: Na dovolenou jsme jeli nejprve 50km rychlostí 10 km/h a pak 200 km rychlostí 100 km/h. Jaká byla naše průměrná rychlost? Z fyziky víme v = s/t. Tedy:

Harmonický průměr ALE POZOR !!! Příklad 2: Na dovolenou jsme jeli nejprve 5 hodin rychlostí 10 km/h a pak 2 hodiny rychlostí 100 km/h. Jaká byla naše průměrná rychlost? Z fyziky víme v = s/t. Tedy:

Míry variability Variační rozpětí Kvartilové rozpětí Rozptyl – čtvercová míra variability (proměnlivosti) dat může porovnávat variabilitu souborů, v nichž je veličina zaznamenána v různých měrných jednotkách – např. platy u nás v Kč versus platy v Německu v Euro), či je na jiné úrovni (poloze) Směrodatná odchylka (stejné jednotky jako veličina) Relativní mírou variability je variační koeficient