Statistické charakteristiky variability

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Statistická indukce Teorie odhadu.
UKAZATELE ZPŮSOBILOSTI A VÝKONNOSTI
Použité statistické metody
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Název školy Střední škola pedagogická, hotelnictví a služeb,
Hodnocení způsobilosti měřících systémů
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
KVANTILY OA a VOŠ Příbram.
Popisná statistika - pokračování
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
Charakteristiky polohy hodnoty znaku - čísla popisující polohu znaku na číselné ose -můžeme zvolit: -Aritmetický průměr -Modus, medián -Harmonický průměr.
Tloušťková struktura porostu
Charakteristiky polohy
Obsah statistiky Jana Zvárová
Odhady odhady bodové a intervalové odhady
Statistický soubor, jednotka, znak.
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Statistika Ukazatelé variability
Jevy a náhodná veličina
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09C17 AutorMgr. Monika Chvostková Období vytvořeníŘíjen.
Charakteristiky variability
Chyby jednoho měření když známe
Statistika 2 Aritmetický průměr, Modus, Medián
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Základy statistiky Autor: Jana Buršová.
RNDr. Monika Pávková Goldbergová
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Didaktické testy II Psychometrická analýza úloh a testů podle klasické teorie testování Martin Chvál Brno,
… jak jsem na tom ve srovnání s ostatními?
Příjemce podpory – škola: Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice, Benešovo náměstí 1, p.o. Číslo projektu:CZ.1.07/1.5.00/
K OMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA Charakteristiky variability VY_32_INOVACE_M4r0120 Mgr. Jakub Němec.
Základy popisné statistiky
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Zlepšení podmínek pro vzdělávání na středních školách Operačního programu Vzdělávání pro konkurenceschopnost Název a adresa školy: Integrovaná střední.
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
STATISTIKA 1. DISTRIBUČNÍ FUNKCE Slouží k popisu rozdělení (distribuce) číselných dat Je zobecněním relativních četností F(y) = p(Y≤ y) F(y) … udává podíl.
Odhady odhady bodové a intervalové odhady
Induktivní statistika
Induktivní statistika
Statistika 2.cvičení
Popisná statistika: přehled
Induktivní statistika
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Metodologie pro ISK 2 Úvod do práce s daty
Výukový materiál zpracován v rámci projektu EU peníze školám
Střední škola obchodně technická s. r. o.
Analýza kardinálních proměnných
Autor: Honnerová Helena
Induktivní statistika
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Statistické charakteristiky variability

Variabilita (proměnlivost) v datech hodnoty mohou být více či méně rozptýleny okolo aritmetického průměru analogie s terčem – menší nebo větší rozptyl zásahů

Charakteristiky (míry) variability rozptyl směrodatná odchylka variační koeficient kvartilová odchylka

Rozptyl Příklad 1: Zjištěnými hodnotami budou v jednom případě čísla 5, 6, 7 a ve druhém případě čísla 1, 7, 10. aritmetický průměr je v obou případech 6 Hodnota Odchylka Hodnota Odchylka 5 5 – 6 = -1 1 1 – 6 = -5 6 6 – 6 = 0 7 7 – 6 = 1 7 7 – 6 = 1 10 10 – 6 = 4 ve druhém případě jsou hodnoty mnohem více rozptýleny

Rozptyl (značíme s2) Příklad 1 (pokračování): Pro hodnoty 5, 6, 7 je rozptyl roven 2/3. Pro hodnoty 1, 7, 10 je rozptyl roven 14.

Odvození výpočetního tvaru rozptylu

Výpočetní tvar rozptylu Tento tvar je často vhodnější pro ruční výpočet Příklad 1 (pokračování): Pro hodnoty 5, 6, 7 je rozptyl samozřejmě opět roven 2/3 a podobně pro hodnoty 1, 7, 10 je rozptyl opět roven 14.

Rozptyl – varianta pro data zadaná tabulkou četností Výpočetní tvar (označíme n = n1+…+ nk):

Příklad 2: Určete rozptyl a směrodatnou odchylku výšek chlapců ve věku 16 let. Snadno spočítáme, že průměrná výška je 174,3 cm. výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4

Tentýž příklad řešený výpočetním tvarem rozptylu (pro ruční výpočet je jednodušší a často i přesnější): výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4

Směrodatná odchylka Výhoda – charakterizuje variabilitu v týchž jednotkách, v jakých jsou udány hodnoty stat. znaku (kdežto rozptyl v druhých mocninách těchto jednotek) V předchozím příkladě je:

Variační koeficient použijeme jej, pokud chceme charakterizovat variabilitu bezrozměrným číslem vyjadřuje se obvykle v procentech

Příklad 3: Máme porovnat dvě firmy co se týče variability platů. V první firmě je průměrný plat 15 000 Kč a směrodatná odchylka 3 000 Kč. Ve druhé je průměrný plat 30 000 Kč a směrodatná odchylka 4 000 Kč. Na první pohled se zdá, že variabilita je vyšší ve druhé firmě, protože je tam vyšší směrodatná odchylka. Je tam však i vyšší plat. Lepším kriteriem je porovnat to, jakou část aritmetického průměru tvoří směrodatná odchylka: 1. firma …V = 3 000 : 15 000 = 0,20 = 20 %, 2. firma …V = 4 000 : 30 000 = 0,13 = 13 %, Vidíme, že ve druhé firmě je variabilita platů výrazně nižší než v první.

Hodnoty variačního koeficientu Hodnoty variačního koeficientu do 0,10 (tj. 10 %) svědčí o malé variabilitě – aritmetický průměr je možné považovat za typickou hodnotu datového souboru. Hodnoty do 0,4 (tj. 40 %) svědčí o vyšší variabilitě – aritmetický průměr je možné považovat pouze za hodnotu orientační. Pokud je variační koeficient ještě vyšší, není dobré dávat aritmetickému průměru nějaký zvláštní význam, nemusí se jednat se o typickou hodnotu v datovém souboru.

Pozor! Je chybou popsat datový soubor pouze hodnotu aritmetického průměru. Aby se zabránilo jeho špatné interpretaci (nebo dokonce úmyslnému zneužití), je nutné doplnit jej některým z údajů o variabilitě (tj. rozptylem, směrodatnou odchylkou nebo variačním koeficientem).

Kvantily (percentily) p-procentní kvantil – je taková hodnota statistického znaku, před níž leží právě p procent shromážděných dat (seřazených podle velikosti). Značíme jej Příklad: 10% kvantil pro statistický znak příjem rodiny udává takovou hodnotu, že 10 % rodin má nižší nebo stejný příjem.

Výpočet kvantilu Označíme-li z pořadové číslo p% kvantilu, pak platí:

Příklad určení pořadového čísla 20% kvantilu v souboru o rozsahu 153: tj. 20% kvantil je v pořadí 31. hodnota mezi 153 údaji. Příklad určení pořadového čísla 25% kvantilu v souboru o rozsahu 108: tj. 25% kvantil leží mezi v pořadí 27. a 28. hodnotou v rozsahu 108 dat.

Příklad 2 (pokračování): Určete 75% kvantil v souboru tělesných výšek chlapců: výška (xi) 160 165 170 175 180 185 190 četnost (ni) 9 20 36 82 35 14 4 kumulativní četnost 29 65 147 182 196 200 148. – 182. Hledáme 150. a 151. hodnotu v pořadí – obě jsou rovny 180 cm (obě tyto hodnoty se nachází v pátém sloupci tabulky, což poznáme podle kumulativních četností). Závěr: 75% kvantil je 180 cm.

Ve statistice se pro některé kvantily užívá dalšího pojmenování: Kvartily – dělí data na čtyři části: dolní kvartil = 25% kvantil medián = 50% kvantil horní kvartil = 75% kvantil Decily – dělí data na deset částí: první decil = 10% kvantil druhý decil = 20% kvantil … devátý decil = 90% kvantil

Kvartilové míry variability Mezikvartilové rozpětí: Kvartilová odchylka Koeficient kvartilové odchylky

Krabičkový diagram (box plot) medián horní kvartil dolní kvartil „vous“ = 1,5 IQR Pokud minimum hodnot je větší než dolní kvartil minus 1,5 IQR, zkracuje se levý „vous“ na tuto délku. Pokud maximum hodnot je menší než horní kvartil plus 1,5 IQR, zkracuje se pravý „vous“ na tuto délku.

Může se stát, že „vous“ zcela zmizí, pokud se minimum nebo maximum rovná dolnímu nebo hornímu kvartilu. Naopak, vyskytnou-li se hodnoty, které se nacházejí mimo maximální rozpětí, dané jeden a půl násobkem mezikvartilového rozpětí, jsou považovány za "podezřelé" (odlehlé) a je jim třeba věnovat zvláštní pozornost, neboť mohou obzvláště při malém počtu pozorování značně ovlivnit některé ukazatele. Odlehlé hodnoty mohou být zaviněny hrubou chybou při měření nebo při přenosu dat do počítače, ale mohou být také správné (existuje skutečně takový extrém). Pak závisí na zpracovateli, zda pro dané účely tento extrém do zpracování zahrne či nikoliv. V grafu bývají odlehlé hodnoty znázorněny tečkou nebo hvězdičkou.