Charakteristiky úrovně OA a VOŠ Příbram
Charakteristiky úrovně (polohy) Statistický soubor je nahrazen jen jediným číslem, které jej určitým způsobem specifikuje. počet hodnot, minimum a maximum – nejjednodušší ukazatele průměry - počítané ze všech hodnot souboru ostatní střední hodnoty (robustní charakteristiky polohy) – jsou-li v souboru extrémní (odlehlá) pozorování useknuté průměry, kvantily – nepočítají se ze všech hodnot souboru (část hodnot se úmyslně vynechává)
Hodnota (Value) Každá hodnota v souboru má svoji značku. Index i se nahrazuje číslem a označuje kolikátá hodnota v souboru to je. x25 = 46 znamená, že 25. hodnota souboru je 46.
Počet hodnot (Count) Udává počet hodnot v souboru n … počet hodnot ve výběru N … počet hodnot v základním souboru (populaci) MS Excel = POČET (oblast) nebo POČET2 nebo Nástroje - Analýza dat – Popisná statistika
Minimum (Minimun) Nejmenší hodnota souboru. MS Excel = MIN (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Maximum (Maximum) Největší hodnota souboru. MS Excel = MAX (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Úhrn (Sum) výběrový úhrn populační úhrn Součet všech hodnot souboru (o první do n-té resp. N-té hodnoty). MS Excel = SUMA (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Aritmetický průměr (Average, Mean) Představuje průměr, připadající na jednotku pozorování. … výběrový průměr μ … průměr základního souboru (populační průměr) Pozn. Citlivý na extrémní hodnoty! Pokud jsou hodnoty příliš vysoké nebo nízké, změní to hodnotu průměru. Není příliš objektivním statistickým ukazatelam. MS Excel = PRŮMĚR (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Př.: Aritmetický průměr (Average, Mean) Příklad: Zjišťováním průměrného platu ve firmě Otýlie (fikce) Jméno Hrubá mzda Libuška 18 300 Kč Karlík Marcelka 18 450 Kč Alenka 18 510 Kč Ing.Nenasyta 45 000 Kč Průměrná mzda 18 390 Kč 23 712 Kč
Pravidla Aritmetický průměr (Average, Mean) Pravidla pro počítání s průměrem Vynásobíme-li aritmetický průměr číslem n (rozsah souboru), dostaneme součet (sumu) všech hodnot souboru. Součet odchylek všech hodnot souboru od průměru je nulový (kladné a záporné odchylky se navzájem vyruší). Součet čtverců (druhých mocnin) odchylek jednotlivých hodnot souboru od průměru je vždy menší než součet čtverců odchylek jednotlivých hodnot souboru od jakékoliv jiné hodnoty než je aritmetický průměr. Přičteme-li ke všem hodnotám tutéž konstantu (kladnou resp. zápornou), hodnota aritmetického průměru se o tuto konstantu změní (vzroste resp. klesne). Vynásobíme-li všechny hodnoty nenulovou konstantou, pak je touto konstantou vynásoben i aritmetický průměr.
Součet jednotlivých odchylek od průměru je nulový. Přičteme-li k jednotlivým hodnotám znaku konstantu, zvýší se o tuto konstantu i aritmetický průměr. Násobíme-li jednotlivé hodnoty konstantou, je touto konstantou násoben i průměr. Aritmetický průměr konstanty je opět roven konstantě. Násobíme-li váhy aritmetického průměru konstantou, průměr se nezmění.
Vážený aritmetický průměr (Weighted Mean) Vážený průměr se nejvíce využije, pokud jsou data již uspořádána v tabulce četností, nebo v případech, kdy jsou hodnoty různě důležité. Interpretace váženého průměru je stejná jako u prostého průměru. ni je tzv. váha, pro součet vah platí Σni = 1, k je počet vah. MS Excel = nemá funkci, nutno počítat podle vzorce
Vážený aritmetický průměr (Weighted Mean) Vahami mohou být přímo relativní četnosti pi . Pro intervalové rozdělení četností lze použít četnosti absolutní ni (viz pravá strana vzorce), k je počet intervalů v tabulce četností, xi* střed intervalu. MS Excel = nemá funkci, nutno počítat podle vzorce
Př.: Vážený aritmetický průměr (Weighted Mean) Příklad: Zjišťováním průměrného platu ve firmě ELBI Počet zaměstnanců (ni) Hrubá mzda (xi) Výpočet xi·ni 2 25 000 Kč 50 000 Kč 1 18 450 Kč 3 22 500 Kč 67 500 Kč Součet 135 950 Kč Průměrná mzda 45 317 Kč
Je-li statistický soubor rozdělen do dílčích podsouborů, v nichž známe dílčí průměry a počty pozorování n1, n2, …, nk, pak průměr celkového souboru je váženým aritmetickým průměrem těchto dílčích průměrů, kde vahami jsou četnosti těchto podsouborů. Platí tedy
Useknutý průměr (Trimmed Mean ) Určitá část největších a nejmenších hodnot se do výpočtu nezahrne. Např. desetiprocentní uřezaný průměr znamená, že se vynechá 10% nejnižších výsledků a 10% nejvyšších výsledků a ze zbytku se počítá prostý průměr. Obvykle se volí 5%, 10% nebo 25%-ní useknutý průměr. Pozn. Snaha nezahrnout do výpočtu extrémní hodnoty! Odstraňuje nedostatky prostého průměru. Počet hodnot l < n. MS Excel = TRIMMEAN (oblast; procenta)
Geometrický průměr (Geometric Mean) Použití pro analýzu časových řad (průměrná procentuální změna sledovaného ukazatele). MS Excel = GEOMEAN (oblast)
Harmonický průměr (Harmonic Mean) Používán v indexní teorii. A dále např. pro výpočet průměrného času pro určení průměrného výkonu, známe-li doby na stejnou jednotkovou práci nebo k výpočtu průměrné rychlosti. MS Excel = HARMEAN (oblast)
Kvadratický průměr (Quadratic Mean) MS Excel = nemá funkci, nutno počítat podle vzorce
Modus (Mode) Nejčastěji se vyskytující hodnota znaku v souboru. U diskrétních znaků je modem znak s nejvyšší četností. U spojitých proměnných lze v tabulce četností nebo v grafu nalézt tzv. modální interval (interval s nejvyšší absolutní četností), modem je pak střed této třídy. Pozn. Může jich být v souboru více, nebo nemusí být žádný. Jsou-li dva jde o tzv. bimodální soubor, je-li jeden je soubor unimodální. MS Excel = MODE (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Medián (Median) Hodnota, dělící seřazený soubor na dvě poloviny. Polovina hodnot souboru je stejná nebo menší než je medián a polovina je větší. Lichý počet hodnot souboru - je prostřední prvek seřazeného souboru Sudý počet hodnot – je průměr dvou prostředních prvků seřazeného souboru. V tabulce četností je mediánem střed první třídy, která má kumulativní relativní četnost větší než 50%. Pozn. Není citlivý na extrémní hodnoty! U souborů s extrémy se upřednostňuje před aritmetickým průměrem. MS Excel = MEDIAN (oblast) nebo Nástroje - Analýza dat – Popisná statistika
Příklad – Míry úrovně Příklad: Zjišťování průměrného platu ve firmě TOŠ (fikce) Jméno Hrubá mzda Libuška 18 300 Kč Karlík Marcelka 18 450 Kč Alenka 18 510 Kč Ing. Nenasyta 45 000 Kč Průměrná mzda 18 390 Kč 23 712 Kč Modus 18 300 Kč Medián 18 375 Kč 18 450 Kč Useknutý průměr 18 390 Kč 23 712 Kč
Př. Průměr a medián Mzdy ČR Průměr – hrubá měsíční mzda v ČR v roce 2007: celkem - muži - ženy - Medián – hrubá měsíční mzda v ČR v roce 2007: 24 604 Kč 27 489 Kč 20 684 Kč 20 908 Kč 22 850 Kč 18 322 Kč
Míry úrovně – stat funkce Statistické funkce Excelu Další funkce
Mzdy z ČR graf Orientační graf rozdělení hrubé mzdy v ČR v roce 2007
Graf Mzdy z ČR