POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik Histogram Empirická distribuční funkce
A. výpočet výběrových charakteristik přímo z napozorovaných hodnot – rozsah výběru: n – napozorované hodnoty: x1 , x2 , ... , xn Charakteristiky polohy : Výběrový průměr : tj. = ( x1 + x2 + x3 + + xn) / n
a) pro n liché, prostřední hodnota ; Výběrový medián Me : – hodnoty uspořádané podle velikosti : x(1) x(2) x(3) ....... x(n) a) pro n liché, prostřední hodnota ; b) pro n sudé, průměr dvou prostředních hodnot . V případě a): x(1) x(2) x(3) x(4) x(5) je medián x(3) . V případě b): x(1) x(2) x(3) x(4) je medián ( x(2) + x(3) ) / 2 .
Výběrový modus Mo : nejčetnější hodnota . Uvažujme x(1) x(2) = x(3) = x(4) x(5) x(6) x(7) ; modus je x(2) ( = x(3) = x(4) ) .
Charakteristiky variability : Výběrový rozptyl s2 : Výběrová směrodatná odchylka s : tj. Po úpravě :
Poznámka: Rozptyl statistického (základního) souboru s2 : Nejedná se o výběrový rozptyl vypočítaný z výběru několika náhodně vybraných jednotek z procesu nebo základního souboru, ale o rozptyl vypočítaný ze všech prvků konečného statistického souboru.
R = xmax - xmin Výběrové rozpětí R : označíme xmin nejmenší x(1) hodnotu ve výběru xmax největší x(n) hodnotu ve výběru rozsahu n potom R = xmax - xmin
Schéma pro výpočet výběrových charakteristik :
Příklad: Me = 13,40 = (1/7) 93,93 = 13,4186 R = 13,53 - 13,30 = 0,23 Uspořádané hodnoty: Me = 13,40 = (1/7) 93,93 = 13,4186 R = 13,53 - 13,30 = 0,23 s2 = (1/6) (1260,4439 - (1/7) 93,932) = 0,006248 s = = 0,079042
B. výpočet výběrových charakteristik z hodnot seskupených do tříd – rozsah výběru: n – napozorované hodnoty: x1 , x2 , ... , xn – počet tříd: k – šíře třídy: h Označíme pro j-tou třídu : – nj třídní četnost (absolutní) – fj = nj / n relativní třídní četnost – Nj = kumulovaná třídní četnost (absolutní) – Fj = Nj / n kumulovaná relativní třídní četnost – zj = třídní znak (obvykle střed j-té třídy) – zj + h/2 = horní mez j-té třídy
Schéma pro výpočet výběrových charakteristik :
Příklad: Výběr n = 44 Seskupíme do tříd šíře h = 0,1 , zvolíme třídní intervaly
Výpočet výběrových charakteristik a s : = 340,58 / 44 = 7,740455 = (1/43)(2636,9431 - 340,582 / 44) = 0,016258 0,127507
Znázornění napozorovaných hodnot v pořadí jak byly měřeny
PŘÍKLADY : 1.1 Po roce provozu se měřil na zkušebně výkon motorů pro malotraktory. Jmenovitý výkon motoru xi byl stanoven na 25 kW. U sedmi zkoušených motorů byly naměřeny následující hodnoty v kW: i 1 2 3 4 5 6 7 xi 24,8 26,1 22,7 24,2 25,6 24,5 26,0 Ze zjištěných hodnot jmenovitého výkonu motoru stanovte výběrové charakteristiky: největší a nejmenší naměřenou hodnotu, aritmetický průměr, medián, rozpětí, rozptyl a směrodatnou odchylku ze zjištěných hodnot jmenovitého výkonu motoru.
1.2 Při zkoušení výrobků v klimatické komoře se měří relativní vlhkost. U šesti po sobě zkoušených stejných výrobků byly naměřeny následující hodnoty xi v procentech: i 1 2 3 4 5 6 xi 89,3 94,1 96,4 90,8 92,0 91,4 Vypočtěte všechny základní výběrové charakteristiky polohy (výběrový průměr, výběrový medián) a variability (výběrové rozpětí, výběrový rozptyl a výběrovou směrodatnou odchylku).
1.4 Ze souboru 5 000 ampulí jistého séra byl vzat náhodný výběr rozsahu n = 6 jednotek. Při destruktivní zkoušce byl zjišťován jejich obsah xi v cm3 a zapsán do uvedené tabulky: i 1 2 3 4 5 6 xi 1,7 1,4 1,6 1,1 1,3 1,3 Vypočtěte z uvedených hodnot běžné výběrové charakteristiky polohy (průměr, medián) a variability (rozpětí, rozptyl a směrodatnou odchylku).
1.8 Ve výběru n = 200 složitých výrobků byla měřena rozteč dvou otvorů s jmenovitou hodnotou 168 mm. Výsledky měření prováděného s přesností na 0,01 mm byly seskupeny do intervalů šíře 0,05 mm a jsou uvedeny v tabulce: Doplňte uvedenou tabulku o relativní třídní četnosti, kumulované třídní četnosti a relativní kumulované třídní četnosti
1.8 pokračování Vypočtěte výběrový průměr a výběrovou směrodatnou odchylku.
grafické znázornění dat seskupených do tříd Histogram grafické znázornění dat seskupených do tříd Napozorované hodnoty x1, x2, ... , xn náhodný výběr rozsahu n . Konstrukce histogramu: počet tříd k stejné šíře h ; zjistí se absolutní třídní četnosti nj , případně relativní třídní četnosti fj ; na osu x se vynesou hranice třídních intervalů, případně třídní znaky zj ; na osu y se vynáší třídní četnosti nj (absolutní) nebo fj (relativní); nad třídními intervaly se sestrojí obdélníky.
Příklad :
Ukázky některých základních typů histogramů a) Symetrický histogram zvonovitého tvaru
b) Dvojvrcholové histogramy
c) Histogramy plochého a hřebenovitého tvaru
d) Histogramy asymetrického tvaru
e) Dvojvrcholové histogramy s výraznou četností v krajní třídě
Empirická distribuční funkce grafické znázornění dat uspořádaných podle velikosti Napozorované hodnoty x1, x2, ... , xn náhodný výběr rozsahu n . Konstrukce empirické distribuční funkce: hodnoty uspořádáme podle velikosti x(1) x(2) … x(n) ; na osu x se vynesou hodnoty x(i), (i = 1, 2, …, n) ; na osu y se vynese ke každé hodnotě x(i) hodnota i / (n + 1) ; body [ x(i) ; i / (n + 1) ] tvoří graf empirické distribuční funkce.
Konstrukce empirické distribuční funkce v případě údajů seskupených do tříd: na osu x se vynesou horní meze třídních intervalů ; na osu y se vynesou proti nim kumulované relativní třídní četnosti zakreslené body [ zj + h/2 ; Fj ] tvoří graf empirické distribuční funkce.
POZNÁMKA: Je-li stupnice, na kterou vynášíme hodnoty Fj , resp. (i) / (n+1) pravděpodobnostní, potom v případě normálního rozdělení sledované náhodné veličiny jsou zakreslené body soustředěny v úzkém okolí přímky, která odpovídá teoretické distribuční funkci normálního rozdělení N(, 2) pro = a = s . Zakreslení přímky na pravděpodobnostní papír Z výběrových hodnot xi (i=1, 2, ..., n) se vypočtou hodnoty výběrového průměru a výběrové směrodatné odchylky s , které jsou odhady parametrů a normálního rozdělení N(, 2). Na pravděpodobnostní papír se zakreslí body (x = ; y = 50) a (x = + s ; y = 84,1) a těmito body se proloží přímka, která představuje průběh odhadu distribuční funkce rozdělení N(, 2).
Uspořádané hodnoty sestavíme do tabulky: Příklad : Uspořádáme naměřené délky podle velikosti a přiřadíme jim hodnoty i / (n+1). Pokud se některé hodnoty opakují, s četností n(i) , potom jim přísluší nárůst n(i)/(n+1) empirické distribuční funkce. Uspořádané hodnoty sestavíme do tabulky:
Uspořádané hodnoty zakreslíme do grafu:
Empirická distribuční funkce zakreslená do pravděpodobnostního papíru: