Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Základní zpracování dat Příklad
OA a VOŠ Příbram „Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“
2
Příklad: Rozdělení věku nezaměstnaných
Řazení - podle velikosti, abecedně. Třídění – zpřehlednění velkého množství dat do tabulek např. uspořádání do tzv. tabulky četností. Grafická prezentace – grafy, diagramy.
3
Třídění Prosté třídění diskrétní znak Intervalové třídění spojitý
Věk Počet 16 20 17 31 18 514 19 938 1452 21 2200 22 2610 23 3688 24 4262 Věk Počet 672 872 632 445 388 336 400 404 124 Výška Počet (140, 150> 12 (150, 160> 36 (160, 170> 78 (170, 180> 59 (180, 190> 20 Prosté třídění diskrétní znak Intervalové třídění spojitý Intervalové třídění spojitý znak
4
TABULKA ROZDĚLENÍ ČETNOSTI Kumulativní relativní četnosti
Hodnoty xi Absolutní četnosti ni Relativní četnosti pi Kumulativní četnosti Kumulativní relativní četnosti x1 n1 x2 n2 xk nk Celkem: 1
5
Tabulka četností Konstrukce tabulky četností
Zjistíme v jakém rozmezí se data pohybují, tedy nejmenší a nejvyšší hodnotu. Rozhodneme, zda provedeme prosté nebo intervalové třídění (v závislosti na typu sledované proměnné) Rozhodneme, kolik bude mít tabulka řádků – volíme počet tzv. tříd. Rozhodneme jaké bude rozpětí jednotlivých tříd. Počítáme kolik pozorování patří do každé třídy (čárkovací metoda nebo počítač).
6
Tabulka četností Volba vhodného počtu tříd (řádků) v tabulce četností
Prosté třídění: Podle počtu obměn diskrétního znaku Intervalové třídění: Sturgesovo pravidlo: počet intervalů k ≈ 1 + 3,3log10 n Jednoduché (odmocninové) pravidlo: k ≈ √n Podle potřeby prezentace (např. intervaly po 10 letech) Intervaly by měly zahrnovat všechny hodnoty a měly by být stejně široké. Měly? – krajní intervaly mohou být delší pokud zahrnují extrémní hodnoty.
7
Tabulka četností Interval Věk 1 2 3 4 5 6 7 8 9 Celkem Nejmenší hodnota sledovaného souboru je 16 let a největší 60 let. Tabulka musí zahrnovat všechny hodnoty! Počet intervalů (řádků) je k = 9. Byl zvolen v souvislosti se šířkou intervalu, která je 5 let (toto uspořádání je přehledné a jednoduché). Intervaly se nesmějí překrývat, proto první končí věkem 20 a druhý začíná věkem 21.
8
Tabulka četností Interval Věk 1 15 – 18 2 19 – 22 3 23 – 26 4 27 – 30 5 31 – 34 6 35 – 38 7 39 – 42 8 43 – 46 9 47 – 50 10 51 – 54 11 55 – 58 12 59 – 62 13 63 – 66 Při použití jednoduchého (odmocninového) pravidla by počet intervalů byl √4275 ≈ 65 Taková tabulka by byla příliš složitá a nepřehledná. Sturgessovo pravidlo stanovuje následující počet intervalů: k ≈ 1 + 3,3log ≈ 13. Šířka intervalů se pak spočítá podle vzorce: (maximální hodnota – minimální hodnota) počet intervalů k (60 – 16)/13 = 3,38 ≈ 4 roky
9
Tabulka četností Střed intervalu (xi*)
Věk Střed intervalu xi* Absolutní četnost ni 1 18 673 2 23 872 3 28 632 4 33 445 5 38 388 6 43 336 7 48 400 8 53 404 9 58 125 Celkem 4275 Střed intervalu (xi*) prostřední hodnota mezi horní a dolní mezí intervalu Absolutní četnost (ni) počet hodnot v souboru spadající do příslušného intervalu 445 nezaměstnaných (hodnot) je ve věku od 31 do 35 let.
10
Tabulka četností Relativní četnost (pi)
Interval Věk Absolutní četnost ni Relativní četnost pi 1 673 0,16 2 872 0,20 3 632 0,15 4 445 0,10 5 388 0,09 6 336 0,08 7 400 8 404 9 125 0,03 Celkem 4275 1,00 Relativní četnost (pi) počet hodnot (v procentech) v souboru spadající do příslušného intervalu 10% všech nezaměstnaných bylo ve věku od 31 do 35 let. Výpočet: Absolutní četnost/celkem = 445 / 4275 = 0,10
11
Tabulka četností Kumulativní absolutní četnost (kni)
Interval Věk Absolutní četnost ni Kumulativní absolutní četnost kni 1 673 2 872 1545 3 632 2177 4 445 2622 5 388 3010 6 336 3346 7 400 3746 8 404 4150 9 125 4275 Celkem Kumulativní absolutní četnost (kni) počet hodnot v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 2177 nezaměstnaných bylo mladších než 30 let Výpočet: = 2177
12
Tabulka četností Kumulativní relativní četnost (kpi)
Interval Věk Absolutní četnost ni Kumulativní relativní četnost kpi 1 673 0,16 2 872 0,36 3 632 0,51 4 445 0,61 5 388 0,70 6 336 0,78 7 400 0,88 8 404 0,97 9 125 1,00 Celkem 4275 Kumulativní relativní četnost (kpi) počet hodnot (v procentech) v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 51% nezaměstnaných bylo mladších než 30 let Výpočet: ( )/4275 = 0,51
13
Kumulativní absolutní četnost kni Kumulativní relativní četnost kpi
Tabulka četností Int Věk Střed intervalu xi* Absolutní četnost ni Relativní četnost pi Kumulativní absolutní četnost kni Kumulativní relativní četnost kpi 1 18 673 0,16 2 23 872 0,20 1545 0,36 3 28 632 0,15 2177 0,51 4 33 445 0,10 2622 0,61 5 38 388 0,09 3010 0,70 6 43 336 0,08 3346 0,78 7 48 400 3746 0,88 8 53 404 4150 0,97 9 58 125 0,03 4275 1,00 Celkem
14
Tabulka četností Graf rozdělení četností Rozdělení věku 100 200 300
100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost
15
Základní zpracování dat
Histogram četností – absolutní četnost ni Rozdělení věku 100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost
16
Základní zpracování dat
Histogram četností – kumulativní absolutní četnost Rozdělení věku 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) kumulativní absolutní četnost
17
Základní zpracování dat
Polygon četností (spojnicový graf)
18
Základní zpracování dat
Histogram četností – pouze pokud jsou všechny intervaly stejně široké Sloupcový graf – pokud jde o prosté třídění znaku, nebo intervalové s nestejně širokými intervaly. Mezi sloupce se vkládají mezery.
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.