Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Základní zpracování dat Příklad OA a VOŠ Příbram „ Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“

Podobné prezentace


Prezentace na téma: "Základní zpracování dat Příklad OA a VOŠ Příbram „ Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“"— Transkript prezentace:

1 Základní zpracování dat Příklad OA a VOŠ Příbram „ Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“

2 Příklad: Rozdělení věku nezaměstnaných 43225353284326 38285022353636 37292846512339 27194425222133 23213647395649 49382624253436 59353339493558 29233528292631 40224437491937 23214224295118 55222256523345 51333849513719 46341945464341 28311921506047 44304052393918 39243450274628 48553154494327 39545452442629 29265951233350 34544133444724 30442035463120 52215632224226 50432023282327 34325453282530 28272253531947 35274923275519 42494725364220 20463549584346 22343927513952 45302131265445 Řazení - podle velikosti, abecedně. Třídění – zpřehlednění velkého množství dat do tabulek např. uspořádání do tzv. tabulky četností. Grafická prezentace – grafy, diagramy.

3 Třídění VěkPočet 1620 1731 18514 19938 201452 212200 222610 233688 244262 VěkPočet 16 - 20 672 21 - 25 872 26 - 30 632 31 - 35 445 36 - 40 388 41 - 45 336 46 - 50 400 51 - 55 404 56 - 60 124 VýškaPočet (140, 150> 12 (150, 160> 36 (160, 170> 78 (170, 180> 59 (180, 190> 20 Prosté třídění diskrétní znak Intervalové třídění spojitý znak Intervalové třídění spojitý

4 TABULKA ROZDĚLENÍ ČETNOSTI Hodnoty x i Absolutn í četnosti n i Relativn í četnosti p i Kumulativn í četnosti Kumulativn í relativn í četnosti x1x1x1x1 n1n1n1n1 x2x2x2x2 n2n2n2n2 xkxkxkxk nknknknk Celkem:1

5 Tabulka četností Konstrukce tabulky četností 1.Zjistíme v jakém rozmezí se data pohybují, tedy nejmenší a nejvyšší hodnotu. 2.Rozhodneme, zda provedeme prosté nebo intervalové třídění (v závislosti na typu sledované proměnné) 3.Rozhodneme, kolik bude mít tabulka řádků – volíme počet tzv. tříd. 4.Rozhodneme jaké bude rozpětí jednotlivých tříd. 5.Počítáme kolik pozorování patří do každé třídy (čárkovací metoda nebo počítač).

6 Tabulka četností Volba vhodného počtu tříd (řádků) v tabulce četností Prosté třídění: Podle počtu obměn diskrétního znaku Intervalové třídění: Sturgesovo pravidlo: počet intervalů k ≈ 1 + 3,3log 10 n Jednoduché (odmocninové) pravidlo: k ≈ √n Podle potřeby prezentace (např. intervaly po 10 letech) Intervaly by měly zahrnovat všechny hodnoty a měly by být stejně široké. Měly? – krajní intervaly mohou být delší pokud zahrnují extrémní hodnoty.

7 Tabulka četností IntervalVěk 1 16 - 16 - 20 2 21 - 25 3 26 - 30 4 31 - 35 5 36 - 40 6 41 - 45 7 46 - 50 8 51 - 55 9 56 - 60 Celkem Nejmenší hodnota sledovaného souboru je 16 let a největší 60 let. Tabulka musí zahrnovat všechny hodnoty! Počet intervalů (řádků) je k = 9. Byl zvolen v souvislosti se šířkou intervalu, která je 5 let (toto uspořádání je přehledné a jednoduché). Intervaly se nesmějí překrývat, proto první končí věkem 20 a druhý začíná věkem 21.

8 Tabulka četností IntervalVěk 1 15 – 18 2 19 – 22 3 23 – 26 4 27 – 30 5 31 – 34 6 35 – 38 7 39 – 42 8 43 – 46 9 47 – 50 10 51 – 54 11 55 – 58 12 59 – 62 13 63 – 66 Při použití jednoduchého (odmocninového) pravidla by počet intervalů byl √4275 ≈ 65 Taková tabulka by byla příliš složitá a nepřehledná. Sturgessovo pravidlo stanovuje následující počet intervalů: k ≈ 1 + 3,3log 10 4275 ≈ 13. Šířka intervalů se pak spočítá podle vzorce: (maximální hodnota – minimální hodnota) počet intervalů k (60 – 16)/13 = 3,38 ≈ 4 roky

9 Tabulka četností IntervalVěk Střed intervalu x i * Absolutní četnost n i 1 16 - 20 18673 2 21 - 25 23872 3 26 - 30 28632 4 31 - 35 33445 5 36 - 40 38388 6 41 - 45 43336 7 46 - 50 48400 8 51 - 55 53404 9 56 - 60 58125 Celkem4275 Střed intervalu (x i *) prostřední hodnota mezi horní a dolní mezí intervalu Absolutní četnost (n i ) počet hodnot v souboru spadající do příslušného intervalu 445 nezaměstnaných (hodnot) je ve věku od 31 do 35 let.

10 Tabulka četností IntervalVěk Absolutní četnost n i Relativní četnost p i 1 16 - 20 6730,16 2 21 - 25 8720,20 3 26 - 30 6320,15 4 31 - 35 4450,10 5 36 - 40 3880,09 6 41 - 45 3360,08 7 46 - 50 4000,09 8 51 - 55 4040,09 9 56 - 60 1250,03 Celkem42751,00 Relativní četnost (p i ) počet hodnot (v procentech) v souboru spadající do příslušného intervalu 10% všech nezaměstnaných bylo ve věku od 31 do 35 let. Výpočet: Absolutní četnost/celkem = 445 / 4275 = 0,10

11 Tabulka četností IntervalVěk Absolutní četnost n i Kumulativní absolutní četnost kn i 1 16 - 20 673673 2 21 - 25 8721545 3 26 - 30 6322177 4 31 - 35 4452622 5 36 - 40 3883010 6 41 - 45 3363346 7 46 - 50 4003746 8 51 - 55 4044150 9 56 - 60 1254275 Celkem4275 Kumulativní absolutní četnost (kn i ) počet hodnot v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 2177 nezaměstnaných bylo mladších než 30 let Výpočet: 673 + 872 + 632 = 2177

12 Tabulka četností IntervalVěk Absolutní četnost n i Kumulativní relativní četnost kp i 1 16 - 20 6730,16 2 21 - 25 8720,36 3 26 - 30 6320,51 4 31 - 35 4450,61 5 36 - 40 3880,70 6 41 - 45 3360,78 7 46 - 50 4000,88 8 51 - 55 4040,97 9 56 - 60 1251,00 Celkem4275 Kumulativní relativní četnost (kp i ) počet hodnot (v procentech) v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 51% nezaměstnaných bylo mladších než 30 let Výpočet: (673 + 872 + 632)/4275 = 0,51

13 Tabulka četností IntVěk Střed intervalu x i * Absolutní četnost n i Relativní četnost p i Kumulativní absolutní četnost kn i Kumulativní relativní četnost kp i 1 16 - 20 186730,166730,16 2 21 - 25 238720,2015450,36 3 26 - 30 286320,1521770,51 4 31 - 35 334450,1026220,61 5 36 - 40 383880,0930100,70 6 41 - 45 433360,0833460,78 7 46 - 50 484000,0937460,88 8 51 - 55 534040,0941500,97 9 56 - 60 581250,0342751,00 Celkem42751,00

14 Tabulka četností Graf rozdělení četností Rozdělení věku 0 100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost

15 Základní zpracování dat Histogram četností – absolutní četnost n i Rozdělení věku 0 100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost

16 Základní zpracování dat Histogram četností – kumulativní absolutní četnost Rozdělení věku 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) kumulativní absolutní četnost

17 Základní zpracování dat Polygon četností (spojnicový graf)

18 Základní zpracování dat Histogram četností – pouze pokud jsou všechny intervaly stejně široké Sloupcový graf – pokud jde o prosté třídění znaku, nebo intervalové s nestejně širokými intervaly. Mezi sloupce se vkládají mezery.

19


Stáhnout ppt "Základní zpracování dat Příklad OA a VOŠ Příbram „ Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“"

Podobné prezentace


Reklamy Google