Základní zpracování dat Příklad

Slides:



Advertisements
Podobné prezentace
PKML.
Advertisements

Histogram představuje grafické zobrazení intervalového zobrazení četnosti znaku jakosti slouží k názornému zobrazení „struktury“ naměřených dat hranice.
Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Střední odborné učiliště Liběchov Boží Voda Liběchov Registrační číslo projektu: Šablona: IV/2 Inovace a zkvalitnění výuky směřující k rozvoji.
Přijímací zkoušky na SŠ MATEMATIKA Připravil PhDr. Ivo Horáček, PhD.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
SINOVÁ VĚTA PRO III. ROČNÍK SOU Poznámky pro žáky se SPU DOC PDF
9 CELÁ ČÍSLA
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Čísla 0 – 100, sčítání a odčítání
Urči název a zařaď do příslušné skupiny
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
Tomáš NETERDA 1961 Sportovní kariéra : plavecké třídy ZŠ Komenského gymnázium Dašická plavecká škola
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Procenta Výpočet počtu procent
Statistika I 2. cvičení.
Kdo chce být milionářem ?
Výzkumy volebních preferencí za ČR a kraje od
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Jednotky délky a jejich převody 5. ročník
Střední odborné učiliště Liběchov Boží Voda Liběchov Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona: IV/2 Inovace a zkvalitnění.
Dělitelnost přirozených čísel
Statistika Ing. Jan Popelka, Ph.D. odborný asistent
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Martina Burgetová Tento materiál byl vytvořen v rámci projektu Operačního programu.
Zábavná matematika.
Procenta.
Mapa zájmu - plány.
V rámci všech serverů společnosti Aliaweb, spol. s r.o. oslovíte přes uživatelů Kurzy.cz finanční portál pro laiky i odborníky, tj. investice a.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.
EU – OP – VK Matematika – 8.B Mgr. Václav Calábek.
Stav studie „Seroprevalence VHC u injekčních uživatelů drog“ k Národní monitorovací středisko pro drogy a drogové závislosti Úřad vlády ČR tel.
BOX - PLOT OA a VOŠ Příbram.
Jazyk vývojových diagramů
Nejmenší společný násobek
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
ODČÍTÁNÍ DO 100 S PŘECHODEM DESÍTKY
Únorové počítání.
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Histogram OA a VOŠ Příbram
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Násobení a dělení čísel (10,100, 1000)
Náhoda, generátory náhodných čísel
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
TRUHLÁŘ II.ročník Výrobní zařízení Střední škola stavební Teplice
Analýza dat.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
Analýza knihovnických standardů za rok 2006 knihovny Jmk Provozní doba Nákup knihovního fondu Kč na 1 obyvatele Roční přírůstek Počet studijních míst Veřejně.
Technické kreslení.
Úkoly nejen pro holky.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Přednost početních operací
Slovní úlohy řešené soustavou rovnic
Predikce chemických posunů
Znaky dělitelnosti.
Úvod do pravděpodobnosti a statistiky
KONTROLNÍ PRÁCE.
Porovnání výroby a prodejů vozidel ve světě
Základní zpracování dat Příklad
Transkript prezentace:

Základní zpracování dat Příklad OA a VOŠ Příbram „Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky“

Příklad: Rozdělení věku nezaměstnaných 43 22 53 53 28 43 26 38 28 50 22 35 36 36 37 29 28 46 51 23 39 27 19 44 25 22 21 33 23 21 36 47 39 56 49 49 38 26 24 25 34 36 59 35 33 39 49 35 58 29 23 35 28 29 26 31 40 22 44 37 49 19 37 23 21 42 24 29 51 18 55 22 22 56 52 33 45 51 33 38 49 51 37 19 46 34 19 45 46 43 41 28 31 19 21 50 60 47 44 30 40 52 39 39 18 39 24 34 50 27 46 28 48 55 31 54 49 43 27 39 54 54 52 44 26 29 29 26 59 51 23 33 50 34 54 41 33 44 47 24 30 44 20 35 46 31 20 52 21 56 32 22 42 26 50 43 20 23 28 23 27 34 32 54 53 28 25 30 28 27 22 53 53 19 47 35 27 49 23 27 55 19 42 49 47 25 36 42 20 20 46 35 49 58 43 46 22 34 39 27 51 39 52 45 30 21 31 26 54 45 Řazení - podle velikosti, abecedně. Třídění – zpřehlednění velkého množství dat do tabulek např. uspořádání do tzv. tabulky četností. Grafická prezentace – grafy, diagramy.

Třídění Prosté třídění diskrétní znak Intervalové třídění spojitý Věk Počet 16 20 17 31 18 514 19 938 1452 21 2200 22 2610 23 3688 24 4262 Věk Počet 16 - 20 672 21 - 25 872 26 - 30 632 31 - 35 445 36 - 40 388 41 - 45 336 46 - 50 400 51 - 55 404 56 - 60 124 Výška Počet (140, 150> 12 (150, 160> 36 (160, 170> 78 (170, 180> 59 (180, 190> 20 Prosté třídění diskrétní znak Intervalové třídění spojitý Intervalové třídění spojitý znak

TABULKA ROZDĚLENÍ ČETNOSTI Kumulativní relativní četnosti Hodnoty xi Absolutní četnosti ni Relativní četnosti pi Kumulativní četnosti Kumulativní relativní četnosti x1 n1 x2 n2 xk nk Celkem: 1

Tabulka četností Konstrukce tabulky četností Zjistíme v jakém rozmezí se data pohybují, tedy nejmenší a nejvyšší hodnotu. Rozhodneme, zda provedeme prosté nebo intervalové třídění (v závislosti na typu sledované proměnné) Rozhodneme, kolik bude mít tabulka řádků – volíme počet tzv. tříd. Rozhodneme jaké bude rozpětí jednotlivých tříd. Počítáme kolik pozorování patří do každé třídy (čárkovací metoda nebo počítač).

Tabulka četností Volba vhodného počtu tříd (řádků) v tabulce četností Prosté třídění: Podle počtu obměn diskrétního znaku Intervalové třídění: Sturgesovo pravidlo: počet intervalů k ≈ 1 + 3,3log10 n Jednoduché (odmocninové) pravidlo: k ≈ √n Podle potřeby prezentace (např. intervaly po 10 letech) Intervaly by měly zahrnovat všechny hodnoty a měly by být stejně široké. Měly? – krajní intervaly mohou být delší pokud zahrnují extrémní hodnoty.

Tabulka četností Interval Věk 1 16 - 20 2 21 - 25 3 26 - 30 4 31 - 35 5 36 - 40 6 41 - 45 7 46 - 50 8 51 - 55 9 56 - 60 Celkem Nejmenší hodnota sledovaného souboru je 16 let a největší 60 let. Tabulka musí zahrnovat všechny hodnoty! Počet intervalů (řádků) je k = 9. Byl zvolen v souvislosti se šířkou intervalu, která je 5 let (toto uspořádání je přehledné a jednoduché). Intervaly se nesmějí překrývat, proto první končí věkem 20 a druhý začíná věkem 21.

Tabulka četností Interval Věk 1 15 – 18 2 19 – 22 3 23 – 26 4 27 – 30 5 31 – 34 6 35 – 38 7 39 – 42 8 43 – 46 9 47 – 50 10 51 – 54 11 55 – 58 12 59 – 62 13 63 – 66 Při použití jednoduchého (odmocninového) pravidla by počet intervalů byl √4275 ≈ 65 Taková tabulka by byla příliš složitá a nepřehledná. Sturgessovo pravidlo stanovuje následující počet intervalů: k ≈ 1 + 3,3log10 4275 ≈ 13. Šířka intervalů se pak spočítá podle vzorce: (maximální hodnota – minimální hodnota) počet intervalů k (60 – 16)/13 = 3,38 ≈ 4 roky

Tabulka četností Střed intervalu (xi*) Věk Střed intervalu xi* Absolutní četnost ni 1 16 - 20 18 673 2 21 - 25 23 872 3 26 - 30 28 632 4 31 - 35 33 445 5 36 - 40 38 388 6 41 - 45 43 336 7 46 - 50 48 400 8 51 - 55 53 404 9 56 - 60 58 125 Celkem 4275 Střed intervalu (xi*) prostřední hodnota mezi horní a dolní mezí intervalu Absolutní četnost (ni) počet hodnot v souboru spadající do příslušného intervalu 445 nezaměstnaných (hodnot) je ve věku od 31 do 35 let.

Tabulka četností Relativní četnost (pi) Interval Věk Absolutní četnost ni Relativní četnost pi 1 16 - 20 673 0,16 2 21 - 25 872 0,20 3 26 - 30 632 0,15 4 31 - 35 445 0,10 5 36 - 40 388 0,09 6 41 - 45 336 0,08 7 46 - 50 400 8 51 - 55 404 9 56 - 60 125 0,03 Celkem 4275 1,00 Relativní četnost (pi) počet hodnot (v procentech) v souboru spadající do příslušného intervalu 10% všech nezaměstnaných bylo ve věku od 31 do 35 let. Výpočet: Absolutní četnost/celkem = 445 / 4275 = 0,10

Tabulka četností Kumulativní absolutní četnost (kni) Interval Věk Absolutní četnost ni Kumulativní absolutní četnost kni 1 16 - 20 673 2 21 - 25 872 1545 3 26 - 30 632 2177 4 31 - 35 445 2622 5 36 - 40 388 3010 6 41 - 45 336 3346 7 46 - 50 400 3746 8 51 - 55 404 4150 9 56 - 60 125 4275 Celkem Kumulativní absolutní četnost (kni) počet hodnot v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 2177 nezaměstnaných bylo mladších než 30 let Výpočet: 673 + 872 + 632 = 2177

Tabulka četností Kumulativní relativní četnost (kpi) Interval Věk Absolutní četnost ni Kumulativní relativní četnost kpi 1 16 - 20 673 0,16 2 21 - 25 872 0,36 3 26 - 30 632 0,51 4 31 - 35 445 0,61 5 36 - 40 388 0,70 6 41 - 45 336 0,78 7 46 - 50 400 0,88 8 51 - 55 404 0,97 9 56 - 60 125 1,00 Celkem 4275 Kumulativní relativní četnost (kpi) počet hodnot (v procentech) v souboru, které jsou menší nebo rovny horní mezi příslušného intervalu 51% nezaměstnaných bylo mladších než 30 let Výpočet: (673 + 872 + 632)/4275 = 0,51

Kumulativní absolutní četnost kni Kumulativní relativní četnost kpi Tabulka četností Int Věk Střed intervalu xi* Absolutní četnost ni Relativní četnost pi Kumulativní absolutní četnost kni Kumulativní relativní četnost kpi 1 16 - 20 18 673 0,16 2 21 - 25 23 872 0,20 1545 0,36 3 26 - 30 28 632 0,15 2177 0,51 4 31 - 35 33 445 0,10 2622 0,61 5 36 - 40 38 388 0,09 3010 0,70 6 41 - 45 43 336 0,08 3346 0,78 7 46 - 50 48 400 3746 0,88 8 51 - 55 53 404 4150 0,97 9 56 - 60 58 125 0,03 4275 1,00 Celkem

Tabulka četností Graf rozdělení četností Rozdělení věku 100 200 300 100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost

Základní zpracování dat Histogram četností – absolutní četnost ni Rozdělení věku 100 200 300 400 500 600 700 800 900 1000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) četnost

Základní zpracování dat Histogram četností – kumulativní absolutní četnost Rozdělení věku 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 16 - 20 21 - 25 26 - 30 31 - 35 36 - 40 41 - 45 46 - 50 51 - 55 56 - 60 věk (roky) kumulativní absolutní četnost

Základní zpracování dat Polygon četností (spojnicový graf)

Základní zpracování dat Histogram četností – pouze pokud jsou všechny intervaly stejně široké Sloupcový graf – pokud jde o prosté třídění znaku, nebo intervalové s nestejně širokými intervaly. Mezi sloupce se vkládají mezery.