Škály podle informace v datech:

Slides:

Advertisements

Podobné prezentace

Advertisements

Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

Přijímací zkoušky na SŠ MATEMATIKA Připravil PhDr. Ivo Horáček, PhD.

Města ČR – orientace na mapě

Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.

Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.

Měření času Jednotky času

*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.

Aktuální informace o vyšetřování c-erb-2 genu v referenční laboratoři a návrh změny v indikačních kritériích Hajdúch M., Petráková K., Kolář Z., Trojanec.

Věk (v letech) skupina: kontrolní pacienti průměr 41,08 51,67 sm.odch.

19.1 Odčítání v oboru do 100 s přechodem přes desítku

Téma 3 ODM, analýza prutové soustavy, řešení nosníků

Čísla 0 – 100, sčítání a odčítání

Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.

Tomáš NETERDA 1961 Sportovní kariéra : plavecké třídy ZŠ Komenského gymnázium Dašická plavecká škola

Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .

Zápis čísla v desítkové soustavě

Statistika I 2. cvičení.

Kdo chce být milionářem ?

Statistická chyba a hladina statistické významnosti

Výzkumy volebních preferencí za ČR a kraje od

NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ

Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2

Druhá mocnina a odmocnina

Střední odborné učiliště Liběchov Boží Voda Liběchov Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona: IV/2 Inovace a zkvalitnění.

VY_32_INOVACE_INF_RO_12 Digitální učební materiál

ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY

Elektronická učebnice - I

MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.

VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)

Střední škola Oselce Škola: SŠ Oselce, Oselce 1, Nepomuk, Projekt: Registrační číslo: CZ.1.07/1.5.00/ Název: Modernizace.

Zábavná matematika.

V rámci všech serverů společnosti Aliaweb, spol. s r.o. oslovíte přes uživatelů Kurzy.cz finanční portál pro laiky i odborníky, tj. investice a.

Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA

Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA

Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.

Stav studie „Seroprevalence VHC u injekčních uživatelů drog“ k Národní monitorovací středisko pro drogy a drogové závislosti Úřad vlády ČR tel.

Jazyk vývojových diagramů

Nejmenší společný násobek

Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.

MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.

Statistická chyba a hladina statistické významnosti

Únorové počítání.

52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.

Histogram OA a VOŠ Příbram

Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA

Násobení a dělení čísel (10,100, 1000)

Náhoda, generátory náhodných čísel

Sexuální život u pacientů s mentálním postižením v ÚSP

Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)

SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100

TRUHLÁŘ II.ročník Výrobní zařízení Střední škola stavební Teplice

Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.

Celá čísla Dělení.

DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ

MS PowerPoint Příloha - šablony.

Pojmy a interpretace.

1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.

Technické kreslení.

Úkoly nejen pro holky.

Přednost početních operací

DĚLENÍ ČÍSLEM 5 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 50.

Slovní úlohy řešené soustavou rovnic

Predikce chemických posunů

KONTROLNÍ PRÁCE.

Porovnání výroby a prodejů vozidel ve světě

Základní zpracování dat Příklad

TŘÍDĚNÍ DAT je základní způsob zpracování dat.

Transkript prezentace:

Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se ? x1 = x2 Data ordinální Větší, menší ? x1 < x2 Data intervalová O kolik ? má smysl měřit rozdíl Data poměrová Kolikrát ? má smysl měřit podíl Údaje měřitelné na škále vyššího typu můžeme vždy degradovat a zobrazit na škále nižšího typu. Připouštíme tím ztrátu informace, ale většinou je to v zájmu přehlednosti dat. Děláme to v případě, kdy má změřená hodnota stejnou vypovídací schopnost jako např. ordinální vyjádření znaku (hladina protilátek v krvi +++, +, ...) Je to nevyhnutelné v případě měření každého spojitého znaku - musíme zvolit konečnou jednotku měření (přesnost měření)

TŘÍDĚNÍ DAT je základní způsob zpracování zjištěných (naměřených) dat. Při statistickém šetření potřebujeme roztřídit (uspořádat) velké množství dat do skupin podle jednoho či více zvolených statistických znaků. Třídící znak volíme podle účelu šetření.: věk respondentů pohlaví zdravotní stav daný určitým kritériem … Třídící znak musí být zvolen tak, aby každá statistická jednotka mohla být jednoznačně zařazena do některé skupiny skupiny byly určitým způsobem vyvážené a homogenní

Důvody, způsoby a principy třídění dat

Určení hodnoty veličiny Hodnotu, kterou náhodná veličina nabyla, zjišťujeme načítáním - DATA DISKRÉTNÍ měřením - DATA SPOJITÁ DISKRÉTNÍ DATA - Čárkovací a jiné metody //// //// /// … 13 hodnot … 10, 8, 4 hodnoty

Čárkovací metoda - příklad DATA: 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 4, 3, 3, 4 Pravděpodobnost jevu: xi ni 2 //// / 6 3 //// //// // 12 4 //// /// 8 5 //// n = 30 xi 2 3 4 5 celkem pi 0,2 0,4 0,27 0,13 1,0

Metoda Lodyha a List (Stem & Leaf) DATA: 55, 70, 71, 70, 65, 63, 58, 56, 82, 64, 65, 75, 76, 68, 63, 69, 65, 51 1. sloupec - lodyha (angl. STEM) - číslice na místě desítek 2. sloupec - list (angl. LEAF) - číslice na místě jednotek vše uspořádáno vzestupně, tvar připomíná histogram lodyha desítky listy jednotky 5 1568 6 33455589 7 00156 8 2

Metoda Lodyha a List (Stem & Leaf) - příklad 1 16 | 07 17 | 0355555588 18 | 0000222333333355777777778888 19 | 22335777888 20 | 000022233788 21 | 00035778 22 | 0002335578 23 | 023578 24 | 00228 25 | 26 | 23 27 | 28 | 08 29 | 0 30 | 7 31 | 32 | 33 | 2337 34 | 25 35 | 0077 36 | 00008 37 | 23577 38 | 233333558 39 | 2225577 40 | 0000003357788888 41 | 002233555577778 42 | 033355557788 43 | 00233333555577778 44 | 0222233555778 45 | 0000000023333357778888 46 | 00002333577 47 | 00000023578 48 | 000000223358 49 | 00333 50 | 037 51 | 0 Sloučení skupin 16 | 070355555588 18 | 000022233333335577777777888822335777888 20 | 00002223378800035778 22 | 0002335578023578 24 | 00228 26 | 23 28 | 080 30 | 7 32 | 2337 34 | 250077 36 | 0000823577 38 | 2333335582225577 40 | 0000003357788888002233555577778 42 | 03335555778800233333555577778 44 | 02222335557780000000023333357778888 46 | 0000233357700000023578 48 | 00000022335800333 50 | 0370

Metoda Lodyha a List (Stem & Leaf) - příklad 2 4 | 355566666777788899999 5 | 00000111111222223333333444444444555555666677788889999999 6 | 00000022223334444555667899 7 | 00001111123333333444444555555556666666667777777777778888888888888889 8 | 00000000111111111111122222222222233333333333333444444444455555566666 9 | 000000123346 Rozdělení skupin 4 | 3 4 | 55566666777788899999 5 | 00000111111222223333333444444444 5 | 555555666677788889999999 6 | 00000022223334444 6 | 555667899 7 | 00001111123333333444444 7 | 555555556666666667777777777778888888888888889999999999 8 | 000000001111111111111222222222222333333333333334444444444 8 | 55555566666677888888999 9 | 00000012334 9 | 6

Způsoby a výsledky třídění dat TŘÍDĚNÍ DAT PODLE POČTU TŘÍDÍCÍCH ZNAKŮ jednostupňové (podle věku respondentů) dvoustupňové (podle 2 veličin – výsledkem je kontingenční tabulka) vícestupňové (pohlaví, věk, vzdělání, …) TŘÍDĚNÍ DAT PODLE TYPU TŘÍDĚNÍ prosté intervalové Výsledkem třídění je tabulka obsahující NADPIS (jaká data, kdy a kde bylo šetření provedeno) HLAVIČKU (obsah sloupců) LEGENDU (obsah řádků) VLASTNÍ DATA

PROSTÉ TŘÍDĚNÍ PŘÍKLAD je-li třídící znak kategoriální nebo numerický s malým počtem hodnot PŘÍKLAD Pozorováním hnízd jistého druhu ptáků ve vymezené lokalitě byly zjištěny následující počty mláďat v jednotlivých hnízdech: 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 3, 3, 4, 4 Lokalita A kde …, kdy … i xi ni 1 2 6 3 12 4 8 5 Celkem hnízd n = 30

Tabulka četností diskrétní veličiny Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Absolutní, relativní a kumulativní četnosti v lokalitě A: Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost Absolutní kumulativní četnost Relativní četnost Relativní kumulativní četnost i xi ni Ni fi Fi 1 2 6 6/30 = 0,20 0,20 3 12 18 12/30 = 0,40 0,60 4 8 26 8/30 = 0,27 0,87 5 30 4/30 = 0,13 1,00 Celkem n hodnot 30/30 = 1

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT je-li třídící znak numerická proměnná s velkým počtem hodnot je důležité správně stanovit počet třídících intervalů pokud si nejsme jisti správnou variantou, můžeme použít některé pravidlo pro stanovení přibližného počtu intervalů, např. Sturgesovo pravidlo: k = 1 + 3,3 log n, kde n je rozsah souboru Dále musíme vhodně zvolit hranice a střed intervalů (střední hodnota reprezentuje daný interval) U spojitých znaků musíme určit, která mez do intervalu patří a která ne (horní, dolní) U diskrétních znaků se snažíme za střed intervalu volit celé číslo

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Příklad 1: V ročníku je 56 dětí. Jejich výkony ve sprintu na 60 m se pohybují od 8,20 s do 21,4 s. Časy jsou uvedeny v desítkové soustavě a přesnost měřením je na 1 desetinné místo. Navrhněte vhodný počet intervalů a formu intervalového rozdělení. Řešení: počet intervalů k = 1 + 3,3 log (56) = 1 + 3,3*1,75 = 1 + 5,8 ~ 7 intervaly (21,4 – 8,2 )/ 7 = 1,886 ~ 1,9 Intervalů bude 7 a každý bude mít šířku 1,9 sekund

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Předpokládejme, že časy dětí odpovídají této tabulce a jsou vypočteny relativní četnosti. Dolňte absolutní a relativní kumulativní četnosti u jednotlivých tříd časů. V čem je problém u relativních četností? Čas Střed intervalu Počet dětí Kumulativní četnost absolutně relativně absolutní relativní 8,2 - 10,0 9,1 4 0,07 10,1 - 11,9 11,0 8 0,14 12,0 - 13,8 12,9 18 0,32 13,9 - 15,7 14,8 12 0,21 15,8 - 17,6 16,7 9 0,16 17,7 - 19,5 18,6 19,6 - 21,4 20,5 1 0,02 Celkem 56 0,99

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Příklad 2: Ve firmě je 120 zaměstanců a jejich příjem se pohybuje od 5.000,- Kč pracovnice na úklid až po 41.000,- ambiciózního zástupce vedoucího. 120 zaměstnanců má tyto příjmy: 1 zaměstnanec: 5 000, 2: 8 900, 3: 12 680, 7: 14 500, 5: 16 900, 19: 18 250, 12: 19 450, 8: 20 120, 7: 21 320, 4: 22 560, 9: 22 890, 3: 23 130, 11: 23 800, 12: 24 100, 6: 24 760, 1: 25.000, 4: 25 230, 3: 25 800, 1: 28 100, 1: 29 000, 1: 41 000 Navrhněte vhodný počet intervalů a formu intervalového rozdělení. Řešení: počet intervalů k = 1 + 3,3 log (120) = 1 + 3,3*2,08 = 1 + 6,9 = 8 šířka intervalu ( 41 000 – 5 000 )/ 8 = 4500 Kč

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Dolňte tabulku podle zadání: 1 zaměstanec 5 000, 2: 8 900, 3: 12 680, 7: 14 000, 5: 16 900, 19: 18 500, 12: 19 450, 8: 20 120, 7: 21 320, 4: 22 560, 9: 22 890, 3: 23 030, 11: 23 800, 12: 24 100, 6: 24 760, 1: 25.000, 4: 25 230, 3: 25 800, 1: 28 100, 1: 29 000, 1: 41 000 Interval rozpětí platu Střed intervalu Počet pracovníků Kumulativní četnost absolutně relativně absolutní relativní <5.000-9.500) 7.250 3 0,025 <9.500-14.000) 11.750 6 0,05 <14.000-18.500) 16.250 12 0,1 18 0,15 <18.500-23.000) 20.750 <23.000-27.500) 25.250 <27.500-32.000) <32.000-36.500) <36.500-41.000> 38.750 Celkem 120 1,00

Grafické zobrazení diskrétní veličiny - sloupcový graf Příklad počtu mláďat zkoumaného druhu ptáků v lokalitě A Diskrétní veličinu obvykle zobrazujeme graficky pomocí SLOUPCOVÉHO GRAFU Lokalita A kde, kdy i xi ni 1 2 6 3 12 4 8 5 Celkem 30

Grafické zobrazení diskrétní veličiny - sloupcový graf Stejný příklad počtu mláďat v lokalitě A - vypočteme relativní četnosti Opět diskrétní veličina a grafické zobrazení pomocí SLOUPCOVÉHO GRAFU, ale přepočteného na relativní počty Užitečnost relativních hodnot spočívá v možnosti snadného porovnání s měřením v jiné lokalitě. Loka-lita A Počet mláďat Četnost absol. relat. 1 2 6 0,20 3 12 0,40 4 8 0,27 5 0,13 Celkem 30 1,00

Grafické porovnání Př. 2 Pozorováním hnízd stejného druhu ptáků v lokalitě B byly zjištěny následující počty mláďat: (pro přehlednost uspořádáno do tabulky) Nakreslete v Excelu společný graf absolutních četností pro populaci ptáků v obou lokalitách. Nakreslete v Excelu společný graf relativních četností pro populaci ptáků v obou lokalitách. Lokalita B i xi ni 1 2 12 3 25 4 15 5 8 Celkem n=60

Grafické porovnání absolutních a relativních četností

Grafické zobrazení spojité veličiny - histogram

Grafické zobrazení diskrétní veličiny - sloupcový graf

Grafické zobrazení diskrétní veličiny - sloupcový graf

Grafické zobrazení diskrétní veličiny - histogram

Grafické zobrazení - sloupcový a koláčový graf Česká republika Praha Středočeský kraj Ostatní kraje

Grafické zobrazení - spojnicový graf

Grafické zobrazení - mapa četností podle okresů ČR VHA 2008, kumulativně do 40. kt. počty případů

Odkaz na článek Grafy a tabulky ve statistice (aneb Na co ve výuce obvykle není čas) Josef Tvrdík Katedra informatiky, Přírodovědecká fakulta Ostravské university Abstrakt: V článku jsou uvedeny některé jednoduché zásady a doporučení pro vhodnou prezentaci statistických výsledků, zejména tabulek a grafů. Tyto zásady a doporučení vycházejí z literatury a ze zkušeností z aplikací statistiky v různých oborech. Některé chyby v prezentaci výsledků jsou podrobně diskutovány a je také doporučeno vhodnější řešení.