TŘÍDĚNÍ DAT je základní způsob zpracování dat.

Slides:



Advertisements
Podobné prezentace
Statistika I 2. cvičení.
Advertisements

Sedm základních nástrojů řízení jakosti. Kontrolní tabulky Vývojové diagramy Histogramy Diagramy příčin a následků Paretovy diagramy Bodové diagramy Regulační.
Kraje České republiky Porovnání krajů České republiky dle ekonomických údajů a údajů o obyvatelstvu Dostupné z Metodického portálu ISSN: ,
Strategické otázky výzkumníka 1.Jaký typ výzkumu zvolit? 2.Na jakém vzorku bude výzkum probíhat? 3.Jaké výzkumné metody a techniky uplatnit?
Kapitola 1: Popisná statistika jednoho souboru2  Matematická statistika je věda, která se zabývá studiem dat vykazujících náhodná kolísání.  Je možno.
STATISTIKA 1 RNDr. M. Žambochová, Ph.D. (KMS, M308) zápočet.
NÁZEV ŠKOLY: S0Š Net Office, spol. s r.o, Orlová Lutyně AUTOR: Ing. Oldřich Vavříček NÁZEV: Podpora výuky v technických oborech TEMA: Základy elektrotechniky.
Základní škola a Mateřská škola, Liberec, Barvířská 38/6, příspěvková organizace Název : VY_32_inovace_18 Informatika - MS Excel – Typy grafů Autor: Pavlína.
Práce se spojnicovým diagramem Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín Tematická oblastMATEMATIKA - Finanční matematika a statistika.
Zkvalitnění výuky na GSOŠ prostřednictvím inovace CZ.1.07/1.5.00/ Gymnázium a Střední odborná škola, Klášterec nad Ohří, Chomutovská 459, příspěvková.
Autor: Předmět: Ročník: Název: Označení: DUM vytvořen: Mgr. Hana Němcová Matematika, seminář diferenciální a integrální počet Osmý ročník víceletého gymnázia.
Autor: Předmět: Ročník: Název: Označení: DUM vytvořen: Mgr. Hana Němcová Matematika, seminář diferenciální a integrální počet Osmý ročník víceletého gymnázia.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_30-03 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorRNDr.
Inf Vizualizace dat a tvorba grafů. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Grafy Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Induktivní statistika
Měření délky pevného tělesa
Martina Litschmannová
STATISTIKA Starší bratr snědl svůj oběd i oběd mladšího bratra. Oba snědli v průměru jeden oběd.
„VĚDA JE, DÁVÁ SPRÁVNÉ ÚDAJE, NEKLESEJTE NA MYSLI, ONA VÁM TO VYČÍSLÍ“
Matematika 3 – Statistika Kapitola 4: Diskrétní náhodná veličina
Lineární funkce - příklady
ČÍSLO PROJEKTU CZ.1.07/1.5.00/ ČÍSLO MATERIÁLU 1 – Množiny – teorie
STATISTICKÉ METODY V GEOGRAFII
Statistické pojmy. Statistické pojmy Statistika - vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter Pojem statistika slouží k.
Sloupkový diagram Tematická oblast
Výběrové metody (Výběrová šetření)
Základy zpracování geologických dat testování statistických hypotéz
Základní škola a Mateřská škola Bílá Třemešná, okres Trutnov
Procvičení vzorců a funkcí v rámci jednoho i více listů
Financováno z ESF a státního rozpočtu ČR.
Název školy Základní škola Jičín, Husova 170 Číslo projektu
CZ.1.07/1.4.00/ Autor Šárka Jurášová Škola
Poměr v základním tvaru.
Základy statistické indukce
4.1 – 4.3 Lineární nerovnice i jednoduchý podílový tvar
Základy zpracování geologických dat testování statistických hypotéz
Parametry polohy Modus Medián
SÁRA ŠPAČKOVÁ MARKÉTA KOČÍBOVÁ MARCELA CHROMČÁKOVÁ LUKÁŠ BARTOŠ B3E1
Elektrické měřící přístroje
APLIKACE MATEMATIKY A FYZIKY A Matematická část 2
V.a1 Teoretické pozadí statistické analýzy
BIBS Informatika pro ekonomy přednáška 2
Test z Metodologie – náměty k přípravě
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Číslicové měřící přístroje
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
ZŠ, Týn nad Vltavou, Malá Strana
zpracovaný v rámci projektu
STATISTIKA Exaktní věda Úkoly statistiky zjišťovat data
Základní statistické pojmy
Úvod do praktické fyziky
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
* Funkce Matematika – 9. ročník *.
Poměr v základním tvaru.
Matematická gramotnost napříč vzděláváním
Běžná pravděpodobnostní rozdělení
Matematika + opakování a upevňování učiva
Teorie chyb a vyrovnávací počet 1
Výuka matematiky v 21. století na středních školách technického směru
Náhodný jev, náhodná proměnná
Název školy: Speciální základní škola, Louny,
Nejistota měření Chyba měření - odchylka naměřené hodnoty od správné hodnoty → Nejistota měření Kombinovaná standartní nejistota: statistické (typ A) -
Jiří Šafr jiri.safr(zavináč)seznam.cz
Lineární funkce a její vlastnosti
Více náhodných veličin
F-Pn-P063-Prime_mereni MĚŘENÍ V LABORATOŘI 3. PŘÍMÉ MĚŘENÍ.
… jak přesně počítat s nepřesnými čísly
Funkce Pojem funkce Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem.
Grafy kvadratických funkcí
Transkript prezentace:

TŘÍDĚNÍ DAT je základní způsob zpracování dat. Při statistickém šetření potřebujeme roztřídit (uspořádat) velké množství dat do skupin podle jednoho či více zvolených statistických znaků. Třídící znak volíme podle účelu šetření.: věk respondentů pohlaví zdravotní stav daný určitým kritériem … Třídící znak musí být zvolen tak, aby každá statistická jednotka mohla být jednoznačně zařazena do některé skupiny skupiny byly určitým způsobem vyvážené a homogenní

Důvody, způsoby a principy třídění dat

Určení hodnoty veličiny Hodnotu, kterou náhodná veličina nabyla, zjišťujeme načítáním - DATA DISKRÉTNÍ měřením - DATA SPOJITÁ DISKRÉTNÍ DATA - Čárkovací a jiné metody //// //// /// … 13 hodnot … 4, 8, 10 hodnot

Příklad jednoduchého třídění dat DATA: zjistíme četnost (počty) jednotlivých hodnot 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 4, 3, 3, 4 Pravděpodobnost jevu: vypočteme jako podíl ni/n xi ni 2 //// / 6 3 //// //// // 12 4 //// /// 8 5 //// n = 30 xi 2 3 4 5 celkem pi 0,2 0,4 0,27 0,13 1,0

Metoda Lodyha a List (Stem & Leaf) DATA: 55, 70, 71, 70, 65, 63, 58, 56, 82, 64, 65, 75, 76, 68, 63, 69, 65, 51 1. sloupec - lodyha (angl. STEM) - číslice na místě desítek 2. sloupec - list (angl. LEAF) - číslice na místě jednotek vše uspořádáno vzestupně, tvar připomíná histogram lodyha desítky listy jednotky 5 1568 6 33455589 7 00156 8 2

Metoda Lodyha a List (Stem & Leaf) - příklad 1 16 | 07 17 | 0355555588 18 | 0000222333333355777777778888 19 | 22335777888 20 | 000022233788 21 | 00035778 22 | 0002335578 23 | 023578 24 | 00228 25 | 26 | 23 27 | 28 | 08 29 | 0 30 | 7 31 | 32 | 33 | 2337 34 | 25 35 | 0077 36 | 00008 37 | 23577 38 | 233333558 39 | 2225577 40 | 0000003357788888 41 | 002233555577778 42 | 033355557788 43 | 00233333555577778 44 | 0222233555778 45 | 0000000023333357778888 46 | 00002333577 47 | 00000023578 48 | 000000223358 49 | 00333 50 | 037 51 | 0 Sloučení skupin 16 | 070355555588 18 | 000022233333335577777777888822335777888 20 | 00002223378800035778 22 | 0002335578023578 24 | 00228 26 | 23 28 | 080 30 | 7 32 | 2337 34 | 250077 36 | 0000823577 38 | 2333335582225577 40 | 0000003357788888002233555577778 42 | 03335555778800233333555577778 44 | 02222335557780000000023333357778888 46 | 0000233357700000023578 48 | 00000022335800333 50 | 0370

Metoda Lodyha a List (Stem & Leaf) - příklad 2 4 | 355566666777788899999 5 | 00000111111222223333333444444444555555666677788889999999 6 | 00000022223334444555667899 7 | 00001111123333333444444555555556666666667777777777778888888888888889 8 | 00000000111111111111122222222222233333333333333444444444455555566666 9 | 000000123346 Rozdělení skupin 4 | 3 4 | 55566666777788899999 5 | 00000111111222223333333444444444 5 | 555555666677788889999999 6 | 00000022223334444 6 | 555667899 7 | 00001111123333333444444 7 | 555555556666666667777777777778888888888888889999999999 8 | 000000001111111111111222222222222333333333333334444444444 8 | 55555566666677888888999 9 | 00000012334 9 | 6

Způsoby a výsledky třídění dat TŘÍDĚNÍ DAT PODLE POČTU TŘÍDÍCÍCH ZNAKŮ jednostupňové (podle věku respondentů) dvoustupňové (podle 2 veličin – výsledkem je kontingenční tabulka) vícestupňové (pohlaví, věk, vzdělání, …) TŘÍDĚNÍ DAT PODLE TYPU TŘÍDĚNÍ prosté intervalové Výsledkem třídění je tabulka obsahující NADPIS (jaká data, kdy a kde bylo šetření provedeno) HLAVIČKU (obsah sloupců) LEGENDU (obsah řádků) VLASTNÍ DATA

PROSTÉ TŘÍDĚNÍ PŘÍKLAD je-li třídící znak kategoriální nebo numerický s malým počtem hodnot PŘÍKLAD Pozorováním hnízd jistého druhu ptáků ve vymezené lokalitě byly zjištěny následující počty mláďat v jednotlivých hnízdech: 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 3, 3, 4, 4 Lokalita A kde …, kdy … i xi ni 1 2 6 3 12 4 8 5 Celkem hnízd n = 30

Tabulka četností diskrétní veličiny Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost i xi ni 1 2 6 3 12 4 8 5 Celkem n hodnot 30

Tabulka četností diskrétní veličiny Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost i xi ni 1 2 6 3 12 4 8 5 Celkem n hodnot 30

Tabulka četností diskrétní veličiny Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Vypočteme relativní četnosti v lokalitě A: Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost Relativní četnost i xi ni fi 1 2 6 6/30 = 0,20 3 12 12/30 = 0,40 4 8 8/30 = 0,27 5 4/30 = 0,13 Celkem n hodnot 30 30/30 = 1

Tabulka četností diskrétní veličiny Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Vypočteme relativní a kumulativní četnosti v lokalitě A: Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost Absolutní kumulativní četnost Relativní četnost Relativní kumulativní četnost i xi ni Ni fi Fi 1 2 6 6/30 = 0,20 0,20 3 12 18 12/30 = 0,40 0,60 4 8 26 8/30 = 0,27 0,87 5 30 4/30 = 0,13 1,00 Celkem n hodnot 30/30 = 1

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT je-li třídící znak numerická proměnná s velkým počtem hodnot, musíme nejprve data rozdělit do určitých intervalů (skupin). Je důležité správně stanovit počet třídících intervalů Přibližný počet intervalů můžeme stanovit některým pravidlo pro výpočet přibližného počtu intervalů, např. Sturgesovo pravidlo: k = 1 + 3,3 log n, kde n je rozsah souboru Dále musíme vhodně zvolit hranice a střed intervalů (střední hodnota reprezentuje daný interval) U spojitých znaků musíme určit, která mez do intervalu patří a která ne (horní, dolní) U diskrétních znaků se snažíme za střed intervalu volit celé číslo

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Příklad 1: V ročníku je 56 dětí. Jejich výkony ve sprintu na 60 m se pohybují od 8,20 s do 21,4 s. Časy jsou uvedeny v desítkové soustavě a přesnost měřením je na 1 desetinné místo. Navrhněte vhodný počet intervalů a formu intervalového rozdělení. Řešení: počet intervalů k = 1 + 3,3 log (56) = 1 + 3,3*1,75 = 1 + 5,8 ~ 7 intervaly (21,4 – 8,2 )/ 7 = 1,886 ~ 1,9 ~ 2,0 Intervalů bude 7 a každý bude mít šířku 2 sekundy

SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT Předpokládejme, že časy dětí odpovídají této tabulce a jsou vypočteny relativní četnosti. Doplňte absolutní a relativní kumulativní četnosti u jednotlivých tříd časů. Proč je součet relativních četností 0,99 ? Čas Střed intervalu Počet dětí Kumulativní četnost absolutně relativně absolutní relativní <8 - 10) 9 4 0,07 <10 - 12) 11 8 0,14 <12 - 14) 13 18 0,32 <14 - 16) 15 12 0,21 <16 - 18) 17 0,16 <18 - 20) 19 <20 - 22) 21 1 0,02 Celkem 56 0,99

Grafické zobrazení diskrétní veličiny - sloupcový graf Příklad počtu mláďat zkoumaného druhu ptáků v lokalitě A Diskrétní veličinu často zobrazujeme graficky pomocí SLOUPCOVÉHO GRAFU na základě ABSOLUTNÍCH POČTŮ Lokalita A kde, kdy i xi ni 1 2 6 3 12 4 8 5 Celkem 30

Grafické zobrazení diskrétní veličiny - sloupcový graf Stejný příklad počtu mláďat v lokalitě A - vypočteme relativní četnosti Diskrétní veličinu můžeme zobrazit graficky pomocí SLOUPCOVÉHO GRAFU RELATIVNÍCH ČETNOSTÍ . Loka-lita A Počet mláďat Četnost absol. relat. 1 2 6 0,20 3 12 0,40 4 8 0,27 5 0,13 Celkem 30 1,00

Grafické porovnání Př. 2 Pozorováním hnízd stejného druhu ptáků v lokalitě B byly zjištěny následující počty mláďat: (pro přehlednost uspořádáno do tabulky) Nakreslete v Excelu společný graf absolutních četností pro populaci ptáků v obou lokalitách. Nakreslete v Excelu společný graf relativních četností pro populaci ptáků v obou lokalitách. Lokalita B i xi ni 1 2 12 3 25 4 15 5 8 Celkem n=60

Grafické porovnání absolutních a relativních četností

Grafické zobrazení spojité veličiny - histogram

Grafické zobrazení diskrétní veličiny - sloupcový graf

Grafické zobrazení diskrétní veličiny - sloupcový graf

Grafické zobrazení diskrétní veličiny - histogram

Grafické zobrazení - sloupcový a koláčový graf Česká republika Praha Středočeský kraj Ostatní kraje

Grafické zobrazení - spojnicový graf

Grafické zobrazení - mapa četností podle okresů ČR VHA 2008, kumulativně do 40. kt. počty případů

Odkaz na článek Grafy a tabulky ve statistice (aneb Na co ve výuce obvykle není čas) Josef Tvrdík Katedra informatiky, Přírodovědecká fakulta Ostravské university Abstrakt: V článku jsou uvedeny některé jednoduché zásady a doporučení pro vhodnou prezentaci statistických výsledků, zejména tabulek a grafů. Tyto zásady a doporučení vycházejí z literatury a ze zkušeností z aplikací statistiky v různých oborech. Některé chyby v prezentaci výsledků jsou podrobně diskutovány a je také doporučeno vhodnější řešení.