Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

TŘÍDĚNÍ DAT je základní způsob zpracování dat.

Podobné prezentace


Prezentace na téma: "TŘÍDĚNÍ DAT je základní způsob zpracování dat."— Transkript prezentace:

1 TŘÍDĚNÍ DAT je základní způsob zpracování dat. Při statistickém šetření potřebujeme roztřídit (uspořádat) velké množství dat do skupin podle jednoho či více zvolených statistických znaků. Třídící znak volíme podle účelu šetření.: věk respondentů pohlaví zdravotní stav daný určitým kritériem … Třídící znak musí být zvolen tak, aby každá statistická jednotka mohla být jednoznačně zařazena do některé skupiny skupiny byly určitým způsobem vyvážené a homogenní

2 Důvody, způsoby a principy třídění dat

3 Určení hodnoty veličiny
Hodnotu, kterou náhodná veličina nabyla, zjišťujeme načítáním - DATA DISKRÉTNÍ měřením - DATA SPOJITÁ DISKRÉTNÍ DATA - Čárkovací a jiné metody //// //// /// … 13 hodnot … 4, 8, 10 hodnot

4 Příklad jednoduchého třídění dat
DATA: zjistíme četnost (počty) jednotlivých hodnot 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 4, 3, 3, 4 Pravděpodobnost jevu: vypočteme jako podíl ni/n xi ni 2 //// / 6 3 //// //// // 12 4 //// /// 8 5 //// n = 30 xi 2 3 4 5 celkem pi 0,2 0,4 0,27 0,13 1,0

5 Metoda Lodyha a List (Stem & Leaf)
DATA: 55, 70, 71, 70, 65, 63, 58, 56, 82, 64, 65, 75, 76, 68, 63, 69, 65, 51 1. sloupec - lodyha (angl. STEM) - číslice na místě desítek 2. sloupec - list (angl. LEAF) - číslice na místě jednotek vše uspořádáno vzestupně, tvar připomíná histogram lodyha desítky listy jednotky 5 1568 6 7 00156 8 2

6 Metoda Lodyha a List (Stem & Leaf) - příklad 1
16 | 07 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 00228 25 | 26 | 23 27 | 28 | 08 29 | 0 30 | 7 31 | 32 | 33 | 2337 34 | 25 35 | 0077 36 | 00008 37 | 23577 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 00333 50 | 037 51 | 0 Sloučení skupin 16 | 18 | 20 | 22 | 24 | 00228 26 | 23 28 | 080 30 | 7 32 | 2337 34 | 36 | 38 | 40 | 42 | 44 | 46 | 48 | 50 | 0370

7 Metoda Lodyha a List (Stem & Leaf) - příklad 2
4 | 5 | 6 | 7 | 8 | 9 | Rozdělení skupin 4 | 3 4 | 5 | 5 | 6 | 6 | 7 | 7 | 8 | 8 | 9 | 9 | 6

8 Způsoby a výsledky třídění dat
TŘÍDĚNÍ DAT PODLE POČTU TŘÍDÍCÍCH ZNAKŮ jednostupňové (podle věku respondentů) dvoustupňové (podle 2 veličin – výsledkem je kontingenční tabulka) vícestupňové (pohlaví, věk, vzdělání, …) TŘÍDĚNÍ DAT PODLE TYPU TŘÍDĚNÍ prosté intervalové Výsledkem třídění je tabulka obsahující NADPIS (jaká data, kdy a kde bylo šetření provedeno) HLAVIČKU (obsah sloupců) LEGENDU (obsah řádků) VLASTNÍ DATA

9 PROSTÉ TŘÍDĚNÍ PŘÍKLAD je-li třídící znak kategoriální nebo
numerický s malým počtem hodnot PŘÍKLAD Pozorováním hnízd jistého druhu ptáků ve vymezené lokalitě byly zjištěny následující počty mláďat v jednotlivých hnízdech: 3, 4, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 2, 5, 3, 3, 3, 4, 5, 2, 2, 2, 3, 3, 4, 4, 3, 3, 4, 4 Lokalita A kde …, kdy … i xi ni 1 2 6 3 12 4 8 5 Celkem hnízd n = 30

10 Tabulka četností diskrétní veličiny
Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost i xi ni 1 2 6 3 12 4 8 5 Celkem n hodnot 30

11 Tabulka četností diskrétní veličiny
Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost i xi ni 1 2 6 3 12 4 8 5 Celkem n hodnot 30

12 Tabulka četností diskrétní veličiny
Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Vypočteme relativní četnosti v lokalitě A: Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost Relativní četnost i xi ni fi 1 2 6 6/30 = 0,20 3 12 12/30 = 0,40 4 8 8/30 = 0,27 5 4/30 = 0,13 Celkem n hodnot 30 30/30 = 1

13 Tabulka četností diskrétní veličiny
Hodnotu ni nazýváme absolutní četnost (nebo jen četnost) a vyjadřuje kolikrát se hodnota xi vyskytuje v datech. Platí vztah , kde k je počet různých hodnot xi Vypočteme relativní a kumulativní četnosti v lokalitě A: Pořadí hodnoty Hodnota (počet mláďat) Absolutní četnost Absolutní kumulativní četnost Relativní četnost Relativní kumulativní četnost i xi ni Ni fi Fi 1 2 6 6/30 = 0,20 0,20 3 12 18 12/30 = 0,40 0,60 4 8 26 8/30 = 0,27 0,87 5 30 4/30 = 0,13 1,00 Celkem n hodnot 30/30 = 1

14 SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT
je-li třídící znak numerická proměnná s velkým počtem hodnot, musíme nejprve data rozdělit do určitých intervalů (skupin). Je důležité správně stanovit počet třídících intervalů Přibližný počet intervalů můžeme stanovit některým pravidlo pro výpočet přibližného počtu intervalů, např. Sturgesovo pravidlo: k = 1 + 3,3 log n, kde n je rozsah souboru Dále musíme vhodně zvolit hranice a střed intervalů (střední hodnota reprezentuje daný interval) U spojitých znaků musíme určit, která mez do intervalu patří a která ne (horní, dolní) U diskrétních znaků se snažíme za střed intervalu volit celé číslo

15 SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT
Příklad 1: V ročníku je 56 dětí. Jejich výkony ve sprintu na 60 m se pohybují od 8,20 s do 21,4 s. Časy jsou uvedeny v desítkové soustavě a přesnost měřením je na 1 desetinné místo. Navrhněte vhodný počet intervalů a formu intervalového rozdělení. Řešení: počet intervalů k = 1 + 3,3 log (56) = 1 + 3,3*1,75 = 1 + 5,8 ~ 7 intervaly (21,4 – 8,2 )/ 7 = 1,886 ~ 1,9 ~ 2,0 Intervalů bude 7 a každý bude mít šířku 2 sekundy

16 SKUPINOVÉ (INTERVALOVÉ) TŘÍDĚNÍ DAT
Předpokládejme, že časy dětí odpovídají této tabulce a jsou vypočteny relativní četnosti. Doplňte absolutní a relativní kumulativní četnosti u jednotlivých tříd časů. Proč je součet relativních četností 0,99 ? Čas Střed intervalu Počet dětí Kumulativní četnost absolutně relativně absolutní relativní <8 - 10) 9 4 0,07 < ) 11 8 0,14 < ) 13 18 0,32 < ) 15 12 0,21 < ) 17 0,16 < ) 19 < ) 21 1 0,02 Celkem 56 0,99

17 Grafické zobrazení diskrétní veličiny - sloupcový graf
Příklad počtu mláďat zkoumaného druhu ptáků v lokalitě A Diskrétní veličinu často zobrazujeme graficky pomocí SLOUPCOVÉHO GRAFU na základě ABSOLUTNÍCH POČTŮ Lokalita A kde, kdy i xi ni 1 2 6 3 12 4 8 5 Celkem 30

18 Grafické zobrazení diskrétní veličiny - sloupcový graf
Stejný příklad počtu mláďat v lokalitě A - vypočteme relativní četnosti Diskrétní veličinu můžeme zobrazit graficky pomocí SLOUPCOVÉHO GRAFU RELATIVNÍCH ČETNOSTÍ . Loka-lita A Počet mláďat Četnost absol. relat. 1 2 6 0,20 3 12 0,40 4 8 0,27 5 0,13 Celkem 30 1,00

19 Grafické porovnání Př. 2 Pozorováním hnízd stejného druhu ptáků v lokalitě B byly zjištěny následující počty mláďat: (pro přehlednost uspořádáno do tabulky) Nakreslete v Excelu společný graf absolutních četností pro populaci ptáků v obou lokalitách. Nakreslete v Excelu společný graf relativních četností pro populaci ptáků v obou lokalitách. Lokalita B i xi ni 1 2 12 3 25 4 15 5 8 Celkem n=60

20 Grafické porovnání absolutních a relativních četností

21 Grafické zobrazení spojité veličiny - histogram

22 Grafické zobrazení diskrétní veličiny - sloupcový graf

23 Grafické zobrazení diskrétní veličiny - sloupcový graf

24 Grafické zobrazení diskrétní veličiny - histogram

25 Grafické zobrazení - sloupcový a koláčový graf
Česká republika Praha Středočeský kraj Ostatní kraje

26 Grafické zobrazení - spojnicový graf

27 Grafické zobrazení - mapa četností podle okresů ČR
VHA 2008, kumulativně do 40. kt. počty případů

28 Odkaz na článek Grafy a tabulky ve statistice (aneb Na co ve výuce obvykle není čas) Josef Tvrdík Katedra informatiky, Přírodovědecká fakulta Ostravské university Abstrakt: V článku jsou uvedeny některé jednoduché zásady a doporučení pro vhodnou prezentaci statistických výsledků, zejména tabulek a grafů. Tyto zásady a doporučení vycházejí z literatury a ze zkušeností z aplikací statistiky v různých oborech. Některé chyby v prezentaci výsledků jsou podrobně diskutovány a je také doporučeno vhodnější řešení.


Stáhnout ppt "TŘÍDĚNÍ DAT je základní způsob zpracování dat."

Podobné prezentace


Reklamy Google