Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem

Podobné prezentace


Prezentace na téma: "S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem"— Transkript prezentace:

1 S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem WWW:

2 P OPISNÁ S TATISTIKA

3 S TATISTIKA – 1. PŘEDNÁŠKA Základní informace o kurzu Pojmy Zpracování dat 3

4 Z ÁKLADNÍ INFORMACE Základní literatura a přednášky POPELKA, J., SYNEK, V. Úvod do statistické analýzy dat. Univerzita J. E. Purkyně v Ústí nad Labem, Fakulta životního prostředí, stran. ISBN E-learningový kurz: StatistikaStatistika Lokální disk na síti FŽP UJEP - cvičení 4

5 Z ÁKLADNÍ INFORMACE Doporučená literatura HENDL, J. Přehled statistických metod zpracování dat. Portál, Praha ISBN CYHELSKÝ, L., HINDLS, R., KAHOUNOVÁ, J. Elementární statistická analýza. 2. vyd. Management Press, Praha ISBN HINDLS, R., HRONOVÁ, S., NOVÁK, I. Metody statistické analýzy pro ekonomy. 2. aktualizované a rozšíř. vyd. Management Press, Praha ISBN

6 Z ÁKLADNÍ POJMY „Statistika je přesný součet nepřesných čísel.“ (Zdeněk Opava) „Statistika je nauka, jak získat informace z numerických dat.“ (Jan Hendl) „Statistika nuda je, má však cenné údaje … “ (Zdeněk Svěrák) „Statistika je jako bikiny. Odhalí téměř vše, ale to nejdůležitější nám zůstane skryto.“ (autor neznámý) 6

7 Z ÁKLADNÍ POJMY STATISTIKA údaje neboli data o hromadných jevech – ročenky a souhrny, praktická činnost - získávání dat o hromadných jevech, jejich zpracování, vyhodnocování a zveřejňování výsledků, vědecký obor - zkoumání zákonitostí hromadných jevů, souhrn vědeckých metod sběru dat, zpracování a analýzy, statistické výkazy a dotazníky sloužící ke sběru dat o hromadných jevech, slangově i oddělení, organizace a instituce zabývající se sběrem a zpracováním dat, číselné charakteristiky - sloužící k popisu vlastností hromadných jevů. 7

8 Z ÁKLADNÍ POJMY HROMADNÝ JEV Statistika se zabývá jevy, které se vyznačují velkými počty výskytů (hromadností). Hromadný jev (na rozdíl od jednotlivého jevu) se může v prostoru a čase mnohokrát opakovat. Při pozorování hromadného jevu se u každého pozorovaného prvku mohou projevovat jeho individuální vlastnosti a vlastnosti typické pro skupinu prvků S větším počtem pozorování se stírají vlivy jedinečnosti a více se uplatňují vlivy společné – zákonité. 8

9 Z ÁKLADNÍ POJMY STATISTICKÉ JEDNOTKY A ZNAKY Statistická jednotka (předmět sledování) člověk, zvíře, rostlina, předmět, událost, územní celek 9 Statistický znak (vlastnost jednotky, kterou jsme schopni číselně nebo slovně popsat)

10 Z ÁKLADNÍ POJMY STATISTICKÉ SOUBORY Základní soubor (populace) všechny jednotky, které existují v rámci nějakého logického celku Výběrový soubor – vybrané jednotky Výběr je nejčastěji náhodný výběr nebo systematický.  Všichni obyvatelé ČR (cca 10 mil.)  Všechny sovy v Krušných horách (stovky?)  Každá část ovzduší ve městě Most (neurčitelně velký soubor)  Všechny kraje ČR (14)  Všechny telefonní hovory v síti (miliardy za rok)  Reálný svět (?) Náhodně oslovení lidé na ulici (maximálně 3000) Odchycené sovy v hnízdních budkách (do 30 jedinců) Odebrané vzorky ve stanici ČHmÚ (denní odběry) Kraje na severu ČR (4) Telefonní hovory monitorované v termínu (tisíce) Laboratorní pokusy (3 pokusy)

11 Z ÁKLADNÍ POJMY STATISTICKÉ PROMĚNNÉ 11

12 Z ÁKLADNÍ POJMY STATISTICKÉ PROMĚNNÉ

13 Příklad: Počet kotlů na pevná paliva v domácnosti: Tabulka prostého třídění 13 Řazení kvantitativní proměnné podle velikosti kvalitativní ordinální podle významu kvalitativní nominální abecedně Třídění zpřehlednění velkého množství dat do tabulek např. uspořádání do tzv. tabulky četností. Grafická prezentace grafy, diagramy. Počet kotlůČetnost

14 Příklad: Soubor koncentrace Pb v ovzduší města Litoměřice má 104 hodnot (104 měření). Tabulky intervalového třídění 14 Prosté třídění kvantitativní diskrétní proměnná Intervalové třídění kvantitativní spojitá proměnná kvantitativní diskrétní proměnná s vysokým počtem obměn KoncentraceČetnost (0 – 5>25 (5 – 10>24 (10 – 15>38 (15 – 20>12 (20 – 25>3 (25 – 30>2 KoncentraceČetnost (1,9 – 5,3>25 (5,3 – 8,7>26 (8,7 – 12,1>31 (12,1 – 15,5>9 (15,5 – 18,9>6 (18,9 – 22,3>3 (22,3 – 25,7>2 (25,7 – 29,1>2

15 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TŘÍDĚNÍ 15 Histogram – prosté třídění Histogram – intervalové třídění

16 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 16

17 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 17 Volba vhodného počtu tříd (řádků) v tabulce četností. Prosté třídění: Podle počtu obměn diskrétní proměnné Počet tříd se rovná počtu obměn. Počet kotlůČetnost

18 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 18 Volba vhodného počtu tříd (řádků) v tabulce četností Intervalové třídění: Sturgesovo pravidlo počet intervalů ≈ 1 + 3,3·log 10 (počet hodnot) Jednoduché (odmocninové) pravidlo počet intervalů ≈ √počet hodnot Subjektivně (např. intervaly po 5µg/m 3. Vhodné spíše pro prezentaci dat než stat. analýzy. Třídy musí zahrnovat všechny hodnoty a nejčastěji se volí stejně široké. Krajní intervaly mohou být širší pokud zahrnují výrazně vysoké nebo nízké hodnoty. KoncentraceČetnost (0 – 5>25 (5 – 10>24 (10 – 15>38 (15 – 20>12 (20 – 25>3 (25 – 30>2 Tabulka četností se šesti třídami a subjektivně stanovenými hranicemi intervalů

19 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 19 TřídaKoncentrace 1(0 – 5> 2(5 – 10> 3(10 – 15> 4(15 – 20> 5(20 – 25> 6(25 – 30> Subjektivní volba počtu tříd Soubor koncentrace Pb v ovzduší má 104 hodnot. Nejmenší hodnota sledovaného souboru je 2 µg/m 3 a největší 29 µg/m 3. Tabulka musí zahrnovat všechny hodnoty! Zvolíme rozpětí třídy 5 µg/m 3. Toto uspořádání je přehledné a jednoduché. Počet tříd je pak 6 = (30 – 0)/5. Třídy se nesmějí překrývat, proto se aplikují zleva otevřené a zprava uzavřené intervaly. Tabulka je vhodná pro prezentaci hodnot, ne však pro statistické analýzy.

20 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 20 TřídaKoncentrace 1(1,9 – 5,3> 2(5,3 – 8,7> 3(8,7 – 12,1> 4(12,1 – 15,5> 5(15,5 – 18,9) 6(18,9 – 22,3> 7(22,3 – 25,7> 8(25,7 – 29,1> Volba počtu tříd dle statistických pravidel Při použití jednoduchého (odmocninového) pravidla na soubor se 104 hodnotami by byl počet tříd √104 ≈ 10. Sturgesovo pravidlo stanovuje následující počet tříd: 1 + 3,3log ≈ 8. Rozpětí tříd se pak spočítá podle vzorce: (maximální hodnota – minimální hodnota) počet tříd =(29 – 2)/8 = 3,375 ≈ 3,4 µg/m 3 Některé statistické analýzy vyžadují aplikaci Sturgesova pravidla. Tabulka četností s osmi třídami a hranicemi intervalů stanovenými Sturgesovým pravidlem

21 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 21 TřídaKoncentraceStřed intervalu x* Absolutní četnost n i 1(1,9 – 5,3>3,625 2(5,3 – 8,7>7,026 3(8,7 – 12,1>10,431 4(12,1 – 15,5>13,89 5(15,5 – 18,9)17,26 6(18,9 – 22,3>20,63 7(22,3 – 25,7>24,02 8(25,7 – 29,1>27,42 Celkem104 Střed třídy (x*) prostřední hodnota mezi horní a dolní mezí třídy Absolutní četnost (n i ) počet hodnot v souboru spadající do příslušné třídy

22 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 22 TřídaKoncentraceAbsolutní četnost n i Relativní četnost p i 1(1,9 – 5,3>250,24 2(5,3 – 8,7>260,25 3(8,7 – 12,1>310,29 4(12,1 – 15,5>90,09 5(15,5 – 18,9)60,06 6(18,9 – 22,3>30,03 7(22,3 – 25,7>20,02 8(25,7 – 29,1>20,02 Celkem1041,00 Relativní četnost (p i ) relativní počet hodnot (uvádí se i v procentech) v souboru spadající do příslušné třídy

23 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 23 TřídaKoncentraceAbsolutní četnost n i Kumulativní absolutní četnost kn i 1(1,9 – 5,3>25 2(5,3 – 8,7>2651 3(8,7 – 12,1>3182 4(12,1 – 15,5>991 5(15,5 – 18,9)697 6(18,9 – 22,3>3100 7(22,3 – 25,7>2102 8(25,7 – 29,1>2104 Celkem104- Kumulativní absolutní četnost (kn i ) počet hodnot v souboru, které jsou menší nebo rovny horní hranici příslušného intervalu

24 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 24 TřídaKoncentraceAbsolutní četnost n i Kumulativní relativní četnost kp i 1(1,9 – 5,3>250,24 2(5,3 – 8,7>260,49 3(8,7 – 12,1>310,78 4(12,1 – 15,5>90,87 5(15,5 – 18,9)60,93 6(18,9 – 22,3>30,96 7(22,3 – 25,7>20,98 8(25,7 – 29,1>21,00 Celkem104 Kumulativní relativní četnost (kp i ) relativní počet hodnot (uvádí se i v procentech) v souboru, které jsou menší nebo rovny horní hranici příslušného intervalu

25 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 25 TřídaKoncentraceStřed intervalu x i * Absolutní četnost n i Relativní četnost p i Kumulativní absolutní četnost kn i Kumulativní relativní četnost kp i 1(1,9 – 5,3>3,6250,24250,24 2(5,3 – 8,7>7,0260,25510,49 3(8,7 – 12,1>10,4310,29820,78 4(12,1 – 15,5>13,890,09910,87 5(15,5 – 18,9>17,260,06970,93 6(18,9 – 22,3>20,630,031000,96 7(22,3 – 25,7>24,020,021020,98 8(25,7 – 29,1>27,420,021041,00 Celkem1041,00--

26 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 26 Histogram četností – absolutní četnost n i

27 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 27 Histogram četností – kumulativní absolutní četnost

28 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ 28 Polygon četností (spojnicový graf)

29 Sloupcový graf pokud jde o prosté třídění znaku, nebo intervalové třídění s nestejně širokými intervaly. Mezi sloupce se vkládají mezery. Histogram četností pouze pokud jsou všechny intervaly stejně široké 29 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ

30 Sloupcový graf pokud jde o prosté třídění znaku, nebo intervalové s nestejně širokými intervaly. Mezi sloupce se vkládají mezery. (grafická úprava z tisku) 30 Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ

31 V programu MS Excel je nutno mít zdrojová data uspořádaná do sloupce a ručně zadané dolní a horní meze všech tříd. Data - Analýza – Analýza dat - Histogram Z ÁKLADNÍ ZPRACOVÁNÍ DAT TABULKA ČETNOSTÍ - MS E XCEL 31 Volba „Kumulativní procentuální podíl“ vypočte kumulativní relativní četnost. Do políčka „Hranice tříd“ zadáváme pouze horní meze.

32 Hromadný jev Statistická jednotka a znak Statistická proměnná Základní soubor Výběrový soubor Prosté a intervalové třídění dat Tabulka četností Sturgesovo pravidlo Absolutní, relativní, kumulativní absolutní a kumulativní relativní četnost Histogram a polygon 32 Z ÁKLADNÍ ZPRACOVÁNÍ DAT D ŮLEŽITÉ POJMY – 1. PŘEDNÁŠKA


Stáhnout ppt "S TATISTIKA Ing. Jan Popelka, Ph.D. odborný asistent Katedra informatiky a geoinformatiky Univerzita Jana Evangelisty Purkyně v Ústí nad Labem"

Podobné prezentace


Reklamy Google