STATISTIKA Zjišťování, zpracování, hodnocení a interpretace číselných údajů.
ZÁKLADNÍ STATISTICKÉ POJMY Statistický znak: ✔ Věcně, prostorově a časově vymezen ✔ Příklad: počet výskytů viru H5N1 na území ČR v roce 2007 ✔ Znaky zkoumáme u statistických jednotek
Statistická jednotka: ✔ příklad: zjišťujeme-li kvalitu výuky na základních školách ČR, jsou jednotlivé ZŠ statistickými jednotkami
Základní a výběrový statistický soubor: ✔ Souhrn všech statistických jednotek (všechny základní školy v ČR) tvoří základní statistický soubor ✔ Souhrn několika vybraných statistických jednotek (ZŠ v okresních městech ČR) tvoří výběrový statistický soubor
Statistické zjišťování: ✔ Vyčerpávající ➠ základní statistický soubor ✔ Výběrové ➠ výběrový statistický soubor
Hodnota statistického znaku: ✔ Statistický znak nabývá většinou nějaké číselné hodnoty ✔ Hodnotu zjištěnou u i-té statistické jednotky označujeme x i ✔ Je-li počet zkoumaných statistických jednotek n, pak získaných n hodnot znaku označujeme x 1,x 2,..., x n
Typy statistických znaků: ✔ Nominální znaky: mají nečíselné (kvalitativní) pojmenování. Připouští pouze relaci rovnosti: x i = x j nebo x i ≠ x j.
✔ Ordinální znaky: relace rovnosti ➠ x i = x j relace uspořádání ➠ x i < x j
✔ Intervalové znaky: relace rovnosti ➠ x i = x j relace uspořádání ➠ x i < x j rozdíl ➠ x i ‒ x j
✔ Poměrové znaky: relace rovnosti ➠ x i = x j relace uspořádání ➠ x i < x j rozdíl ➠ x i ‒ x j podíl ➠ x i / x j
Určeme a zdůvodněme typ statistického znaku: ✔ Počet odpracovaných hodin ✔ Počet bodů v soutěži ✔ Míra nezaměstnanosti ✔ Školní klasifikace 1 – 5 ✔ Datum nástupu do zaměstnání P P P O I
✔ Číslo lístku do tomboly ✔ Jméno prvního potomka ✔ Míra inflace ✔ Daň z přidané hodnoty ✔ Počet vyrobených kusů N N P P P
STÁTNÍ STATISTICKÁ SLUŽBA ✔ Získávání dat ✔ Vytváření statistických informací o ekonomickém, demografickém, sociálním a ekologickém vývoji ČR a jejích částí ✔ Poskytování a zveřejňování informací ✔ Zajištění srovnatelnosti informací ✔ Nestrannost, nezávislost
✔ Zákon č. 89 / 1995 Sb., o státní statistické službě (novela č. 230 / 2006 Sb.) ✔ Zákon č. 101 / 2000 Sb., o ochraně osobních údajů
ORGANIZACE STATISTICKÉ SLUŽBY ✔ Český statistický úřad (ČSÚ) ✔ Ministerstva ✔ Jiné ústřední správní úřady
Český statistický úřad ✔ ✔ Statistické zjišťování ✔ Statistické registry ✔ Národní účty ✔ Makroekonomické analýzy, demografický vývoj, statistiky obyvatelstva
✔ Mezinárodní spolupráce ✔ Výsledky voleb ✔ Statistická ročenka České republiky ✔ Poradní orgán: Česká statistická rada ✔ Koordinace státní statistické služby vykonávané ministerstvy
Ministerstva: ✔ Vykonávají státní statistickou službu podle metodiky ČSÚ ✔ Pouze v oboru své působnosti
Jiné ústřední správní úřady ✔ Český báňský úřad ✔ Úřad pro ochranu hospodářské soutěže ✔ Státní úřad pro jadernou bezpečnost ✔ Český telekomunikační úřad ➠ Dle metodiky ČSÚ projednané s ministerstvy
ETAPY STATISTICKÝCH PRACÍ ✔ Statistické zjišťování ➠ získávání, shromažďování, ověřování dat ✔ Statistické zpracování ➠ třídění, výpočet charakteristik, publikace ✔ Statistický rozbor ➠ vyvozování závěrů, navrhování opatření
Statistické zjišťování: ✔ Vyčerpávající & výběrové ✔ Jednotka zjišťování & zpravodajská jednotka ✔ Zpravodajská povinnost ✔ Rozhodný okamžik & rozhodné období ✔ Periodicita & lhůta zjišťování
Formy zjišťování: ✔ Výkaznictví ✔ Zvlášť organizovaná šetření ✔ Elektronický sběr dat ✔ Formulář hlášení ✔ Dotazník ✔ Rozhovor
Předepsané náležitosti výkazu: ✔ Označení organizátora ✔ Název výkazu ✔ Značka výkazu (příklad: Stav 1-12) ✔ Registrační doložka ✔ Rozhodný okamžik (období)
✔ Identifikace zpravodajské jednotky ✔ Lhůta zjišťování ✔ Informace, komu a kolikrát se výkaz odesílá ✔ Tabelární část ✔ Závěrečné údaje
Chyby: ✔ Úmyslné ✔ Neúmyslné ➠ náhodné ➠ soustavné
Statistické zpracování: ✔ Třídění, výpočet charakteristik, publikace ✔ Organizace zpracování ➠ centralizovaná ➠ decentralizovaná
Technika zpracování: ✔ Systém STATISTICA ✔ MS Excel ✔ R ✔ S+
Třídění statistických údajů: ✔ Stanovení třídicího znaku ✔ Určení obměn třídicího znaku ✔ Vyjádření četnosti ✔ Třídění ➠ jednostupňové (1 třídicí znak) ➠ vícestupňové (více třídicích znaků)
Publikace výsledků statistického zpracování: ✔ Slovní popis ✔ Tabulky ✔ Grafy
Slovní popis: ✔ Příklad: Ceny výrobců v říjnu 2010 Meziměsíčně vzrostly ceny zemědělských výrobců o 2,3 % a ceny tržních služeb o 0,3 %. Ceny průmyslových výrobců a stavebních prací se nezměnily. Meziročně byly ceny zemědělských výrobců vyšší o 21,1 % a průmyslových výrobců o 2,6 %. Ceny stavebních prací byly nižší o 0,3 %, tržních služeb o 1,2 %.
Tabulky: ✔ Prosté ➠ netříděné údaje ✔ Skupinové ➠ 1 třídicí znak ✔ Kombinační ➠ více třídicích znaků
Tabulka prostá:
Tabulka skupinová:
Tabulka kombinační:
Náležitosti statistické tabulky: ✔ Název ✔ Legenda ✔ Název legendy ✔ Hlavička ✔ Políčko ✔ Číslování řádků a sloupců
✔ Součty ✔ Měřicí jednotky ✔ Znaky - 0. ✕ ( ) ✔ Obecná poznámka ✔ Zvláštní poznámka
Grafy: ✔ Nadpis grafu ✔ Klíč ✔ Poznámky obecné ✔ Poznámky zvláštní ✔ Vysvětlivky
Stupnice grafu: ✔ Nositelka stupnice ✔ Body ✔ Kóty
✔ Délka stupnice ✔ Rozpětí stupnice ✔ Grafický interval ✔ Číselný interval ✔ Modul stupnice
Modul stupnice ➠ poměr grafického a číselného intervalu ➠➠
Druhy grafů: ✔ Spojnicové ✔ Sloupcové ✔ Kruhové ✔ Piktogramy ✔ Kartogramy ✔ Kartodiagramy
Spojnicový graf
Sloupcový graf
Kruhový graf
Piktogram
Kartogram
Kartodiagram
CHARAKTERISTIKY POLOHY ✔ Aritmetický průměr ✔ Modus ✔ Medián
Aritmetický průměr ✔ Aritmetický průměr prostý ➠ ✔ Aritmetický průměr vážený ➠
✔ Příklad: Jaká je průměrná měsíční mzda připadající na jednoho zaměstnance?
✔ Příklad: Vypočítejme průměrný počet odpracovaných hodin jednoho zaměstnance.
Aritmetický průměr počítaný z intervalového rozložení četností ✔ Příklad: Vypočítejme průměrné procento plnění výkonových norem v podniku.
Odchylka od průměru (i-tá centrovaná hodnota)
Vlastnosti aritmetického průměru ✔ Součet odchylek od průměru je roven nule. ✔ Přičteme-li libovolné reálné číslo K k průměrovaným údajům, pak se aritmetický průměr nově získaných a původních údajů liší právě o toto číslo K. ✔ Násobíme-li (resp. dělíme) každý z průměrovaných údajů libovolným reálným číslem K, je průměr nově získaných údajů právě K-krát větší (resp. menší).
✔ Součet odchylek od průměru je roven nule. Důkaz: ➠ ➠ ☟ ☟
✔ Přičteme-li libovolné reálné číslo K k průměrovaným údajům, pak se aritmetický průměr nově získaných a původních údajů liší právě o toto číslo K. Důkaz: ➠
✔ Násobíme-li (resp. dělíme) každý z průměrovaných údajů libovolným reálným číslem K, je průměr nově získaných údajů právě K-krát větší (resp. menší). Důkaz: ➠
Modus ✔ Mod (x) ✔ Hodnota znaku vykazující největší četnost v daném souboru
✔ Příklad: Ve skupině 20 zaměstnanců byl zjištěn tento počet zhotovených šroubů: ☞ _______________
Určení modu z intervalového rozložení četností ✔ Příklad: Zásilková služba přepravila za měsíc 201 balíků o hmotnosti udané náledující tabulkou.
☞ __________________________ modální interval
Medián ✔ Med (x) ✔ Prostřední hodnota uspořádaného souboru
●●●●●●● ●●●●●●●●
✔ Příklad: U 11 pracovníků byly zjištěny tyto počty zhotovených výrobků stejného druhu: ☝ ☐
✔ Příklad: V rámci marketingového průzkumu trhu bylo dotázáno 20 náhodně vybraných zákazníků jisté pojištovny a byl zjišťován jejich zájem o nový druh pojištění. Získané odpovědi byly zakódovány takto:
1 – jednoznačný nezájem 2 – podprůměrný zájem 3 – průměrný zájem 4 – nadprůměrný zájem 5 – jednoznačný zájem
Zjištěné hodnoty: 5, 3, 3, 4, 5, 3, 3, 1, 4, 3, 5, 3, 3, 5, 1, 4, 5, 3, 5, 3 Uspořádané hodnoty: 1, 1, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5 ☐
✔ Extrémní hodnoty a medián: 4, 4, 4, 4, 4, 4, 29, 4, 4, 4, 4, 4 Med(x) = 4 6,08
Určení mediánu z intervalového rozložení četností ✔ Příklad: Zásilková služba přepravila za měsíc 201 balíků o hmotnosti udané náledující tabulkou.
∑ = 201 ➠ prostřední člen má pořadí 101 V prvním intervalu jsou členy s pořadím 1 až 59, ve druhém 60 až 124 ( = 124) ➠ Med (x) leží ve 2. intervalu ☞ _______________
Interpretace vypočítaných charakteristik polohy ✔ První soubor : 3, 3, 5, 7, 12 ✔ Druhý soubor: 4, 4, 4, 6, 7 6, Mod(x) = 3, Med(x) = 5 5, Mod(x) = 4, Med(x) = 4 Velikost údajů v prvním souboru je obecně vyšší.
✔ Variační rozpětí ✔ Průměrná odchylka ✔ Relativní průměrná odchylka ✔ Rozptyl ✔ Směrodatná odchylka ✔ Variační koeficient CHARAKTERISTIKY VARIABILITY
První soubor: 4, 5, 5, 5, 6 Druhý soubor: 1, 2, 3, 6, 13 Oba mají aritmetický průměr roven 5, hodnoty druhého souboru však vykazují větší variabilitu.
Variační rozpětí ✔ Znaky ordinální, intervalové, poměrové
✔ Příklad: Posuďme odměňování prémiemi ve dvou pracovních skupinách.
✔ Nevýhoda: bereme v úvahu pouze extrémní hodnoty ✔ Např. Soubor 1, 1, 1, 1, 1, 1, 5, 1, 1, 1, 1, 1 má variační rozpětí 4
Průměrná odchylka ✔ Odchylka i-té hodnoty od průměru (i-tá centrovaná hodnota) ✔ Průměrná odchylka
✔ Průměrnou odchylku počítáme pouze u znaků intervalových a poměrových ✔ Průměrná odchylka počítaná váženým aritmetickým průměrem
✔ Příklad: Vypočítejme, s jakou přesností pracoval stroj, jestliže součástek o požadovaném rozměru 12,59 mm opracoval takto:
12,59 0,9 0,6 0,3 0 0,6
Při opracovávání součástek se stroj průměrně odchýlil o 0,0126 mm od průměrného rozměru.
Relativní průměrná odchylka ✔ Vyjádření v procentech: ✔ V předchozím příkladu je %
✔ Použití u poměrových znaků ✔ Příklad: Následující tabulka udává přehled o odpracovaných hodinách 35 zaměstnanců. Vypočítejme průměrnou odchylku a relativní průměrnou odchylku.
186,6
Rozptyl
✔ Příklad: Kurzy akcií (v Kč) společnosti AAA Auto Group v průběhu 23 dní v měsíci srpnu 2010 byly následující: 17,75; 17,74; 17,85; 17,59; 17,92; 17,98; 18,39; 18,25; 18,30; 18,00; 18,15; 18,15; 18,22; 18,40; 18,25; 17,95; 18,25; 18,23; 17,95; 17,90; 17,80; 17,87; 17,87. Určeme rozptyl cen akcií.
✔ Rychlejší postup výpočtu rozptylu:
Směrodatná odchylka
✔ Použití u intervalových a poměrových znaků ✔ Příklad: vypočítejme směrodatnou odchylku v počtu odpracovaných hodin, jak udává následující tabulka:
tj. 1 hodina a 35 minut
Variační koeficient ✔ Použití u poměrových znaků
✔ Příklad: Podnik sleduje náklady ve svých provozech, jak ukazuje tabulka. Vypočítejme průměrné náklady na jeden provoz a variační koeficient.
Shrnutí charakteristik polohy a variability
POMĚRNÉ UKAZATELE ✔ Poměrné ukazatele splnění plánu ✔ Poměrné ukazatele struktury ✔ Poměrné ukazatele vývoje
Poměrné ukazatele splnění plánu ✔ Příklad: sledujeme výrobu jistého podniku za jeden kalendářní rok. Tabulka ukazuje, jak se dařilo plnit plánovanou výrobu v jednotlivých čtvrtletích:
Poměrné ukazatele struktury ✔ Příklad: za určitý měsíc byly zaměstnancům vyplaceny mzdy v částkách Kč udaných tabulkou:
Vyjádřeme poměrné ukazatele struktury mezd – tj. složení vyplacených mezd podle jejich druhu v procentech.
Výrobní dělníci: úkolová mzda 61 % časová mzda 31 % ostatní příplatky 8 % Pomocní dělníci: úkolová mzda 45 % časová mzda 49 % ostatní příplatky 6 %
Kolik procent z úhrnného objemu mezd bylo vyplaceno výrobním dělníkům a kolik pomocným dělníkům? Výrobní dělníci: 87 % Pomocní dělníci: 13 %
Poměrné ukazatele vývoje ✔ Porovnávané údaje (srovnávaná hodnota a základ srovnání) pochází z různého časového období ✔ Stálý základ ➠ bazický index Proměnlivý základ ➠ řetězový index
✔ Příklad: výše průměrné hrubé měsíční mzdy v letech 2001 – 2009: Stálý základ – hodnota z roku 2001
Proměnlivý základ – vždy hodnota z předchozího roku 8
✔ Shrnutí Stálý základ ➠ bazický index Proměnlivý základ ➠ řetězový index (tempo růstu)
✔ Průměrné tempo růstu
☟ ☟
✔ Závěr: průměrné tempo růstu je geometrický průměr temp růstu
Převod řetězových indexů na bazické
✔ Příklad: převeďme řadu temp růstu reálného HDP ve stálých cenách v zemích EU na bazické indexy.
Převod bazických indexů na řetězové
✔ Příklad: Průmyslový podnik vykázal během šesti let tento vývoj odbytu vzhledem k prvnímu roku sledovaného období: Převeďme řadu bazických indexů na řetězové
INDEXY ✔ Extenzitní veličiny q ✔ Objem, rozsah, velikost, množství ✔ Stejnorodé, různorodé ✔ Intenzitní veličiny p ✔ Intenzita, úroveň, hladina ➠ poměr dvou extenzitních veličin
Individuální indexy ✔ Stejnorodé veličiny ✔ Jednoduché individuální indexy ✔ množství ✔ úrovně ✔ Složené individuální indexy ✔ množství ✔ úrovně 1 místo k míst
Jednoduché individuální indexy množství ✔ Příklad: v roce 2009 bylo v ČR vyprodukováno celkem 24,2 mil. tun odpadu, v roce ,9 mil. tun. Vypočítejme index produkce odpadu.
Pokles o 6,6 %.
Jednoduché individuální indexy úrovně ✔ Příklad: cena uhlí pro domácnost v roce 2002 činila 2010 Kč za tunu. V roce Kč za tunu. Vypočítejme index ceny uhlí za daná období.
Nárůst o 0,5 %.
Složené individuální indexy množství ✔ Příklad: Produkce jistého výrobku dosahovala v jednotlivých závodech podniku výše v tis. Kč, jak ukazuje tabulka: k míst
Změřme změnu objemu produkce v podniku.
Vzrůst o 9 %.
Složené individuální indexy úrovně ✔ Index proměnlivého složení ✔ Index stálého složení ✔ Index struktury
✔ Příklad: údaje o produkci jistého výrobku v jednotlivých závodech podniku:
Pomocné výpočty:
Zjistíme změnu průměrných vlastních nákladů na kus ➠ index proměnlivého složení
Pokles průměrných vlastních nákladů na jeden výrobek o 0,73 %.
Zjistíme změnu průměrných vlastních nákladů na kus, která není ovlivněná produkcí ➠ index stálého složení
Pokles o 7,27 %. Pokles o 5,65 %.
Zjistíme vliv změněné struktury produkce na změnu průměrných vlastních nákladů na 1 kus ➠ index struktury
Vzrůst o 5,21 %. Vzrůst o 7,06%.
Souhrnné indexy ✔ Různorodé veličiny ✔ Index hodnotový ✔ Index objemový ✔ Index cenový
✔ Příklad: Pobočka firmy Mrázek a syn prodala v 1. a 2. čtvrtletí rukavice, šály a čepice v následujícím množství:
Vyjádříme změnu celkových tržeb ➠ index hodnotový I h
Vzrůst o 20,68 %.
Vyjádříme změnu celkových tržeb ovlivněnou pouze počtem prodaných kusů ➠ index objemový I o
Vzrůst o 17,73 %.
Vzrůst o 18,18 %.
Vyjádříme změnu celkových tržeb ovlivněnou pouze změnou v cenách za kus ➠ index cenový I c
Vzrůst o 2,12 %.
Vzrůst o 2,51 %.
ČASOVÉ ŘADY ✔ Intervalové ✔ Okamžikové ✔ Odvozených ukazatelů ➠ možnost kumulace
✔ Příklad: vývoj investic v mil. Kč do ochrany životního prostředí v letech 2003 – 2007 popisuje následující intervalová řada:
✔ Příklad: okamžiková časová řada: Nelze sčítat ➠ průměrujeme
Chronologický průměr
✔ Příklad: vypočítejme průměrný počet pracovníků jisté firmy za rok 2009, známe-li údaje ze začátku roku a z konce každého čtvrtletí:
1. čtvrtletí ➠ ( ) dní 2. čtvrtletí ➠ ( ) dní 3. čtvrtletí ➠ ( ) dní 4. čtvrtletí ➠ ( ) dní
✔ případ, kdy mají všechny intervaly stejnou délku d ☟ ☟
Vyrovnávání časových řad ✔ Metoda klouzavých průměrů ✔ Analytická metoda
✔ Příklad: vyrovnejme následující časovou řadu, vyjadřující počty uchazečů na jedno pracovní místo k – 2009, klouzavými průměry
✔ Průměry dvojic sousedních hodnot 13,1; 12, 05; 10,2; 7,3; 3,65; 3,2; 10,65 7 nových údajů
✔ Průměry trojic sousedních hodnot 12,26; 11,3; 8,4; 5,7; 3,73; 7,93 _ __ 6 nových údajů
✔ Průměry pětic sousedních hodnot 10,28; 8, 24; 6,32; 7,68 4 nové údaje
✔ průměry pětic ✔ průměry trojic ✔ původní řada
✔ Průměry sudého počtu sousedních údajů ➠ centrování vycentrujeme průměry sousedních dvojic 13,1; 12, 05; 10,2; 7,3; 3,65; 3,2; 10,65
Analytické vyrovnávání časových řad přímkou hodnoty původní časové řady hodnoty časové proměnné
✔ Příklad: vyrovnejme následující časovou řadu, vyjadřující kurzy eura v Kč v letech , analyticky přímkou
Sezónnost v časových řadách ✔ Příklad: firma prodala v jednotlivýh čtvrtletích dvou let zboží za 244, 309, 618, 420, 345, 480, 771, 529 tis. Kč. ➠ výrazné sezónní kolísání ➠ mírný vzestupný trend
Vyrovnáme řadu přímkou:
Poměry původních hodnot s vyrovnanými ➠ sezónní indexy