História štatistiky Štatistika má nezastupiteľne miesto v modernej spoločnosti využíva sa pri analýze sociálnych a ekonomických javov, a to nielen vo vede a výskume, ale aj ako dôležitý nástroj hospodárskej politiky štátu. Termín štatistika pochádza z latinského slova „status“, ktoré znamená stav Dávno pred vznikom pojmu štatistika sa uskutočňovali úradné zisťovania počtu ľudí a ich majetku za účelom zistenia počtu bojaschopných mužov alebo počtu osôb schopných a povinných platiť dane Najstaršie štatistické práce sa zaoberali „popisom štátu“ a predstavovali zobrazenie daného zemepisného, hospodárskeho a politického stavu spoločnosti. V 17. storočí sa zmenilo chápanie štatistiky na tzv. politickú aritmetiku kde východiskom boli údaje o narodeniach a úmrtiach. Veľký vplyv na vývoj štatistiky mal vznik teórie pravdepodobnosti, ktorá skúma zákonitosti hromadných javov
História štatistiky Štatistiku 19. storočia charakterizuje skúmanie hromadných javov prostredníctvom vyčerpávajúceho zisťovania. Začiatkom 20. storočia vzniká moderná štatistika – analytická štatistika, induktívna štatistika. Rozvíjali sa metódy umožňujúce robiť závery o celku na základe výberových a čiastkových zisťovaní. Štatistika sa teda vyvinula od úradného zisťovania a evidencie cez univerzitnú štatistiku, politickú aritmetiku a počet pravdepodobností až po súčasnú modernú štatistiku ako výsledok 200 ročného vývoja. K rozvoju štatistiky ako samostatnej vednej disciplíny a najmä jej aplikácii v praxi prispel rýchly rozvoj výpočtovej techniky počnúc sedemdesiatimi rokmi 20. storočia Jadro štatistických analýz tvorí špecializovaný software ako je napr. Statgraphics, SPSS, SAS, Stata, Statistica, NCSS a ine.
Predmet štatistiky Základným cieľom štatistiky je získavanie a poskytovanie údajov v podobe uľahčujúcej ich hodnotenie a analýzu ako aj identifikovanie zákonitostí a ich kvantitatívne vyjadrenie Predmetom štatistiky ako vednej disciplíny sú hromadné javy – spoločenské a prírodné Hromadné javy – udalosti – sú také, ktoré sa za presne definovaných podmienok vecných, časových a priestorových viackrát opakujú, napr. narodenia, úmrtia, spotreba potravinárskych výrobkov, výroba aut a pod. Hromadná udalosť nadobúda mnoho konkrétnych foriem, skladá sa z mnohých individuálnych udalostí Predmetom štatistického skúmania nie sú teda udalosti individuálne, tie sú len konkrétnym prejavom hromadných udalostí. Napr. bez pozorovania viacerých rodín nemožno sformulovať hypotézu, že počet detí vo vidieckych rodinách je väčší ako v mestských
Význam štatistiky V súčasnosti pojem štatistika chápeme najmenej v štyroch významoch Praktická činnosť, ktorá súvisí so získavaním štatistických údajov, s ich triedením, grafickým znázorňovaním, s konštrukciou a výpočtom číselných charakteristík, ako aj s tvorbou systémov štatistických dát Číselné alebo slovné údaje o hromadných udalostiach, ktoré môžeme nájsť v rôznych publikáciách Konkrétnu číselnú charakteristiku, vypočítanú zo zistených číselných údajov o hromadnej udalosti Vednú disciplínu, ktorá sa zaoberá metódami skúmania zákonitostí hromadných udalostí, teda metódami zberu, spracovania a analyzovania údajov
Základné štatistické pojmy Nevyhnutným predpokladom každého štatistického skúmania je hromadnosť pozorovania Pri hromadnom pozorovaní môže ísť o: jednoduché pozorovanie - získanie údajov pozorovaním, meraním, štatistický prieskum... Experiment - najmä v biologických a iných pokusoch, môže byť realizovaný aj v marketingu...
Predmetom skúmania je hromadný jav. Hromadný jav sa skladá z mnohých individuálnych javov. Nositelia týchto javov sa nazývajú štatistickými jednotkami Štatistická jednotka - je základný prvok, na ktorom možno skúmať konkrétny prejav určitého hromadného javu a je základným a presne vymedzeným objektom pozorovania Výber štatistickej jednotky je určený cieľom skúmania Napr.: sociálne slabšie rodiny v SR v r.2005
Vymedzenie štatistických jednotiek priestorové - musí byť presne vymedzený priestor, napr. Slovensko časové - vymedzenie obdobia, resp. okamihu, napr. kalendárny rok 2009 vecné - obsahové vymedzenie , napr. domácností s čistým príjmom pod 4500 Sk na 1 člena
Štatistický súbor je množina štatistických jednotiek, z ktorých každá vyhovuje určitým vlastnostiam, ktoré vymedzujú štatistický súbor z hľadiska časového priestorového a vecného a v iných vlastnostiach sa štatistické jednotky líšia. Vlastnosti, v ktorých sa štatistické jednotky líšia sú predmetom skúmania. Rozsah štatistického súboru - počet štatistických jednotiek v štatistickom súbore
Štatistický súbor študentov pre štatistický súbor študentov môžu byť spoločné nasledovné vlastnosti: Fakulta VSZaSP ročník: 1. Školský rok 2009/2010 súbor študentov sa však bude líšiť napr. v študijnom prospechu a táto vlastnosť môže byť predmetom skúmania
Základný súbor - populácia Súbor všetkých štatist. jednotiek, ktoré z hľadiska vecného, časového a priestorového vymedzenia do súboru patria Výberový súbor Vybraná časť jednotiek zo základného súboru, predstavuje reprezentatívnu vzorku základného súboru
Štatistické znaky sú vlastnosti štatististických jednotiek Môžeme ich rozdeľovať z rôznych hľadísk: a) podľa toho, či sa nachádzajú na všetkých štat. jednotkách daného súboru ich delíme na: spoločné - vymedzujú štatist. súbor variabilné - sú predmetom štat. skúmania
b) podľa toho, ako charakterizujú vlastnosti štat b) podľa toho, ako charakterizujú vlastnosti štat. jednotiek: - nepriame, zistiteľné len nepriamo, napr. meranie kvality výrobku - priame- priamo merateľné, napr. príjem c) podľa charakteru na: - vecné - časové - priestorové
d) vecné štat. znaky delíme podľa ich charakteru na: kvantitatívne - merateľné, môžu byť: spojité - nadobúdajú ľubovoľné hodnoty z ohraničeného alebo neohraničeného intervalu, napr. mesačný príjem, výdavky na potraviny diskrétne - nadobúdajú izolované, väčšinou celočíselné hodnoty, napr. vek, počet nezaopatrených detí, počet rokov praxe v odbore...
kvalitatívne znaky, slovné, môžu byť: dichotomické- alternatívne napr. pohlavie polynomické - multinomické, množné napr. vzdelanie, alebo druh športu ….
Rozdelenie štatistických znakov ŠTATISTICKÉ ZNAKY SPOLOČNÉ VARIABILNÉ PRIAME NEPRIAME ČASOVÉ VECNÉ VECNÉ PRIESTOROVÉ KVALITATÍVNE KVANTITATÍVNE ALTERNATÍVNE MNOŽNÉ SPOJITÉ DISKRÉTNE
Etapy štatistického skúmania Štatistické skúmanie sa skladá z troch etáp: Štatistické zisťovanie Spracovanie Štatistický rozbor
Formy štat. zisťovania: výkazníctvo : daňové priznanie, výsledovka, súpis – cenzus obavateľstva, marketingový prieskum, anketa i iné panel domácností Štat. zisťovanie: z hľadiska počtu jednotiek: vyčerpávajúce - ak zisťujeme informácie o jednotkách celého základného súboru výberové - ak zisťujeme informácie len o výberovom súbore
Podľa dĺžky resp. periodicity časového intervalu štatistického zisťovania poznáme: štatistické zisťovania: - jednorázové - bežné - periodické - pravidelne sa opakujúce - nepravidelné -opakujúce sa v nepravidelných intervaloch
Štatistické triedenie Prvá fáza spracovania štatistických údajov, usporiadanie jednotiek štatistického súboru do skupín (tried) podľa určitého štatistického znaku alebo znakov, vymedzenie typických skupín... štatistický znak, ktorý je kritériom pri triedení nazývame triediacim znakom.
Základné kritériá pri triedení: zásada úplnosti - triedy musia byť vytvorené tak, aby každá jednotka mala šancu byť do niektorej z tried zatriedená zásada jednoznačnosti - triedy musia byť vytvorené tak, aby o každej jednotke bolo jednoznačne rozhodnuté do ktorej z tried má byť zaradená
Klasifikácia triedenia podľa druhu triediaceho znaku: z hľadiska časového - vytvorenie časových radov z hľadiska vecného - kvalitatívne - kvantitatívne z hľadiska priestorového - priestorové zoskupenie jednotiek, napr. regionálne zatriedenie podnikov
Triedenie podľa kvalitatívnych znakov (asociačné triedenie) Označenie kvalitatívnych znakov - A, B, C, ... Varianty, obmeny znakov označujeme: napr. dichotomické - a, alebo a1 , a2 polynomické – a1, a2, a3, .... trieda – určitá skupina štat. jednotiek, ktorá má rovnakú obmenu (variant) alebo kombináciu obmien štat. znaku
Príklad: máme 81 pracovníkov a evidujeme u nich: A- pohlavie, B - vzdelanie, C - funkcia každý znak má len dve obmeny a1 - muži b1 - VŠ c1- vo funkcií a2 - ženy b2- bez VŠ c2- bez funkcie Označenie triedy – triednym symbolom (a1) = 38 (b1) = 17 (c1) = 14 (a2) = 43 (b2) = 64 (c2) = 67 triedny symbol triedna početnosť
Podvojné triedenie kombinovanie dvoch triediacich znakov súčasne, výsledkom sú: asociačné tabuľky (rozmer 2 x 2), oba triediace znaky sú alternatívne kontigenčné tabuľky- aspoň jeden zo znakov má viac ako 2 varianty
Asociačná tabuľka -výsledok triedenia podľa pohlavia (A) a funkcie (C)
Triedenie podľa kvantitatívnych znakov - variačné triedenie Kvantitatívne znaky označujeme písmenami z konca abecedy – X, Y, Z, ... ich obmeny – x1, x2, x3, ..xj.. xn kde j = 1....n Triedenie súboru o rozsahu n na m počet tried. Rozlišujeme: - triedenie jednoduché - rozdelenie početností - skupinové - intervalové rozdelenie početností
Rozdelenie početností Použijeme ho vtedy, keď triediaci znak je diskrétny s malým počtom obmien, variantov n i – absolútne početnosti ( počet nezaopatrených detí) i=1,2,3,4....m x i – hodnota znaku
Rozdelenie početností Použijeme ho vtedy, keď triediaci znak je diskrétny s malým počtom obmien, variantov ni – absolútne početnosti ( počet nezaopatrených detí) i=1,2,3,4.…m m počet tried, obmien xi – hodnota, obmena znaku
Intervalové rozdelenie početností Počet intervalov (m) Rozpätie intervalu (h)
Kumulatívne početnosti Dolná Horná Bežné početnosti Kumulatívne početnosti hranica Absolutne Relatívne ni fi Ni Fi 10 n1 f1=(n1/n)*100 N1=n1 F1=(N1/n)*100 10,5 n2 f2=(n2/n)*100 N2=n1+n2 F2=(N2/n)*100 11 n3 f3=(n3/n)*100 N3=n1+n2+n3 F3=(N3/n)*100 11,5 ... 12 12,5 13 nj fj=(nj/n)*100 13,5 14 nm nm=(nm/n)*100 Nm=n F=100% Spolu n 100% x