Úvod do štatistického spracovania a vyhodnocovania údajov

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Statistické charakteristiky variability
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
Základní statistické pojmy a postupy
Tloušťková struktura porostu
Základní statistické charakteristiky
Charakteristiky variability
Biostatistika 4. přednáška
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Pohled z ptačí perspektivy
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
© Tom Vespa STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
… jak jsem na tom ve srovnání s ostatními?
Popisná analýza v programu Statistica
Popisná statistika úvod rozdělení hodnot míry centrální tendence
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Kontingenční tabulky v Excelu Základní popisné statistiky.
Úpravy algebrických výrazov
STATISTICKÉ METODY V GEOGRAFII
Úpravy algebrických výrazov
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná statistika: přehled
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
METODOLOGIE MAGISTERSKÉ PRÁCE
Spojitá a kategoriální data Základní popisné statistiky
Lineárna funkcia a jej vlastnosti
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Deskriptivní statistika
Kapitola 3: Centrální tendence a variabilita
Digitalizácia zvuku.
Elektronické testovanie matematickej gramotnosti
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Seminárna práca z matematiky
Katolícke gymnazium Františka Assiského
Priama úmernosť ISCED 2.
Výber maturitných predmetov
Plánovanie a príprava hodiny
Úvod. Porovnávanie celých čísel.
Čo je informatika? Je všeobecne veda o informáciách.
Kvalitatívne heuristiky
PaedDr. Jozef Beňuška
ŠTATISTIKA.
3D Modelovanie prvkov krajiny
História štatistiky Štatistika má nezastupiteľne miesto v modernej spoločnosti využíva sa pri analýze sociálnych a ekonomických javov, a to nielen vo vede.
Grafické riešenie lineárnej rovnice
Ing. Zlatica Molčanová Košice
Úvod do štatistického spracovania a vyhodnocovania údajov – 2. časť
Počtové operácie s celými číslami: sčítanie a odčítanie
POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY
Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne
Střední škola obchodně technická s. r. o.
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

Úvod do štatistického spracovania a vyhodnocovania údajov 10. novembra 2008

Premenné štatistická jednotka premenná hodnota premennej učiteľ Predmetom skúmania v štatistike sú štatistické jednotky – objekty. Každá štatistická jednotka je nositeľom určitých vlastností – znakov, ktoré chceme skúmať. Tieto vlastnosti sa nazývajú premenné alebo štatistické znaky. Premenná nadobúda hodnotu. Premenná jednej štatistickej jednotky v jednom časovom okamihu nadobúda práve jednu hodnotu. štatistická jednotka premenná hodnota premennej učiteľ škola, roky praxe 5. ZŠ Poprad, 25 žiak pohlavie, vek (roky) chlapec, 14 vedomostný test skóre body

Typy premenných podľa spôsobu ich merania: Intervalová (kardinálna, metrická) Poradová (ordinálna) absolútna Nominálna (kategorická) Binárna (dichotomická) Premenné sú zoradené od najvyššej úrovne po najnižšiu.

1. Intervalová (kardinálna) premenná Umožňujú zoradenie objektov, ale aj kvantifikáciu a porovnanie veľkosti rozdielov medzi nimi. Intervalová premenná musí mať určenú jednotku merania a v nej musia byť vyjadrené všetky jej hodnoty. Napríklad teplota (°C), výsledky z testov (počet bodov), výška (cm), hmotnosť (kg), roky praxe (počet rokov), počet obrázkov v učebnici

2. Poradová (ordinálna) premenná Umožňuje zoradenie objektov do poradia, ale nie je možné určiť, aký je medzi jednotlivými objektmi v poradí rozdiel. Ak napríklad rozdelím výsledky testov do kategórií: do 20 bodov, 21-25 bodov, 26 – 30 bodov, ide o poradovú premennú. Ale aj hodnotenie učebnice učiteľmi, hodnotenie prospechu dieťaťa v škole

2. Nominálna (kategorická) premenná Objekt je zaradený vždy do jednej z viacerých možných skupín. Ide o sledovanie tých premenných u ktorých nemá význam určovanie poradia. Napríklad: národnosť, krvná skupina, miesto bydliska, škola,

4. Binárna premenná (dichotomická) Je špecifický prípad nominálnej premennej, kde objekt patrí vždy iba do jednej z dvoch možných kategórií Napríklad: pohlavie, patrí/nepatrí do skupiny, časový okamih pred akciou/po akcii

Typy premenných: Intervalová (kardinálna, metrická) Proporcionálna (pomerová) absolútna Nominálna (kategorická) Binárna (dichotomická) Premenné sú zoradené od najvyššej úrovne po najnižšiu. Štatistická metóda spracovania hodnôt premennej sa nesmie použiť na analýzu premennej meranej na nižšej škále ako vyžaduje metóda.

Tri úrovne využívania štatistiky: Opisná štatistika (sprehľadnenie dát) Analýza dát (zisťovanie vzťahov v dátach) Induktívna štatistika (zovšeobecňovanie a extrapolácia získaných výsledkov z analýzy dát)

Opisná (deskriptívna) štatistika Účel: Sprehľadniť získané údaje (tabuľky, grafické prostriedky) Charakterizovať výbery pomocou kvantitatívnych charakteristík (stredové hodnoty, hodnoty rozptylu)

Jednorozmerová deskriptívna štatistika – intervalové premenné Histogram Škatuľový graf Histogram doplnený o škatuľový graf

Histogram Je typ stĺpcového grafu určený na znázornenie rozdelenia intervalovej premennej. Graf vyjadruje početnosti hodnôt premennej v intervaloch jej hodnôt

Škatuľový graf Horizontálna čiara predstavuje medián, horná hrana škatule 75-y percentil a dolná hrana dvadsiaty piaty percentil. Dĺžka obdĺžnika teda predstavuje stredných 50% hodnôt súboru.

Histogram + škatuľový graf Týmto znázornením sa zvyšuje množstvo informácií obsiahnutých v jednom prehľadnom grafe.

Dvojrozmerná deskriptívna štatistika – intervalové premenné Bivariačný histogram X-Y graf

Bivariačný histogram Ide o rozšírenie histogramu a slúži na znázornenie rozdelenia početnosti do dvoch premenných.

X-Y graf Predstavuje základný graf na znázornenie vzťahu medzi dvoma intervalovými premennými. V prípade veľkého počtu pozorovaní s totožnými hodnotami x a y sa stáva nevhodným.

Viacrozmerná deskriptívna štatistika – intervalové premenné X-Y-Z graf: Zobrazenie do priestoru, pričom bod je daný tromi súradnicami, ktoré predstavujú tri hodnoty troch rôznych premenných.

Jednorozmerná deskriptívna štatistika – nominálne (kategorické) premenné Frekvenčná tabuľka Koláčový graf Stĺpcový graf Kumulatívny stĺpcový graf

Frekvenčná tabuľka Zodpovedá jednostupňovému triedeniu. Obsahuje početnosti podľa kategórií jednej premennej vzdelanie početnosť percento ZŠ 17 2,7 SŠ bez maturity 83 13,3 SŠ s maturitou 428 68,4 VŠ 98 15,6

Koláčový graf Najvhodnejšie grafické znázornenie percent (relatívnych početností) frekvenčnej tabuľky.

Stĺpcový graf Najvhodnejšie grafické zobrazenie absolútnych početností frekvenčnej tabuľky.

Kumulatívny stĺpcový graf Alternatíva ku koláčovému grafu

Dvojrozmerná deskriptívna štatistika – nominálne premenné Kontingenčná tabuľka Kumulatívny stĺpcový graf Stĺpcový graf 3-D stĺpcový graf

Kontingenčná tabuľka Kontingenčná (krížová) tabuľka je metódou organizovania a analýzy údajov podľa skupín, kategórií alebo tried, ktorá umožňuje ich porovnávanie (riadková a stĺpcová premenná). ZŠ SŠ bez M SŠ s M VŠ muž 5 34 179 62 žena 12 49 252 36 ZŠ SŠ SŠ s M VŠ muž 1,81 12,27 63,54 22,38 žena 3,44 14,04 72,21 10,32

Kumulatívny stĺpcový graf Grafické zobrazenie riadkových alebo stĺpcových percent kontingenčnej tabuľky.

Stĺpcový graf Graficky zobrazuje stĺpcové početnosti z kontingenčnej tabuľky.

3-D stĺpcový graf Predstavuje alternatívu k stĺpcovému grafu.

Opisné charakteristiky Miery polohy (aritmetický priemer, geometrický priemer, medián, modus) Miery variability (variačné rozpätie, medzikvartilové rozpätie, rozptyl, štandardná odchýľka, variačný koeficient, koeficient disperzie) Miery tvaru (šikmosť, špičatosť)

1. Miery polohy Aritmetický priemer – najznámejšia stredná hodnota, počíta sa ako súčet všetkých hodnôt vydelených ich počtom

1. Miery polohy Geometrický priemer – je vhodnejšou alternatívou aritmetického priemeru, ak vyjadrujeme hodnoty pomerovej premennej. Používa sa najmä vtedy, keď je premenná skôr súčinom ako súčtom mnohých malých efektov.

1. Miery polohy Medián predstavuje strednú hodnotu súboru, ktorý je zoradený od najmenšej po najväčšiu hodnotu. V prípade párneho počtu hodnôt je medián aritmetický priemer hodnôt na miestach n/2 a n/2+1. Okrem mediánu sa používajú aj kvartily (delia súbor na 4 časti) a percentily (delia súbor na 100 častí). Medián je druhý kvartil resp. päťdesiaty percentil.

1. Miery polohy Modus predstavuje najčastejšie sa vyskytujúcu hodnotu premennej.

2. Miery variability Variačné rozpätie je najjednoduchšou mierou variability. Vypočíta sa ako rozdiel medzi najväčšou a najmenšou hodnotou v súbore. R = x(max) – x(min)

2. Miery variability Medzikvartilové rozpätie – predstavuje rozdiel medzi tretím a prvým kvartilom. Reprezentuje oblasť stredných 50 percent hodnôt premennej.

2. Miery variability Rozptyl je najpoužívanejšou mierou variability. Rovná sa priemernému štvorcu odchýlky hodnoty od priemeru. Čím je rozptyl väčší, tým viac sa údaje odchyľujú od priemeru Počíta sa:

2. Miery variability Štandardná odchýlka je v princípe odmocnený rozptyl, čím sa odstraňuje vplyv umocňovania na získanú hodnotu rozptylu. Je to priemerný rozdiel medzi hodnotami a priemerom pri ignorovaní znamienok. Počíta sa ako odmocnina rozptylu:

2. Miery variability Variačný koeficient predstavuje relatívnu mieru variability. Používa sa na porovnávanie variability medzi súbormi dát s odlišnými priemermi. Počíta sa ako podiel štandardnej odchýlky a priemeru

2. Miery variability Koeficient disperzie predstavuje relatívnu mieru variability, ktorá je iba málo ovplyvnená extrémnymi hodnotami Vypočíta sa:

3. Miery tvaru Šikmosť – meria smer a stupeň asymetrie rozdelenia premennej. Kladná (pravostranná šikmosť) hodnota znamená, že väčšina hodnôt je menšia ako priemer, záporná hodnota (ľavostranná šikmosť) znamená, že väčšina hodnôt je väčšia ako priemer.

3. Miery tvaru Špicatosť – meria hustotu chvostov rozdelenia premennej, t.j. charakterizuje výskyt extrémne vysokých a extrémne nízkych hodnôt