POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Statistické funkce v tabulkovém kalkulátoru Excel MS
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Hodnocení způsobilosti měřících systémů
Charakteristiky variability
DATA  INFORMACE Statistická analýza je založena na zhušťování informace – tj. jak s co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních.
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Tloušťková struktura porostu
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Základní statistické charakteristiky
STATISTICKÉ CHARAKTERISTIKY
Charakteristiky variability
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Na co ve výuce statistiky není čas
ŠkolaStřední průmyslová škola Zlín Název projektu, reg. č.Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávací.
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
… jak jsem na tom ve srovnání s ostatními?
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Úpravy algebrických výrazov
STATISTICKÉ METODY V GEOGRAFII
Úpravy algebrických výrazov
Statistika 2.cvičení
Popisná statistika: přehled
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Lineárna funkcia a jej vlastnosti
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Zásoby ITMS kód projektu „Učíme inovatívne, kreatívne a hravo – učíme pre život a prax“ „Moderné vzdelávanie pre vedomostnú spoločnosť /
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Priama úmernosť ISCED 2.
PaedDr. Jozef Beňuška
Úvod. Porovnávanie celých čísel.
POPULAČNÁ GENETIKA..
Základy štatistiky s využitím systému SAS®
Kvalitatívne heuristiky
Operácie s mocninami s celočíselným mocniteľom
MERANIE, RIADENIE A REGULÁCIA
PaedDr. Jozef Beňuška
doc.Ing. Zlata Sojková, CSc.
Graf kvadratickej funkcie s absolútnou hodnotou
ŠTATISTIKA.
Balík protokolov TCP/IP ( Protocol Suite )
3D Modelovanie prvkov krajiny
Základy teórie chýb.
Úvod do štatistického spracovania a vyhodnocovania údajov
Ing. Zlatica Molčanová Košice
Úvod do štatistického spracovania a vyhodnocovania údajov – 2. časť
Počtové operácie s celými číslami: sčítanie a odčítanie
Základné parametre obrazu II.
INDEXY.
DEKOMPOZÍCIA ČASOVÝCH RADOV
ZNALOSTNÉ SYSTÉMY prednáška č. 4
ZNALOSTNÉ SYSTÉMY prednáška č. 4
3D modelovanie Polygony
V ä z b y Chemická väzba.
Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne
Statistika a výpočetní technika
Analýza kardinálních proměnných
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Transkript prezentace:

POPISNÉ (DESKRIPTÍVNE) CHARAKTERISTIKY

doc.Ing. Peter Obtulovič,CSc Triedenie síce poskytuje celkový prehľad o základnej štruktúre skúmaného štatistického súboru, ale hlavne pri porovnávaní viacerých súborov len pomocou radov rozdelenia početností by bolo veľmi nepružné a nepresné. Preto sa snažíme skoncentrovať informácie obsiahnuté v získaných údajoch o štatistickom znaku formou zodpovedajúcich charakteristík, ktoré by dostatočne spoľahlivo popisovali rozhodujúce vlastnosti skúmaného súboru. Medzi rozhodujúce vlastnosti štatistických znakov zaraďujeme polohu (úroveň), kolísanie (variabilitu), šikmosť (asymetriu) a špicatosť (exces). Číselné charakteristiky koncentrovanou formou – jedným číslom – vyjadrujú určitú vlastnosť skúmaného štatistického znaku (väčšinou sú použiteľné pre kvantitatívne štatistické znaky, len niektoré pre kvalitatívne štatistické znaky) Popisné charakteristiky delíme na: charakteristiky polohy (úrovne) charakteristiky variability (premenlivosti) charakteristiky šikmosti (asymetrie) charakteristiky špicatosti (excesu) Základné Doplnkové doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Číselné charakteristiky polohy Za rozhodujúcu vlastnosť štatistického znaku považujeme jeho polohu (úroveň alebo koncentráciu). Meria sa pomocou stredných hodnôt, ktoré charakterizujú polohu znaku jedným číslom, nachádzajúcim sa medzi minimálnou a maximálnou hodnotou znaku v súbore. Charakteristiky polohy sú čísla spĺňajúce tieto požiadavky: musia byť jednoznačne, presne definované pri ich výpočte sa berú do úvahy všetky jednotky štatistického súboru v štatistickom súbore musia byť ľahko zistiteľné ich vlastnosti umožňujú porovnanie stredných hodnôt za niekoľko súborov Stredné hodnoty sa najčastejšie delia na dve skupiny: priemery ostatné stredné hodnoty Priemery sú stredné hodnoty počítané zo všetkých údajov štatistického súboru, pričom poskytujú v koncentrovanej forme informácie o polohe hodnôt štatistického znaku. Najdôležitejšie sú priemer aritmetický, harmonický, geometrický a kvadratický. doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Najrozšírenejším z priemerov je aritmetický priemer , ktorý zo zistených hodnôt x1, x2 ... xn, vypočítame: Aritmetický priemer počítaný podľa vzťahu (2.1) sa nazýva jednoduchý aritmetický priemer. Ak sú hodnoty štatistického znaku usporiadané do radu rozdelenia početností, resp. do intervalového rozdelenia početností aritmetický priemer vypočítame: Početnosti ni , fi udávajú váhu jednotlivých variantov znaku x1, x2 ... xn, čo vedie k názvu aritmetického priemeru počítaného podľa vzťahu (2.2) vážený aritmetický priemer. Pri výpočte číselných charakteristík z intervalového rozdelenia početností sa prepočíta stred intervalu : kde i =1,2 ... m doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Aritmetický priemer v oboch uvedených výpočtových tvaroch predstavuje hodnotu znaku, ktorú vypočítame ako súčet všetkých hodnôt znaku delenú ich počtom. Z definície aritmetického priemeru bezprostredne vyplývajú jeho dôležité vlastnosti:   stálosť súčtu hodnôt tz.: ak každú hodnotu znaku nahradíme aritmetickým priemerom súčet sa nezmení. 2. súčet odchýlok hodnôt znaku od aritmetického priemeru sa rovná nule. 3. súčet štvorcov odchýlok hodnôt znaku od aritmetického priemeru je minimálny (tj. menší ako súčet odchýlok hodnôt znaku od ľubovoľné zvoleného čísla a) doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc 4. Aritmetický priemer konštánt je rovný tejto konštante. 5. Ak násobíme alebo delíme jednotlivé triedne početnosti v štatistickom súbore ľubovoľnou konštantou, aritmetický priemer sa nezmení. 6. Ak pripočítame (odpočítame) k jednotlivým hodnotám znaku konštantu, zvýši (zníži) sa o túto konštantu i aritmetický priemer. V prípade násobenia (delenia) jednotlivých hodnôt znaku konštantou je touto konštantou násobený (delený) aj aritmetický priemer.   Aritmetický priemer sa ako charakteristika polohy hodnôt znaku v štatistickom súbore používa najčastejšie pre jeho jednoduchý výpočet a výhodné matematické vlastnosti. Na druhej strane si však treba uvedomiť, že aritmetický priemer je citlivý na extrémne hodnoty znaku, čím môže podstatne skresliť jeho samotnú interpretáciu. doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Harmonický priemer sa používa vtedy ak je medzi hodnotami znaku a výsledným javom nepriamy vzťah, tj. váhy hodnôt znaku v štatistickom súbore sú dané nepriamo. jednoduchý harmonický priemer vypočítame: vážený harmonický priemer vypočítame: Geometrický priemer sa používa na spriemerovanie hodnôt štatistického znaku, medzi ktorými je multiplikatívny vzťah. jednoduchý geometrický priemer vypočítame doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc vážený geometrický priemer vypočítame: S geometrickým priemerom sa v praxi stretneme pri výpočte priemerného koeficienta rastu a v teórii indexov.   Nakoniec sa ešte zmienime o kvadratickom priemere, ktorý má síce malé praktické použitie, ale môžeme sa s ním stretnúť pri mierach variability, kedy je jedna z nich (smerodajná odchýlka) vlastne kvadratickým priemerom odchýlok jednotlivých hodnôt štatistického znaku od ich aritmetického priemeru. Jednoduchý kvadratický priemer vypočítame: resp. vážený kvadratický priemer doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Medzi uvedenými štyrmi typmi priemerov platí relácia nerovnosti:   Rovnosť vo vzťahu (2.12) platí len v prípade, kedy sú všetky hodnoty znaku v súbore rovnaké, ak sa odlišuje aspoň jedna hodnota platí už relácia ostrej nerovnosti. Ostatné stredné hodnoty sú také stredné hodnoty, ktoré v skúmaných štatistických súboroch zaujímajú charakteristickú polohu a ich veľkosť nezáleží od veľkosti všetkých hodnôt štatistického súboru, ale len od ich rozloženia v tomto súbore. Preto ich používame hlavne pri výskyte extrémnych hodnôt v skúmanom súbore. Medzi ostatné stredné hodnoty zaraďujeme modus, medián a kvantily.  Modus definujeme ako hodnotu skúmaného štatistického znaku, ktorá sa v súbore najčastejšie vyskytuje. Hlavne pri výskyte extrémnych hodnôt, alebo pri výraznej koncentrácii znaku na začiatku resp. na konci oboru hodnôt sa môže modus značne odchýliť od priemeru, pričom však vernejšie charakterizuje polohu. Modus tak predstavuje najtypickejšiu hodnotu daného znaku v súbore, charakterizovanú vrcholom rozdelenia početností. Podľa počtu vrcholov rozlišujeme jednovrcholové rozdelenie početností a viacvrcholové rozdelenie početností. Väčší počet vrcholov rozdelenia početností než jeden má príčinu v nerovnorodosti skúmaného štatistického súboru.   doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Modus vypočítame z radu rozdelenia početností ako hodnotu znaku s maximálnou absolútnou početnosťou, tj.: resp. z intervalového rozdelenia početností:     kde a – dolná hranica modálneho, tj. najpočetnejšieho intervalu h – šírka modálneho intervalu d0 – diferencia absolútnych početností modálneho intervalu a predchádzajúceho d1– diferencia absolútnych početností modálneho intervalu a nasledujúceho doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Medián definujeme ako prostrednú hodnotu usporiadaného štatistického súboru, ktorá ho rozdeľuje na dva početne rovnako veľké čiastkové súbory, pričom rovnaký počet štatistických jednotiek je menší ako medián a rovnaký počet štatistických jednotiek je väčší ako medián. Pri výpočte mediánu je potrebné rozlišovať či má súbor párny alebo nepárny počet štatistických jednotiek. Poradie mediánového člena r v štatistickom súbore s nepárnym počtom štatistických jednotiek vypočítame: Pri výpočte mediánu z intervalového rozdelenia početností musíme určiť mediánový interval, tj. interval v ktorom leží (v prípade že n je nepárne) resp. ležia (v prípade, že n je párne) prostredné hodnoty. Ich poradie vypočítame analogicky ako v predchádzajúcom prípade tj. pre nepárny počet podľa vzťahu (2.15), resp. pre párny počet podľa vzťahu (2.17) a medián vypočítame podľa vzťahu ( 2.19): doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Kvantil je hodnota, ktorá rozdeľuje usporiadaný súbor hodnôt určitého štatistického znaku na dve časti, jedna obsahuje hodnoty, ktoré sú menšie (alebo rovnaké) ako kvantil, druhá časť obsahuje hodnoty, ktoré sú väčšie (alebo rovnaké) ako kvantil. Polohu kvantilu v štatistickom súbore vyjadrujeme v percentách. Tak napríklad 50 % kvantil je medián. Medzi často používané kvantily patria kvartily, decily a percentily. Kvartily sú hodnoty, ktoré delia usporiadaný štatistický súbor na štyri časti, pričom každá z týchto častí obsahuje práve 25 % jednotiek. Kvartily sú tri. Dolný kvartil oddeľuje štvrtinu najnižších hodnôt znaku. Prostredný kvartil je pochopiteľne medián a horný kvartil , ktorý oddeľuje 75 % hodnôt znaku od zostávajúcich 25 % najvyšších hodnôt znaku. Podobne sú definované decily , ktoré delia usporiadaný súbor na desať rovnako početných častí. Percentily , delia usporiadaný súbor na 100 rovnako početných častí. doc.Ing. Peter Obtulovič,CSc

Vzájomná poloha modusu, mediánu a aritmetického priemeru v štat. súbore - symetrické rozdelenie X =  _ X ~ - asymetrické rozdelenie pravostranné ľavostranné X <  ~ X _ < X  ~ X _ doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Číselné charakteristiky variability.   Variabilita je popri polohe štatistického znaku druhou dôležitou vlastnosťou vyjadrujúcou kolísanie (premenlivosť) hodnôt štatistického súboru. Často sa stretávame so situáciou, že rozdelenia početností môžu mať zhodnú polohu, ale pritom sa významne odlišujú. Odlišnosť je najčastejšie spôsobená  rozdielom v maximálnych a minimálnych hodnotách, rozdielmi medzi jednotlivými hodnotami znaku navzájom, rozdielom medzi jednotlivými hodnotami znaku a strednou hodnotou, v rôznom rozložení početnosti hodnôt znaku v súbore, čo sa prejavuje v určitých špecifických vlastnostiach každého štatistického súboru. Variabilita hodnôt znaku v štatistickom súbore môže mať príčiny subjektívneho aj objektívneho charakteru. Pri skúmaní štatistických znakov sa snažíme o čo najväčšie obmedzenie variability subjektívneho charakteru, no aj napriek tomu sa nedá v praxi úplne vylúčiť, musíme teda pri jej analýze uvažovať aj s jej prítomnosťou v štatistickom súbore. Na meranie variability sa najčastejšie používajú tieto miery: ● miery variability, ktorých veľkosť ovplyvňujú len niektoré hodnoty v súbore variačné rozpätie kvantilové rozpätie kvartilové rozpätie doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc ● miery variability, ktorých veľkosť je závislá od každej hodnoty znaku vyjadrené v absolútnych jednotkách rozptyl štandardná (smerodajná) odchýlka ● miery variability, ktorých veľkosť je závislá od každej hodnoty znaku vyjadrené v relatívnej forme variačný koeficient. doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Rozptyl má výhodné vlastnosti, pre ktoré je vhodný nielen ako miera variability štatistického súboru, ale používa sa aj pri konštrukcii zložitejších štatistických charakteristík. Aby sme mohli vyjadriť variabilitu štatistického znaku v pôvodných merných jednotkách často sa popisuje pomocou kladne vzatej odmocniny z rozptylu, ktorá sa nazýva štandardná (smerodajná) odchýlka :   Štandardná odchýlka vyjadruje variabilitu štatistického znaku v pôvodných merných jednotkách, pričom je definovaná ako kvadratický priemer odchýlok jednotlivých hodnôt znaku od jeho aritmetického priemeru. doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Doteraz uvedené miery variability poskytujú v koncentrovanej podobe informácie o veľkosti variability určitého štatistického znaku v pôvodných merných jednotkách, no nepostačujú pri porovnávaní variability niekoľkých súborov, vyjadrených v rôznych merných jednotkách, poprípade aj v rovnakých merných jednotkách , ale s rôznou úrovňou hodnôt znaku. V takýchto prípadoch používame relatívne charakteristiky variability. Tie vylučujú vplyv rôznej úrovne alebo vplyv merných jednotiek tým, že charakteristiky absolútnej variability dávajú do pomeru s aritmetickým priemerom alebo mediánom. Najznámejšou mierou relatívnej variability je variačný koeficient : definovaný ako pomer štandardnej odchýlky a aritmetického priemeru. Variačný koeficient je bezrozmerné číslo, jeho stonásobok udáva variabilitu v percentách. Podľa veľmi hrubého pravidla variačný koeficient vyšší ako 30 – 40 % je znakom značnej nesúrodosti štatistického súboru. Možnosť interpretovať variačný koeficient v % dosť často zvádza užívateľov k  chápaniu jeho definičného oboru od 0 % do 100 %, resp. od 0 do 1. Je to zásadný omyl, a to už preto, že nejde o štruktúrny ukazovateľ, v ktorom by súčet zložiek dával 100 % celku. Vzhľadom k tomu, že priemer môže byť i číslo záporné ( napr. priemerná teplota v januári u nás na Slovensku, či záporný zisk v súbore podnikov ), nie je možné vylúčiť, že variačný koeficient je aj číslo záporné. Všeobecne je teda definičným oborom interval . Špeciálnym prípadom je situácia, keď sa aritmetický priemer rovná nule, kedy nie je možné variačný koeficient vypočítať ( delenie nulou je z matematického hľadiska neprípustné ). doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Miery šikmosti a špicatosti   Miery šikmosti sú založené na porovnaní stupňa koncentrácie malých hodnôt sledovaného štatistického znaku so stupňom koncentrácie veľkých hodnôt tohto znaku. Rovnaký stupeň hustoty malých a veľkých hodnôt sa prejavuje v symetrii tvaru rozdelenia početností. Väčší stupeň koncentrácie malých hodnôt v porovnaní s koncentráciou veľkých hodnôt sa prejaví zošikmením tvaru rozdelenia doľava (príslušná miera šikmosti je kladná). Naopak väčšia koncentrácia veľkých hodnôt v porovnaní s hustotou malých hodnôt sa prejaví spravidla zošikmením tvaru rozdelenia početností doprava (príslušná miera šikmosti je záporná). doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc a) Pearsonova miera šikmosti =0 symetrické rozdelenie >0 pozitívna asymetria 0 negatívna asymetria b) Koeficient šikmosti (stručne šikmosť) - jednoduchá forma - vážená forma 1 = 0 symetrické rozdelenie 1 > 0 pozitívna (ľavostranná) asymetria 1 < 0 negatívna (pravostranná) asymetria doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc Miery špicatosti sú založené na porovnávaní stupňa koncentrácie hodnôt prostrednej veľkosti so stupňom nahustenia ostatných hodnôt. Ak je podiel početnosti prostredných hodnôt porovnateľný s početnosťami ostatných, resp. všetkých hodnôt premennej, špicatosť sa prejavuje spravidla plochým tvarom rozdelenia početností, naopak väčší stupeň koncentrácie prostredných hodnôt v porovnaní s početnosťami všetkých ostatných hodnôt sa prejaví špicatým tvarom rozdelenia početností. doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc

doc.Ing. Peter Obtulovič,CSc koeficient špicatosti - 2 bezrozmerné číslo 2 = 0 normálne rozdelenie 2 < 0 plochšie rozdelenie 2 > 0 špicatejšie rozdelenie - jednoduchá forma - vážená forma doc.Ing. Peter Obtulovič,CSc