Analýza kardinálních proměnných

Slides:



Advertisements
Podobné prezentace
Základní statistická analýza dat z pre- a klinických studií
Advertisements

Statistika.
Statistické funkce v tabulkovém kalkulátoru Excel MS
Třídění dat OA a VOŠ Příbram. Třídění  rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů.
Statistické charakteristiky variability
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Hodnocení způsobilosti měřících systémů
EXPLORATORNÍ STATISTIKA
Charakteristiky variability
KVANTILY OA a VOŠ Příbram.
BOX - PLOT OA a VOŠ Příbram.
Statistika Vypracoval: Mgr. Lukáš Bičík
Tloušťková struktura porostu
Jiří Šafr jiri.safr(zavináč)seznam.cz
také Gaussovo rozdělení (normal or Gaussian distribution)
Obecné a centrální momenty
Nechť (, , P) je pravděpodobnostní prostor:
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Statistika Ukazatelé variability
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09C17 AutorMgr. Monika Chvostková Období vytvořeníŘíjen.
Charakteristiky variability
Průměry aritmetický průměr: geometrický průměr: harmonický průměr:
Lineární regresní analýza
Biostatistika 4. přednáška
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Popisné statistiky. Výskyt strupovitosti se zdá být ve vztahu s obsahem některých chemických prvků “ve slupkách“ hlíz. Některé odrůdy trpí strupovitostí.
Na co ve výuce statistiky není čas
Základy matematické statistiky. Nechť je dána náhodná veličina X (“věk žadatele o hypotéku“) X je definována rozdělením pravděpodobností, s nimiž nastanou.
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
REGIONÁLNÍ ANALÝZA Cvičení 2 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Kurzy eura v roce 2009 k prvnímu dni v měsíci zaokrouhlené na celé Kč Kč28.
© Tom Vespa STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
… jak jsem na tom ve srovnání s ostatními?
Popisná analýza v programu Statistica
1. cvičení
Příjemce podpory – škola: Hotelová škola, Obchodní akademie a Střední průmyslová škola Teplice, Benešovo náměstí 1, p.o. Číslo projektu:CZ.1.07/1.5.00/
Popisná statistika úvod rozdělení hodnot míry centrální tendence
Základy popisné statistiky
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Zlepšení podmínek pro vzdělávání na středních školách Operačního programu Vzdělávání pro konkurenceschopnost Název a adresa školy: Integrovaná střední.
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Kontingenční tabulky v Excelu Základní popisné statistiky.
Popisná statistika I tabulky četností
Statistika 2.cvičení
STATISTICKÉ ZPRACOVÁNÍ DAT (JEDNOROZMĚRNÉ SOUBORY)
Popisná statistika: přehled
Popisná analýza v programu Statistica
STATISTICKÉ CHARAKTERISTIKY
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Spojitá a kategoriální data Základní popisné statistiky
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Střední hodnoty Udávají střed celé skupiny údajů, kolem kterého všechny hodnoty kolísají (analogie těžiště). Aritmetický průměr - vznikne součtem hodnot.
Kapitola 3: Centrální tendence a variabilita
Metodologie pro ISK 2 Úvod do práce s daty
Základní zpracování dat Příklad
Výukový materiál zpracován v rámci projektu EU peníze školám
ASTAc Biostatistika 2. cvičení
Střední škola obchodně technická s. r. o.
Metodologie pro ISK 2 Kontrola dat Popis kategorizovaných dat
Medián, modus Medián Pro medián náhodné veličiny x platí: Modus
Autor: Honnerová Helena
Základy statistiky.
Základy popisné statistiky
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Transkript prezentace:

Analýza kardinálních proměnných Metodologie pro ISK II Analýza kardinálních proměnných

Kardinální proměnné Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily…) Zobrazení: histogram

Míry centrální tendence MODUS je hodnota, která se v datech vyskytuje nejčastěji. MEDIÁN dělí řadu výsledků seřazených podle velikosti na dvě stejně početné poloviny MEDIÁNOVÁ KATEGORIE je ta, ve které je dosaženo 50% všech údajů, postupujeme-li od první kategorie výše. ARITMETICKÝ PRŮMĚR je součet všech hodnot vydělený jejich počtem

Míry centrální tendence Analyze  Descriptive Statistics  Frequencies  Statistics  Mean, Median, Mode

Aritmetický průměr V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč?

Aritmetický průměr V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč?

Analyze – Frequencies - Statistics Co všechno zjišťujeme? MINIMUM MAXIMUM ROZPĚTÍ Analyze – Frequencies - Statistics MIN: minimální hodnota MAX: maximální hodnota RANGE: rozpětí (maximální minus minimální hodnota)

Rozptyl Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty (průměru). vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty.

Směrodatná odchylka SMĚRODATNÁ ODCHYLKA je druhá odmocnina rozptylu, a v podstatě nám říká, uvnitř jakého intervalu okolo průměru leží zvolené procento případů Čím je směrodatná odchylka menší, tím lépe pro aritmetický průměr

Směrodatná odchylka (příklady)

Směrodatná odchylka

Směrodatná odchylka (příklad) Zdroj: http://wilderdom.com/intelligence/IQUnderstandingInterpreting.html

Rozptyl, směrodatná odchylka Koeficient variace Rozptyl a směrodatná odchylka mají vždy stejnou jednotku jako daná proměnná (věk v letech, výška v cm, plat v EUR…) Chceme-li porovnávat mezi sebou různé proměnné (s různými jednotkami), vypočítáme variační koeficient

Směrodatná odchylka, rozptyl Analyze - Frequencies - Statistics

Percentily Nejčastěji používané: MEDIÁN (x50) KVARTILY (x25, x50, x75) DECILY (x10, x20, x30, x40, x50, x60, x70, x80, x90)

Percentily http://finexpert.e15.cz/jak-se-lisi-prumerna-mzda-a-median

Percentily (příklad) „spodních“ 10 % čtenářů čte jen jednu knihu ročně polovina čtenářů přečte do 10 knih ročně tři čtvrtiny čtenářů přečte do 20 knih ročně

Šikmost

Šikmost Symetrické (normální) rozložení - aritmetický průměr, medián a modus mají stejné nebo velmi podobné hodnoty. (0) Pokud je aritmetický průměr větší než medián, který je zase větší než modus, znamená to, že je více případů menších než průměr a naše rozložení je šikmé doprava. (+) Třetí možností je, že je více případů větších než aritmetický průměr. Ten je pak menší než medián a ten je menší než modus. Naše rozložení je šikmé doleva. (-)

Špičatost Pozitivní špičatost Negativní špičatost

Šikmost a špičatost šikmost špičatost

Šikmost a špičatost (příklad)

nejvyšší hodnota výběru, která je Boxploty menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí Velmi podrobné a přehledné vizualizace distribuce spojitých dat nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí nejnižší hodnota výběru, která je větší nebo rovna rozdílu hodnoty dolního kvartilu a 1.5 násobkuinterkvartilového rozpětí

Analyze – Explore - Plots Boxplot (příklad) extremes Analyze – Explore - Plots outliers

Za DÚ: Kolik průměrně naši respondenti kupují knih za rok? Je průměr v tomto případě vhodný ukazatel? Zdůvodněte své stanovisko… Vytvořte boxploty pro přečtené a nakoupené knihy a porovnejte je.

Za DÚ z minula: Vytvořte novou proměnnou spokojenost_2, kde budou jen tři kategorie: Spokojen/a Ani/ani Nespokojen/a Vytvořte novou proměnnou „vek“ a okomentujte rozložení (max, min, středové hodnoty) Z jakých zdrojů získávají knihy muži a ženy? (vytvořte tabulku četností podle pohlaví) Z kolika zdrojů získáváme knihy?