Použité statistické metody

Slides:



Advertisements
Podobné prezentace
Fakta o vývoji vlastnictví bytů v ČR za posledních 10 let Stanislav Drápal, Český statistický úřad Praha, 18. září 2012.
Advertisements

Statistika.
Výpočet zásoby porostu na zkusných plochách při požadované přesnosti
kvantitativních znaků
Mikroekonomie I Použití grafů v mikroekonomii
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
EDA pro časové řady.
Hodnocení způsobilosti měřících systémů
Regulační diagram je to základní grafický nástroj statistické regulace procesu, který umožňuje posoudit statistickou zvládnutost procesu statisticky zvládnutý.
POPISNÁ STATISTIKA ZPRACOVÁNÍ DAT Výpočet výběrových charakteristik
Statistická chyba a hladina statistické významnosti
Charakteristiky variability
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
Testování hypotéz (ordinální data)
Popisná statistika - pokračování
DATA  INFORMACE Statistická analýza je založena na zhušťování informace – tj. jak s co nejmenšího množství vhodně zvolených údajů vytěžit maximum relevantních.
Statistika Vypracoval: Mgr. Lukáš Bičík
Testování hypotéz přednáška.
Posloupnosti, řady Posloupnost je každá funkce daná nějakým předpisem, jejímž definičním oborem je množina všech přirozených čísel n=1,2,3,… Zapisujeme.
25. října 2004Statistika (D360P03Z) 4. předn.1 Statistika (D360P03Z) akademický rok 2004/2005 doc. RNDr. Karel Zvára, CSc. KPMS MFF UK
Obsah statistiky Jana Zvárová
kvantitativních znaků
DATOVÉ SOUBORY PRO ANALYTICKÉ A PROGNOSTICKÉ PRÁCE NA ÚROVNI SPRÁVNÍCH OBVODŮ OBCÍ S ROZŠÍŘENOU PŮSOBNOSTÍ Doc. RNDr. Alois Andrle, CSc. ÚRS PRAHA, a.s.
Řízení a supervize v sociálních a zdravotnických organizacích
ÚVOD DO STATISTIKY „Jsou tři druhy lží: lži, odsouze-níhodné lži a statistiky“ (Swoboda 1977) Význam statistiky ve vědě Základní pojmy statistiky Statistická.
Aplikace při řízení tržních rizik
Charakteristické rysy a typy jednorozměrného rozdělení četností.
Statistika Ukazatelé variability
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09C17 AutorMgr. Monika Chvostková Období vytvořeníŘíjen.
Statistika Zkoumání závislostí
Charakteristiky variability
Korelace a elaborace aneb úvod do vztahů proměnných
Závislost Vzájemný vztah dvou veličin
Lineární regresní analýza
Biostatistika 6. přednáška
Lineární regrese kalibrační přímky
Charakteristiky variability
Popisná statistika III
Teorie psychodiagnostiky a psychometrie
Experimentální fyzika I. 2
Teorie psychodiagnostiky a psychometrie
Lorenzova křivka a Giniho koeficient
Distribuční funkce diskrétní náhodná proměnná spojitá náhodná proměnná
Biostatistika 8. přednáška
Základy statistiky Autor: Jana Buršová.
Korelace.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
VY_32_INOVACE_21-16 STATISTIKA 2 Další prvky charakteristiky souboru.
Vzájemná závislost - KORELACE
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Základy popisné statistiky
Základy statistiky Základní pojmy. Základy statistiky Statistiku můžeme chápat jako činnost - získávání stat. údajů, jejich zpracování a vyhodnocení jako.
STATISTIKA 1. MOMENTY Vztah mezi momenty v rámci skupin a celku Data rozdělena do několika skupin S 1, …, S k Počty objektů v jednotlivých skupinách n.
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Charakteristiky variability Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
Základy zpracování geologických dat R. Čopjaková.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Prostorová analýza voleb POL 509
STATISTICKÉ CHARAKTERISTIKY
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Spojitá a kategoriální data Základní popisné statistiky
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Prostorová analýza – Seminář 2 popisné statistiky, korelace
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Analýza kardinálních proměnných
Základy popisné statistiky
Vzájemná závislost - KORELACE
Transkript prezentace:

Použité statistické metody Základní popisné statistiky aritmetický průměr směrodatná odchylka variační koeficient Další ukazatelé míry regionálních rozdílů Giniho koeficient koeficient b-konvergence/divergence statistické metody

Směrodatná odchylka momentová charakteristika definována jako odmocnina ze sumy kvadrátů odchylek od aritmetického průměru momentová charakteristika popisuje rozptýlenost hodnot statistického souboru kolem aritmetického průměru Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 smodch 0,30 0,35 0,38 0,57 0,59 0,62 0,53 0,70 0,80 1,26 1,30 Od roku 1995 se směrodatná odchylka zvětšuje – rozptýlenost hodnot kolem střední hodnoty je každý rok větší – rozdíly mezi kraji se zvětšují. statistické metody

Variační koeficient definován jako podíl směrodatné odchylky a aritmetického průměru posuzujeme relativní velikost rozptýlenosti dat vzhledem k průměru počítáme, když chceme porovnat rozptýlenost dat skupin měření stejné proměnné s různým průměrem většinou se udává v procentech Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 varkoef 24,45 24,30 22,63 26,50 25,47 24,95 21,25 26,36 30,37 40,18 39,98 Variační koeficient se v letech 1995 – 2002 udržuje na víceméně konstantní hladině mezi 21 – 26 procenty, od roku 2003 výrazně roste a v roce 2005 je jeho hodnota již 40%. Pokud to dáme ještě do souvislosti se směrodatnou odchylkou, tak zjistíme, že v letech 1995 – 2002 rostly rozdíly mezi kraji, ale současně se zvyšovala také výstavba, takže procentuální podíl směrodatné odchylky a průměru byl stále stejný, v dalších letech rostly rozdíly v bytové výstavbě mezi kraji mnohem rychleji než samotná bytová výstavba. statistické metody

Giniho koeficient definován jako poměr oblasti mezi skutečnou Lorenzovou křivkou distribuční funkce a křivkou jednotné distribuce k oblasti pod jednotnou distribucí udává míru nerovnosti distribuce, používá se tedy pro kvantitativní vyjádření nerovnosti v rozdělení u sledovaného argumentu je to číslo mezi 0 a 1, kde 0 odpovídá dokonalé rovnosti ukazatelů a 1 odpovídá dokonalé nerovnosti Příklad – grafické vyjádření distribuční funkce u počtu dokončených bytů na 1000 obyvatel v krajích České republiky pro rok 1991 Giniho koeficient v roce 1991 je roven 0,14 a v roce 2001 je 0,11. Hodnoty koeficientu se v těchto letech příliš neliší a rovnoměrnost výstavby v rámci krajů je v těchto letech velmi podobná. statistické metody

Koeficient b-konvergence/divergence zobrazuje hodnoty Pearsonova korelačního koeficientu, který měří lineární závislost mezi přírůstkem sledovaného znaku v jednotlivých krajích v daném roce a hodnoty argumentu v předchozím roce může nabývat hodnot od -1 do 1. Blíží-li se koeficient korelace hodnotě 1, existuje mezi proměnnými silná přímá lineární závislost, obdobně koeficent korelace blížící se hodnotě -1 vyjadřuje silnou nepřímou lineární závislost pokud se hodnoty koeficientu korelace blíží nule, říkáme, že sledované proměnné jsou lineárně nezávislé Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 beta -0,93 -0,36 -0,37 -0,28 -0,21 -0,26 -0,55 0,42 -0,13 0,82 -0,19 Např. v roce 2003 byla hodnota koeficientu -0,13 a v roce 2004 byl roven 0,82. Tedy v roce 2003 byla lineární závislost mezi přírůstkem počtu dokončených bytů a počtem dokončených bytů v předchozím roce velmi nízká, navíc byly tyto veličiny nepřímo úměrné a naopak v roce 2004 se jednalo o silnou přímou lineární závislost mezi přírůstkem a počtem dokončených bytů v minulém roce. statistické metody

Odhady trendů vývoje daty jsme prokládali přímku používali jsme metody lineární regrese daty jsme prokládali přímku koeficient korelace byl ve většině případů blízký 1, lineární funkce tedy velmi dobře vystihovala data Příklad: Rozestavěné byty celkem – Česká republika rok 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 počet 72356 62117 66172 74726 90552 103191 112530 118785 121705 129609 139132 146801 155202 Vyjádření regresní funkce – viz. graf. Koeficient korelace: 0,98263 Rozestavěné byty celkem – vypočtené hodnoty rok 2006 2007 2008 2009 2010 počet 163102 171095 179089 187083 195077 statistické metody