Použité statistické metody Základní popisné statistiky aritmetický průměr směrodatná odchylka variační koeficient Další ukazatelé míry regionálních rozdílů Giniho koeficient koeficient b-konvergence/divergence statistické metody
Směrodatná odchylka momentová charakteristika definována jako odmocnina ze sumy kvadrátů odchylek od aritmetického průměru momentová charakteristika popisuje rozptýlenost hodnot statistického souboru kolem aritmetického průměru Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 smodch 0,30 0,35 0,38 0,57 0,59 0,62 0,53 0,70 0,80 1,26 1,30 Od roku 1995 se směrodatná odchylka zvětšuje – rozptýlenost hodnot kolem střední hodnoty je každý rok větší – rozdíly mezi kraji se zvětšují. statistické metody
Variační koeficient definován jako podíl směrodatné odchylky a aritmetického průměru posuzujeme relativní velikost rozptýlenosti dat vzhledem k průměru počítáme, když chceme porovnat rozptýlenost dat skupin měření stejné proměnné s různým průměrem většinou se udává v procentech Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 varkoef 24,45 24,30 22,63 26,50 25,47 24,95 21,25 26,36 30,37 40,18 39,98 Variační koeficient se v letech 1995 – 2002 udržuje na víceméně konstantní hladině mezi 21 – 26 procenty, od roku 2003 výrazně roste a v roce 2005 je jeho hodnota již 40%. Pokud to dáme ještě do souvislosti se směrodatnou odchylkou, tak zjistíme, že v letech 1995 – 2002 rostly rozdíly mezi kraji, ale současně se zvyšovala také výstavba, takže procentuální podíl směrodatné odchylky a průměru byl stále stejný, v dalších letech rostly rozdíly v bytové výstavbě mezi kraji mnohem rychleji než samotná bytová výstavba. statistické metody
Giniho koeficient definován jako poměr oblasti mezi skutečnou Lorenzovou křivkou distribuční funkce a křivkou jednotné distribuce k oblasti pod jednotnou distribucí udává míru nerovnosti distribuce, používá se tedy pro kvantitativní vyjádření nerovnosti v rozdělení u sledovaného argumentu je to číslo mezi 0 a 1, kde 0 odpovídá dokonalé rovnosti ukazatelů a 1 odpovídá dokonalé nerovnosti Příklad – grafické vyjádření distribuční funkce u počtu dokončených bytů na 1000 obyvatel v krajích České republiky pro rok 1991 Giniho koeficient v roce 1991 je roven 0,14 a v roce 2001 je 0,11. Hodnoty koeficientu se v těchto letech příliš neliší a rovnoměrnost výstavby v rámci krajů je v těchto letech velmi podobná. statistické metody
Koeficient b-konvergence/divergence zobrazuje hodnoty Pearsonova korelačního koeficientu, který měří lineární závislost mezi přírůstkem sledovaného znaku v jednotlivých krajích v daném roce a hodnoty argumentu v předchozím roce může nabývat hodnot od -1 do 1. Blíží-li se koeficient korelace hodnotě 1, existuje mezi proměnnými silná přímá lineární závislost, obdobně koeficent korelace blížící se hodnotě -1 vyjadřuje silnou nepřímou lineární závislost pokud se hodnoty koeficientu korelace blíží nule, říkáme, že sledované proměnné jsou lineárně nezávislé Příklad: Počet dokončených bytů na 1000 obyvatel v jednotlivých krajích České republiky rok 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 beta -0,93 -0,36 -0,37 -0,28 -0,21 -0,26 -0,55 0,42 -0,13 0,82 -0,19 Např. v roce 2003 byla hodnota koeficientu -0,13 a v roce 2004 byl roven 0,82. Tedy v roce 2003 byla lineární závislost mezi přírůstkem počtu dokončených bytů a počtem dokončených bytů v předchozím roce velmi nízká, navíc byly tyto veličiny nepřímo úměrné a naopak v roce 2004 se jednalo o silnou přímou lineární závislost mezi přírůstkem a počtem dokončených bytů v minulém roce. statistické metody
Odhady trendů vývoje daty jsme prokládali přímku používali jsme metody lineární regrese daty jsme prokládali přímku koeficient korelace byl ve většině případů blízký 1, lineární funkce tedy velmi dobře vystihovala data Příklad: Rozestavěné byty celkem – Česká republika rok 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 počet 72356 62117 66172 74726 90552 103191 112530 118785 121705 129609 139132 146801 155202 Vyjádření regresní funkce – viz. graf. Koeficient korelace: 0,98263 Rozestavěné byty celkem – vypočtené hodnoty rok 2006 2007 2008 2009 2010 počet 163102 171095 179089 187083 195077 statistické metody