ZÁKLADY EKONOMETRIE 4. cvičení METODOLOGICKÝ POSTUP ŘEŠENÍ EKONOMETRICKÉHO PROBLÉMU
Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce
Náhodná složka → Porušení: Multikolinearita Gauss-Markovy předpoklady: E(u) = 0 Náhodné vlivy se vzájemně vynulují E(u uT) = σ2 In Konečný a konstantní rozptyl = homoskedasticita → Porušení: Heteroskedasticita Náhodné složky jsou sériově nezávislé → Porušení: Autokorelace X je nestochastická matice – E(XTu) = 0 Veškerá náhodnost je obsažena v náhodné složce X má plnou hodnost k matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → Porušení: Multikolinearita
Vlastnosti bodové odhadové funkce - Malý výběr Počet pozorování n < 30 Nevychýlený = nestranný odhad: E (b) = β b – získáme z více výběrových vzorků pokud E(b) > β – odhady jsou nadhodnoceny, E(b) < β – odhady jsou podhodnoceny Vydatný odhad: standardní chyba regresního koeficientu sb musí být minimální ze všech jiných postupů - to způsobuje, že intervalové odhady jsou nejmenší. Jako nevychýlený odhad může sloužit více statistik, z nichž nejvhodnější je ta, která má minimální rozptyl.
Nestrannost odhadu
Vydatnost odhadu
Vlastnosti bodové odhadové funkce - Velký výběr počet pozorování n ≥ 30 Konzistentní – bodový odhad b je konzistentním odhadem, jestliže jeho hodnota s rostoucím počtem pozorování n konverguje ke skutečnému=populačnímu parametru Asymptoticky nestranný – je to slabší vlastnost, (pokud je odhad konzistentní, tak je i asymptoticky nestranný) Asymptotická vydatnost – rozptyl konverguje k nule rychleji než s použitím jiné odhadové funkce
Asymptotická nestrannost
Asymptotická vydatnost
Konzistence
Příklad Vraťme se k příkladu z minulého cvičení, podívejme se, zda je odhad nestranný? Víme, že v celé populaci platí závislost: Proveďte simulaci – 500krát odhadněte model. Jaká byla nejvyšší hodnota odhadu parametru β? A jaká byla nejnižší hodnota? Soubor: 1.cviceni_LRM_s_resenim.xlsx 11
Možná otázka do závěrečného testu Odvození bodové odhadové funkce a její vlastnosti (rozdělit pro malé a velké výběry). Princip metody MNČ. Gaussovy-Markovovy předpoklady
Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Aplikace
1. Specifikace modelu Orientace v dané ekonomické problematice Určení proměnných Určení vzájemných vazeb mezi proměnnými Formulace hypotéz – v podobě algebraických vztahů (tj. jedné či více rovnic) Specifikace náhodných vlivů
Specifikace modelu Ekonomický model Ekonomicko-matematický model Stanovení základní hypotézy (tj. které proměnné použijeme, jak budou působit, jejich intenzita, apod.) Slovní vyjádření Ekonomicko-matematický model převedení slovního vyjádření do podoby jedné rovnice (jednorovnicový model) soustavy rovnic (vícerovnicový model) Ekonometrický model zahrnutí faktoru nejistoty v podobě náhodné složky
Náhodná složka u modely obvykle pracují s 3 či 4 vysvětlujícími proměnnými – působení ostatních nepodstatných vlivů je zahrnuto v náhodné složce o náhodné složce se předpokládá, že má normální rozdělení se střední hodnotou 0 a rozptylem σ2 u ~ N(0; σ2)
Matematická vs. ekonometrická fce Matematická funkce: 1 vysvětlující proměnná: y = f (x) více vysvětlujících proměnných: y = f (x1, x2, …) Ekonometrická funkce: y = f (x) + u y = f (x1, x2, …) + u
Druhy proměnných v modelu Endogenní tj. vysvětlované, závisle proměnné hodnoty jsou generovány systémem či modelem Exogenní tj. vysvětlující, nezávisle proměnné působí na zkoumaný systém, samy systémem nejsou ovlivňovány jejich hodnoty jsou determinovány mimo systém Predeterminované Exogenní + endogenní-zpožděné
Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití
2. Odhad parametrů Využití disponibilní (tj. výběrové) informace z dat Použití vhodné odhadové techniky
Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití
3. Verifikace Aneb jak se odhadnutý model shoduje s teorií a napozorovanými daty Ekonomická (jestli proměnné modelu mají správný směr a intenzitu) Statistická (ověření přesnosti a významnosti výsledků) Ekonometrická (zda byly dodrženy podmínky pro použití dané odhadové techniky a statistických testů)
Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití
4. Využití Kvalitativní a kvantitativní analýza minulého vývoje Předpovědi (predikce, prognózy) Volba hospodářské politiky analýza různých scénářů simulační experimenty
Příklad 1 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Proveďte predikci bodovou a intervalovou. Ověřte, zda je model vhodný k predikci.
Příklad 2 – data.in7 Odhadněte závislost spotřeby (CONS) na disponibilním důchodu (INC). Proveďte Specifikaci Kvantifikaci Verifikaci Aplikaci Použijte datový soubor data.in7
A. Specifikace CONS – endogenní proměnná (vysvětlovaná) INC – exogenní proměnná (vysvětlující) Forma závislosti: CONSt = β0 + β1INCt +ut Ekonomický předpoklad: S růstem důchodu, roste spotřeba – kladné znaménko u koeficientu β1, β1 náleží do intervalu (0,1) – v dlouhodobém horizontu platí: nemůžu spotřebovat více, než vydělám
B. Kvantifikace Pomocí výběru n = 159, budeme odhadovat model CONSt = b0 + b1INCt + et CONSt^ = b0 + b1INCt Použijeme PcGive a MNČ
B. Kvantifikace
B. Kvantifikace Odhadnutý regresní model: CONSt = -181,27 + 1,186 INCt +et CONSt^ = -181,27 + 1,186 INCt Intervalový odhad parametrů
C. Verifikace ekonomická b1 náleží do intervalu (0,1) ? – nesplňuje! Absolutní pružnost Zvýší-li se důchod (INC) o jednu jednotku, tzn. o jednu miliardu, zvýší se spotřeba (CONS) v průměru o 1,186 miliard, ceteris paribus Relativní pružnost Bere se vždy vzhledem k nějakému datu, v %! Např. pro období 1954-2, Y = 884,528, X = 894,831, qx= 1,1865*884,528/894,831 = 1,173 Zvýší-li se v druhém čtvrtletí roku 1954 disponibilní důchod o jedno %, poté se spotřeba zvýší v průměru o 1,173%.
C. Verifikace statistická Standard Error Standardní chyba regresních koeficientů podle následujícího vztahu Slouží k určení významnosti parametrů, k intervalovým odhadům s je odhad σ – u nás ve výstupu je to sigma
Verifikace statistická – významnost proměnných T-statistika, t-value, t-prob t statistika slouží k určení významnosti jednotlivých parametrů v modelu. H0: βj = 0 ... Nevýznamná proměnná H1: βj ≠ 0 ... Významná proměnná Obecně pro t-statistiku platí popř. p-hodnota ≤ α → zamítám hypotézu H0 o nevýznamnosti proměnné v modelu, proměnná je tedy významná popř. p-hodnota > α → nepodařilo si mi zamítnout hypotézu H0 o nevýznamnsoti proměnné v modelu, proměnná je nevýznamná Na hladině významnosti 5 % zamítáme nulovou hypotézu o nevýznamnosti proměnné INC. Proměnná disponibilní důchod je v modelu významná.
C. Verifikace statistická Pro úrovňovou konstantu neprovádíme statistické vyhodnocení, ale vždy ji ponecháme v modelu. Part. R2 – parciální (dílčí) korelační koeficient Určuje, jak daná proměnná vysvětluje závislou proměnnou bez ohledu na ostatní exogenní proměnné
C. Verifikace statistická Koeficient vícenásobné determinace R2 Hodnotí celkovou kvalitu modelu, určuje, jak se model shoduje s daty Rozptyl Y = Vysvětlený rozptyl + nevysvětlený rozptyl Rozptyl empirických hodnot n – 1 stupně volnosti v obrázku a + b Rozptyl vyrovnaných hodnot .. k – 1 stupně volnosti v obrázku a Reziduální rozptyl (RSS=NSČ) .. n – k stupně volnosti v obrázku b
C. Verifikace statistická Vícenásobný koeficient determinace , pokud 1 – dokonalý model Korigovaný koeficient vícenásobné determinace Používá se pro srovnávání více modelů s jiným počtem vysvětlujících proměnných
C. Verifikace statistická – významnost modelu F-poměr testuje statistickou významnost modelu (využívá se Fischerovo rozdělení) Používá se pokud máme v modelu dvě a více exogenní proměnné. H0: R2 statisticky nevýznamné, β0 = β1 =... βj = 0 H1: R2 statisticky významné, βj ≠ 0 F > F(k – 1, n – k – 1)* … odmítáme H0 ve prospěch H1. [0.000] - počítá nám p-value [číslo] ≤ α → zamítám hypotézu H0, model je tedy významný [číslo] > α → nepodařilo se mi zamítnout hypotézu H0, model je tedy nevýznamný Protože máme v modelu pouze jednu exogenní proměnnou nemusíme vyhodnocovat statistickou významnost modelu
C. Verifikace statistická – zbylý výstup Sigma – Odhad směrodatné chyba (odchylka) náhodné složky u RSS - residua sum of squares, aneb naše NSČ – je to vlastně hodnota naší účelovou funkci, kterou minimalizujeme. Log-likelihood – věrohodnostní poměr – alternativa metody minimálních čtverců, je metoda maximální věrohodnosti
C. Verifikace ekonometrická Ověřuje splnění podmínek pro použití MNČ Testuje se heteroskedasticita, autokorelace, mulikolinearita DW – Durbin-Watson – testuje autokorelaci prvního řádu, budeme řešit později !!!
D. Aplikace Predikce apod. , ukládání vyrovnaných hodnot, reziduí... Predikce – dosazení konkrétních hodnot do regresní funkce
Závěry plynoucí z analýzy Koeficient u proměnné INC nesplňuje ekonomický předpoklad, protože je větší než 1. Z pohledu statistické verifikace je model v pořádku. K tomu, abychom statistickou verifikaci mohli považovat za „právoplatnou“, potřebujeme ověřit, zda byly splněny podmínky pro použití MNČ Toto řešení tedy není úplné, je potřeba doplnit ekonometrickou verifikaci a model se nezdá příliš vhodný z důvodu nesplnění ekonomických předpokladů.
Predikce Predikce bodová a intervalová Ex ante a ex post
Predikce Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná Ex-post - pseudopředpověď
Predikce Ex-Ante Podmíněná volbou vysvětlující proměnné vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu Predikce může být bodová nebo intervalová
Predikce Ex-post Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci) H1: Chyba je statisticky významná Testujeme pomocí t-statistiky