ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA
Predikce Predikce bodová a intervalová Ex ante a ex post
Predikce Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná Ex-post - pseudopředpověď
Dělení predikce období extrapolaci do budoucna, extrapolace do minulosti nazývanou jako retrospektiva, znalosti endogenní proměnné v období prognózy na ex-post predikci, kdy známe hodnotu endogenní proměnné v období - pseudopředpověď, ex-ante - klasické chápání předpovědi, znalosti exogenních proměnných v období prognózy na podmíněnou predikci – pro období předpovědi neznáme hodnoty exogenních proměnných, tyto hodnoty musíme také predikovat, předpověď Y je tedy podmíněná předpovědí hodnot X, nepodmíněnou predikci – pro období předpovědi známe hodnoty exogenních proměnných.
Predikce Ex-Ante Podmíněná volbou vysvětlující proměnné vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu Predikce může být bodová nebo intervalová – v GiveWinu 2 možnosti: Intervalovou předpověď můžeme interpretovat tak, že pro opakované výběry daný interval obsahuje se spolehlivostí (1 – α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.
Predikce Ex-post Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci) H1: Chyba je statisticky významná Testujeme pomocí t-statistiky
Příklad 1 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Proveďte predikci bodovou a intervalovou pro disponibilní příjem 211 mld. CZK a cenový index 113. Ověřte, zda je model vhodný k predikci pomocí ex-post predikce.
Ekonomická specifikace = tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu b0 – úrovňová konstanta může být libovolná, vzniká z podmínky, aby součet čtverců reziduí byl minimální b1 – v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami b2 – by mělo být < 0
Příklad – eko1.xls Výstup z GiveWinu: EQ( 1) Modelling y by OLS (using eko1.xls) The estimation sample is: 1966 to 1973 Coefficient Std.Error t-value t-prob Part.R^2 Constant 3.01620 1.032 2.92 0.033 0.6308 x1 0.103550 0.004550 22.8 0.000 0.9904 x2 -0.0979638 0.01583 -6.19 0.002 0.8845 sigma 0.120682 RSS 0.0728202076 R^2 0.997094 F(2,5) = 857.8 [0.000]** log-likelihood 7.44531 DW 1.95 no. of observations 8 no. of parameters 3 mean(y) 10.5 var(y) 3.1325
Regresní nadrovina – zápis: Napozorované hodnoty: Y = 3,016 + 0,104X2 – 0,098X3 + e Vyrovnané hodnoty: Y^ = 3,016 + 0,104X2 – 0,098X3
Intervalový odhad Provést intervalový odhad alespoň u jednoho parametru, který je statisticky významný pro β2: 0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57 0,092 <= β2<= 0,114
Absolutní pružnost dle vzorců: b1 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X2 se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK. b2 = - 0,098 – vzroste-li cenový index X2 o jeden procentní bod a X1 se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. definovány v daných jednotkách
Relativní pružnost pro r. 2003 Y(73) = 13,6; X2(73) = 209, X3(73) = 113 zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 % zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %
Predikce – EX ANTE Bodová predikce Intervalová predikce Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast (SE) 2004 13.7953 0.1207 Dynamic (ex ante) forecasts for y (SE with parameter uncertainty) 2004 13.7953 0.1584 Intervalová predikce S parametrem sigma: S parametrem chyby předpovědi:
Predikce – EX POST Odhadnutý model na období 1996 – 2001 Provedena predikce 2002, 2003 Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast SE Actual Error t-value 2002 12.3717 0.1076 12.1000 -0.271654 -2.524 2003 13.7732 0.1076 13.6000 -0.173184 -1.609 Intuitivní vyhodnocení pomocí % chyby z skutečné hodnoty: X = 0,2716/12,1 = 0,022 = 2,2 % < 5 % Pomocí t-testu: H0: Chyba není st. Významná 2,524 (z výstupu abs hodnota) < 2,57 (tabulková hodnota) → Nezamítáme H0, chyba není statisticky významná.
MULTIKOLINEARITA Podstata Příčiny Důsledky Měření
MULTIKOLINEARITA Multikolinearita = existence více než jednoho vztahu lineární závislost mezi pozorováními vysvětlujících proměnných Kolinearita = existence pouze jednoho lineárního vztahu Pozn. Většinou se v obou případech používá pojem multikolinearita
Multikolinearita
MULTIKOLINEARITA Týká se pouze výběrového vzorku, nikoliv abstraktního modelu !!! multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru Podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými Zda je či není multikolinearita únosná
Příčiny Tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im) Průřezová analýza (např. proměnná příjem a bohatství) Zahrnutí zpožděné endo nebo exo proměnné. Špatně diskretizovaná proměnné pomocí 0, 1
Důsledky Snížená přesnost odhadů regresních koeficientů Velké standardní chyby odhadové funkce MNČ Pochybnosti či nejistotu pokud jde o správnost specifikace modelu Odhady zůstávají nestranné, vydatné Velká citlivost odhadové funkce MNČ na velmi malé změny v matici X Obtížné vyjádření odděleného působení silně kolineárních proměnných.
Měření multikolinearity – Metoda I Použití párových korelačních koeficientů Pouze pro 2 vysvětlující proměnné: multikolinearita je únosná, pokud: rX1X2 ≤ 0,9 a současně koeficient vícenásobné determinace modelu
Párové korelační koeficienty modul PcGive Package → Descriptive Statistics Model → Formulate – Vložím proměnné zvolit nabídku korelační matice
Měření multikolinearity – Metoda II Využívá se pomocných regresí Více vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty) Využívá se koeficientů pomocné regrese Ri2 Pokud máme model Y = f(X1, X2, X3) … z modelu … R2 X1= f (X2,X3) … R12 X2= f (X1,X3) … R22 X3= f (X1,X2) … R32 jsou-li všechna Ri2 < R2, pak je multikolinearita únosná
Příklad 2 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Je v modelu multikolinearita?
Je v modelu multikolinearita? Příklad KUŘE Určete, jak závisí počet prodaných kuřat na níže uvedených proměnných. K dispozici máme roční pozorování od roku 1960 do roku 1982. Y – počet prodaných kuřat (v desítkách milionů kusů) X2 – výše dotace do zemědělství (v miliardách Kč) X3 – cena za kuře (Kč/kilo) X4 – cena vepřového (Kč/kilo) Je v modelu multikolinearita?
Možná otázka do závěrečného testu Predikce Multikolinearita Podstata Příčiny Důsledky Měření