ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Statistická indukce Teorie odhadu.
Vyhodnocení úspěšnosti fiskálních predikcí
Výpočet zásoby porostu na zkusných plochách při požadované přesnosti
Cvičení 9 – Ekonomická funkce nelineární v parametrech :
kvantitativních znaků
4EK211 Základy ekonometrie Modely simultánních rovnic Problém identifikace strukturních simultánních rovnic Cvičení / Zuzana.
Testování statistických hypotéz
Monte Carlo permutační testy & Postupný výběr
Odhady parametrů základního souboru
Kalmanuv filtr pro zpracování signálů a navigaci
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Ekonomická funkce nelineární v parametrech Logistická křivka
Cvičení října 2010.
ZÁKLADY EKONOMETRIE 10 cvičení Cobb-Douglas PF
4EK211 Základy ekonometrie Logistická křivka Umělé proměnné Cvičení /
4EK211 Základy ekonometrie Autokorelace Cvičení /
4EK211 Základy ekonometrie Heteroskedasticita Cvičení – 8
Lineární regresní analýza Úvod od problému
Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce.
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
ZÁKLADY EKONOMETRIE 8. cvičení MZNČ
Analýza variance (Analysis of variance)
Statistika II Michal Jurajda.
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
Růstové a přírůstové funkce
ROZHODOVACÍ ÚLOHY.
Základy ekonometrie Cvičení září 2010.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Základy ekonometrie Cvičení října 2010.
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
ZÁKLADY EKONOMETRIE 10. cvičení Nelineární funkce
Statistická analýza únavových zkoušek
Lineární regrese.
Obecný lineární model Fitované hodnoty and regresní residuály
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
PSY117/454 Statistická analýza dat v psychologii Přednáška 8
Odhad metodou maximální věrohodnost
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Základy ekonometrie 4EK211
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Aplikovaná statistika 2. Veronika Svobodová
METODY STŘEDNĚDOBÉHO PROGNÓZOVÁNÍ SURO jaro 2010.
IV..
Aplikovaná statistika 2.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Základy zpracování geologických dat R. Čopjaková.
Ekonometrie1.část Vyučující Ing. Pavlína Hálová, Ph.D kancelář č.379 tel.linka 2062 Konzultační hodiny: Po 14:00 – 15:
Metody zkoumání závislosti numerických proměnných
INDUKTIVNÍ STATISTIKA
Historická sociologie, Řízení a supervize
Základy statistické indukce
Analýza časových řad Klasický přístup k analýze ČŘ
Historická sociologie, Řízení a supervize
Odhady parametrů základního souboru
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Lineární regrese.
Transkript prezentace:

ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA

Predikce Predikce bodová a intervalová Ex ante a ex post

Predikce Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná Ex-post - pseudopředpověď

Dělení predikce období extrapolaci do budoucna, extrapolace do minulosti nazývanou jako retrospektiva, znalosti endogenní proměnné v období prognózy na ex-post predikci, kdy známe hodnotu endogenní proměnné v období - pseudopředpověď, ex-ante - klasické chápání předpovědi, znalosti exogenních proměnných v období prognózy na podmíněnou predikci – pro období předpovědi neznáme hodnoty exogenních proměnných, tyto hodnoty musíme také predikovat, předpověď Y je tedy podmíněná předpovědí hodnot X, nepodmíněnou predikci – pro období předpovědi známe hodnoty exogenních proměnných.

Predikce Ex-Ante Podmíněná volbou vysvětlující proměnné vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu Predikce může být bodová nebo intervalová – v GiveWinu 2 možnosti: Intervalovou předpověď můžeme interpretovat tak, že pro opakované výběry daný interval obsahuje se spolehlivostí (1 – α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.

Predikce Ex-post Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci) H1: Chyba je statisticky významná Testujeme pomocí t-statistiky

Příklad 1 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Proveďte predikci bodovou a intervalovou pro disponibilní příjem 211 mld. CZK a cenový index 113. Ověřte, zda je model vhodný k predikci pomocí ex-post predikce.

Ekonomická specifikace = tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu b0 – úrovňová konstanta může být libovolná, vzniká z podmínky, aby součet čtverců reziduí byl minimální b1 – v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami b2 – by mělo být < 0

Příklad – eko1.xls Výstup z GiveWinu: EQ( 1) Modelling y by OLS (using eko1.xls) The estimation sample is: 1966 to 1973 Coefficient Std.Error t-value t-prob Part.R^2 Constant 3.01620 1.032 2.92 0.033 0.6308 x1 0.103550 0.004550 22.8 0.000 0.9904 x2 -0.0979638 0.01583 -6.19 0.002 0.8845 sigma 0.120682 RSS 0.0728202076 R^2 0.997094 F(2,5) = 857.8 [0.000]** log-likelihood 7.44531 DW 1.95 no. of observations 8 no. of parameters 3 mean(y) 10.5 var(y) 3.1325

Regresní nadrovina – zápis: Napozorované hodnoty: Y = 3,016 + 0,104X2 – 0,098X3 + e Vyrovnané hodnoty: Y^ = 3,016 + 0,104X2 – 0,098X3

Intervalový odhad Provést intervalový odhad alespoň u jednoho parametru, který je statisticky významný pro β2: 0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57 0,092 <= β2<= 0,114

Absolutní pružnost dle vzorců: b1 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X2 se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK. b2 = - 0,098 – vzroste-li cenový index X2 o jeden procentní bod a X1 se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. definovány v daných jednotkách

Relativní pružnost pro r. 2003 Y(73) = 13,6; X2(73) = 209, X3(73) = 113 zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 % zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %

Predikce – EX ANTE Bodová predikce Intervalová predikce Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast (SE) 2004 13.7953 0.1207 Dynamic (ex ante) forecasts for y (SE with parameter uncertainty) 2004 13.7953 0.1584 Intervalová predikce S parametrem sigma: S parametrem chyby předpovědi:

Predikce – EX POST Odhadnutý model na období 1996 – 2001 Provedena predikce 2002, 2003 Dynamic (ex ante) forecasts for y (SE based on error variance only) Horizon Forecast SE Actual Error t-value 2002 12.3717 0.1076 12.1000 -0.271654 -2.524 2003 13.7732 0.1076 13.6000 -0.173184 -1.609 Intuitivní vyhodnocení pomocí % chyby z skutečné hodnoty: X = 0,2716/12,1 = 0,022 = 2,2 % < 5 % Pomocí t-testu: H0: Chyba není st. Významná 2,524 (z výstupu abs hodnota) < 2,57 (tabulková hodnota) → Nezamítáme H0, chyba není statisticky významná.

MULTIKOLINEARITA Podstata Příčiny Důsledky Měření

MULTIKOLINEARITA Multikolinearita = existence více než jednoho vztahu lineární závislost mezi pozorováními vysvětlujících proměnných Kolinearita = existence pouze jednoho lineárního vztahu Pozn. Většinou se v obou případech používá pojem multikolinearita

Multikolinearita

MULTIKOLINEARITA Týká se pouze výběrového vzorku, nikoliv abstraktního modelu !!! multikolinearita se NETESTUJE, jen měří v jednom konkrétním výběru Podstata zkoumání: intenzita závislosti mezi dvěma nebo více vysvětlujícími proměnnými Zda je či není multikolinearita únosná

Příčiny Tendence časových řad ekonomických ukazatelů (makroúdajů) vyvíjet se stejným směrem (např. HDP, C, I, S, Ex, Im) Průřezová analýza (např. proměnná příjem a bohatství) Zahrnutí zpožděné endo nebo exo proměnné. Špatně diskretizovaná proměnné pomocí 0, 1

Důsledky Snížená přesnost odhadů regresních koeficientů Velké standardní chyby odhadové funkce MNČ Pochybnosti či nejistotu pokud jde o správnost specifikace modelu Odhady zůstávají nestranné, vydatné Velká citlivost odhadové funkce MNČ na velmi malé změny v matici X Obtížné vyjádření odděleného působení silně kolineárních proměnných.

Měření multikolinearity – Metoda I Použití párových korelačních koeficientů Pouze pro 2 vysvětlující proměnné: multikolinearita je únosná, pokud: rX1X2 ≤ 0,9 a současně koeficient vícenásobné determinace modelu

Párové korelační koeficienty modul PcGive Package → Descriptive Statistics Model → Formulate – Vložím proměnné zvolit nabídku korelační matice

Měření multikolinearity – Metoda II Využívá se pomocných regresí Více vysvětlujících proměnných (tj. nelze dělat párové korelační koeficienty) Využívá se koeficientů pomocné regrese Ri2 Pokud máme model Y = f(X1, X2, X3) … z modelu … R2 X1= f (X2,X3) … R12 X2= f (X1,X3) … R22 X3= f (X1,X2) … R32 jsou-li všechna Ri2 < R2, pak je multikolinearita únosná

Příklad 2 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Je v modelu multikolinearita?

Je v modelu multikolinearita? Příklad KUŘE Určete, jak závisí počet prodaných kuřat na níže uvedených proměnných. K dispozici máme roční pozorování od roku 1960 do roku 1982. Y – počet prodaných kuřat (v desítkách milionů kusů) X2 – výše dotace do zemědělství (v miliardách Kč) X3 – cena za kuře (Kč/kilo) X4 – cena vepřového (Kč/kilo) Je v modelu multikolinearita?

Možná otázka do závěrečného testu Predikce Multikolinearita Podstata Příčiny Důsledky Měření