Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce.

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Cvičení 9 – Ekonomická funkce nelineární v parametrech :
TEORIE ROZHODOVÁNÍ A TEORIE HER
4EK211 Základy ekonometrie Modely simultánních rovnic Problém identifikace strukturních simultánních rovnic Cvičení / Zuzana.
Použité statistické metody
Testování statistických hypotéz
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Klára Galusková Pavla Pokoráková Jan Škarvada
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Cvičení října 2010.
4EK211 Základy ekonometrie Logistická křivka Umělé proměnné Cvičení /
4EK211 Základy ekonometrie Autokorelace Cvičení /
4EK211 Základy ekonometrie Heteroskedasticita Cvičení – 8
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
ZÁKLADY EKONOMETRIE 8. cvičení MZNČ
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Jazyk vývojových diagramů
Testování hypotéz přednáška.
1 Národní informační středisko pro podporu jakosti.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
Základy ekonometrie Cvičení září 2010.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Základy ekonometrie Cvičení října 2010.
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
ZÁKLADY EKONOMETRIE 10. cvičení Nelineární funkce
Lineární regrese.
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Metrologie   Přednáška č. 5 Nejistoty měření.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Základy ekonometrie 4EK211
8. Kontingenční tabulky a χ2 test
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
IV..
Aplikovaná statistika 2.
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

ZÁKLADY EKONOMETRIE 4. cvičení METODOLOGICKÝ POSTUP ŘEŠENÍ EKONOMETRICKÉHO PROBLÉMU

Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce

Náhodná složka → Porušení: Multikolinearita Gauss-Markovy předpoklady: E(u) = 0 Náhodné vlivy se vzájemně vynulují E(u uT) = σ2 In Konečný a konstantní rozptyl = homoskedasticita → Porušení: Heteroskedasticita Náhodné složky jsou sériově nezávislé → Porušení: Autokorelace X je nestochastická matice – E(XTu) = 0 Veškerá náhodnost je obsažena v náhodné složce X má plnou hodnost k matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → Porušení: Multikolinearita

Vlastnosti bodové odhadové funkce - Malý výběr Počet pozorování n < 30 Nevychýlený = nestranný odhad: E (b) = β b – získáme z více výběrových vzorků pokud E(b) > β – odhady jsou nadhodnoceny, E(b) < β – odhady jsou podhodnoceny Vydatný odhad: standardní chyba regresního koeficientu sb musí být minimální ze všech jiných postupů - to způsobuje, že intervalové odhady jsou nejmenší. Jako nevychýlený odhad může sloužit více statistik, z nichž nejvhodnější je ta, která má minimální rozptyl.

Nestrannost odhadu

Vydatnost odhadu

Vlastnosti bodové odhadové funkce - Velký výběr počet pozorování n ≥ 30 Konzistentní – bodový odhad b je konzistentním odhadem, jestliže jeho hodnota s rostoucím počtem pozorování n konverguje ke skutečnému=populačnímu parametru Asymptoticky nestranný – je to slabší vlastnost, (pokud je odhad konzistentní, tak je i asymptoticky nestranný) Asymptotická vydatnost – rozptyl konverguje k nule rychleji než s použitím jiné odhadové funkce

Asymptotická nestrannost

Asymptotická vydatnost

Konzistence

Příklad Vraťme se k příkladu z minulého cvičení, podívejme se, zda je odhad nestranný? Víme, že v celé populaci platí závislost: Proveďte simulaci – 500krát odhadněte model. Jaká byla nejvyšší hodnota odhadu parametru β? A jaká byla nejnižší hodnota? Soubor: 1.cviceni_LRM_s_resenim.xlsx 11

Možná otázka do závěrečného testu Odvození bodové odhadové funkce a její vlastnosti (rozdělit pro malé a velké výběry). Princip metody MNČ. Gaussovy-Markovovy předpoklady

Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Aplikace

1. Specifikace modelu Orientace v dané ekonomické problematice Určení proměnných Určení vzájemných vazeb mezi proměnnými Formulace hypotéz – v podobě algebraických vztahů (tj. jedné či více rovnic) Specifikace náhodných vlivů

Specifikace modelu Ekonomický model Ekonomicko-matematický model Stanovení základní hypotézy (tj. které proměnné použijeme, jak budou působit, jejich intenzita, apod.) Slovní vyjádření Ekonomicko-matematický model převedení slovního vyjádření do podoby jedné rovnice (jednorovnicový model) soustavy rovnic (vícerovnicový model) Ekonometrický model zahrnutí faktoru nejistoty v podobě náhodné složky

Náhodná složka u modely obvykle pracují s 3 či 4 vysvětlujícími proměnnými – působení ostatních nepodstatných vlivů je zahrnuto v náhodné složce o náhodné složce se předpokládá, že má normální rozdělení se střední hodnotou 0 a rozptylem σ2 u ~ N(0; σ2)

Matematická vs. ekonometrická fce Matematická funkce: 1 vysvětlující proměnná: y = f (x) více vysvětlujících proměnných: y = f (x1, x2, …) Ekonometrická funkce: y = f (x) + u y = f (x1, x2, …) + u

Druhy proměnných v modelu Endogenní tj. vysvětlované, závisle proměnné hodnoty jsou generovány systémem či modelem Exogenní tj. vysvětlující, nezávisle proměnné působí na zkoumaný systém, samy systémem nejsou ovlivňovány jejich hodnoty jsou determinovány mimo systém Predeterminované Exogenní + endogenní-zpožděné

Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití

2. Odhad parametrů Využití disponibilní (tj. výběrové) informace z dat Použití vhodné odhadové techniky

Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití

3. Verifikace Aneb jak se odhadnutý model shoduje s teorií a napozorovanými daty Ekonomická (jestli proměnné modelu mají správný směr a intenzitu) Statistická (ověření přesnosti a významnosti výsledků) Ekonometrická (zda byly dodrženy podmínky pro použití dané odhadové techniky a statistických testů)

Metodologický postup Specifikace modelu Odhad parametrů (tj. kvantifikace) Verifikace Využití

4. Využití Kvalitativní a kvantitativní analýza minulého vývoje Předpovědi (predikce, prognózy) Volba hospodářské politiky analýza různých scénářů simulační experimenty

Příklad 1 – eko1.xls Odhadněte závislost maloobchodního obratu na disponibilním příjmu a cenovém indexu. Y – maloobchodní obrat potřeb pro domácnost v mld. CZK X1 – disponibilní příjem v mld. CZK X2 – cenový index Proveďte predikci bodovou a intervalovou. Ověřte, zda je model vhodný k predikci.

Příklad 2 – data.in7 Odhadněte závislost spotřeby (CONS) na disponibilním důchodu (INC). Proveďte Specifikaci Kvantifikaci Verifikaci Aplikaci Použijte datový soubor data.in7

A. Specifikace CONS – endogenní proměnná (vysvětlovaná) INC – exogenní proměnná (vysvětlující) Forma závislosti: CONSt = β0 + β1INCt +ut Ekonomický předpoklad: S růstem důchodu, roste spotřeba – kladné znaménko u koeficientu β1, β1 náleží do intervalu (0,1) – v dlouhodobém horizontu platí: nemůžu spotřebovat více, než vydělám

B. Kvantifikace Pomocí výběru n = 159, budeme odhadovat model CONSt = b0 + b1INCt + et CONSt^ = b0 + b1INCt Použijeme PcGive a MNČ

B. Kvantifikace

B. Kvantifikace Odhadnutý regresní model: CONSt = -181,27 + 1,186 INCt +et CONSt^ = -181,27 + 1,186 INCt Intervalový odhad parametrů

C. Verifikace ekonomická b1 náleží do intervalu (0,1) ? – nesplňuje! Absolutní pružnost Zvýší-li se důchod (INC) o jednu jednotku, tzn. o jednu miliardu, zvýší se spotřeba (CONS) v průměru o 1,186 miliard, ceteris paribus Relativní pružnost Bere se vždy vzhledem k nějakému datu, v %! Např. pro období 1954-2, Y = 884,528, X = 894,831, qx= 1,1865*884,528/894,831 = 1,173 Zvýší-li se v druhém čtvrtletí roku 1954 disponibilní důchod o jedno %, poté se spotřeba zvýší v průměru o 1,173%.

C. Verifikace statistická Standard Error Standardní chyba regresních koeficientů podle následujícího vztahu Slouží k určení významnosti parametrů, k intervalovým odhadům s je odhad σ – u nás ve výstupu je to sigma

Verifikace statistická – významnost proměnných T-statistika, t-value, t-prob t statistika slouží k určení významnosti jednotlivých parametrů v modelu. H0: βj = 0 ... Nevýznamná proměnná H1: βj ≠ 0 ... Významná proměnná Obecně pro t-statistiku platí popř. p-hodnota ≤ α → zamítám hypotézu H0 o nevýznamnosti proměnné v modelu, proměnná je tedy významná popř. p-hodnota > α → nepodařilo si mi zamítnout hypotézu H0 o nevýznamnsoti proměnné v modelu, proměnná je nevýznamná Na hladině významnosti 5 % zamítáme nulovou hypotézu o nevýznamnosti proměnné INC. Proměnná disponibilní důchod je v modelu významná.

C. Verifikace statistická Pro úrovňovou konstantu neprovádíme statistické vyhodnocení, ale vždy ji ponecháme v modelu. Part. R2 – parciální (dílčí) korelační koeficient Určuje, jak daná proměnná vysvětluje závislou proměnnou bez ohledu na ostatní exogenní proměnné

C. Verifikace statistická Koeficient vícenásobné determinace R2 Hodnotí celkovou kvalitu modelu, určuje, jak se model shoduje s daty Rozptyl Y = Vysvětlený rozptyl + nevysvětlený rozptyl Rozptyl empirických hodnot n – 1 stupně volnosti v obrázku a + b Rozptyl vyrovnaných hodnot .. k – 1 stupně volnosti v obrázku a Reziduální rozptyl (RSS=NSČ) .. n – k stupně volnosti v obrázku b

C. Verifikace statistická Vícenásobný koeficient determinace , pokud 1 – dokonalý model Korigovaný koeficient vícenásobné determinace Používá se pro srovnávání více modelů s jiným počtem vysvětlujících proměnných

C. Verifikace statistická – významnost modelu F-poměr testuje statistickou významnost modelu (využívá se Fischerovo rozdělení) Používá se pokud máme v modelu dvě a více exogenní proměnné. H0: R2 statisticky nevýznamné, β0 = β1 =... βj = 0 H1: R2 statisticky významné, βj ≠ 0 F > F(k – 1, n – k – 1)* … odmítáme H0 ve prospěch H1. [0.000] - počítá nám p-value [číslo] ≤ α → zamítám hypotézu H0, model je tedy významný [číslo] > α → nepodařilo se mi zamítnout hypotézu H0, model je tedy nevýznamný Protože máme v modelu pouze jednu exogenní proměnnou nemusíme vyhodnocovat statistickou významnost modelu

C. Verifikace statistická – zbylý výstup Sigma – Odhad směrodatné chyba (odchylka) náhodné složky u RSS - residua sum of squares, aneb naše NSČ – je to vlastně hodnota naší účelovou funkci, kterou minimalizujeme. Log-likelihood – věrohodnostní poměr – alternativa metody minimálních čtverců, je metoda maximální věrohodnosti

C. Verifikace ekonometrická Ověřuje splnění podmínek pro použití MNČ Testuje se heteroskedasticita, autokorelace, mulikolinearita DW – Durbin-Watson – testuje autokorelaci prvního řádu, budeme řešit později !!!

D. Aplikace Predikce apod. , ukládání vyrovnaných hodnot, reziduí... Predikce – dosazení konkrétních hodnot do regresní funkce

Závěry plynoucí z analýzy Koeficient u proměnné INC nesplňuje ekonomický předpoklad, protože je větší než 1. Z pohledu statistické verifikace je model v pořádku. K tomu, abychom statistickou verifikaci mohli považovat za „právoplatnou“, potřebujeme ověřit, zda byly splněny podmínky pro použití MNČ Toto řešení tedy není úplné, je potřeba doplnit ekonometrickou verifikaci a model se nezdá příliš vhodný z důvodu nesplnění ekonomických předpokladů.

Predikce Predikce bodová a intervalová Ex ante a ex post

Predikce Cílem predikce (předpovědi) je kvantitativní odhad endogenní proměnné mimo interval pozorování s využitím minulé i současné informace Ex-ante - podmíněná Ex-post - pseudopředpověď

Predikce Ex-Ante Podmíněná volbou vysvětlující proměnné vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě procentuálního nárůstu Predikce může být bodová nebo intervalová

Predikce Ex-post Vyřadím určitý počet pozorování z modelu, poté odhadnu model, předpovím pozorování a zkontroluji s jejich skutečnou hodnotou. Chyba odhadu H0: Chyba není statisticky významná(model je vhodný k predikci) H1: Chyba je statisticky významná Testujeme pomocí t-statistiky