Cvičení 6 – 25. října 2010 Heteroskedasticita

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
Úvod do analýzy rozptylu
Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Testování parametrických hypotéz
Testování statistických hypotéz
Statistické metody v ochraně kulturního dědictví
Odhady parametrů základního souboru
Predikce Zobecněná MNČ
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
4EK211 Základy ekonometrie Heteroskedasticita Cvičení – 8
Lineární regresní analýza Úvod od problému
Náhodná složka G-M předpoklady Vlastnoti bodové odhadové funkce.
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
ZÁKLADY EKONOMETRIE 4. cvičení PREDIKCE MULTIKOLINEARITA
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
ZÁKLADY EKONOMETRIE 8. cvičení MZNČ
4EK416 Ekonometrie Úvod do předmětu – obecné informace
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz (ordinální data)
Testování hypotéz přednáška.
Tloušťková struktura porostu
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Biostatistika 6. přednáška
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Pohled z ptačí perspektivy
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Základy ekonometrie 4EK211
8. Kontingenční tabulky a χ2 test
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
Biostatistika 1. přednáška Aneta Hybšová
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
1. cvičení
Mann-Whitney U-test Wilcoxonův test Znaménkový test
IV..
Popisné charakteristiky statistických souborů. ZS - přesné parametry (nelze je měřením zjistit) VS - výběrové charakteristiky (slouží jako odhad skutečných.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Statistické testování – základní pojmy
Přednáška č. – 4 Extrémní hodnoty a analýza výběrových souborů
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
ORDINÁLNÍ VELIČINY Měření variability ordinálních proměnných
Neparametrické testy pro porovnání polohy
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

Cvičení 6 – 25. října 2010 Heteroskedasticita Základy ekonometrie Cvičení 6 – 25. října 2010 Heteroskedasticita

Náhodná složka Gauss-Markovy předpoklady: E(u) = 0 E(u u´) = σ2 In X je nestochastická matice – E(X´u)=0 X má plnou hodnost (k+1) G-M předpoklady musejí být splněny, aby mohla být k odhadu použita metoda nejmenších čtverců

Náhodná složka u ~ N (0, σ2), kde σ2 je rozptyl modelu, který má být dle G-M předpokladu E(u u´) = σ2 In, resp. E(ui2) = σ2 = konst konstantní a konečný

Náhodná složka - vlastnosti σ2 je konstantní a konečný rozptyl → HOMOSKEDASTICITA porušení G-M předpokladu → HETEROSKEDASTICITA σ2 není konstantní nebo konečná, tj. σ2 je funkcí vysvětlující proměnné náhodná složka může mít v případě heteroskedasticity pro každé pozorování odlišný rozptyl: E(ui2) = σ i2 ≠ konst

Příklad Y – počet chyb při psaní na stroji X – počet hodin strávených cvičením Y = f(X) + u čím více hodin cvičení – tím méně chyb rozptyl větší pro skupinu lidí s nižší praxí někdo se učí rychleji a už od počátku dělá méně chyb než ti, kteří se učí pomaleji a na začátku dělají spoustu chyb s rostoucím počtem hodin praxe se schopnosti jednotlivců začínají sbližovat a rozptyl se tak zmenšuje

Příklad – rozptyl graficky

Příčiny heteroskedasticity Chybná specifikace modelu obvykle vynechání podstatné vysvětlující proměnné Odhad z prostorových dat se značnou variabilitou v jednom náhodném výběru variabilita endogenní proměnné (a tedy i reziduí) může být závislá na některé exogenní proměnné

Příčiny heteroskedasticity Chyby měření s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí Odhad z upravených dat odhad nikoliv na původních pozorováních, ale např. ze skupinových průměrů získaných z tříděných dat

Důsledky heteroskedasticity Bodové odhady parametrů zůstávají nevychýlené a konzistentní nemají však minimální rozptyl – tj. nejsou vydatné a ani asymptoticky vydatné Odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma (s2) jsou vychýlené intervalové odhady nejsou směrodatné statistické testy (t-testy, F-test) ztrácejí na síle

Testování heteroskedasticity Grafický test graf reziduí Parametrické testy Parkův test Glejserův test Whiteův test (implementován v PcGive) Neparametrické testy Spearmanův koeficient korelace pořadí Goldfeldův-Quandtův test

Grafický test reziduí Graf reziduí v závislosti na exogenní nebo Abstraktní model s náhodnou složkou Data Rezidua Graf reziduí v závislosti na exogenní nebo vyrovnané endogenní proměnné Vyhodnocení: rezidua náhodně rozložena → HOMOSKEDASTICITA graf nevypadá úplně náhodně → HETEROSKEDASTICITA

Homoskedasticita rezidua jsou v pásmu závislost reziduí e na exogenní nebo vyrovnané endogenní proměnné

Heteroskedasticita rezidua se rozbíhají závislost reziduí e na exogenní nebo vyrovnané endogenní proměnné

rezidua v pásmu vykazující lineární trend Heteroskedasticita rezidua v pásmu vykazující lineární trend závislost reziduí e na exogenní nebo vyrovnané endogenní proměnné

rezidua v pásmu vykazující kvadratický trend Heteroskedasticita rezidua v pásmu vykazující kvadratický trend závislost reziduí e na exogenní nebo vyrovnané endogenní proměnné

Neparametrické testy Spearmanův koeficient korelace pořadí Goldfeldův-Quandtův test

Spearmanův koeficient korelace pořadí zkoumá korelaci pořadí mezi jednou vysvětlující proměnou a rezidui test je třeba dělat pro každou vysvětlující proměnnou zvlášť počítá se pro konkrétní výběr – třeba pak testovat jeho statistickou významnost pro abstraktní model

Spearmanův koeficient korelace pořadí Postup: Absolutní hodnoty reziduí |ei| seřadíme vzestupně a očíslujeme Pořadové číslo přiřadíme k původním (tj. nesrovnaným) reziduím Absolutní hodnoty exogenní proměnné |Xi| seřadíme vzestupně a očíslujeme Pořadové číslo přiřadíme k původním (tj. nesrovnaným) hodnotám Xi Spočítáme rozdíly v pořadí reziduí a pozorování di = pořadí |ei| - pořadí |Xi| Spočítáme Spearmanův koeficient korelace pořadí

Spearmanův koeficient korelace pořadí vyhodnocení: |re,x| → 0 (resp. |re,x| < 0,8 – 0,9) … je možné očekávat homoskedasticitu |re,x| → 1 (resp. |re,x| > 0,8 – 0,9) … je možné očekávat heteroskedasticitu

Spearmanův koeficient korelace pořadí třeba testovat statistickou významnost pro abstraktní model testuje se přes t-statistiku: H0: homoskedasticita H1: heteroskedasticita vypočtená t hodnota > t1-α/2 (n-k-1) → zamítneme H0 vypočtená t hodnota < t1-α/2(n-k-1) → akceptujeme H0

Goldfeldův-Quandtův test vhodný jen pro časové řady Postup: zvolíme statisticky významnou proměnnou a seřadit ji vzestupně rozdělíme data na dvě stejné poloviny a kolem středu řady vynecháme q hodnot (q ≤ n/4) vypočteme stupně volnosti v vypočteme F(v,v) statistiku

Goldfeldův-Quandtův test ad 3) výpočet stupňů volnosti: ad 4) výpočet F(v,v) statistiky: je součet čtverců reziduí (RSS) pro danou polovinu dat kde

Goldfeldův-Quandtův test Testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita Vyhodnocení: F(v,v) vypočtená > F(v,v) tabulková …akceptujeme heteroskedasticitu na hladině α, v opačném případě přijmeme homoskedasticitu

Parametrické testy Parkův test Glejserův test Whiteův test (v PcGivu) testy s pomocnou regresí většinou potřebujeme n ≥ 30

Parkův test Pomocná regrese: Náhodná složka je neměřitelná - pomocná regrese přes rezidua: Vyhodnocení: t-test u parametru β2 H0: homoskedasticita H1: heteroskedasticita

Glejserův test pomocná regrese na absolutní hodnotě reziduí a formy závislosti: Vyhodnocení: t-test u parametru β2 H0: homoskedasticita H1: heteroskedasticita

Whiteův test vychází z pomocné regrese: et2 = f(X1, X2, X12, X22, X1*X2,…) testuje se koeficient determinace (R2) u této pomocné regrese statistika n* R2 ≈ χ2(k-1) n – rozsah souboru k – počet parametrů pomocné regrese (počet parametrů je uveden ve výstupu ze softwaru)

Whiteův test vyhodnocení: H0: homoskedasticita H1: heteroskedasticita n* R2 > tabulková χα2(k-1) … zamítáme nulovou hypotézu o homoskedasticitě