4EK211 Základy ekonometrie Heteroskedasticita Cvičení 6 - 7 1. 4. – 8 Zuzana Dlouhá
Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady E(u) = 0 náhodné vlivy se vzájemně vynulují E(u uT) = σ2 In konečný a konstantní rozptyl = homoskedasticita → porušení: heteroskedasticita náhodné složky jsou sériově nezávislé → porušení: autokorelace X je nestochastická matice – E(XTu) = 0 veškerá náhodnost je obsažena v náhodné složce X má plnou hodnost k matice X neobsahuje žádné perfektně lineárně závislé sloupce pozorování vysvětlujících proměnných → porušení: multikolinearita 2 2
Heteroskedasticita - obecně rozptyl náhodné složky σ2 není konečný a konstantní, tj. σ2 je funkcí některé exogenní proměnné náhodná složka může mít v případě heteroskedasticity pro každé pozorování odlišný rozptyl: Příklad y = počet chyb při psaní na stroji x = počet hodin strávených cvičením y = f(x) + u čím více hodin cvičení – tím méně chyb rozptyl větší pro skupinu lidí s nižší praxí někdo se učí rychleji a už od počátku dělá méně chyb než ti, kteří se učí pomaleji a na začátku dělají spoustu chyb s rostoucím počtem hodin praxe se schopnosti jednotlivců začínají sbližovat a rozptyl se tak zmenšuje 3 3
Heteroskedasticita - příčiny chybná specifikace modelu vynechání podstatné vysvětlující proměnné nevhodná funkční forma modelu odhad z prostorových dat se značnou variabilitou v jednom náhodném výběru variabilita endogenní proměnné (a tedy i reziduí) může být závislá na některé exogenní proměnné chyby měření s rostoucí hodnotou endogenní proměnné dochází ke kumulaci chyb měření – to zvyšuje rozptyl endogenní proměnné a tedy i rozptyl reziduí odhad z upravených dat odhad nikoliv na původních pozorováních, ale např. ze skupinových průměrů získaných z tříděných dat 4 4
Heteroskedasticita - důsledky bodové odhady parametrů zůstávají nevychýlené a konzistentní nemají však minimální rozptyl – tj. nejsou vydatné a ani asymptoticky vydatné odhady směrodatných chyb bodových odhadů (sbi) a rozptylu sigma (s2) jsou vychýlené intervalové odhady nejsou směrodatné statistické testy (t-testy, F-test) ztrácejí na síle 5 5
Heteroskedasticita – testování – grafický test 6 6
Heteroskedasticita – neparametrické testy Spearmanův test korelace pořadí zkoumá korelaci pořadí mezi jednou vysvětlující proměnou a rezidui test je tedy třeba dělat pro každou vysvětlující proměnnou zvlášť!!! počítá se pro konkrétní výběr – třeba pak testovat jeho statistickou významnost pro abstraktní model Postup Absolutní hodnoty reziduí |ei| seřadíme vzestupně a očíslujeme Pořadové číslo přiřadíme k původním (tj. nesrovnaným) reziduím Absolutní hodnoty exogenní proměnné |xi| seřadíme vzestupně a očíslujeme Pořadové číslo přiřadíme k původním (tj. nesrovnaným) hodnotám xi Spočítáme rozdíly v pořadí reziduí a pozorování: di = pořadí |ei| - pořadí |xi| Spočítáme Spearmanův koeficient korelace pořadí: 7 7
Heteroskedasticita – neparametrické testy 7. Vyhodnocení: |re,x| → 0 (resp. |re,x| < 0,8 – 0,9) … je možné očekávat homoskedasticitu |re,x| → 1 (resp. |re,x| > 0,8 – 0,9) … je možné očekávat heteroskedasticitu třeba testovat statistickou významnost pro abstraktní model testuje se přes t-statistiku: Testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita vypočtená t hodnota > t*1-α/2 (n-k-1) → zamítneme H0 vypočtená t hodnota ≤ t*1-α/2(n-k-1) → akceptujeme H0 8 8
Heteroskedasticita – neparametrické testy – příklad Soubor: CV6_PR1.xls Data: y = průměrný roční výnos cenného papíru x = riziko cenného papíru (směrodatná odchylka) Zadání: Odhadněte závislost průměrného ročního výnosu cenného papíru (y) na riziku (x). Vyhodnoťte heteroskedasticitu s využitím Spearmanova koeficientu korelace pořadí pro α = 0,05. yi = β0 + β1xi + ui, i = 1, 2,...,10 9 9
Heteroskedasticita – neparametrické testy Goldfeldův-Quandtův test Postup: zvolíme statisticky významnou proměnnou a seřadíme datový soubor vzestupně podle této proměnné rozdělíme data na dvě stejné poloviny a kolem středu řady vynecháme q hodnot (q ≤ n/4) vypočteme stupně volnosti v vypočteme F(v,v) statistiku (odhad 2 modelů v EViews a použít Sum Squared resid) 5. Vyhodnocení - testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita F(v,v) > F*(v,v) → akceptujeme heteroskedasticitu na hladině α, v opačném případě přijmeme homoskedasticitu 10 10
Heteroskedasticita – neparametrické testy – příklad Soubor: CV6_PR2.xls Data: y = spotřební výdaje (tis. USD/rok) x = disponibilní příjem (tis. USD/rok) Zadání: Odhadněte závislost spotřebních výdajů (y) na disponibilním příjmu (x). Vyhodnoťte heteroskedasticitu graficky s využitím testu Goldfelda-Quandta pro α = 0,05 uvažujte logaritmickou transformaci modelu a vyhodnoťte heteroskedasticitu s využitím testu Goldfelda-Quandta pro α = 0,05 yi = β0 + β1xi + ui, i = 1, 2,...,30 11 11
Heteroskedasticita – parametrické testy testy s pomocnou regresí většinou potřebujeme n ≥ 30 Parkův test podle Parka je vztah mezi rozptylem a proměnnou (která způsobuje heteroskedasticitu) následovný (pomocná regrese): po zlogaritmování: náhodná složka je neměřitelná, takže pomocná regrese přes rezidua: parametry modelu odhadneme pomocí MNČ a t-testem vyhodnotíme významnost β1 → H0: homoskedasticita H1: heteroskedasticita 12 12
Heteroskedasticita – parametrické testy Glejserův test pomocná regrese na absolutní hodnotě reziduí a formy závislosti: parametry modelu odhadneme pomocí MNČ a t-testem vyhodnotíme významnost β1 → H0: homoskedasticita H1: heteroskedasticita 13 13
Heteroskedasticita – parametrické testy Whiteův test pomocná regrese: et2 = f(x1, x2, x12, x22, x1*x2,…) + v testuje se koeficient determinace (R2) u této pomocné regrese statistika n* R2 ≈ χ2(k-1) n = rozsah souboru k = počet parametrů pomocné regrese Testovaná hypotéza: H0: homoskedasticita H1: heteroskedasticita n* R2 > tabulková χα2(k-1) ... zamítáme nulovou hypotézu o homoskedasticitě EViews – odhad modelu, okno Equation -> View -> Residual Diagnostics White Prob. Chi-Square(k) < 0,01 (α) -> zamítame hypotézu o homoskedasticite 14 14
Heteroskedasticita – parametrické testy – příklady Soubor: CV6_PR3.xls Data: vydaje = průměrné měsíční výdaje placené kreditní kartou (v USD) vek = věk (v letech) prijem = příjem (v tis. USD) Zadání: Odhadněte závislost výdajů na věku a příjmu. Vyhodnoťte heteroskedasticitu s využitím Whiteova testu pro α = 0,05. vydajei = β0 + β1veki + β2prijemi + ui, i = 1, 2,...,72 Výsledek z EViews: Heteroskedasticity Test: White F-statistic 1.317236 Prob. F(5,66) 0.2676 Obs*R-squared 6.532993 Prob. Chi-Square(5) 0.2578 Scaled explained SS 43.20148 Prob. Chi-Square(5) 0.0000 n* R2 = 6,539 < Χ0,052(5) = 11,070 Prob. Chi-Square(5) = 0,2578 > 0,05 => nezamítáme nulovou hypotézu o homoskedasticitě na α = 0,05 15 15
Heteroskedasticita – parametrické testy – příklady Soubor: CV6_PR4.xls Data: prijmy = příjem (v tis. USD) vydaje = výdaje placené kreditní kartou (v tis. USD) Zadání: Odhadněte závislost výdajů na příjmech. Vyhodnoťte heteroskedasticitu s využitím Whiteova testu pro α = 0,01. vydajei = β0 + β1prijmyi + ui, i = 1, 2,...,20 Výsledek z EViews: Heteroskedasticity Test: White F-statistic 61.23720 Prob. F(2,17) 0.0000 Obs*R-squared 17.56228 Prob. Chi-Square(2) 0.0002 Scaled explained SS 6.721933 Prob. Chi-Square(2) 0.0347 n* R2 = 17,562 > Χ0,012(2) = 9,21 Prob. Chi-Square(5) = 0,0002 < 0,01 => zamítáme nulovou hypotézu o homoskedasticitě na α = 0,01 16 16