Základy ekonometrie Cvičení 3 4. října 2010
Dnešní funkce 8 Data: eko1.xls - odhadnout funkci na datech dynamickým jednorovnicovým modelem 8
Výstup PcGive 1. tabulka = hodnocení individuálních odhadů koeficientů 2. tabulka = hodnotí model jako celek dodatečné výstupy PcGive – nabídka TEST ukládají se buď do tištěného výstupu nebo přímo do databáze
Získaný výstup
ROZBOR PRVNÍ TABULKY Z VÝSTUPU
1. sloupec = bodový odhad resp. estimátor jde o odhady získané odhadovou fcí Jak vypadá odhadnutá regresní nadrovina? Ekonomická verifikace/interpretace Pozor: Regresní nadrovina je něco jiného než estimátor !!!
Regresní nadrovina – zápis: Napozorované hodnoty: Y = 3,016 + 0,104X2 – 0,098X3 + e Vyrovnané hodnoty: Y^ = 3,016 + 0,104X2 – 0,098X3
Ekonomická verifikace = tj. zhodnocení odhadnutých koeficientů z hlediska znaménka a intervalu b1 – libovolné, vzniká z podmínky, aby součet čtverců reziduí byl minimální b2 – v intervalu (0,1) pokud nepracujeme s úsporami nebo >0 s úsporami b3 – by mělo být < 0 Ekonomická verifikace - OK
Ekonomická interpretace b1 – bez interpretacee b2 – odhad β2 – absolutní (příjmová) pružnost b3 – odhad β3 – absolutní (cenová) pružnost
Absolutní pružnost dle vzorců: b2 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld CZK) a X3 se nezmění, vzroste maloobchodní obrat potřeb pro domácnost v průměru o 0,104 mld CZK. b3 = - 0,098 – vzroste-li cenový index X3 o jeden procentní bod a X2 se nezmění, klesne maloobchodní obrat potřeb pro domácnost v průměru o 98 miliónu CZK. definovány v daných jednotkách
Absolutní a relativní pružnost každou absolutní pružnost lze převést na pružnost relativní relativní pružnost – dána v % a pro dané období definuje se koeficient relativní pružnosti - q
Relativní pružnost koeficient příjmové pružnosti: koeficient cenové pružnosti: VŽDY PRO NĚJAKÉ OBDOBÍ! (např. pro daný rok)
Relativní pružnost pro r. 73 Y(73) = 13,6; X2(73) = 209, X3(73) = 113 zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 % zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %
2. sloupec = standardní chyba regresního koeficientu dle vzorce: kde s standardní chyba regrese (viz výstup – 2. tabulka, hodnota SIGMA) tj. prvek z diagonály momentové matice
Standardní chyba regrese s = charakteristika výběrového rozptylu po kvantifikaci modelu - pro intervalové odhady (ze statisticky významných bodových odhadů) dle vzorců: při číslování od β0: při číslování od β1:
Součet čtverců reziduí = RSS v metodě nejmenších čtverců hledáme minimum kvadratické formy: RSS – viz výstup, 2.tabulka Součet čtverců reziduí (RSS)
3. sloupec = t-value dle vzorce: v tabulkách – kritická hodnota t-rozdělení (resp. kvantily studentova rozdělení) testuje se hypotéza: H0: βi=0 H1: βi<>0 pokud vypočtená hodnota v absolutní hodnotě větší než tabulková hodnota => platí H1, koeficient je statisticky významný a vysvětlující proměnná je v modelu významná
4. sloupec = t-probability = pravděpodobnost, že nulová hypotéza je pravdivá (tj. koeficient je statisticky nevýznamný, vysvětlující proměnná nemá v modelu smysl) t-prob < 0,05 koeficient je statisticky významný na 5-ti % hladině t-prob < 0,01 koeficient je statisticky významný na 1-ti % hladině
Statistická verifikace pokud nemáme tabulkovou hodnotu pro srovnání postupujeme dle 4. sloupce tabulková hodnota je třeba pro výpočet intervalového odhadu
5. sloupec = parciální koeficient determinace tento sloupec lze využít k testování multikolinearity – více bude rozebráno při práci s náhodnými složkami Y=f(X2,X3)+u pracuje se zde s korelačními koeficienty
Korelační koeficienty párový korelační koeficient - viz korelační matice (Package – Descriptive Statistics) b) dílčí (parciální) korelační koeficient tj. 5. sloupec c) vícenásobný koeficient determinace (tj. R2 – viz. výstup, 2. tabulka)
VÝSTUP PcGive ROZBOR 2. TABULKY
SIGMA (tj. u – kvantifikace – rezidua) standardní chyba regrese [u~N(0,σ2)] charakteristika výběrového rozptylu, který dostaneme po kvantifikaci abstraktního modelu (tj. u – kvantifikace – rezidua) dle vzorců: konstanta modelu s indexem 1: konstanta modelu s indexem 0:
tj. prvek z diagonály momentové matice SIGMA užívá se při výpočtu standardní chyby regresních koeficientů s(bi) vzorec pro výpočet s(bi): tj. prvek z diagonály momentové matice
RSS součet čtverců reziduí RSS = ∑ei2 = ∑eTe užívá se při výpočtu sigma: metoda nejmenších čtverců: RSS → MIN
R^2 a F-test R^2: vícenásobný koeficient determinace F-test: F(k, n-k-1) (k = počet vysvětlujících proměnných k+1 = počet odhadovaných parametrů) tyto statistiky definují vazbu modelu
log-likelihood hodnota věrohodnostní funkce při odhadové metodě – metoda maximální věrohodnosti (MMV) MNČ: ∑eTe → MIN MMV: tj. bere se maximum ze záporných hodnot
MMV vs. MNČ oba odhady dávají stejné výsledky, pokud se pracuje s normálním regresním modelem tj. náhodné složky modelu mají normální rozdělení
DW Durbinova-Watsonova (DW) statistika d užívá se pro testování vlastností náhodných složek test autokorelace prvního řádu
Další řádky: počet pozorování – tj. n počet parametrů – tj. k+1 (vč. konstanty) (počet vysvětlujících proměnných = k) mean (y) – průměr vysvětlované (tj. endogenní) proměnné var (y) – rozptyl vysvětlované proměnné
Test shody modelu s daty Y = β1 + β2 X2 + β3 X3 + u rozptyl Y = vysvětlený rozptyl + nevysvětlený rozptyl C – celkový rozptyl Y V – vysvětlený rozptyl (tj. modelem vysvětlený) N – nevysvětlený rozptyl vysvětlený rozptyl nevysvětlený rozptyl
Vzorce pro výpočet rozptylů Celkový rozptyl C: Vysvětlený rozptyl V: Nevysvětlený rozptyl N:
Koeficient vícenásobné determinace Je-li N=0, pak R2 = 1 nezohledňuje počet vysvětlujících proměnných – hodnota R2 nikdy neklesne přidáním dalších vysvětlujících proměnných do modelu
Korigovaný R2 korigovaný koeficient determinace (tj. R2adj) R2adj < R2 – zvyšováním počtu proměnných roste R2, ale ne R2adj rovnost jen pokud R2 = 1 nebo k = 1
F-statistika (Fisherovo rozdělení) F(k,n-k-1) – náš příklad: k+1=3, n=8, F(2,5) – viz výstup V = R2C N = (1 - R2)C
F-statistika Výstup: vypočtená hodnota + signifikace Závěry stejné jako u t-statistiky Vypočtená hodnota > tabulková hodnota => R2 je statisticky významný, model je statisticky významný H(0): všechna βi = 0 H(1): existuje alespoň jedno βi <> 0