ZÁKLADY EKONOMETRIE 1. cvičení základní pojmy ze statistiky, ekonometrie
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických dat pomocí ekonometrických metod a modelů…“
Něco málo ze statistiky... Pravděpodobnostní rozdělení Testování hypotéz
Příklad 1 – Rozdělení mezd v ČR Průměrná mzda v roce 2006 je 21 440. Téměř dvě třetiny lidí mají plat nižší než je průměrná mzda.
Normální rozdělení
Normální rozdělení
Normální rozdělení - rozptyl
Testování hypotéz Chceme znát hodnoty nějaké veličiny za celou populaci Můžeme zobecnit výběrový průměr a říci, že to je věrohodný odhad průměru celé populace?
Testování hypotéz Problematikou zobecnění informace z výběrového vzorku Vždy ověřujeme nějakou známou informaci, například to může být expertní odhad mzdy Tuto informaci poté konfrontujeme s výsledkem našeho výzkumu na výběrovém vzorku populace. Ve slovníku statistického testování hypotéz Původní informace - nulová hypotéza - H0, Testujme proti alternativní hypotéze - H1.
Příklad 2 Přejeme si testovat průměrnou výšku muže v ČR. Předpokládáme, že má výška normální rozdělení a že průměrná výška muže je 180cm. Provedli jsme výzkum u 20 mužů, jejich výška je uvedena v následující tabulce.
1) Spočítáme výběrové charakteristiky Výběrový průměr Výběrový rozptyl Výběrovou směrodatnou odchylku
2) Definujeme nulovou a alternativní hypotézu H0: μ = 180 (Průměr muže je 180 cm.) H1: μ ≠ 180 (Průměr muže je jiný než 180 cm.) Při testování shody průměrů můžeme použít t-statistiku
3) Definujeme obor přijetí a zamítnutí Najdeme v tabulkách t-hodnotu
4) Vyhodnocení testu Testovaná statistika patří do zóny přijetí H0, říkáme tedy: „Na 5% hladině významnosti se nám nepodařilo zamítnout nulovou hypotézu.“ Neprokázali jsme změnu průměrné výšky muže.
Chyby při testování hypotéz Skutečnost H0 platí H0 neplatí, platí H1 Rozhodnutí Nemůžeme zamítnout H0 Správné rozhodnutí Chyba II. druhu Zamítneme H0 Chyba I. druhu Chyba I. druhu („odsouzení nevinného“) Tato chyba nastává s pravděpodobností Chyba II. druhu („neodsouzení viníka“) Tato chyba nastává s pravděpodobností β (pozor, nepleťte si s parametry modelu).
Hladina významnosti a p-hodnota (p-value) Hladinu významnosti α standardně volíme jako 1%, 5% nebo 10%. Čím nižší hladinu zvolíme, tím je test statisticky významnější. (Tím nižší je pravděpodobnost, že odsoudíme nevinného) Softwary provádí vyhodnocení testu a počítá p-value neboli p-hodnotu P-hodnota uvádí nejnižší hladinu významnosti, při které je možné zamítnout nulovou hypotézu.
Testování hypotéz p-value ≤ α … Zamítáme nulovou hypotézu. Výsledek je statisticky významný. (Laicky: Platí H1) p-value > α … Nepodařilo se nám zamítnout nulovou hypotézu. Výsledek není statisticky významný. (Laicky: Platí H0)
Něco málo z ekonometrie... KLASICKÝ LINEÁRNÍ REGRESNÍ MODEL
Klasický lineární regresní model (KLRM) Příklad: Určete, zda existuje závislost počtu léků, které člověk užívá, na věku. Předpokládáme, že závislost existuje a má lineární tvar: Protože závislost není úplná a neplatí vždy (např. někteří starší lidé neberou léky, jiní mladí jich zase berou hodně) proto do modelu zahrneme náhodný vliv (náhodnou složku u) Toto je model pro celou populaci, hovoříme tedy o ABSTRAKTNÍM MODELU
Klasický lineární regresní model (KLRM) Pro odhad potřebujeme nějaká data (většinou výběr) Toto je model pro konkrétní výběr, hovoříme tedy o KONKRÉTNÍM MODELU
Metoda nejmenších čtverců Jak najít přímku, tak aby co nejlépe popisovala závislost? Tj. byla co nejblíže všem bodům? Chceme minimalizovat součet čtverců odchylek (reziduí)
Příklad Podívejte se jak ovlivňuje náhodná složka odhady v konkrétním výběru. Víte, že v celé populaci existuje závislost: Generujte různé náhodné složky (v MS Excelu) a sledujte, jak se mění ODHADNUTÁ přímka. Excel: 1.cviceni_LRM_s_resenim.xlsx