Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Statistická indukce Teorie odhadu.
Testování parametrických hypotéz
Jednovýběrové testy parametrickch hypotéz
A5M33IZS – Informační a znalostní systémy Testování modelů.
Testování statistických hypotéz
Monte Carlo permutační testy & Postupný výběr
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
P‑value ano, či ne? Roman Biskup
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
1 Hodnocení geologických dat pomocí matematické statistiky Petr Čoupek 740/742/ IT spec.
Testování hypotéz přednáška.
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Náhodná proměnná Rozdělení.
Testování hypotéz vymezení důležitých pojmů
Základy ekonometrie Cvičení září 2010.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Základy ekonometrie Cvičení října 2010.
Odhady parametrů základního souboru
Základy ekonometrie Cvičení 3 4. října 2010.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Lineární regrese.
Simultánní rovnice Tomáš Cahlík
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Heteroskedasticita Tomáš Cahlík 8. týden
Pohled z ptačí perspektivy
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Základy ekonometrie 4EK211
8. Kontingenční tabulky a χ2 test
Vícenásobná regrese s kvalitanivní informací Tomáš Cahlík 6. týden
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
T - testy Párový t - test Má se zjistit, zda se sjíždějí přední pravé pneumatiky stejně jako přední levé pneumatiky. Bylo vybráno 6 vozů stejné značky:
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
PSY717 – statistická analýza dat
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
Základy testování hypotéz
IV..
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Statistické testování – základní pojmy
Přednáška č. 3 – Posouzení nahodilosti výběrového souboru
t-test Počítání t-testu t statistika Měření velikosti efektu
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ
Odhady parametrů základního souboru
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Úvod do statistického testování
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Úvod do induktivní statistiky
Lineární regrese.
7. Kontingenční tabulky a χ2 test
Základy statistiky.
Transkript prezentace:

Lineární regresní model Statistická inference Tomáš Cahlík 4. týden

Obsah Klasický lineární regresní model (CLM) Klasický lineární regresní model (CLM) Testování hypotéz o jednom parametru: t- test a intervaly spolehlivosti Testování hypotéz o jednom parametru: t- test a intervaly spolehlivosti Testování hypotéz o jedné lineární kombinaci parametrů Testování hypotéz o jedné lineární kombinaci parametrů Testování vícenásobných lineárních omezení: F-test Testování vícenásobných lineárních omezení: F-test Shrnutí Shrnutí Doporučené samostudium Doporučené samostudium

CLM  Připomeňme si G-M předpoklady pro průřezová data: 1. (Populační) model je lineární v parametrech 2. Výběrový soubor o velikosti n je získán z populace náhodným výběrem 3. Neexistuje perfektní kolinearita mezi regresory (U jednoduché regrese jsme měli formulaci: Výběrový rozptyl regresoru je větší než nula) 4. Podmíněná střední hodnota náhodné složky je nula 5. Podmíněný rozptyl náhodné složky je konstantní a konečný (tzv. homoskedasticita)  V klasickém LRM je přidán předpoklad normality 6. Náhodné složky jsou normálně rozdělené s očekávanou hodnotou 0 a rozptylem…. A jsou nezávislé na vysvětlujících proměnných

CLM  Předpoklad 6 dubluje některé G-M předpoklady  Pokud jsou splněny předpoklady CLM, mají OLS estimátory nejmenší rozptyl ze všech možných nestranných estimátorů (u G-M předpokladů jen ze všech lineárních nestranných estimátorů)  Pokud jsou splněny předpoklady CLM, platí  4.1 druhá rovnice

CLM  Předpoklad 6 dubluje některé G-M předpoklady  Pokud jsou splněny předpoklady CLM, mají OLS estimátory nejmenší rozptyl ze všech možných nestranných estimátorů (u G-M předpokladů jen ze všech lineárních nestranných estimátorů)  Pokud jsou splněny předpoklady CLM, platí  4.1 druhá rovnice

Testování hypotéz o jednom parametru: t-test  Protože neznáme sd…., při testování hypotéz o jednom parametru beta vycházíme z věty: Pokud jsou splněny předpoklady CLM, platí  4.3

Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti  Nulová hypotéza, alternativní hypotéza, testovací statistika, jednostranný test, dvoustranný test, hladina významnosti, interval spolehlivosti, intervalový odhad, p-hodnota  Statistické tabulky Statistické tabulky Statistické tabulky  Při rostoucích stupních volnosti se t-rozdělení přibližuje normovanému normálnímu rozdělení. Pokud je počet stupňů volnosti vyšší než 120, je rozdíl prakticky zanedbatelný.

Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti  Příklad 1 (z minulého týdne): HO je

Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti  Příklad 2 (z minulého týdne): HO je

Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti  Správná formulace závěru je: „Podařilo (Nepodařilo) se nám odmítnout nulovou hypotézu na příslušné hladině významnosti“ Formulace „ Přijímáme nulovou hypotézu na příslušné hladině významnosti“ je NESPRÁVNÁ Formulace „ Přijímáme nulovou hypotézu na příslušné hladině významnosti“ je NESPRÁVNÁ

Testování vícenásobných lineárních omezení: F-test  Testování významnosti modelu jako celku  Nulová hyptéza: 4.44  Testovací statistika  Má F-rozdělení s k, n-k-1 stupni volnosti  Bývá standardním výstupem ekonometrických software

Testování vícenásobných lineárních omezení: F-test  F-test můžeme použít na testování libovolné kombinace lineárních omezení.  Př. 2 – pokračování:  Můžeme testovat i jednu proměnnou, ale F-test má menší sílu než t-test a nemůže být použit pro jednostranný test

Testování vícenásobných lineárních omezení: F-test  Př. 3: Závislost mzdy na vzdělání rodičů

Testování vícenásobných lineárních omezení: F-test  Otestujeme, jestli vzdělání otce a matky mají stejný efekt na log(wage)  Přidáme test na další omezení, třeba exper=0.3

Shrnutí Klasický lineární regresní model (CLM) Klasický lineární regresní model (CLM) Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti Testování hypotéz o jednom parametru: t-test a intervaly spolehlivosti Testování hypotéz o jedné lineární kombinaci parametrů Testování hypotéz o jedné lineární kombinaci parametrů Testování vícenásobných lineárních omezení: F-test Testování vícenásobných lineárních omezení: F-test

Doporučené samostudium Ve skriptech „Základy ekonometrie v příkladech“ si prostudujte kap. 4.5 Ve skriptech „Základy ekonometrie v příkladech“ si prostudujte kap. 4.5 Na počítači si hrajte se soubory wage2, ceosal2, htv. Zkoušejte různé kombinace vysvětlujících proměnných a různé kombinace lineárních omezení parametrů Na počítači si hrajte se soubory wage2, ceosal2, htv. Zkoušejte různé kombinace vysvětlujících proměnných a různé kombinace lineárních omezení parametrů