Lineární regresní analýza Úvod od problému

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Korelace a regrese Karel Zvára 1.
Cvičení 9 – Ekonomická funkce nelineární v parametrech :
kvantitativních znaků
Testování parametrických hypotéz
MATLAB LEKCE 7.
A5M33IZS – Informační a znalostní systémy Testování modelů.
( Vyhledání nulových hodnot funkcí )
Programování numerických výpočtů - návrh písemky.
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
VÍCENÁSOBNÁ REGRESE 1.
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
ZÁKLADY EKONOMETRIE 8. cvičení MZNČ
Lineární algebra.
Robustní vyrovnání Věra Pavlíčková, únor 2014.
Úvod do regresní analýzy
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
kvantitativních znaků
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
Základy ekonometrie Cvičení 3 4. října 2010.
Nelineární programování - úvod
Lineární regrese.
Regrese Aproximace metodou nejmenších čtverců
Simultánní rovnice Tomáš Cahlík
Testy významnosti Karel Mach. Princip (podstata): Potvrzení H O Vyvrácení H O →přijmutí H 1 (H A ) Ptáme se:  1.) Pochází zkoumaný výběr (jeho x, s 2.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Lineární regrese.
Praktické využití regresní analýzy Struktura národního hospodářství a znečištění ovzduší v tranzitivních ekonomikách: Případ České republiky Gabriela Jandová.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Lineární regrese kalibrační přímky
Další spojitá rozdělení pravděpodobnosti
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Odhad metodou maximální věrohodnost
Princip maximální entropie
Experimentální fyzika I. 2
V. Analýza rozptylu ANOVA.
MATEMATICKÁ STATISTIKA
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Praktikum elementární analýzy dat Třídění 2. a 3. stupně UK FHS Řízení a supervize (LS 2012) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
IV..
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Základy zpracování geologických dat R. Čopjaková.
MATEMATIKA PRO CHEMIKY II. SYLABUS PŘEDMĚTU Opakování a rozšíření znalostí Reálné funkce a vlastnosti funkcí jedné a dvou proměnných Spojitost a limita.
Ekonometrie1.část Vyučující Ing. Pavlína Hálová, Ph.D kancelář č.379 tel.linka 2062 Konzultační hodiny: Po 14:00 – 15:
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Interpolace funkčních závislostí
Statistické testování – základní pojmy
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Parciální korelace Regresní analýza
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
Základy statistiky.
Transkript prezentace:

Lineární regresní analýza Úvod od problému

Jednoduchá regrese Model jednoduché lineární regrese Metoda nejmenších čtverců Testy významnosti Použití regresní rovnice pro predikci a odhad

Model jednoduché lineární regrese Model lineární regrese y = 0 + 1x +  Regresní rovnice E(y) = 0 + 1x Odhad regresní rovnice y = b0 + b1x ^ Poznámka: b0 a b1 jsou odhady parametrů, β0 + β1 b0 a b1 a chceme vypočítat, x a y známe (naše data)

Model jednoduché lineární regrese Grafická podstata metody nejmenších čtverců (MNČ) Matematická podstata MNČ Minimalizace součtu Σ(y - b0 - b1x)2 i Poznámka: řešení se provádí hledáním minima tj. derivací, získáme soustavu dvou rovnic o dvou neznámých b0 a b1 Viz např. http://www.aristoteles.cz/matematika/linearni_algebra/soustavy/cramerovo-pravidlo.php

Mnohonásobná regrese Model mnohonásobné lineární regrese Metoda nejmenších čtverců Mnohonásobný koeficient determinace Předpoklady modelu Testy významnosti Použití regresní rovnice pro predikci a odhad Kvalitativní nezávislé proměnné Analýza reziduálních hodnot

Mnohorozměrná statistická analýza Datová matice X X1 X2 X3 X4 ATD. ANO 204 M 1,2 NE 180 F 4,3 NE 178 F 2,3 NE 187 M 3,8 ANO 192 M 2,6 . ATD.

Něco málo z vektorové algebry Matice Násobení vektorů a matic Transpozice Inverze Derivace součinu vektoru a matice

Model mnohonásobné lineární regrese y = 0 + 1x1 + 2x2 + . . . + pxp +  Regresní rovnice E(y) = 0 + 1x1 + 2x2 + . . . + pxp Odhad regresní rovnice y = b0 + b1x1 + b2x2 + . . . + bpxp ^

Metoda nejmenších čtverců Kritérium nejmenších čtverců Výpočet hodnot koeficientů Vzorce pro výpočet koeficientů mají podobu maticových rovnic. Poznámka k interpretaci koeficientů bi jsou odhady změny y odpovídající jednotkové změně v xi , jestliže ostatní nezávislé proměnné udržujeme konstantní. ^

Mnohonásobný koeficient determinace Vztah mezi SST, SSM (SSR), SSE SST = SSM + SSE St.v. n-1 p n-p-1 Mnohonásobný koeficient determinace R 2 = SSM/SST Upravený mnohonásobný koeficient determinace ^ ^

Předpoklady modelu Předpoklady o chybové složce  Chyba  je náhodná proměnná s nulovou střední hodnotou. Rozptyl chyb  , označujeme 2, má být stejný pro všechny hodnoty nezávisle proměnných. Hodnoty  jsou nezávislé. Chyba  je normálně rozložená náhodná proměnná reflektující odchylky mezi zjištěnou hodnotou y a očekávanou hodnotou y E(y)=0 + 1x1 + 2x2 + . . . + pxp

Testy významnosti: t Test Hypotéza H0: i = 0 Ha: i = 0 Testová statistika Pravidlo zamítnutí Zamítá se H0 jestliže t < -tnebo t > t kde t je založena na t rozložení se stupni volnosti n - p - 1.

Použití regresní rovnice pro predikci a odhad Odhad střední hodnoty závisle proměnné y a predikce individuálních hodnot y je v mnohonásobné regresy stejné jako v jednoduché regresy. Dosadíme dané hodnoty pro x1, x2, . . . , xp do regresní rovnice a po výpočtu použijeme hodnotu y jako bodový odhad střední hodnoty y. Existují vzorce pro výpočet intervalového odhadu střední hodnoty y a predikčního intervalu hodnoty y. V statistických systémech jsou tyto odhady k dispozici. ^

Kvalitativní nezávislé proměnné V mnoha situacích pracujeme také s kvalitativními nezávislými proměnnými jako např. pohlaví, temperament, typ školy atd. Například x2 může reprezentovat pohlaví, kde x2 = 0 indikuje muže a x2 = 1 indikuje ženy. V tomto případě, x2 ise nazývá indikátorová proměnná (dummy variable). Jestliže má kvalitativní proměnná k úrovní, je zapotřebí k - 1 indikátorových proměnných kódovaných jako 0 nebo 1. Například proměnná s úrovněmi A, B, a C se reprezentuje proměnnými x1 a x2 hodnotami (0, 0), (1, 0) nebo (0,1).