Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Lineární regresní analýza Úvod od problému

Podobné prezentace


Prezentace na téma: "Lineární regresní analýza Úvod od problému"— Transkript prezentace:

1 Lineární regresní analýza Úvod od problému

2 Jednoduchá regrese Model jednoduché lineární regrese
Metoda nejmenších čtverců Testy významnosti Použití regresní rovnice pro predikci a odhad

3 Model jednoduché lineární regrese
Model lineární regrese y = 0 + 1x +  Regresní rovnice E(y) = 0 + 1x Odhad regresní rovnice y = b0 + b1x ^ Poznámka: b0 a b1 jsou odhady parametrů, β0 + β1 b0 a b1 a chceme vypočítat, x a y známe (naše data)

4 Model jednoduché lineární regrese
Grafická podstata metody nejmenších čtverců (MNČ) Matematická podstata MNČ Minimalizace součtu Σ(y - b0 - b1x)2 i Poznámka: řešení se provádí hledáním minima tj. derivací, získáme soustavu dvou rovnic o dvou neznámých b0 a b1 Viz např.

5 Mnohonásobná regrese Model mnohonásobné lineární regrese
Metoda nejmenších čtverců Mnohonásobný koeficient determinace Předpoklady modelu Testy významnosti Použití regresní rovnice pro predikci a odhad Kvalitativní nezávislé proměnné Analýza reziduálních hodnot

6 Mnohorozměrná statistická analýza Datová matice X
X1 X2 X3 X4 ATD. ANO M 1,2 NE F 4,3 NE F 2,3 NE M 3,8 ANO M 2,6 . ATD.

7 Něco málo z vektorové algebry
Matice Násobení vektorů a matic Transpozice Inverze Derivace součinu vektoru a matice

8 Model mnohonásobné lineární regrese
y = 0 + 1x1 + 2x pxp +  Regresní rovnice E(y) = 0 + 1x1 + 2x pxp Odhad regresní rovnice y = b0 + b1x1 + b2x bpxp ^

9 Metoda nejmenších čtverců
Kritérium nejmenších čtverců Výpočet hodnot koeficientů Vzorce pro výpočet koeficientů mají podobu maticových rovnic. Poznámka k interpretaci koeficientů bi jsou odhady změny y odpovídající jednotkové změně v xi , jestliže ostatní nezávislé proměnné udržujeme konstantní. ^

10 Mnohonásobný koeficient determinace
Vztah mezi SST, SSM (SSR), SSE SST = SSM + SSE St.v. n p n-p-1 Mnohonásobný koeficient determinace R 2 = SSM/SST Upravený mnohonásobný koeficient determinace ^ ^

11 Předpoklady modelu Předpoklady o chybové složce 
Chyba  je náhodná proměnná s nulovou střední hodnotou. Rozptyl chyb  , označujeme 2, má být stejný pro všechny hodnoty nezávisle proměnných. Hodnoty  jsou nezávislé. Chyba  je normálně rozložená náhodná proměnná reflektující odchylky mezi zjištěnou hodnotou y a očekávanou hodnotou y E(y)=0 + 1x1 + 2x pxp

12 Testy významnosti: t Test
Hypotéza H0: i = 0 Ha: i = 0 Testová statistika Pravidlo zamítnutí Zamítá se H0 jestliže t < -tnebo t > t kde t je založena na t rozložení se stupni volnosti n - p - 1.

13 Použití regresní rovnice pro predikci a odhad
Odhad střední hodnoty závisle proměnné y a predikce individuálních hodnot y je v mnohonásobné regresy stejné jako v jednoduché regresy. Dosadíme dané hodnoty pro x1, x2, , xp do regresní rovnice a po výpočtu použijeme hodnotu y jako bodový odhad střední hodnoty y. Existují vzorce pro výpočet intervalového odhadu střední hodnoty y a predikčního intervalu hodnoty y. V statistických systémech jsou tyto odhady k dispozici. ^

14 Kvalitativní nezávislé proměnné
V mnoha situacích pracujeme také s kvalitativními nezávislými proměnnými jako např. pohlaví, temperament, typ školy atd. Například x2 může reprezentovat pohlaví, kde x2 = 0 indikuje muže a x2 = 1 indikuje ženy. V tomto případě, x2 ise nazývá indikátorová proměnná (dummy variable). Jestliže má kvalitativní proměnná k úrovní, je zapotřebí k - 1 indikátorových proměnných kódovaných jako 0 nebo 1. Například proměnná s úrovněmi A, B, a C se reprezentuje proměnnými x1 a x2 hodnotami (0, 0), (1, 0) nebo (0,1).


Stáhnout ppt "Lineární regresní analýza Úvod od problému"

Podobné prezentace


Reklamy Google