Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Lineární regrese.

Podobné prezentace


Prezentace na téma: "Lineární regrese."— Transkript prezentace:

1 Lineární regrese

2 Regrese a možné zdroje informací
Česky: Hebák a kol.(2.díl,1-150), Hendl( , ) , Meloun- Militký, Zvára Anglicky: Fox, Draper&Smith, v SPSS: Field, Norušis

3 4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Prvotní vysvětlení regrese na základě obrázků

4 4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost r = 0,97

5 4 typy lineární závislosti 2 kardinálních proměnných
Silná negativní závislost r = - 0,97

6 4 typy lineární závislosti 2 kardinálních proměnných
Slabá pozitivní závislost r = 0,35

7 4 typy lineární závislosti 2 kardinálních proměnných
Nulová závislost r = 0

8 Exkurz o nelineární závislosti
Co to je? Jak dopadne, když užiji lineární model? Proč většinou užíváme lineární model (ignoramus et ignoramibus)

9 Základní otázky v lineární regresi
Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky

10 Regresní úkol a interpretace parametrů
snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese-konstanta (b0) - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient (b1) -sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)

11 Interpretace parametrů v obrázku

12 !!!Regrese předpoklady!!! regrese předpokládá volbu kombinace vysvětlujících proměnných, které jsou kardinální, nezávislá proměnná může být i dichotomická Nekorelovanost nezávislých proměnných (opak multikolinearita)

13 Metody odhadu parametrů
metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!) Alternativní – metoda maximální věrohodnosti – hledáme parametry, pro které je největší hodnota věrohodnostní funkce Řešení je v obou případech skrze parciální derivace, tj. lze spočítat v ruce

14 MNČ graficky

15 Regrese jednoduchá a vícenásobná
Jednoduchá - jedna závisle (vysvětlovaná) proměnná a jedna nezávisle (vysvětlující) Vícenásobná - jedna závisle (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!! Ideální začít jednoduchou regresí (ideálně skrze graf) a poté pokračovat dále

16 Jednoduchá regrese v obrázku

17 Jednoduchá lin. regrese
Kardinální závisle i nezávisle proměnná Předpoklad: vztah mezi proměnnými je lineární Příklad v SPSS (graf a regresní křivka): Graphs-Chart builder-Scatter/Dot (Add Fit Line at Total) Doporučení: Vždy před výpočty vizualizovat data

18 Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) R2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné beta koeficienty aneb posouzení individuálního vlivu proměnných (vlastně regresní koeficienty pokud bychom původní data standardizovali-co je to standardizace? A jaké jsou možnosti standardizace?)

19 Regrese v SPSS-závislost příjmu na počtu let vzdělání
RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

20 Regrese v SPSS-závislost příjmu na počtu let vzdělání
F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)

21 Regrese v SPSS-závislost příjmu na počtu let vzdělání
T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

22 Náš příklad Data byty Závisle proměnná cena bytu
Nezávisle proměnná – plocha bytu

23 Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví
Obě proměnné v modelu správně Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání *pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má má v průměru o 3800 Kč více

24 Vícenásobná lin. regrese

25 Vícenásobná regrese Model y = 0 + 1x1 + 2x2 + . . . + pxp + 
Regresní rovnice pro populaci E(y) = 0 + 1x1 + 2x pxp Odhad z výběru y = b0 + b1x1 + b2x bpxp


Stáhnout ppt "Lineární regrese."

Podobné prezentace


Reklamy Google