Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Lineární regrese
2
Regrese a možné zdroje informací
Česky: Hebák a kol.(2.díl,1-150), Hendl( , ) , Meloun- Militký, Zvára Anglicky: Fox, Draper&Smith, v SPSS: Field, Norušis
3
4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Prvotní vysvětlení regrese na základě obrázků
4
4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost r = 0,97
5
4 typy lineární závislosti 2 kardinálních proměnných
Silná negativní závislost r = - 0,97
6
4 typy lineární závislosti 2 kardinálních proměnných
Slabá pozitivní závislost r = 0,35
7
4 typy lineární závislosti 2 kardinálních proměnných
Nulová závislost r = 0
8
Exkurz o nelineární závislosti
Co to je? Jak dopadne, když užiji lineární model? Proč většinou užíváme lineární model (ignoramus et ignoramibus)
9
Základní otázky v lineární regresi
Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky
10
Regresní úkol a interpretace parametrů
snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese-konstanta (b0) - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient (b1) -sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)
11
Interpretace parametrů v obrázku
12
!!!Regrese předpoklady!!! regrese předpokládá volbu kombinace vysvětlujících proměnných, které jsou kardinální, nezávislá proměnná může být i dichotomická Nekorelovanost nezávislých proměnných (opak multikolinearita)
13
Metody odhadu parametrů
metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!) Alternativní – metoda maximální věrohodnosti – hledáme parametry, pro které je největší hodnota věrohodnostní funkce Řešení je v obou případech skrze parciální derivace, tj. lze spočítat v ruce
14
MNČ graficky
15
Regrese jednoduchá a vícenásobná
Jednoduchá - jedna závisle (vysvětlovaná) proměnná a jedna nezávisle (vysvětlující) Vícenásobná - jedna závisle (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!! Ideální začít jednoduchou regresí (ideálně skrze graf) a poté pokračovat dále
16
Jednoduchá regrese v obrázku
17
Jednoduchá lin. regrese
Kardinální závisle i nezávisle proměnná Předpoklad: vztah mezi proměnnými je lineární Příklad v SPSS (graf a regresní křivka): Graphs-Chart builder-Scatter/Dot (Add Fit Line at Total) Doporučení: Vždy před výpočty vizualizovat data
18
Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) R2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné beta koeficienty aneb posouzení individuálního vlivu proměnných (vlastně regresní koeficienty pokud bychom původní data standardizovali-co je to standardizace? A jaké jsou možnosti standardizace?)
19
Regrese v SPSS-závislost příjmu na počtu let vzdělání
RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné
20
Regrese v SPSS-závislost příjmu na počtu let vzdělání
F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)
21
Regrese v SPSS-závislost příjmu na počtu let vzdělání
T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více
22
Náš příklad Data byty Závisle proměnná cena bytu
Nezávisle proměnná – plocha bytu
23
Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví
Obě proměnné v modelu správně Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání *pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má má v průměru o 3800 Kč více
24
Vícenásobná lin. regrese
25
Vícenásobná regrese Model y = 0 + 1x1 + 2x2 + . . . + pxp +
Regresní rovnice pro populaci E(y) = 0 + 1x1 + 2x pxp Odhad z výběru y = b0 + b1x1 + b2x bpxp
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.