Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Lineární regrese
2
Regrese a možné zdroje informací
Česky: Hebák a kol.(2.díl,1-150), Hendl( , ) , Meloun-Militký, Zvára
3
4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Prvotní vysvětlení korelačního koeficientu na základě obrázků
4
4 typy lineární závislosti 2 kardinálních proměnných
Silná pozitivní závislost r = 0,97
5
4 typy lineární závislosti 2 kardinálních proměnných
Silná negativní závislost r = - 0,97
6
4 typy lineární závislosti 2 kardinálních proměnných
Slabá pozitivní závislost r = 0,35
7
4 typy lineární závislosti 2 kardinálních proměnných
Nulová závislost r = 0
8
Základní otázky v lineární regresi
Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky
9
Regresní úkol a interpretace parametrů
snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese-konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)
10
!!!Regrese předpoklady!!! regrese předpokládá volbu kombinace vysvětlujících proměnných, které jsou kardinální, nezávislá proměnná může být i dichotomická Nekorelovanost nezávislých proměnných (opak multikolinearita)
11
Metody odhadu parametrů
metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!)
12
Regrese jednoduchá a vícenásobná
Jednoduchá - jedna závislá (vysvětlovaná) proměnná a jedna nezávislá (vysvětlující) Vícenásobná - jedna závislá (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!!
13
Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) R2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné
14
Regrese v SPSS-závislost příjmu na počtu let vzdělání
RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné
15
Regrese v SPSS-závislost příjmu na počtu let vzdělání
F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)
16
Regrese v SPSS-závislost příjmu na počtu let vzdělání
T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více
17
Regrese v SPSS-závislost příjmu na počtu let vzdělání
T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více
18
Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví
Obě proměnné v modelu správně Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání *pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má má v průměru o 3800 Kč více
19
Regrese-umělé proměnné
jako vysvětlující proměnné lze použít i nominální či ordinální proměnné převedením na umělé (dummy) proměnné - umělých proměnných je poté o jednu méně než kategorií původní proměnné "vynechaná proměnná" odpovídá kategorii vůči níž se budou ostatní kategorie porovnávat-ukázka na proměnné vzdělání (vytvoříme 3umělé proměnné-SŠ bez, SŠ s mat. a VŠ), tedy vynechaná je ZŠ oproti ní všechny srovnáváme
20
Regrese a její problémy
multikolinearita - závislost mezi vysvětlujícími proměnnými, je téměř vždy přítomná, problémem je škodlivá multikolinearita zejm. perfektní multikolinearita - pak není možno odhadovat regresní parametry metodou nejmenších čtverců měření škodlivé multikolinearity - orientační kritérium alespoň jeden párový korelační koeficient mezi vysvětlujícími proměnnými ve výši 0,8 (existují i rozličné exaktní testy), pro výpočty při existenci škodlivé multikolinearity se užívá tzv. hřebenové regrese
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.