Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Lineární regrese. Regrese a možné zdroje informací Česky: Hebák a kol.(2.díl,1-150), Hendl(237-295,351-385), Meloun-Militký, Zvára Česky: Hebák a kol.(2.díl,1-150),

Podobné prezentace


Prezentace na téma: "Lineární regrese. Regrese a možné zdroje informací Česky: Hebák a kol.(2.díl,1-150), Hendl(237-295,351-385), Meloun-Militký, Zvára Česky: Hebák a kol.(2.díl,1-150),"— Transkript prezentace:

1 Lineární regrese

2 Regrese a možné zdroje informací Česky: Hebák a kol.(2.díl,1-150), Hendl( , ), Meloun-Militký, Zvára Česky: Hebák a kol.(2.díl,1-150), Hendl( , ), Meloun-Militký, Zvára

3 4 typy lineární závislosti 2 kardinálních proměnných Silná pozitivní závislost Silná pozitivní závislost Slabá pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Silná negativní závislost Nulová závislost Nulová závislost Prvotní vysvětlení korelačního koeficientu na základě obrázků Prvotní vysvětlení korelačního koeficientu na základě obrázků

4 4 typy lineární závislosti 2 kardinálních proměnných Silná pozitivní závislost r = 0,97

5 4 typy lineární závislosti 2 kardinálních proměnných Silná negativní závislost r = - 0,97

6 4 typy lineární závislosti 2 kardinálních proměnných Slabá pozitivní závislost r = 0,35

7 4 typy lineární závislosti 2 kardinálních proměnných Nulová závislost r = 0

8 Základní otázky v lineární regresi Lze nalézt lineární vztah mezi proměnnými? Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky U více nezávislých proměnných se nabízí i další otázky

9 Regresní úkol a interpretace parametrů snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese- konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku) význam parametrů u lineární regrese- konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)

10 !!!Regrese předpoklady!!! normalita závislé i nezávislých proměnných viz např procedura Explore v Analyze- Descriptives (regrese předpokládá volbu kombinace vysvětlujících proměnných normálně rozdělených), nezávislá proměnná může být i dichotomická normalita závislé i nezávislých proměnných viz např procedura Explore v Analyze- Descriptives (regrese předpokládá volbu kombinace vysvětlujících proměnných normálně rozdělených), nezávislá proměnná může být i dichotomická Nekorelovanost nezávislých proměnných (opak multikolinearita) Nekorelovanost nezávislých proměnných (opak multikolinearita)

11 Metody odhadu parametrů metoda nejmenších čtverců MNČ (resp. OLS)- napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!) metoda nejmenších čtverců MNČ (resp. OLS)- napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!)

12 Regrese jednoduchá a vícenásobná Jednoduchá - jedna závislá (vysvětlovaná) proměnná a jedna nezávislá (vysvětlující) Jednoduchá - jedna závislá (vysvětlovaná) proměnná a jedna nezávislá (vysvětlující) Vícenásobná - jedna závislá (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) Vícenásobná - jedna závislá (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!! vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!!

13 Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) R 2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné R 2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

14 Regrese v SPSS-závislost příjmu na počtu let vzdělání RSquare- po vynásobení stem jde o procento vysvětleného rozptylu RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

15 Regrese v SPSS-závislost příjmu na počtu let vzdělání F-test Ho: Model není dobrý H1: Lze ho použít F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)

16 Regrese v SPSS-závislost příjmu na počtu let vzdělání T-testy pro jednotlivé proměnné Ho: Proměnná do modelu T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

17 Regrese v SPSS-závislost příjmu na počtu let vzdělání T-testy pro jednotlivé proměnné Ho: Proměnná do modelu T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání Příjem= * roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

18 Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví Z hodnot v tabulce lze napsat rovnici: Z hodnot v tabulce lze napsat rovnici: Příjem= * roky vzdělání *pohlaví(je muž) Příjem= * roky vzdělání *pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má má v průměru o 3800 Kč více Obě proměnné v modelu správně

19 Regrese-umělé proměnné jako vysvětlující proměnné lze použít i nominální či ordinální proměnné převedením na umělé (dummy) proměnné - umělých proměnných je poté o jednu méně než kategorií původní proměnné jako vysvětlující proměnné lze použít i nominální či ordinální proměnné převedením na umělé (dummy) proměnné - umělých proměnných je poté o jednu méně než kategorií původní proměnné "vynechaná proměnná" odpovídá kategorii vůči níž se budou ostatní kategorie porovnávat-ukázka na proměnné vzdělání (vytvoříme 3umělé proměnné-SŠ bez, SŠ s mat. a VŠ), tedy vynechaná je ZŠ oproti ní všechny srovnáváme "vynechaná proměnná" odpovídá kategorii vůči níž se budou ostatní kategorie porovnávat-ukázka na proměnné vzdělání (vytvoříme 3umělé proměnné-SŠ bez, SŠ s mat. a VŠ), tedy vynechaná je ZŠ oproti ní všechny srovnáváme

20 Regrese a její problémy multikolinearita - závislost mezi vysvětlujícími proměnnými, je téměř vždy přítomná, problémem je škodlivá multikolinearita zejm. perfektní multikolinearita - pak není možno odhadovat regresní parametry metodou nejmenších čtverců multikolinearita - závislost mezi vysvětlujícími proměnnými, je téměř vždy přítomná, problémem je škodlivá multikolinearita zejm. perfektní multikolinearita - pak není možno odhadovat regresní parametry metodou nejmenších čtverců měření škodlivé multikolinearity - orientační kritérium alespoň jeden párový korelační koeficient mezi vysvětlujícími proměnnými ve výši 0,8 (existují i rozličné exaktní testy), pro výpočty při existenci škodlivé multikolinearity se užívá tzv. hřebenové regrese měření škodlivé multikolinearity - orientační kritérium alespoň jeden párový korelační koeficient mezi vysvětlujícími proměnnými ve výši 0,8 (existují i rozličné exaktní testy), pro výpočty při existenci škodlivé multikolinearity se užívá tzv. hřebenové regrese


Stáhnout ppt "Lineární regrese. Regrese a možné zdroje informací Česky: Hebák a kol.(2.díl,1-150), Hendl(237-295,351-385), Meloun-Militký, Zvára Česky: Hebák a kol.(2.díl,1-150),"

Podobné prezentace


Reklamy Google