Lineární regrese.

Slides:



Advertisements
Podobné prezentace
Korelace a regrese Karel Zvára 1.
Advertisements

Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Monte Carlo permutační testy & Postupný výběr
Cvičení 6 – 25. října 2010 Heteroskedasticita
Predikce Zobecněná MNČ
Cvičení října 2010.
4EK211 Základy ekonometrie Autokorelace Cvičení /
SB029 Dodatek k přednáškám Základy analýzy dat a SPSS
LOGISTICKÁ REGRESE 1.
Lineární regresní analýza Úvod od problému
ZÁKLADY EKONOMETRIE 2. cvičení KLRM
ZÁKLADY EKONOMETRIE 8. cvičení MZNČ
Analytické metody výzkumu
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Korelace a regrese síla (těsnost) závislosti dvou náhodných veličin: korelace symetrický vztah obou veličin neslouží k předpovědi způsob (tvar) závislosti.
Obecný lineární model Analýza kovariance Nelineární modely
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
Řízení a supervize v sociálních a zdravotnických organizacích
Základy ekonometrie Cvičení 3 4. října 2010.
Regrese Aproximace metodou nejmenších čtverců
Simultánní rovnice Tomáš Cahlík
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Korelace a elaborace aneb úvod do vztahů proměnných
Korelace a elaborace aneb úvod do vztahů proměnných
Závislost Vzájemný vztah dvou veličin
Lineární regrese.
Praktické využití regresní analýzy Struktura národního hospodářství a znečištění ovzduší v tranzitivních ekonomikách: Případ České republiky Gabriela Jandová.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Závislost dvou kvantitativních proměnných
Lineární regrese kalibrační přímky
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
V. Analýza rozptylu ANOVA.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Teorie psychodiagnostiky a psychometrie
Korelace a elaborace aneb úvod do vztahů proměnných
REGIONÁLNÍ ANALÝZA Cvičení 4 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Název projektu: Kvalitní vzdělání je efektivní investice.
Základy ekonometrie 4EK211
Pearsonův test dobré shody chí kvadrát
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
V experimentu měníme hodnotu jedné nebo několika veličin x i a studujeme závislost veličiny y. - např. měníme, ostatní x i bereme jako parametry ( , ,
Víceúrovňové modely Aneb kontextuální analýza v současnosti.
Aplikovaná statistika 2. Veronika Svobodová
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Jiří Šafr jiri.safr(zavináč)seznam.cz
IV..
Aplikovaná statistika 2.
REGRESNÍ ANALÝZA Vysoká škola technická a ekonomická v Českých Budějovicích Institute of Technology And Business In České Budějovice.
Funkce, funkční závislosti Lineární funkce. Obsah: Definice funkce Grafické znázornění funkce Konstantní funkce Lineární funkce Vlastnosti lineárních.
Základy zpracování geologických dat R. Čopjaková.
POZNÁMKA: Pokud chcete změnit obrázek na tomto snímku, vyberte obrázek a odstraňte ho. Potom klikněte na ikonu Obrázek v zástupném textu a vložte vlastní.
Dvojrozměrné (vícerozměrné) statistické soubory Karel Mach.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Interpolace funkčních závislostí
Prostorová analýza voleb POL 509
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Parciální korelace Regresní analýza
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Lineární regrese.
Lineární regrese.
Interpolace funkčních závislostí
Transkript prezentace:

Lineární regrese

Regrese a možné zdroje informací Česky: Hebák a kol.(2.díl,1-150), Hendl(237-295,351-385) , Meloun-Militký, Zvára

4 typy lineární závislosti 2 kardinálních proměnných Silná pozitivní závislost Slabá pozitivní závislost Silná negativní závislost Nulová závislost Prvotní vysvětlení korelačního koeficientu na základě obrázků

4 typy lineární závislosti 2 kardinálních proměnných Silná pozitivní závislost r = 0,97

4 typy lineární závislosti 2 kardinálních proměnných Silná negativní závislost r = - 0,97

4 typy lineární závislosti 2 kardinálních proměnných Slabá pozitivní závislost r = 0,35

4 typy lineární závislosti 2 kardinálních proměnných Nulová závislost r = 0

Základní otázky v lineární regresi Lze nalézt lineární vztah mezi proměnnými? Jak velký vliv má nezávisle proměnná X na proměnnou závislou Y? Jak moc ji vysvětluje? Jakou konkrétní hodnotu bude mít závisle proměnná Y, když budeme vědět, jakou hodnotu má proměnná X – dokáže tedy z hodnot nezávisle proměnné predikovat hodnoty závisle proměnné. U více nezávislých proměnných se nabízí i další otázky

Regresní úkol a interpretace parametrů snaha graficky vystihnout závislost a příslušnou regresní křivku vyjádřit rovnicí význam parametrů u lineární regrese-konstanta - průsečík s osou y (jaká je hodnota závisle proměnné při nulové hodnotě nezávislé proměnné-pozor někdy pro tuto interpretaci není z logického hlediska prostor), regresní koeficient-sklon křivky (o kolik vzroste závisle proměnná, vzroste-li nezávisle proměnná o jednotku)

!!!Regrese předpoklady!!! normalita závislé i nezávislých proměnných viz např procedura Explore v Analyze-Descriptives (regrese předpokládá volbu kombinace vysvětlujících proměnných normálně rozdělených), nezávislá proměnná může být i dichotomická Nekorelovanost nezávislých proměnných (opak multikolinearita)

Metody odhadu parametrů metoda nejmenších čtverců MNČ (resp. OLS)-napozorované hodnoty prokládáme námi zvolenou křivkou tak, aby součet čtvercových odchylek regresní křivky od napozorovaných hodnot byl minimální (toto kritérium vede k jednoznačnému řešení, pokud bychom pouze chtěli aby součet všech odchylek byl nulový-což je u MNČ mj. také splněno, bylo by takových křivek nekonečně mnoho a jejich kvalita by byla různá - nakreslit !!!)

Regrese jednoduchá a vícenásobná Jednoduchá - jedna závislá (vysvětlovaná) proměnná a jedna nezávislá (vysvětlující) Vícenásobná - jedna závislá (vysvětlovaná) proměnná a více nezávislých (vysvětlujících) vždy před použitím analýzy by měla předcházet úvaha o souvislostech, tedy budujeme jen model, který má nějaké teoretické opodstatnění!!!

Regrese v SPSS výsledkem procedury v SPSS je regresní rovnice, otestování významnosti regresního modelu a jednotlivých parametrů včetně signalizace jednotlivých problémů F-test Ho: Model není dobrý (požadujeme Sig<0.05) T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří ((požadujeme Sig<0.05) R2 (R-Square) po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

Regrese v SPSS-závislost příjmu na počtu let vzdělání RSquare- po vynásobení stem jde o procento vysvětleného rozptylu závislé proměnné za pomoci nezávislé (nezávislých) proměnné

Regrese v SPSS-závislost příjmu na počtu let vzdělání F-test Ho: Model není dobrý H1: Lze ho použít (požadujeme tedy Sig<0.05)

Regrese v SPSS-závislost příjmu na počtu let vzdělání T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= 1612 + 624* roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

Regrese v SPSS-závislost příjmu na počtu let vzdělání T-testy pro jednotlivé proměnné Ho: Proměnná do modelu nepatří (požadujeme Sig<0.05) Z hodnot v tabulce lze napsat rovnici: Příjem= 1612 + 624* roky vzdělání Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více

Regrese v SPSS-závislost příjmu na počtu let vzdělání a pohlaví Obě proměnné v modelu správně Z hodnot v tabulce lze napsat rovnici: Příjem= -476 + 626* roky vzdělání + 3800*pohlaví(je muž) Osoba která má o rok vyšší vzdělání má v průměru o 625 Kč více Pokud se nic dalšího nezmění (tzv. ceteris paribus) Osoba, která je muž má má v průměru o 3800 Kč více

Regrese-umělé proměnné jako vysvětlující proměnné lze použít i nominální či ordinální proměnné převedením na umělé (dummy) proměnné - umělých proměnných je poté o jednu méně než kategorií původní proměnné "vynechaná proměnná" odpovídá kategorii vůči níž se budou ostatní kategorie porovnávat-ukázka na proměnné vzdělání (vytvoříme 3umělé proměnné-SŠ bez, SŠ s mat. a VŠ), tedy vynechaná je ZŠ oproti ní všechny srovnáváme

Regrese a její problémy multikolinearita - závislost mezi vysvětlujícími proměnnými, je téměř vždy přítomná, problémem je škodlivá multikolinearita zejm. perfektní multikolinearita - pak není možno odhadovat regresní parametry metodou nejmenších čtverců měření škodlivé multikolinearity - orientační kritérium alespoň jeden párový korelační koeficient mezi vysvětlujícími proměnnými ve výši 0,8 (existují i rozličné exaktní testy), pro výpočty při existenci škodlivé multikolinearity se užívá tzv. hřebenové regrese