Regresná a korelačná analýza (RaKA) resp. Korelačný počet

Slides:



Advertisements
Podobné prezentace
ZÁKLADY EKONOMETRIE 6. cvičení Autokorelace
Advertisements

Cvičení 9 – Ekonomická funkce nelineární v parametrech :
kvantitativních znaků
Odhady parametrů základního souboru
Cvičení 6 – 25. října 2010 Heteroskedasticita
4EK211 Základy ekonometrie Autokorelace Cvičení /
Lineární regresní analýza Úvod od problému
Úvod do regresní analýzy
Regresní analýza a korelační analýza
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Testování hypotéz (ordinální data)
kvantitativních znaků
Základy ekonometrie Cvičení září 2010.
Základy ekonometrie Cvičení října 2010.
Lineární regrese.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
REGIONÁLNÍ ANALÝZA Cvičení 3 Evropský sociální fond
Lineární regresní analýza
Další spojitá rozdělení pravděpodobnosti
Jedno-indexový model a určení podílů cenných papírů v portfoliu
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
Biostatistika 8. přednáška
Jednoduchý lineární regresní model Tomáš Cahlík 2. týden
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
Aplikovaná statistika 2. Veronika Svobodová
Přenos nejistoty Náhodná veličina y, která je funkcí náhodných proměnných xi: xi se řídí rozděleními pi(xi) → můžeme najít jejich střední hodnoty mi a.
Aplikovaná statistika 2.
Základy zpracování geologických dat R. Čopjaková.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Metody zkoumání závislosti numerických proměnných
Korelace. Určuje míru lineární vazby mezi proměnnými. r < 0
INDUKTIVNÍ STATISTIKA
Korelace Korelace obecně je míra kvality (vhodnosti, těsnosti) nalezeného regresního modelu pro daná data; vychází z hodnot reziduí V každém typu regresního.
Interpolace funkčních závislostí
Úpravy algebrických výrazov
Úpravy algebrických výrazov
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
Lineárna funkcia a jej vlastnosti
Hodnocení závislosti STAT metody pro posouzení závislosti – jiné pro:
Identifikácia MSW modelu
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Priama úmernosť ISCED 2.
Základy štatistiky s využitím systému SAS®
Operácie s mocninami s celočíselným mocniteľom
doc.Ing. Zlata Sojková, CSc.
ŠTATISTIKA.
EKONOMETRIA PREDNÁŠKA 7
Nepriama úmernosť ISCED 2.
Bc. Milada Kazdová Školiteľ: PaedDr.Miroslav Tisoň, PhD.
Regresná a korelačná analýza (RaKA) resp. Korelačný počet
Ekonomický rast a konvergencia
EKONOMETRIA PREDNÁŠKA 5
jednoduchá regrese kvadratický Y=b0+b1X+b2X 2
Úvod do štatistického spracovania a vyhodnocovania údajov
Grafické riešenie lineárnej rovnice
Ing. Zlatica Molčanová Košice
Úvod do štatistického spracovania a vyhodnocovania údajov – 2. časť
Blackova – Scholesova analýza
EKONOMETRIA PREDNÁŠKA 6
INDEXY.
DEKOMPOZÍCIA ČASOVÝCH RADOV
Entrópia, redundancia a sci-fi príklad.
ZNALOSTNÉ SYSTÉMY prednáška č. 4
ZNALOSTNÉ SYSTÉMY prednáška č. 4
V ä z b y Chemická väzba.
Cenový model kapitálových aktív
Viacrozmerné štatistické metódy Viacrozmerné metódy všeobecne
Lineární regrese.
Základy statistiky.
Transkript prezentace:

Regresná a korelačná analýza (RaKA) resp. Korelačný počet prof.Ing. Zlata Sojková, CSc.

Skúmanie vzťahov medzi štatistickými znakmi: Skúmanie vzťahov medzi kvalitatívnymi znakmi, napr. AB , nazýme meranie asociácie skúmanie vzťahov medzi kvantitatívnymi štatistickými znakmi - regresná a korelačná analýza prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc.

Pri regresenej a korelečnej analýze pôjde skúmanie príčinnej - kauzálnej závislosti, skúmanie vzťahov medzi príčinou a účinkom kedy jeden resp viac javov (znakov, nezávisle prememnných veličín ) vyvoláva účinok - výsledný jav - závisle prememnnú veličinu Y = f (X1 X2…... Xk ,Bo , B1 ,….Bp ) +e Neznáme parametre funkčného vzťahu Nezávislé premenné veličiny - príčiny Náhodné, nešpecifikované vplyvy Závislé premenná - účinok prof.Ing. Zlata Sojková, CSc.

Príklad zdanlivej korelácie Jedna z preslávených zdanlivých korelácií : ak sa dĺžka sukní skracuje kurzy akcií stúpajú . Odhliadnúc od toho, že to nie vždy platí, išlo by Skutočne o zdanlivú, alebo nezmyselnú koreláciu prof.Ing. Zlata Sojková, CSc.

Príklady štatistickej - voľnej -závislosti Skúmanie závislosti spotreby bravčového mäsa od príjmu, ceny mäsa bravčového ceny mäsa hovädzieho a hydiny a od tradície, resp. ďalších nešpecifikovaných, či náhodných vplyvov. Skúmanie pridanej hodnoty resp. HNP od vstupov: práce a kapitálu…. Skúmanie závislosti výživy obyvateľstva od stupňa ekonomického rozvoja krajiny…. prof.Ing. Zlata Sojková, CSc.

Opakom štatistickej závislosti je funkčná závislosť Y = f(X1 X2…... Xk ,Bo , B1 ,…., Bp) kedy je závisle prememnná veličina jednoznačne určená funkčným vzťahom, príklady z fyziky, chémie - takýto druh vzťahov nie je predmetom štatistického skúmania prof.Ing. Zlata Sojková, CSc.

Regresná a korelačná analýza (RaKA) Dve základné úlohy RaKA: regresná úloha (RÚ) jej podstatou je a) nájsť funkčný vzťah podľa ktorého sa mení závislé premenná so zmenou nezávisle premenných - nájsť vhodnú regresnú funkciu. b) Súčasne je potrebné odhadnúť parametre regresnej funkcie. korelačná úloha (KÚ)- merať tesnosť - silu skúmanej závislosti. prof.Ing. Zlata Sojková, CSc.

Znázornenie korelačného poľa v dvoch prípadoch y x y x prof.Ing. Zlata Sojková, CSc.

Podľa počtu nezávisle premenných rozlišujeme: Jednoduchú závislosť , kedy uvažujeme len jednú nezávislé premennú X, teda skúmame vzťah medzi Y a X viacnásobnú závislosť, pri ktorej uvažujeme minimálne dve nezávislé prememnné veličiny (znaky) X1, X2, … Xk , pričom k  2 prof.Ing. Zlata Sojková, CSc.

Jednoduchá regresná a korelačná analýza Uvažujme štatistický znak X a Y medzi ktorými je v základnom súbore lineárna závislosť Y = Bo + B1 X +e bodovým odhadom tejto regresnej funkcie je priamka yj = b0 + b 1 xj + ej , ktorej koeficienty vypočítame z výberových údajov Akú metódu použiť ??? prof.Ing. Zlata Sojková, CSc.

Metóda najmenších štvorcov (MNŠ)  Získame sústavu p+1 rovníc s p+1 neznámymi parametrami prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. yj = b0 + b 1 xj + ej  môžeme zapísať yj = yj , + ej a ej = y j - yj , Princíp MNŠ Metódy najmenších štvorcov (ej )2 = (y j - y j’)2 (ej ) = y j - y j’ prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Možno dokázať, že koeficienty bo , b1 , …, bp určené MNŠ sú “najlepšie odhady” parametrov B 0 , B1 , …, Bp ak súčasne o náhodných chybách platí: E (ej ) = 0, D (ej ) = E (ej2 ) = 2 , E(ej1 , ej2 ) = 0 , pre každé j1  j2 Slovne možno podmienku formulovať nasledovne: od náhodných chýb požadujeme nulovú strednú hodnotu, konštantný rozptyl a vzájomnú nezávislosť náhodných chýb. prof.Ing. Zlata Sojková, CSc.

Koeficienty jednoduchej regresnej funkcie odvodíme: prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Úpravou získame nasledovné dve normálové rovnice s dvomi neznámymi parametrami: Sústavu rovníc môžme riešiť eliminačnou metódou , alebo pomocou determinantov. Získame tak koeficienty b o a b 1 prof.Ing. Zlata Sojková, CSc.

Postup pri výpočte koeficientov LRF xj yj xjyj xj 2 x1 y1 x1y1 x12 x2 y2 xn yn prof.Ing. Zlata Sojková, CSc.

Interpretácia koeficientov ljednoduchej lineárnej regresnej funkcie bo …lokujúca konštanta vyjadruje očakávanú úroveň závislé premennej pri nulovej hodnote nezávisle premennej b 1 …. regresný koeficient vyjadruje o koľko merných jednotiek sa zmení závislé premenná pri zmene nezávisle premennej o jednu mernú jednotku ak b1 > 0 …ide o pozitívnu závislosť po b1< 0 ….jedná sa o negatívnu závislosť prof.Ing. Zlata Sojková, CSc.

Vlastnosti metódy najmenších štvorcov: Regresná funkcia prechádza bodom o súradniciach a prof.Ing. Zlata Sojková, CSc.

Kedy možno MNŠ aplikovať? Ak je regresná funkcia lineárna lineárna v parametroch (LvP) alebo vieme regresnú funkciu transformovať na lineárnu v prametroch Posúďte u ktorých z nasledujúccich regresných funkcií možno použiť MNŠ prof.Ing. Zlata Sojková, CSc.

Niektoré typy jednoduchých regresných funkcií prof.Ing. Zlata Sojková, CSc.

Príklady z mikro- a makroekonómie Philipsova krivka ???? Cobbova -Douglasova produkčná funkcia Engelove krivky Krivky ekonomického rastu Uveďte ďalšie…... prof.Ing. Zlata Sojková, CSc.

Skúmanie vzťahu spotreby vybraných komodít od úrovne HNP prof.Ing. Zlata Sojková, CSc.

Porovnanie dvoch prípadov závislosti Ktorá závislosť bude tesnejšia? y x y x prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Intervaly spoľahlivosti pri lineárnej regresii.   Okrem bodových odhadov parametrov lineárnej regresnej funkcie sa často prepočítavajú aj intervalové odhady parametrov, ktoré nazývame intervaly spoľahlivosti. Výpočty intervalov spoľahlivosti je možné urobiť s pomocou štandardných odchýlok parametrov a reziduálneho rozptylu. Reziduálny rozptyl je za predpokladu platnosti podmienok lineárneho klasického modelu , neskresleným odhadom stochastického parametra a vypočíta sa podľa vzťahu prof.Ing. Zlata Sojková, CSc.

Intervalový odhad ľubovoľného parametra pre regresnú priamku vychádza z toho, že za predpokladov formulovaných klasickým lineárnym modelom má veličina t rozdelenie s n – p stupňami voľnosti. Pri zvolenej spoľahlivosti 1 – je obojstranný interval spoľahlivosti pre parameter daný vzťahom prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. a pre parameter analogicky sa konštruuje aj obojstranný interval spoľahlivosti pre regresnú priamku   kde je kvantil t rozdelenia s (pre regresnú priamku n – 2) stupňami voľnosti. prof.Ing. Zlata Sojková, CSc.

Korelačná úloha korelačného počtu Skúmať tesnosť - silu - závislosti k tomu slúžia miery tesnosti závislosti požadujeme, aby sa pohybovali v pevne ohraničanom intervale, a aby vrámci intervalu rástli s vyššiou silou závislosti prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Korelačná analýza predstavuje súhrn metód a postupov, pomocou ktorých overujeme vypovedaciu schopnosť kvantifikovaných regresných modelov ako celku aj jeho častí. Overovanie vypovedacej schopnosti vedie k výpočtu číselných charakteristík, ktoré v koncentrovanej forme popisujú kvalitu vypočítaných modelov. prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Index korelácie a index determinácie V základnom súbore Iyx odhadom z výberových údajov je iyx est Iyx = iyx . Princíp spočíva v rozklade variability závisle premennne Y Variabilita nevysvetlená regresnou funkciou - reziduálna variabilita Variabilita závisle premennej vysvetlená regresnou funkciou Celková variabilita závisle premennej prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. . Je zrejmé, že platí vzťah  C = V + N C = je celkový súčet štvorcov odchýlok V = je vysvetlený súčet štvorcov odchýlok N = je nevysvetlený (reziduálny) súčet štvorcov odchýlok. prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Index korelácie iyx Index determinácie iyx2 prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Index determinácie môže nadobúdať hodnoty z intervalu 0 až 1 , čím viac sa hodnota indexu blíži k jednotke, tým väčšia časť celkovej variability je modelom vysvetlená a naopak, ak sa index determinácie blíži k nule, tým menšia časť celkovej variability je modelom vysvetlená.  Index determinácie sa bežne používa ako kritérium pri rozhodovaní o voľbe konkrétneho tvaru regresnej funkcie. Ak však majú regresné funkcie rôzny počet parametrov je potrebné upraviť index determinácie do korigovanej podoby v tvare: prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Variabilita   Súčet štvorcov odchýlok Stupne voľnosti Rozptyl F test Vysvetlená Nevysvetlená V = N = F = Celková C = prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Testovacie kritérium v tabuľke je možné využiť k súčasnému testovaniu významnosti celého regresného modelu, indexu determinácie aj indexu korelácie. Vypočítanú hodnotu F testu porovnávame s kvantilom F rozdelenia a p-1 a n – p stupňov voľnosti tj. ak F považujeme regresný model za nevýznamný, podobne aj index determinácie a index korelácie. ak F > považujeme regresný model za štatisticky významný, podobne aj index determinácie a index korelácie prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. K detailnému vyhodnoteniu kvality jednotlivých parametrov regresného modelu sa používajú t testy parametrov. Pri teste formulujeme nulovú hypotézu H0 : pre i = 0, 1 H1 : v ktorej predpokladáme nulové teda nevýznamné pôsobenie či vplyv premennej pri ktorej parameter stojí. Testovacie kritérium je definované vzťahom prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. kde je hodnota parametra regresnej funkcie a je štandardná odchýlka parametra.   Vypočítanú hodnotu testovacieho kritéria porovnávame s kvantilom t rozdelenia na hladine významnosti a stupňov voľnosti tj.: - ak        nulovú hypotézu o nevýznamnosti parametra nezamietame -  ak       zamietame nulovú hypotézu a potvrdzujeme štatistickú významnosť posudzovaného parametra. prof.Ing. Zlata Sojková, CSc.

Nelineárna regresná a korelačná analýza   Okrem lineárnych regresných funkcií sa v praxi veľmi často používa celý rad nelineárnych funkcií, pričom je možné použiť nelineárne funkcie s dvoma alebo viacerými parametrami. Niektoré nelineárne regresné funkcie je možné vhodnou transformáciou upraviť na lineárne v parametroch, ktoré potom môžeme riešiť metódou najmenších štvorcov. Najčastejšie môžeme nelineárne funkcie s dvoma parametrami transformovať na tvar: prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. ktorú odhadneme regresnou funkciou v tvare kde Funkcia sa potom vypočíta ako lineárna funkcia. Nie všetky nelineárne funkcie je možné takýmto spôsobom prepočítať, len tie ktoré sú lineárne v parametroch, tj existuje určitá forma transformácie, ktorú nazývame linearizujúca transformácia, najčastejšie sa jedná o substitúciu a logaritmickú transformáciu napr.: prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. –        hyperbolická funkcia prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. logaritmická funkcia prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. exponenciálna funkcia prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. mocninová (Cobb-Douglasova produkčná funkcia) prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Podobne je možné upraviť aj niektoré viacparametrické nelineárne funkcie ako je napr. parabola druhého stupňa prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. hyperbola druhého stupňa prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Je potrebné si uvedomiť, že transformované regresné funkcie nemajú vždy rovnaké parametre ako pôvodné nelineárne regresné funkcie, takže je potrebné z odhadnutých parametrov transformovaných regresných funkcií spätne prepočítať odhady pôvodných parametrov. Takto získané odhady pôvodných parametrov síce nemajú optimálne štatistické vlastnosti, ale pre riešenie konkrétnych úloh často postačujú. Niektoré regresné funkcie nie je možné ani transformáciou premenných upraviť na funkcie lineárne v parametroch. Odhady parametrov takýchto funkcií sa získavajú pomocou rôznych aproximatívnych iteračných metód. Väčšina z nich je založená na postupnom zlepšovaní tzv. prvotných odhadov, ktorými môžu byť napríklad expertné odhady, odhady získané metódou vybraných bodov a pod. prof.Ing. Zlata Sojková, CSc.

Viacnásobná regresná a korelačná analýza   Predpokladajme, že medzi závisle premennou Y a vysvetľujúcimi (nezávisle) premennými Xi ,i = 1, 2, ..., k  je lineárna závislosť, o ktorej sme sa už z časti zmienili v predchádzajúcich častiach popísaná rovnicou ktorú odhadneme rovnicou prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Koeficienty , ktoré sú odhadmi parametrov , musia spĺňať požiadavku metódy najmenších štvorcov keďže predpokladáme konkrétny tvar regresnej funkcie môžeme ho dosadiť do predchádzajúceho vzťahu a hľadať minimum tejto funkcie tj.: minimum funkcie určíme podobne ako pre prípad jednoduchej regresnej závislosti pomocou parciálnych derivácií funkcie prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Čo vedie k sústave normálnych rovníc v tvare prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc. Riešením tejto sústavy rovníc vypočítame hľadané koeficienty lineárnej regresnej rovnice Podobne ako pre jednoduchú lineárnu závislosť, môžeme odhad parametrov vypočítať z maticovej rovnice Kvalitu regresného modelu hodnotíme podobne ako pre jednoduchú lineárnu závislosť, ktorú sme popísali v predchádzajúcej časti prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc.

prof.Ing. Zlata Sojková, CSc.