Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Regresná a korelačná analýza (RaKA) resp. Korelačný počet

Podobné prezentace


Prezentace na téma: "Regresná a korelačná analýza (RaKA) resp. Korelačný počet"— Transkript prezentace:

1 Regresná a korelačná analýza (RaKA) resp. Korelačný počet
prof.Ing. Zlata Sojková, CSc.

2 Skúmanie vzťahov medzi štatistickými znakmi:
Skúmanie vzťahov medzi kvalitatívnymi znakmi, napr. AB , nazýme meranie asociácie skúmanie vzťahov medzi kvantitatívnymi štatistickými znakmi - regresná a korelačná analýza prof.Ing. Zlata Sojková, CSc.

3 prof.Ing. Zlata Sojková, CSc.

4 Pri regresenej a korelečnej analýze pôjde
skúmanie príčinnej - kauzálnej závislosti, skúmanie vzťahov medzi príčinou a účinkom kedy jeden resp viac javov (znakov, nezávisle prememnných veličín ) vyvoláva účinok - výsledný jav - závisle prememnnú veličinu Y = f (X1 X2…... Xk ,Bo , B1 ,….Bp ) +e Neznáme parametre funkčného vzťahu Nezávislé premenné veličiny - príčiny Náhodné, nešpecifikované vplyvy Závislé premenná - účinok prof.Ing. Zlata Sojková, CSc.

5 Príklad zdanlivej korelácie
Jedna z preslávených zdanlivých korelácií : ak sa dĺžka sukní skracuje kurzy akcií stúpajú . Odhliadnúc od toho, že to nie vždy platí, išlo by Skutočne o zdanlivú, alebo nezmyselnú koreláciu prof.Ing. Zlata Sojková, CSc.

6 Príklady štatistickej - voľnej -závislosti
Skúmanie závislosti spotreby bravčového mäsa od príjmu, ceny mäsa bravčového ceny mäsa hovädzieho a hydiny a od tradície, resp. ďalších nešpecifikovaných, či náhodných vplyvov. Skúmanie pridanej hodnoty resp. HNP od vstupov: práce a kapitálu…. Skúmanie závislosti výživy obyvateľstva od stupňa ekonomického rozvoja krajiny…. prof.Ing. Zlata Sojková, CSc.

7 Opakom štatistickej závislosti je funkčná závislosť
Y = f(X1 X2…... Xk ,Bo , B1 ,…., Bp) kedy je závisle prememnná veličina jednoznačne určená funkčným vzťahom, príklady z fyziky, chémie - takýto druh vzťahov nie je predmetom štatistického skúmania prof.Ing. Zlata Sojková, CSc.

8 Regresná a korelačná analýza (RaKA)
Dve základné úlohy RaKA: regresná úloha (RÚ) jej podstatou je a) nájsť funkčný vzťah podľa ktorého sa mení závislé premenná so zmenou nezávisle premenných - nájsť vhodnú regresnú funkciu. b) Súčasne je potrebné odhadnúť parametre regresnej funkcie. korelačná úloha (KÚ)- merať tesnosť - silu skúmanej závislosti. prof.Ing. Zlata Sojková, CSc.

9 Znázornenie korelačného poľa v dvoch prípadoch
y x y x prof.Ing. Zlata Sojková, CSc.

10 Podľa počtu nezávisle premenných rozlišujeme:
Jednoduchú závislosť , kedy uvažujeme len jednú nezávislé premennú X, teda skúmame vzťah medzi Y a X viacnásobnú závislosť, pri ktorej uvažujeme minimálne dve nezávislé prememnné veličiny (znaky) X1, X2, … Xk , pričom k  2 prof.Ing. Zlata Sojková, CSc.

11 Jednoduchá regresná a korelačná analýza
Uvažujme štatistický znak X a Y medzi ktorými je v základnom súbore lineárna závislosť Y = Bo + B1 X +e bodovým odhadom tejto regresnej funkcie je priamka yj = b0 + b 1 xj + ej , ktorej koeficienty vypočítame z výberových údajov Akú metódu použiť ??? prof.Ing. Zlata Sojková, CSc.

12 Metóda najmenších štvorcov (MNŠ)
Získame sústavu p+1 rovníc s p+1 neznámymi parametrami prof.Ing. Zlata Sojková, CSc.

13 prof.Ing. Zlata Sojková, CSc.
yj = b0 + b 1 xj + ej  môžeme zapísať yj = yj , + ej a ej = y j - yj , Princíp MNŠ Metódy najmenších štvorcov (ej )2 = (y j - y j’)2 (ej ) = y j - y j’ prof.Ing. Zlata Sojková, CSc.

14 prof.Ing. Zlata Sojková, CSc.
Možno dokázať, že koeficienty bo , b1 , …, bp určené MNŠ sú “najlepšie odhady” parametrov B 0 , B1 , …, Bp ak súčasne o náhodných chybách platí: E (ej ) = 0, D (ej ) = E (ej2 ) = 2 , E(ej1 , ej2 ) = 0 , pre každé j1  j2 Slovne možno podmienku formulovať nasledovne: od náhodných chýb požadujeme nulovú strednú hodnotu, konštantný rozptyl a vzájomnú nezávislosť náhodných chýb. prof.Ing. Zlata Sojková, CSc.

15 Koeficienty jednoduchej regresnej funkcie odvodíme:
prof.Ing. Zlata Sojková, CSc.

16 prof.Ing. Zlata Sojková, CSc.
Úpravou získame nasledovné dve normálové rovnice s dvomi neznámymi parametrami: Sústavu rovníc môžme riešiť eliminačnou metódou , alebo pomocou determinantov. Získame tak koeficienty b o a b 1 prof.Ing. Zlata Sojková, CSc.

17 Postup pri výpočte koeficientov LRF
xj yj xjyj xj 2 x1 y1 x1y x12 x2 y2 xn yn prof.Ing. Zlata Sojková, CSc.

18 Interpretácia koeficientov ljednoduchej lineárnej regresnej funkcie
bo …lokujúca konštanta vyjadruje očakávanú úroveň závislé premennej pri nulovej hodnote nezávisle premennej b 1 …. regresný koeficient vyjadruje o koľko merných jednotiek sa zmení závislé premenná pri zmene nezávisle premennej o jednu mernú jednotku ak b1 > 0 …ide o pozitívnu závislosť po b1< 0 ….jedná sa o negatívnu závislosť prof.Ing. Zlata Sojková, CSc.

19 Vlastnosti metódy najmenších štvorcov:
Regresná funkcia prechádza bodom o súradniciach a prof.Ing. Zlata Sojková, CSc.

20 Kedy možno MNŠ aplikovať?
Ak je regresná funkcia lineárna lineárna v parametroch (LvP) alebo vieme regresnú funkciu transformovať na lineárnu v prametroch Posúďte u ktorých z nasledujúccich regresných funkcií možno použiť MNŠ prof.Ing. Zlata Sojková, CSc.

21 Niektoré typy jednoduchých regresných funkcií
prof.Ing. Zlata Sojková, CSc.

22 Príklady z mikro- a makroekonómie
Philipsova krivka ???? Cobbova -Douglasova produkčná funkcia Engelove krivky Krivky ekonomického rastu Uveďte ďalšie…... prof.Ing. Zlata Sojková, CSc.

23 Skúmanie vzťahu spotreby vybraných komodít od úrovne HNP
prof.Ing. Zlata Sojková, CSc.

24 Porovnanie dvoch prípadov závislosti Ktorá závislosť bude tesnejšia?
y x y x prof.Ing. Zlata Sojková, CSc.

25 prof.Ing. Zlata Sojková, CSc.
Intervaly spoľahlivosti pri lineárnej regresii. Okrem bodových odhadov parametrov lineárnej regresnej funkcie sa často prepočítavajú aj intervalové odhady parametrov, ktoré nazývame intervaly spoľahlivosti. Výpočty intervalov spoľahlivosti je možné urobiť s pomocou štandardných odchýlok parametrov a reziduálneho rozptylu. Reziduálny rozptyl je za predpokladu platnosti podmienok lineárneho klasického modelu , neskresleným odhadom stochastického parametra a vypočíta sa podľa vzťahu prof.Ing. Zlata Sojková, CSc.

26 Intervalový odhad ľubovoľného parametra pre regresnú priamku
vychádza z toho, že za predpokladov formulovaných klasickým lineárnym modelom má veličina t rozdelenie s n – p stupňami voľnosti. Pri zvolenej spoľahlivosti 1 – je obojstranný interval spoľahlivosti pre parameter daný vzťahom prof.Ing. Zlata Sojková, CSc.

27 prof.Ing. Zlata Sojková, CSc.
a pre parameter analogicky sa konštruuje aj obojstranný interval spoľahlivosti pre regresnú priamku kde je kvantil t rozdelenia s (pre regresnú priamku n – 2) stupňami voľnosti. prof.Ing. Zlata Sojková, CSc.

28 Korelačná úloha korelačného počtu
Skúmať tesnosť - silu - závislosti k tomu slúžia miery tesnosti závislosti požadujeme, aby sa pohybovali v pevne ohraničanom intervale, a aby vrámci intervalu rástli s vyššiou silou závislosti prof.Ing. Zlata Sojková, CSc.

29 prof.Ing. Zlata Sojková, CSc.
Korelačná analýza predstavuje súhrn metód a postupov, pomocou ktorých overujeme vypovedaciu schopnosť kvantifikovaných regresných modelov ako celku aj jeho častí. Overovanie vypovedacej schopnosti vedie k výpočtu číselných charakteristík, ktoré v koncentrovanej forme popisujú kvalitu vypočítaných modelov. prof.Ing. Zlata Sojková, CSc.

30 prof.Ing. Zlata Sojková, CSc.
Index korelácie a index determinácie V základnom súbore Iyx odhadom z výberových údajov je iyx est Iyx = iyx . Princíp spočíva v rozklade variability závisle premennne Y Variabilita nevysvetlená regresnou funkciou - reziduálna variabilita Variabilita závisle premennej vysvetlená regresnou funkciou Celková variabilita závisle premennej prof.Ing. Zlata Sojková, CSc.

31 prof.Ing. Zlata Sojková, CSc.
. Je zrejmé, že platí vzťah  C = V + N C = je celkový súčet štvorcov odchýlok V = je vysvetlený súčet štvorcov odchýlok N = je nevysvetlený (reziduálny) súčet štvorcov odchýlok. prof.Ing. Zlata Sojková, CSc.

32 prof.Ing. Zlata Sojková, CSc.
Index korelácie iyx Index determinácie iyx2 prof.Ing. Zlata Sojková, CSc.

33 prof.Ing. Zlata Sojková, CSc.
Index determinácie môže nadobúdať hodnoty z intervalu 0 až 1 , čím viac sa hodnota indexu blíži k jednotke, tým väčšia časť celkovej variability je modelom vysvetlená a naopak, ak sa index determinácie blíži k nule, tým menšia časť celkovej variability je modelom vysvetlená.  Index determinácie sa bežne používa ako kritérium pri rozhodovaní o voľbe konkrétneho tvaru regresnej funkcie. Ak však majú regresné funkcie rôzny počet parametrov je potrebné upraviť index determinácie do korigovanej podoby v tvare: prof.Ing. Zlata Sojková, CSc.

34 prof.Ing. Zlata Sojková, CSc.
Variabilita Súčet štvorcov odchýlok Stupne voľnosti Rozptyl F test Vysvetlená Nevysvetlená V = N = F = Celková C = prof.Ing. Zlata Sojková, CSc.

35 prof.Ing. Zlata Sojková, CSc.
Testovacie kritérium v tabuľke je možné využiť k súčasnému testovaniu významnosti celého regresného modelu, indexu determinácie aj indexu korelácie. Vypočítanú hodnotu F testu porovnávame s kvantilom F rozdelenia a p-1 a n – p stupňov voľnosti tj. ak F považujeme regresný model za nevýznamný, podobne aj index determinácie a index korelácie. ak F > považujeme regresný model za štatisticky významný, podobne aj index determinácie a index korelácie prof.Ing. Zlata Sojková, CSc.

36 prof.Ing. Zlata Sojková, CSc.
K detailnému vyhodnoteniu kvality jednotlivých parametrov regresného modelu sa používajú t testy parametrov. Pri teste formulujeme nulovú hypotézu H0 : pre i = 0, H1 : v ktorej predpokladáme nulové teda nevýznamné pôsobenie či vplyv premennej pri ktorej parameter stojí. Testovacie kritérium je definované vzťahom prof.Ing. Zlata Sojková, CSc.

37 prof.Ing. Zlata Sojková, CSc.
kde je hodnota parametra regresnej funkcie a je štandardná odchýlka parametra. Vypočítanú hodnotu testovacieho kritéria porovnávame s kvantilom t rozdelenia na hladine významnosti a stupňov voľnosti tj.: - ak        nulovú hypotézu o nevýznamnosti parametra nezamietame -  ak       zamietame nulovú hypotézu a potvrdzujeme štatistickú významnosť posudzovaného parametra. prof.Ing. Zlata Sojková, CSc.

38 Nelineárna regresná a korelačná analýza
Okrem lineárnych regresných funkcií sa v praxi veľmi často používa celý rad nelineárnych funkcií, pričom je možné použiť nelineárne funkcie s dvoma alebo viacerými parametrami. Niektoré nelineárne regresné funkcie je možné vhodnou transformáciou upraviť na lineárne v parametroch, ktoré potom môžeme riešiť metódou najmenších štvorcov. Najčastejšie môžeme nelineárne funkcie s dvoma parametrami transformovať na tvar: prof.Ing. Zlata Sojková, CSc.

39 prof.Ing. Zlata Sojková, CSc.
ktorú odhadneme regresnou funkciou v tvare kde Funkcia sa potom vypočíta ako lineárna funkcia. Nie všetky nelineárne funkcie je možné takýmto spôsobom prepočítať, len tie ktoré sú lineárne v parametroch, tj existuje určitá forma transformácie, ktorú nazývame linearizujúca transformácia, najčastejšie sa jedná o substitúciu a logaritmickú transformáciu napr.: prof.Ing. Zlata Sojková, CSc.

40 prof.Ing. Zlata Sojková, CSc.
–        hyperbolická funkcia prof.Ing. Zlata Sojková, CSc.

41 prof.Ing. Zlata Sojková, CSc.
logaritmická funkcia prof.Ing. Zlata Sojková, CSc.

42 prof.Ing. Zlata Sojková, CSc.
exponenciálna funkcia prof.Ing. Zlata Sojková, CSc.

43 prof.Ing. Zlata Sojková, CSc.
mocninová (Cobb-Douglasova produkčná funkcia) prof.Ing. Zlata Sojková, CSc.

44 prof.Ing. Zlata Sojková, CSc.
Podobne je možné upraviť aj niektoré viacparametrické nelineárne funkcie ako je napr. parabola druhého stupňa prof.Ing. Zlata Sojková, CSc.

45 prof.Ing. Zlata Sojková, CSc.
hyperbola druhého stupňa prof.Ing. Zlata Sojková, CSc.

46 prof.Ing. Zlata Sojková, CSc.
Je potrebné si uvedomiť, že transformované regresné funkcie nemajú vždy rovnaké parametre ako pôvodné nelineárne regresné funkcie, takže je potrebné z odhadnutých parametrov transformovaných regresných funkcií spätne prepočítať odhady pôvodných parametrov. Takto získané odhady pôvodných parametrov síce nemajú optimálne štatistické vlastnosti, ale pre riešenie konkrétnych úloh často postačujú. Niektoré regresné funkcie nie je možné ani transformáciou premenných upraviť na funkcie lineárne v parametroch. Odhady parametrov takýchto funkcií sa získavajú pomocou rôznych aproximatívnych iteračných metód. Väčšina z nich je založená na postupnom zlepšovaní tzv. prvotných odhadov, ktorými môžu byť napríklad expertné odhady, odhady získané metódou vybraných bodov a pod. prof.Ing. Zlata Sojková, CSc.

47 Viacnásobná regresná a korelačná analýza
Predpokladajme, že medzi závisle premennou Y a vysvetľujúcimi (nezávisle) premennými Xi ,i = 1, 2, ..., k  je lineárna závislosť, o ktorej sme sa už z časti zmienili v predchádzajúcich častiach popísaná rovnicou ktorú odhadneme rovnicou prof.Ing. Zlata Sojková, CSc.

48 prof.Ing. Zlata Sojková, CSc.
Koeficienty , ktoré sú odhadmi parametrov , musia spĺňať požiadavku metódy najmenších štvorcov keďže predpokladáme konkrétny tvar regresnej funkcie môžeme ho dosadiť do predchádzajúceho vzťahu a hľadať minimum tejto funkcie tj.: minimum funkcie určíme podobne ako pre prípad jednoduchej regresnej závislosti pomocou parciálnych derivácií funkcie prof.Ing. Zlata Sojková, CSc.

49 prof.Ing. Zlata Sojková, CSc.
Čo vedie k sústave normálnych rovníc v tvare prof.Ing. Zlata Sojková, CSc.

50 prof.Ing. Zlata Sojková, CSc.
Riešením tejto sústavy rovníc vypočítame hľadané koeficienty lineárnej regresnej rovnice Podobne ako pre jednoduchú lineárnu závislosť, môžeme odhad parametrov vypočítať z maticovej rovnice Kvalitu regresného modelu hodnotíme podobne ako pre jednoduchú lineárnu závislosť, ktorú sme popísali v predchádzajúcej časti prof.Ing. Zlata Sojková, CSc.

51 prof.Ing. Zlata Sojková, CSc.

52 prof.Ing. Zlata Sojková, CSc.

53 prof.Ing. Zlata Sojková, CSc.


Stáhnout ppt "Regresná a korelačná analýza (RaKA) resp. Korelačný počet"

Podobné prezentace


Reklamy Google