Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

4.3. Výber vhodných modelov

Podobné prezentace


Prezentace na téma: "4.3. Výber vhodných modelov"— Transkript prezentace:

1 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Časový rad výšky tučniakov priemerná výška generácie dospelých tučniakov ČR je stacionárny výška ··· t t+1 t+2 t+k

2 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Autokorelácia vo výške tučniakov výška je dedičstvom po rodičoch budúca hodnota závisí od minulých - autokorelácia ak správne popíšeme túto závislosť, vysvetlíme veľkú časť variability matka dcéra t +1 priemer P t +1

3 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Typy nesezónnych ARIMA modelov všetky vychádzajú z autokorelácie v časovom rade Čisté autoregresívne modely Kombinované autoregresívne modely kĺzavých priemerov Čisté modely kĺzavých priemerov Nesezónne ARIMA modely

4 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Čisté autoregresívne modely - AR(p) predikujú výšku tučniakov ako súčet násobkov výšky priemerného tučniaka výšky predchádzajúcich p generácií tučniakov čím vzdialenejšia je generácia, tým menší vplyv má na predikciu t-2 t-1 AR(2) priemer P prenásobenie a sčítanie výšky priemernej a predchádzajúcich generácií... ...slúži na predikciu výšky budúcej generácie...

5 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Čisté autoregresívne modely - AR(p) sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma celkového priemeru časového radu hodnôt časového radu v čase t-1, t-2, … t-p náhodnej chybovej zložky AR(2)

6 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Čisté modely kĺzavých priemerov - MA(q) sú založené na chybe predikcie rozdiel medzi skutočnou a predikovanou hodnotou časového radu pre daný okamih chyba predikcie t-1 aktuálne t-1 predikované

7 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Čisté modely kĺzavých priemerov - MA(q) predikujú výšku tučniakov ako súčet násobkov výšky priemerného tučniaka chýb predikcie pre výšky predchádzajúcich q generácií tučniakov čím vzdialenejšia je generácia, tým menší vplyv má chyba je predikcie t-2 násobky chýb t-1 P Priemer MA(2) Suma priemeru a násobkov predchádzajúcich chýb predikcie... ...slúži na predikciu výšky budúcej generácie...

8 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Čisté modely kĺzavých priemerov - MA(q) sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma celkového priemeru časového radu hodnôt náhodných chýb predikcie v čase t, t-1, t-2, … t-q AR(2)

9 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Kombinované autoregresívne modely kĺzavých priemerov - ARMA(p,q) predikujú výšku tučniakov ako kombináciu AR a MA metódy t-1 t-2 násobky chýb P t-1 t-2 násobky výšky ARMA(2,2) Suma násobkov výšky a násobkov predchádzajúcich chýb predikcie... ...slúži na predikciu výšky budúcej generácie...

10 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Kombinované autoregresívne modely kĺzavých priemerov (ARMA) sú modelmi náhodných procesov, ktorých hodnota v čase t je vážená suma celkového priemeru časového radu hodnôt časového radu v čase t-1, t-2, … t-p hodnôt náhodných chýb predikcie v čase t, t-1, t-2, … t-q ARMA(1,1)

11 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výber nesezónneho ARIMA modelu Odhadnúť AR model? ? Predaj výrobkov tabakového priemyslu v USA Koľko p? Odhadnúť ARMA model? Odhadnúť MA model? Koľko q?

12 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výber nesezónneho ARIMA modelu pridávanie parametrov do modelu zvyšuje presnosť odhadu znižuje jednoduchosť - zrozumiteľnosť modelu cieľom je nájsť optimálnu rovnováhu medzi presnosťou a jednoduchosťou modelu Model Presnosť Jednoduchosť

13 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výber nesezónneho ARIMA modelu ak je časový rad stacionárny autokorelácia medzi pozorovaniami slúži ako základný návod pri výbere modelu pri určení počtu parametrov vychádzame z jej grafického znázornenia grafy autokorelačných funkcií Y a t = + - d f 1

14 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výber modelu na základe grafov autokorelácie každý typ ARIMA modelov má svoj vlastný podpis špeciálny vzhľad grafov autokorelácie vhodný ARIMA model vyberieme na základe porovnania vzorového vzhľadu grafov autokorelácie skutočného vzhľadu v analyzovanom časovom rade vychádzame z dvoch grafov grafu výberovej autokorelačnej funkcie grafu výberovej parciálnej autokorelačnej funkcie

15 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výberová parciálna autokorelačná funkcia Sample Partial Autocorrelation Function - SPACF zobrazuje parciálne koeficienty autokorelácie k-rádu merajú silu závislosti medzi pozorovaniami časového radu vzdialenými od seba o k období za predpokladu, že vplyv iných pozorovaní je vylúčený tzv. čistá autokorelácia t–2 t–1 t

16 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Grafy autokorelácie pre AR(p) veľkosť koeficientov SACF klesá exponenciálne koeficienty SPACF miznú po oneskorení p SACF SPACF Exponenciálny pokles po p=2 miznú podpisový vzor modelu AR(2)

17 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov SACF pre AR(p) môže vyzerať rôzne základnou črtou je vyhladený, exponenciálny pokles koeficientov SACF P

18 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov SPACF pre AR(p) graf môžeme doplniť o hranice významnosti koeficientov pre test zhody koeficienta s nulou na základných hladinách významnosti posledný významný parciálny koeficient autokorelácie určuje rád AR modelu Posledný významný koeficient má k=2 ide o model AR(2) Hranice významnosti pre =0.05

19 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Príklady grafov pre AR(p) SACF SPACF jednoznačne AR(2) diskutabilné, ale tiež AR(2)

20 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Grafy autokorelácie pre MA(q) koeficienty SACF miznú po oneskorení q posledný významný koeficient určuje rád MA modelu veľkosť koeficientov SPACF klesá exponenciálne SACF SPACF miznú po q=2 Exponenciálny pokles podpisový vzor modelu MA(2)

21 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Grafy autokorelácie pre ARMA(p,q) SACF exponenciálne klesá po oneskorení q-p SPACF exponenciálne klesá po p-q SACF SPACF Exponenciálny pokles podpisový vzor modelu ARMA(1,1)

22 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Zhrnutie identifikačných znakov SACF SPACF A AR(p) A MA(q) A ARMA(p,q)

23 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Hľadajte model ČR 1 ČR 2

24 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Hľadajte model ČR 3 ČR 4

25 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Hľadajte model ČR 5 ČR 6

26 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Sezónny časový rad ak je časový rad dlhší ako rok, môže obsahovať sezónnosť výška tučniakov už nebude len vecou dedičstva po rodičoch bude závisieť aj ročného obdobia, v ktorom sa generácia narodila musíme je zahrnúť do modelu t t+4 narodení v lete narodení v zime t t+4 priemer P

27 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Graf sezónnej autokorelácie je vlastne súčasťou bežných grafov autokorelácie sezónna autokorelácia sa prejaví významný koeficientmi na miestach s oneskorením rovným násobku dĺžky sezóny SACF SPACF nesezónna autokorelácia prejav sezónnej autokorelácie

28 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Sezónne ARIMA modely sú vlastne dva ARIMA modely v jednom jeden pre vyjadrenie nesezónnej autokorelácie - nesezónny druhý pre vyjadrenie sezónnej autokorelácie - sezónny pre sezónne modely platia rovnaké princípy, ale sledujú sezónnu časovú škálu tiež tri typy čisté sezónne autoregresívne modely čisté sezónne modely kĺzavých priemerov kombinované sezónne autoregresívne modely kĺzavých priemerov Nesezónny model Sezónny model

29 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Výber sezónnych ARIMA modelov tiež je založený na analýze grafov SPACF a SACF hľadáme známe podpisové vzory, ale na miestach s ročným oneskorením SACF SPACF Sezónny podpisový vzor Nesezónny podpisový vzor

30 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Zápis sezónnych ARIMA modelov umožňuje rozlíšenie sezónnych a nesezónnych zložiek p, P - rád AR modelov q, Q - rád MA modelov d, D - rád diferencií potrebných na stacionarizáciu s - sezónnosť, napr. 12, 6, 4 Nesezónny model Sezónny model ARIMA (p, d, q) (P, D, Q) s

31 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Prelievanie sezónnej autokorelácie ak časový rad obsahuje sezónnu aj nesezónnu zložku koeficienty na sezónnych miestach, akoby sa rozliali do susedných hodnôt koeficientov koeficienty v ich okolí sa javia ako významné a aj tak s nimi pracujeme vyplýva to z matematickej podstaty modelu, nie je to porušenie kvality modelu rozliatie do susedných hodnôt

32 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Hľadajte model ČR 7 (mesačný)

33 4.3. Výber vhodných modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.3. Výber vhodných modelov Hľadajte model ČR 8 (mesačný)

34 4.4. Porovnanie kvality modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.4. Porovnanie kvality modelov Miery kvality modelu Prognózovací systém počíta viac ako 20 mier presnosti odhadu prognostického modelu 2 R Adjusted R 2 Min Error MSE AIC Random Walk R 2 SSE Max Error Amemiya’s Adjusted R 2 SBC MAPE RMSE

35 4.4. Porovnanie kvality modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.4. Porovnanie kvality modelov Tradičné miery kvality modelu napr. MSE, RMSE, R2 porovnávajú modely v absolútnych mierach pre modely s podobným počtom parametrov je ako najlepší vybraný model s najmenšou RMSE alebo najväčším R2 pri hodnotení kvality uprednostňujú presnosť to môže viesť k výberu preparametrizovaného modelu treba použiť aj iné miery Presnosť Jednoduchosť Model R 2 RMSE

36 4.4. Porovnanie kvality modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.4. Porovnanie kvality modelov Penalizačné miery kvality modelu napr. Akaikeovo informačné kritérium (AIC) alebo Schwarz-Bayesovo kritérium hľadajú lepšiu rovnováhu medzi jednoduchosťou a presnosťou vychádzajú z MSE zvyšujú ho penalizačný faktor, ktorý rastie s počtom parametrov najlepší model minimalizuje tieto miery Presnosť Jednoduchosť Model AIC SBC

37 4.4. Porovnanie kvality modelov
Základy štatistiky s využitím systému SAS® 12/7/2018 4.4. Porovnanie kvality modelov Zadržaná vzorka ak je časový rad dostatočne dlhý, rozdelíme ho na dva po sebe idúce intervaly prvý použijeme na odhad parametrov modelu druhý - zadržanú vzorku - použijeme na výpočet mier kvality odhadnutého modelu kvalitu a stabilitu modelu možno overiť aj zmenami dĺžky intervalov najlepší model má najlepšie výsledku pre najväčší počet vzoriek ··· Odhadová vzorka Zadržaná vzorka

38 Základy štatistiky s využitím systému SAS®
12/7/2018 4.5. Výpočet prognózy Transformácia prognostického modelu do pôvodných jednotiek Stacionarizujúce transformácie Stationarland “Skutočný svet” Prognóza Odhad modelu Aplikácia modelu


Stáhnout ppt "4.3. Výber vhodných modelov"

Podobné prezentace


Reklamy Google