Analýza časových řad Klasický přístup k analýze ČŘ dekompozice časové řady - rozklad ČŘ na složky charakterizující různé druhy pohybů v ČŘ, které umíme popsat a kvantifikovat trend periodické kolísání cyklické sezónní krátkodobé náhodná složka Trend + periodická složka = deterministická složka
Základní modely časových řad: aditivní multiplikativní smíšený
Popis trendové složky vyrovnání ČŘ = nahrazení empirických hodnot ČŘ řadou teoretických hodnot, které charakterizují vývoj ČŘ za předpokladu, že je očištěn od sezónní a náhodné složky klasický přístup - popisujeme trend řady analytickou funkcí (tj. modelem s neměnnými parametry) adaptivní přístup - parametry modelu se mění, tj. reagují na měnící se charakter ČŘ (klouzavé průměry)
Analytické vyrovnání ČŘ ( popis trendu ČŘ analytickou funkcí) volba analytické funkce: grafický rozbor logický rozbor vývoje statistická kriteria (MSE) Nejčastěji používané analytické funkce popisující trend Lineární Kvadratický (parabola) Exponenciální S-křivka (nejznámější logistická funkce)
základní metoda k odvození parametrů trendových funkcí lineárních v parametrech: Metoda nejmenších čtverců (MNČ) Lineární funkce - přímka (přímkový trend) teoretická trendová přímka Výběrová trendová přímka Cílem je najít přímku, která nejlépe popisuje průběh závislosti, tj. přímku, která je zjištěným hodnotám časové řady nejblíže
Lineární trend odhady parametrů trendové přímky (odvozeny MNČ)
T = 37,05 + 5,5 t Vypočítejte rovnici trendové přímky měsíc t yt yt tt 1 40 2 56 4 112 3 55 9 165 60 16 240 5 53 25 265 6 70 36 420 7 72 49 504 8 86 64 688 89 81 801 45 581 285 3235 T = 37,05 + 5,5 t
Parabolický trend soustava normálních rovnic
Odhady parametrů trendových funkcí nelineárních v parametrech Příklady: T = a b t exponenciální funkce T = a t b mocninná funkce S-křivka (logistická funkce) nelze použít MNČ k odhadu parametrů trendové funkce nelineární v parametrech Postup odhadu parametrů: Najdeme vhodný tzv. počáteční odhad 2. ten postupně zlepšujeme iteračními postupy tak dlouho, až dostaneme odhad s požadovanou přesností
Funkce nelineární v parametrech Exponenciální trend T = a b t použijeme metodu linearizující transformace log T = log a + t log b MNČ odvodíme parametry log a, log b odlogaritmováním získáme parametry a, b interpretace: a = geometrický průměr hodnot ČŘ b = průměrný koeficient růstu Modifikovaný exponenciální trend T = k + a0 a1 t je častým modelem ekonomických jevů, které vycházejí z omezených zdrojů nebo u nichž existuje mez nasycení
S - křivky Logistický trend Gompertzova křivka - inflexní bod rozděluje křivku na dvě stejné části asymetrická křivka, těžiště je až za inflexním bodem
Posouzení vhodnosti analytické vyrovnávací křivky Používají se různé míry založené na základě reziduálních součtu čtverců MSE (Mean Squared Error) = střední čtvercová chyba Pro výběr mezi funkcemi
test nezávislosti reziduí – Durbin-Watsonův test ♣ Index determinace ♣ reziduální rozptyl test nezávislosti reziduí – Durbin-Watsonův test
Klouzavé průměry princip: ČŘ vyrovnáváme postupně polynomickými křivkami definovanými pro krátké úseky řady (délky m), které nazýváme "klouzavá část". Empirické hodnoty ČŘ pak nahrazujeme průměry vypočítanými z příslušné klouzavé části. délku klouzavé části volíme: ČŘ ročních údajů m = 3,5,7,... ČŘ čtvrtletních údajů m = 4 ČŘ měsíčních údajů m = 12 ČŘ týdenních údajů m = 7
Prosté klouzavé průměry klouzavou část vyrovnáváme přímkou klouzavý průměr je vypočítán jako průměr z: p hodnot, které předcházejí vyrovnávané hodnotě yt, vyrovnávané hodnoty yt, p hodnot, které následují za hodnotou yt. klouzavá část má délku prostý klouzavý průměr
Příklad: Vyrovnání ČŘ ročních údajů klouzavými průměry délky m = 3 a m = 5. Rok y 3-leté klouzavé úhrny průměry 5-leté 1 3 2 4 15 5 8 18 6 28 5,6 21 7 35 7,0 23 7,67 39 7,8 10 25 8,33 41 8,2 9,33 49 9,8 32 10,67 54 10,8 9 14 36 12
centrované klouzavé průměry používání v případě sudé klouzavé části: m = 4, m =12) centrovaný klouzavý průměr = průměr ze dvou za sebou jdoucích klouzavých průměrů Čtvrtletí yt 4-členné klouz. úhrny 4-členné kl. průměry Centrované kl.průměry I/1 3 I/2 4 I/3 8 5,75 I/4 6 7,00 II/1 7 7,75 II/2 10 8,25 II/3 II/4 5,25 21 25 6,25 31 7,75 31 7,75 35 8,75
Popis sezónní složky měření sezónního kolísání vliv sezónní složky se projevuje u ČŘ s periodicitou nejvýše 1 rok i = 1, 2, ..., m roky j = 1, 2, ..., s sezóny (počet pozorování ČŘ n = m.s) měření sezónního kolísání sezónní (periodické) odchylky (ADITIVNÍ MODEL) sezónní (periodické) indexy (MULTIPLIKATIVNÍ MODEL) sezónní (periodické) odchylky jsou definovány jako rozdíl mezi hodnotou ČŘ a hodnotou očištěnou od sezónních vlivů sezónní (periodické) indexy jsou definovány jako podíl hodnoty ČŘ a hodnoty očištěné od sezónních vlivů
Časové řady bez trendu průměrná sezónní odchylka j-té sezóny průměrný sezónní index j-té sezóny
Časové řady s trendem sezónní odchylky - pokud se periodické výkyvy nemění v závislosti na trendu, tj., pokud jsou pro stejná období jednotlivých let konstantní průměrná sezónní odchylka j-té sezóny
Definitivní hodnoty sezónních výkyvů (sezónní faktory) vypočteme vyrovnáním na podmínku
Příklad: Čtvrtletní tržby cestovní kanceláře i j 1 82 - 2 105 3 128 103,125 +24,875 4 93 105,375 -12,375 5 91 107,000 -16,000 6 114 108,125 + 5,875 7 132 109,000 +23,000 8 98 109,625 -11,625 9 110,250 -17,250 10 117 110,375 +6,625 11 134 12 97
Příklady výpočtů: ……….
Sezónní faktory
Časové řady s trendem sezónní indexy - Pokud se periodické výkyvy mění v závislosti na trendu, tj., pokud nejsou pro stejná období jednotlivých let konstantní průměrný sezónní index j-té sezóny
Sezónní očišťování obecný model ČŘ aditivní multiplikativní je jiný přístup k nalezení vývojové tendence časové řady umožní porovnávat hodnoty ukazatele v různých letech umožní porovnávat hodnoty ukazatele v různých obdobích (měsících) roku obecný model ČŘ aditivní multiplikativní řada očištěná od sezónnosti (v PC "adjusted data") aditivní model multiplikativní model
METODA SEZÓNNÍ DEKOMPOZICE Aditivní model Postup: Odhadneme trend pomocí klouzavých průměrů Vypočteme hodnoty sezónních výkyvů Pro každou sezónu vypočteme průměry z odpovídajících hodnot průměrné sezónní odchylky Definitivní hodnoty sezónních výkyvů (sezónní faktory) vypočteme vyrovnáním na podmínku Vypočteme sezónně očištěné hodnoty
Příklad: Čtvrtletní tržby cestovní kanceláře i j 1 82 - 99,02 2 105 99,14 3 128 103,125 +24,875 104,45 4 93 105,375 -12,375 105,39 5 91 107,000 -16,000 108,02 6 114 108,125 + 5,875 108,14 7 132 109,000 +23,000 108,45 8 98 109,625 -11,625 110,39 9 110,250 -17,250 110,02 10 117 110,375 +6,625 111,14 11 134 110,45 12 97 109,39
Sezónní faktory
Sezónní složka – regresní přístup REGRESE S UMĚLÝMI PROMĚNNÝMI Trendová složka – analytická funkce (přímka, parabola... pro popis sezónní složky použijeme umělé proměnné ( nula-jedničkové proměnné detekující 1,...,s-1 období) kde jsou sezónní faktory odhad
Použijeme aditivní model (čtvrtletní časová řada) (použijeme sezónní výkyvy = sezónní odchylky) Musí platit Sezónní výkyvy (průměrné sezónní odchylky) Trendová funkce pro lineární trend Výsledný model ČŘ (např. pro přímkový trend)
Příklad: Čtvrtletní tržby cestovní kanceláře (použijte kvadratický trend) 1 82 2 4 105 3 9 128 16 93 5 25 91 6 36 114 7 49 132 8 64 98 81 10 100 117 11 121 134 12 144 97
Sezónní výkyvy (průměrné sezónní odchylky) výpočet z PC : Odhady sezónních faktorů Sezónní výkyvy (průměrné sezónní odchylky) Kvadratický trend výsledný Výsledný model
Sezónní očišťování regresní metodou obecný model ČŘ aditivní řada očištěná od sezónnosti
Příklad: Čtvrtletní tržby cestovní kanceláře i j 1 82 98,62 2 105 99,65 3 128 104,35 4 93 105,38 5 91 107,62 6 114 108,65 7 132 108,35 8 98 110,38 9 109,62 10 117 111,65 11 134 110,35 12 97 109,38 Sezónní faktory
Popis náhodné složky předpoklady o náhodné složce: náhodnou složku chápeme jako výsledek působení souboru náhodných vlivů předpoklady o náhodné složce: 1. Nulová střední hodnota 2. Homoskedasticita 3. Nekorelovanost (nezávislost náhodných poruch) Obecný předpoklad - koeficient autokorelace autokorelace (závislost dvou za sebou následujících náhodných poruch)
náhodnou složku odhadujeme pomocí reziduí teoretické předpoklady o náhodné složce ověřujeme testy reziduí pokud nejsou splněny teoretické předpoklady o náhodné složce, použitý model deterministické složky není dobrý
Test nezávislosti reziduí - Durbin-Watsonův test d 2 nezávislost d 0 přímá závislost d 4 nepřímá závislost
Extrapolace časových řad extrapolace = prodloužení trendu ČŘ do budoucnosti vychází z deterministického přístupu, že analyzovaná ČŘ do budoucna nemění své chování Nebezpečí: v případě nestabilních časových řad, u kterých dochází ke kvalitativním změnám chování, nelze uvedený princip použít Uvažujme časovou řadu prognóza v čase t na i období dopředu znamená odhad hodnoty ČŘ v okamžiku t + i, tj. odhad hodnoty i = horizont předpovědi
metody provedení prognózy závisí na typu prognózované časové řady ČŘ bez trendu a bez sezónnosti - extrapolujeme průměrnou hodnotou ČŘ se zřejmým trendem, který lze vyjádřit analytickou funkcí - dosadíme do trendové funkce horizont předpovědi i ČŘ se sezónností (multiplikativní nebo aditivní model) ČŘ s výkyvy, nepravidelnostmi apod. použijeme adaptivní přístupy (např. exponenciální vyrovnávání) jiné metody, např. Box-Jenkinsovu metodologii
Příklad: Počet návštěvníků knihovny ve 13 letech byl popsán lineární trendovou funkcí Rok 1 1901 2109 -208 2 2085 2223 -138 3 2124 2337 -213 4 2431 2450 -19 5 2858 2564 +295 6 3164 2678 +486 7 3150 2791 +359 8 2963 2905 +58 9 2746 3019 -273 10 2986 3132 -146 11 3103 3246 -143 12 3287 3360 -73 13 3488 3473 +15 14 předpověď 3587 15 3701 16 3814
Bodové předpovědi:
Podmínky použití klasických statistických metod k extrapolacím ČŘ musí být přiměřeně dlouhá ČŘ musí mít jednoznačný trend, který lze aproximovat co nejjednodušší analytickou funkcí třeba rozlišovat mezi krátkodobou a dlouhodobou prognózou (podle účelu) statistickou analýzu provádět současně s věcnou analýzou kvalitu předpovědi posuzovat statistickými kriterii
Exponenciální vyrovnávání vyrovnání exponenciální funkcí základy metody Holt a Brown empirické hodnoty ČŘ yt y1, y2, ... , yn-1, yn = přítomnost yn-k, yn-k-1,...., yn-1, yn k je "stáří" pozorování k = 0,1,2,...., n-1 model ČŘ : yn-k = Tn-k + n-k parametry funkce - odvození modifikovanou MNČ
wk = k = vyrovnávací konstanta wk jsou váhy pozorování úměrné stáří pozorování wk = k = vyrovnávací konstanta 0 1 k = 0, 1, ....., n-1