Časové řady vznikají při sledování veličiny (Y) v čase (t) hodnoty: y1, y2,…,yT neboli: { yt ; t=1,…T } Y…veličina (ukazatel) libovolného typu, nejčastěji ale číselná spojitá věcné a místní vymezení (co, kde)
Časové řady Příklady: denní tržby v daném obchodě měsíčně počet zaměstnanců firmy čtvrtletní míra nezaměstnanosti v regionu roční míra inflace v zemi
Časové řady - typy a) dle shody dob mezi údaji: ekvidistantní…každé období stejně dlouhé neekvidistantní…existují rozdíly b) dle délky doby mezi údaji: krátkodobé – střednědobé – dlouhodobé jasnější je konkr. vymezení, nejčastěji: denní – týdenní – měsíční – čtvrtletní – roční – pětileté – …
? kde je ekvidistantnost nutnější ? Časové řady - typy c) dle (ne)kumulativnosti údajů: okamžikové…údaj = stav k danému okamžiku; (jednotlivé hodnoty nemá smysl kumulovat=sčítat) intervalové…údaj za celou dobu (interval) t; (jednotlivé hodnoty má smysl kumulovat=sčítat, kumulací vznikají souhrny za více období) Např. u automobilky: počet zaměstnanců k poslednímu dni každého měsíce; počet vozů vyrobených za každý měsíc ? kde je ekvidistantnost nutnější ?
Časové řady - typy d) dle vzniku údajů: základní…údaj byl přímo zjištěn (změřen…) odvozené…údaj nutno vypočítat Např. každoročně určovaná hustota obyvatel - odvozeno vždy z rozlohy a počtu obyvatel
Časové řady - jejich složky časové řady mohou vykazovat trend = systematické „směřování“ trend často patrný již z grafu Př. vývoj průměr- né hrubé měsíční nominální mzdy v Ústeckém kra- ji (roky 2004-08)
Časové řady - jejich složky delší časové řady mohou vykazovat periodické či cyklické chování = opakované výkyvy často patrné již z grafu Př. průměrné čtvrtletní výdaje na osobu, SRN (roky 1985-87) - v tehdejších „záp.“ markách
Časové řady - jejich složky časové řady vždy vykazují nahodilé chování = náhodné výkyvy (nikdy neleží např. přesně na přímce popisující trend) označme jednotlivé složky: Yt … model trendu St … model periodického chování Ct … model cyklického chování et … náhodná složka
Časové řady - jejich složky tzv. aditivní model předpokládá: yt = Yt + St + Ct + et tzv. multiplikativní model předpokládá: yt = Yt . St . Ct . et cíle zpracování časových řad = deskripce (→pochopení) analýza jednotlivých složek (→ model) predikce (=předpověď do budoucna)
Časové řady - deskripce Absolutní přírůstek (diference1.řádu) dt = yt − yt−1 t = 2,…,T o kolik se hodnota liší oproti předešlé (v týchž měrných jednotkách jako Y) dt > 0 … došlo k nárůstu dt < 0 … došlo k poklesu
Časové řady - deskripce Průměrný absolutní přírůstek _ d = (d2+d3+…+dT) / (T−1) = = (yT−y1) / (T−1) zda „převažuje“ nárůst či pokles (ale pozor – vliv krajních hodnot!)
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok mzda absolutní přírůstek 04 15 322 x 05 16 345 1 023 06 17 113 768 07 19 606 2 493 08 20 962 1 356 _____ d = (1023+768+2493+1356) / 4 = 1410; = (20962−15322) / 4 = 1410
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. _____ d = 1410 Interpretace? V průměru došlo ve sledovaném období každoročně k nárůstu mzdy o 1.410,- Kč oproti roku předešlému.
Časové řady - deskripce Koeficient růstu (řetězový index) kt = yt / yt−1 t = 2,…,T kolikrát se hodnota liší oproti předešlé (lze vyjádřit v %); jen pro Y>0 kt > 1 … došlo k nárůstu kt < 1 … došlo k poklesu např. kt=0,97 … pokles Y o 3 %
Časové řady - deskripce Průměrný koeficient růstu _ k = T−1√(k2·k3·…·kT) = = T−1√(yT/y1) zda „převažuje“ nárůst či pokles (ale pozor – vliv krajních hodnot!)
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok mzda koeficient růstu 04 15 322 x 05 16 345 1,067 06 17 113 1,047 07 19 606 1,146 08 20 962 1,069 /vše zaokr./ ___ k = 4√(1,067·1,047·1,146·1,069) = 1,082; = 4√(20 962 / 15 322) = 1,082
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. ____ k = 1,082 Interpretace? V průměru došlo ve sledovaném období každoročně k nárůstu mzdy o 8,2 % oproti roku předešlému.
Časové řady - deskripce Relativní přírůstek rt = dt / yt−1 = kt −1 t = 2,…,T o kolik % se hodnota liší oproti předešlé (po vynásobení 100); jen pro Y>0 rt > 0 … došlo k nárůstu rt < 0 … došlo k poklesu např. rt= -0,03 … pokles Y o 3 %
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok mzda relativní přírůstek 04 15 322 x 05 16 345 0,067 06 17 113 0,047 07 19 606 0,146 08 20 962 0,069 /vše zaokr./ např. v roce 2007 došlo k nárůstu mzdy o 14,6 % oproti roku předešlému
Časové řady - deskripce POZOR!!! při interpretaci % změn! Např.: rok kt rt .. 06 1,047 0,047 07 1,146 0,146 změna mezd v roce 07 vůči roku 06? pomocí kt: 1,146 − 1,047 = 0,099 ! nešlo o nárůst mzdy o 9,9 % ! (ta vzrostla o 14,6 % proti roku 2006) šlo o tzv. nárůst o 9,9 procentního bodu
Časové řady - deskripce Bazický index bt = yt / y0 t = 1,…,T o kolik % se hodnota liší oproti bazické (po vynásobení 100); jen pro Y>0 bt > 1 … došlo k nárůstu oproti y0 bt < 1 … došlo k poklesu oproti y0
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok mzda bazický index (0=2004) 04 15 322 1,000 05 16 345 1,067 06 17 113 1,117 07 19 606 1,280 08 20 962 1,368 /vše zaokr./ např. v roce 2007 vzrostla mzda o 28 % oproti roku 2004 (oproti roku bazickému)
Časové řady - deskripce Převody mezi indexy? kt = bt / bt−1 t = 2,…,T a naopak (ale jen když báze=1.období): bt = k2·…·kt t = 2,…,T
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok kt bt (0=2004) 04 x 1,000 05 1,067 1,067 06 1,047 1,117 07 1,146 1,280 08 1,069 1,368 /vše zaokr./ k4 = b4/b3 = 1,280 / 1,117 = 1,146 b4 = k2·k3·k4 = 1,067·1,047·1,146 = 1,280
Časové řady - deskripce Diference druhého řádu Dt = dt − dt−1 = yt −2yt−1+yt−2 (t=3…T) popisují „vyklenutí“ časové řady Dt >0…průběh na úseku mezi hod-notami yt−2, yt−1, yt je konvexní Dt <0…průběh na úseku mezi hod-notami yt−2, yt−1, yt je konkávní
Časové řady - deskripce Př. Průměrné hrubé měsíční nominální mzdy v Ústeckém kraji za roky 2004-08. rok dt Dt 04 x x 05 1023 x 06 768 -255 07 2493 1725 08 1356 -1137 kladná je pouze D4; na grafu měla pouze trojice období 2.-3.-4. konvexní průběh
Časové řady - deskripce kladná je pouze D4; na grafu měla pouze trojice období 2.-3.-4. konvexní průběh
Časové řady - vyhlazení model pro vyhlazení (vyrovnání) časové řady = snaha odhalit trendovou složku Yt spočívá v „odfiltrování“ náhodných i pravidelných vlivů (odchylek, výkyvů) možnosti: klouzavé průměry regresní model Exponenciální vyrovnání atd. (složitější metody)
Časové řady - vyhlazení a) klouzavé průměry - princip zvolíme K - délku klouzavého okna (=počet průměrovaných hodnot) určíme průměr každé K-tice po sobě jdoucích hodnot : (yt+…+yt+K-1) / K
Časové řady - vyhlazení a) klouzavé průměry - poznámka: Hodnotu K volíme s ohledem na případnou periodičnost, či aspoň „logiku“ : např. denní údaje … K=7; čtvrtletní údaje … K=4
Časové řady - vyhlazení a) klouzavé průměry – zpracování v Excelu: I.1985 1 3336 II.1985 2 3469 III.1985 3 3536 IV.1985 4 3860 I.1986 5 3452 II.1986 6 3670 III.1986 7 3674 IV.1986 8 3999 I.1987 9 3540 II.1987 10 3751 III.1987 11 3776 IV.1987 12 4150
Časové řady - vyhlazení a) klouzavé průměry – zpracování v Excelu:
Časové řady - vyhlazení b) regresní model - princip veličinou X je čas (pořadové číslo t) zbytek zcela dle teorie o regresi
Časové řady - vyhlazení b) regresní model - komentáře : interpretace směrnice X interpretace průměrného abs.přírůstku
Časové řady - vyhlazení b) regresní model - komentáře : využití pro predikci (předpověď) do modelu dosadíme za X hodnotu odpovídající dosud nesledovanému období (neaplikovat do vzdálené budoucnosti!)
Časové řady - vyhlazení c) Exponenciální vyrovnání - použití název exponenciální vyrovnávání nesouvisí s exponencielou jako trendovou funkcí ekonomické časové řady jsou často velmi „nevyrovnané“, obsahují „šumy“ eliminace vlivu šumů na trendovou složku předpoklad použití – acykličnost řady (není ani cyklická ani periodická složka, pouze trendová a náhodná) – nutno předem očistit od těchto složek
Časové řady - vyhlazení c) Exponenciální vyrovnání - princip adaptivní přístup k trendové složce předpovídá hodnotu podle předpovědi pro předchozí období opravenou o chybu předchozí předpovědi. Nástroj používá vyrovnávací konstantu , jejíž velikost určuje, do jaké míry je předpověď ovlivněna chybami v předchozí předpovědi. při odhadech parametrů křivky se používá modifikovaná (vážená) metoda nejmenších čtverců (váhy exponenciálně klesají směrem do minulosti).
Časové řady - vyhlazení c) Exponenciální vyrovnání - výhody Problém s volbou délky klouzavých průměrů (subjektivní volba) ⇒metoda exponenciálního vyrovnávání tuto potíž odstraňuje (výpočet každé vyrovnané hodnoty je založen na všech minulých pozorováních řady).
Časové řady - vyhlazení c) Exponenciální vyrovnání - typy Jednoduché exponenciální vyrovnávání – v krátkých úsecích konstantní trend Dvojité exponenciální vyrovnávání (Brownův algoritmus) – v krátkých úsecích lineární trend Trojité exponenciální vyrovnávání - v krátkých úsecích kvadratický trend
Časové řady - periodičnost model pro periodickou složku St (je-li přítomna) spočívá v „napojení“ na složku trendovou často je periodičnost dána vlivem ročních dob (sezón) => „sezónnost“ možnosti modelování: nejčastěji tzv. sezónní indexy (=multiplikativní, nikoli aditivní model)
Časové řady - periodičnost sezónní index – postup určení a) pro každé období určíme hodnotu odhadu dle modelu trendu (Yt); b) pro každé období spočteme hodnotu indexu yt /Yt udávající, koli- krát (o kolik %) byly skutečné hod-noty modelem nad-/podhodnoceny
Časové řady - periodičnost sezónní index – postup určení c) pro odpovídající si období v rámci jednotlivých period (např. každé první období) určíme z jednotlivých indexů jejich geometrický průměr
Časové řady - periodičnost sezónní index - př.(čtvrtletní výdaje) Pro data (zadání viz př. s klouzavý-mi průměry) lze spočítat tento lineární model trendu: Yt = 3382,9 + 46,4·X (zaokrouhl.) kde za X dosadíme postupně pořadová čísla 1-12 a dostaneme:
Časové řady - vyhlazení Lineární trend – zpracování v Excelu: I.1985 1 3336 II.1985 2 3469 III.1985 3 3536 IV.1985 4 3860 I.1986 5 3452 II.1986 6 3670 III.1986 7 3674 IV.1986 8 3999 I.1987 9 3540 II.1987 10 3751 III.1987 11 3776 IV.1987 12 4150
Časové řady - vyhlazení Lineární trend – zpracování v Excelu:
Časové řady - periodičnost x=t 1 2 3 4 5 6 . yt |3336|3469|3536|3860|3452|3670 Yt|3429|3476|3522|3568|3615|3661 x=t 7 8 9 10 11 12 . yt |3674|3999|3540|3751|3776|4150 Yt|3708|3754|3800|3847|3893|3940 (hodnoty Yt zaokrouhlovány)
Časové řady - periodičnost sezónní index - př.(čtvrtletní výdaje) Soustřeďme se např. na zimní údaje (tedy x=4,8,12; Yt zaokr. na 3 des.m.): x 4 8 12 . yt |3860 |3999 |4150 . Yt|3568,446|3753,999|3939,551
Časové řady - periodičnost sezónní index - př.(čtvrtletní výdaje)
Časové řady - periodičnost sezónní index - př.(čtvrtletní výdaje) Příslušné tři indexy yt /Yt jsou: (x=4) 3860 / 3568,446 = 1,082 (x=8) 3999 / 3753,999 = 1,065 (x=12) 4150 / 3939,551 = 1,053 Např. během první zimy byly skutečné výdaje 8,2 % nad modelem lin.trendu
Časové řady - periodičnost sezónní index - př.(čtvrtletní výdaje) Celkově činí „zimní“ sezónní index: 3√(1,082·1,065·1,053) = 1,067 Tj. průměrně během každé zimy byly skutečné výdaje 6,7 % nad modelem lin.trendu.
Časové řady - periodičnost sezónní index – využití? Proveďme odhad pro nezaznamenanou zimu 1988 (tj. x=16): Y16 = 3382,9+46,4·16 = 4125,104 víme ale, že zimní údaje bývají o 6,7 % vyšší, než je odhad trendem, tj. upravíme odhad na hodnotu: 4125,104 · 1,067 = 4400,383