Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze
O čem budu povídat Co je statistika a jaké jsou její základy Základní soubor, výběr odhady tvorba modelů platnost modelů Data a jejich kvalita, časové řady Problémy s daty Prognózování Analýza časových řad – metody, přístupy Kvalita předpovědí
Co je statistika a jaké jsou její základy Matematická statistika a pravděpodobnost teorie míry a integrálu všechny metody založeny na pravděpodobnosti Ekonomická statistika Práce s náhodnými výběry Teorie výběrových šetření Odhady parametrů a testování hypotéz
Základní soubor, výběr Základní soubor Neznámé parametry Výběr o rozsahu n Odhady parametrů, model náhodný výběr
Tvorba a platnost modelů pracujeme s výběrem platnost v oblasti dat (výběru) špatný odhad parametrů = špatný model (vlastnosti odhadů) tvorba modelu není jen výpočet modelu v softwaru
Data a jejich kvalita Ze špatných dat nelze sestrojit dobrý model Pozornost – zdroje dat ČSÚ, ČNB, Eurostat,…. Úplná a výběrová šetření Pracujeme s výběry! Data z ČSÚ několik fází zjišťování stupně publikací dat časové odstupy jednotlivých fází různé hodnoty pro stejný údaj
Data a jejich kvalita
Časové řady Specifická data Délka řad Srovnatelnost údajů Dostupnost údajů Věrohodnost údajů Zdroje dat
Délka řad Malý počet pozorování = krátké čas. řady Starší data – nepoužitelná Omezená třída použitelných modelů Sezónnost ARIMA – problémy s délkou řad – neplatí limitní vztahy Srovnatelnost v čase Stará data jiná ekonomika jiné technologie změna přírodního prostředí Věcná srovnatelnost metodologické změny pulsy, skoky, metody intervenční analýzy
Změna metodiky
Problémy s kalendářem Desítková soustava vs. kalendář Nestejná délka měsíce (i roků) Různý počet pracovních dnů Pohyblivé svátky Sezónnost během roku Očištění časové řady pracovní dny sezónní očištění odlehlá pozorování
Klasické modely Sezónní dekompozice – omezené použití Nenáhodné složky časové řady – trendová, sezónní, cyklická Náhodná složka Metoda klouzavých průměrů flexibilní použitelná pro některé řady Exponenciální vyrovnávání flexibilní vhodná v mnoha případech
Sezónní dekompozice
Klouzavé průměry
Exponenciální vyrovnávání
Stochastické modely Hlavní roli hraje náhodná složka Použitelné v případě dostatečného počtu pozorování Nestabilní chování dat Modely AR, MA, ARIMA, SARIMA Velmi dobré výsledky Téměř nemožná interpretace Složitá teorie
Stochastické modely
Autokorelační funkce
Lineární dynamické modely Lineární závislost časových řad Korelace v různých časech Směr závislosti Základem jsou stochastické modely Modely s přenosovou funkcí
Lineární závislost časových řad
Lineární dynamické modely
Spektrální analýza Směs sinusovek a kosinusovek s různou amplitudou a frekvencí Periodogram Omezené použití Dobré výsledky
Spektrální analýza
Tvorba předpovědí Horizont předpovědi Vliv vnějších faktorů – nepodchytitelné v modelu Kvalita předpovědí vyhaslé předpovědi Nástroje měření kvality Theilův koeficient nesouladu Práce s rezidui
Nástroje měření kvality předpovědí SSE - součet čtverců chyb TIE - Theilův koeficient nesouladu MSE - součet čtverců chyb
Kvalitní předpovědi dobrá data vhodný model - co nejjednodušší model rozumný horizont předpovědi ověření modelu stabilita a robustnost modelu spolupráce statistik a odborník v oboru vyhaslé předpovědi – konfrontace se skutečností nástroje pro měření kvality
Děkuji za pozornost