36NAN Semestrální práce Predikce ceny akcií dle dosavadního vývoje
Vstupní data dodáno :akcie, d, datum, open, high, low, close, volume Úprava dat pro JavaNNS a GAME Dva možné směry: –Důležité údaje z jednoho dne –Predikce pomocí více předcházejících dat
První sítě Typ BP – zkouška různých konfigurací Úprava dat – JavaNNS data pouze od nuly do jedné Silná provázanost dat na vstupu Mizerné výsledky co se hodnoty týče, zajímavější se zdá predikce trendu
Výsledky BP sítí Různé konfigurace,nejlépe vychází Provázanost vstup.dat
Výsledky sítí BP Výsledek testovací množiny nejlepší sítě
Závěr z první úlohy Takhle by to nešlo, můžeme zapomenout na predikci hodnoty, možná použitelná predikce trendu Příště zkusit jinou síť Upravit vstupní data (viz provázanost vstupů) Použít celou dodanou množinu dat
Úloha č.2 Pokusíme se použít MIA GMDH síť Simulujeme pomocí GAME Nejdříve použijeme stejnou množinu dat pro srovnání výsledků s předcházející úlohou Zkusíme upravit vstupní množinu dat
Vstupní data Data,,krátká“ –Učící množina 183 skupin –Testovací 50 skupin Krátká pro možnost porovnání s výsledky předcházející úlohy Dva možné typy vstupů –Všechno (open,high,low,close) –Pouze indexy open za předchozí tři dny
Vstupní data podruhé Data,,dlouhá“ Opět obě možnosti konfigurace vstupů –Komplet vektor (vektor open,high,low,close) –Tzv.,,Triopen“ (vektor open1,open2,open3) –2000 skupin učící množiny –950 skupin testovací množiny
Výsledky,,krátké“ sítě
Výsledky krátké sítě Na první pohled podstatně lepší od BP,oba typy sítě Na druhý pohled zklamání – síť,,triopen“ má mnohem horší výsledky (2x) než síť s původním vstupním vektorem Co se hodnot týče, vyhodnotíme až pro mohutnější učící množiny
Výsledky,,dlouhé“ sítě Graf je naprosto nezřetelný (950 dat pro porovnání) Opět ale síť,,triopen“ končí s dvojnásobnou chybou oproti klasické
Závěr Jasně vítězí síť GMDH Rozhodně lepší výsledky vykazuje síť s kompletním vstupním vektorem (zřejmě dostává komplexnější informace) Výsledky na první pohled vypadají lákavě, ALE: opak je pravdou. Při bližším zkoumání se chyba průměrně pohybuje v desítkách centů (jako predikce hodnoty naprosto nepoužitelné)
Závěr Nadějnější je predikce trendu, chyba se pohybuje okolo 15 – 20 % Síť by se dala použít jako jeden z ukazatelů, jako samostatný rozhodovací element je nepoužitelná Osobně bych ji při obchodování použil, ale pouze jako jedno z rozhodovacích kritérií