Seminář strojového učení a modelování Fakulta elektrotechnická

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

GENEROVÁNÍ PSEUDONÁHODNÝCH ČÍSEL
Dynamické systémy.
Úvod do Teorie her. Vztah mezi reálným světem a teorií her není úplně ideální. Není úplně jasné, jak přesně postavit herněteoretický model a jak potom.
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií Tento materiál vznikl v rámci projektu ESF CZ.1.07/2.2.00/
Plošná interpolace (aproximace)
Jiří Gazárek, Martin Havlíček Analýza nezávislých komponent (ICA) v datech fMRI, a ICA necitlivá ke zpoždění.
Kalmanuv filtr pro zpracování signálů a navigaci
ENERGIE KLASTRŮ VODY ZÍSKANÁ EVOLUČNÍMI ALGORITMY
Genetické algoritmy [GA]
Lineární regresní analýza Úvod od problému
Genetické algoritmy. V průběhu výpočtu používají náhodné operace. Algoritmus není jednoznačný, může projít více cestami. Nezaručují nalezení řešení.
Využití umělých neuronových sítí k urychlení evolučních algoritmů
Návrh a optimalizace filtru OTA-C s využitím heuristických algoritmů ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra teorie obvodů.
Odpovědi na otázky Praha 2007 Bc. Dalibor Barri ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra mikroelektroniky.
Medians and Order Statistics Nechť A je množina obsahující n různých prvků: Definice: Statistika i-tého řádu je i-tý nejmenší prvek, tj., minimum = statistika.
Optimalizace v simulačním modelování. Obecně o optimalizaci  Optimalizovat znamená maximalizovat nebo minimalizovat parametrech (např. počet obslužných.
20. Metody zpracování digitálních dat dálkového průzkumu
Kvantové počítače Foton se může nacházet „současně na více místech“ (s různou pravděpodobností). Nemá deterministicky určenou polohu. To dává šanci elementární.
Základy ekonometrie Cvičení září 2010.
Jak správně interpretovat ukazatele způsobilosti a výkonnosti
STANOVENÍ NEJISTOT PŘI VÝPOŠTU KONTAMINACE ZASAŽENÉHO ÚZEMÍ
Ing. Lukáš OTTE kancelář: A909 telefon: 3840
Richard Lipka Katedra informatiky a výpočetní techniky Fakulta aplikovaných věd Západočeská univerzita, Plzeň 1.
Generování náhodných veličin (2) Spojitá rozdělení
Základy hydrauliky a hydrologie
Generování náhodných čísel
Optimalizace versus simulace 9.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Genetické algoritmy [GA]. Historie:  1960: I. Rechenberg – první odborná práce na toto téma „Evolution strategies“  1975: John Holland – první genetický.
Náhoda, generátory náhodných čísel
Generování náhodných veličin Diskrétní a spojitá rozdělení Simulační modely ek.procesů 4.přednáška.
Diplomová práce Modelování vlivu lesního vegetačního krytu a lesní půdy na srážko-odtokové vztahy Vedoucí diplomové práce: Mgr. Jan Unucka Studijní obor:
Bezpečnost chemických výrob N Petr Zámostný místnost: A-72a tel.: 4222
Normální (Gaussovo) rozdělení
Akcelerace genetických algoritmů na grafických kartách Mikuláš Dítě Gymnázium Christiana Dopplera Cesta k vědě Evropský sociální fond Praha & EU: Investujeme.
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Ekonomické modelování Analýza podnikových procesů Statistická simulace je vhodný nástroj pro analýzu stochastických podnikových procesů (výrobní, obchodní,
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Náhodné výběry a jejich zpracování Motto: Chceme-li vědět, jak chutná víno v sudu, nemusíme vypít celý sud. Stačí jenom malý doušek a víme na čem jsme.
Metrologie   Přednáška č. 5 Nejistoty měření.
Fitování Konstrukce křivky (funkce), která co nejlépe odpovídá naměřeným hodnotám. - může podléhat dodatečným podmínkám Lineární vs. nelineární regrese.
2. Vybrané základní pojmy matematické statistiky
Alternativy k evolučním optimalizačním algoritmům Porovnání genetických algoritmů a některých tradičních stochastických optimalizačních přístupů David.
Metodika generování a ladění modelů neuronových sítí Ing. Martin MoštěkVŠB – Technická Univerzita Ostrava.
Generování náhodných čísel
Cíl přednášky Seznámit se
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
Optimalizace versus simulace 8.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
Monte Carlo simulace hexameru vody Autor: Bc. Lenka Ličmanová Vedoucí práce: Mgr. Aleš Vítek Seminář KFY PŘF OU.
Molekulová fyzika 3. přednáška „Statistický přístup jako jediná funkční strategie kinetické teorie“
Neuronové sítě.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Model rozložení sněhové pokrývky v povodí vodárenské nádrže Šance Zpracovává : Bc. Jiří Juroš Vedoucí : doc. Dr. Ing. Jiří Horák Diplomová práce.
Střednědobápravděpodobnostníhydrologickápředpověď v prognózní praxi ČHMÚ.
Simulátory umělého života Aplikovatelné v environmentálních informačních systémech.
Praha & EU: Investujeme do vaší budoucnosti Evropský sociální fond Gymnázium, Praha 10, Voděradská 2 Projekt OBZORY Robotika 3.
BIOSTATISTIKA LS 2016 Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D. Cvičící: Ing. Martina Litschmannová,
Model rozložení sněhové pokrývky v povodí vodárenské nádrže Šance
Simulace podnikových procesů
Stručný přehled modelových rozložení I.
Hydrologický předpovědní systém pobočky ČHMÚ České Budějovice
Ing. Milan Houška KOSA PEF ČZU v Praze
Příklad (investiční projekt)
ANALÝZA A KLASIFIKACE DAT
Pokročilé neparametrické metody Validační techniky
ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT
Základy statistiky.
Náhodné výběry a jejich zpracování
Transkript prezentace:

Generování náhodných čísel pro optimalizaci srážko-odtokových procesů pomocí hydrologických dat Seminář strojového učení a modelování Fakulta elektrotechnická České vysoké učení technické v Praze Autor: Martin Chlumecký 14 března 2019

Obsah Problémy Úvod do hydrologie Generátory náhodných čísel druhy, princip Generátory a hydrologická data HRNG, validace Implementace HRNG do GA Výsledky Úvod do hydrologie základní pojmy Srážko-odtokový model kalibrace Modelu Optimalizace genetický algoritmus 2 | Page

Úvod do Hydrologie Hydrologie je věda zabývající se pohybem, distribucí, kvalitou, atd. vody na Zemi. Hydrodynamika odvětím hydrologie pro analýzu dynamičnosti vodních toků a nádrží Slovníček pojmů povodí, srážky, odtok, evaporace, transpirace, evapotranspirace Hydrologické modely zjednodušený popis reality v našem případě srážko-odtokové procesy 3 | Strana

Srážko-Odtokový Model Sacramento Soil Moisture Accounting Model (SAC-SMA) Systém hypotetických nádrží Použití odhad hydrologických parametrů predikce budoucího chování Parametry cca 30 Výstup modelu srážko-odtokové komponenty evapotranspirace 4 | Page

SAC-SMA navržen pro Kalifornii SNOW17 Podpůrné Modely SAC-SMA navržen pro Kalifornii SNOW17 sněhový model energetické rovnice pro tání a akumulaci sněhu UNIT-HG hypotetická odezva povodí vegetace, terén, ... 5 | Page

Sakramento Model 6 | Page

Kalibrace Modelu Nastavení parametrů modelu Validace modelu včetně podmodelů – až 60 parametrů „modelování je více umění než věda“ Validace modelu určuje kvalitu kalibrace čím menší odchylka, mezi pozorovanými a simulovanými průtoky, tím kvalitnější kalibrace, ALE! statistické indikátory Root Mean Square Error Coefficient of Efficiency (Nash–Sutcliffe) Correlation Coefficient Provede se simulace -> vypočítá validace 7 | Page 7

Optimalizace 8 | Page

Genetický Algoritmus (GA) Inspirován přírodními procesy Darwinova teorie přírodního výběru výběr, křížení, mutace, generace, populace Každý jedinec je kanditátem na řešení problému kóduje informace popisující řešení problému chromozóm fitness hodnota Fitness funkce určuje kvalitu řešení skalární veličina jejíž výpočet může zohledňovat více vstupů 9 | Page

Genetický Algoritmus a SAC-SMA Chromozom uspořádané pole všech Sakramento parametrů jeden prvek se nazývá „gen“ jeden gen reprezentuje jeden parametr modelu Fitness funkce definuje kvalitu modelu 10 | Page

GA Workflow 11 | Page

Optimalizační Framework PRNG 12 | Page

„Najít optimální kalibraci modelu za použití genetického algoritmu“ Motivace „Najít optimální kalibraci modelu za použití genetického algoritmu“ 13 | Page

Relevantnost modelové kalibrace Problém č.1 Relevantnost modelové kalibrace GA najde „nejlepší“ kalibraci modelu avšak nalezené hodnoty parametrů jsou nepoužitelné Nerealistické hydrologické jevy nerealistické průběhy evapotranspirace a UNIT-HG navzdory dobré validaci modelu 14 | Page

Problém č.1 15 | Page

Nemůžeme najít optimální kalibraci modelu Problém č.2 Nemůžeme najít optimální kalibraci modelu optimalizace je NP-úplný problém velký počet parametrů prostor řešení je nekonečný současné techniky často selhávají závislé na konkrétním povodí 16 | Page

Random Number Generator (RNG) Naše řešení Random Number Generator (RNG) 17 | Page

softwarové nebo fyzické zařízení využití RNG softwarové nebo fyzické zařízení generující náhodné číselné řady využití šifrování počítačové simulace modelování druhy true random number generator (TRNG) pseudo random number generator (PRNG) 18 | Page

TRNG přírodní jevy jsou ideální zdroje náhodnosti generováno z fyzikálních procesů elektrický či akustický šum tepelné kvantové nepředvídatelné normální rozložení Rychlost 4 – 16 Mbps cena 1.000 – 50.000 Kč 19 | Page

PRNG rychlost předvídatelné periodicita rovnoměrné rozložení cena 25 Mreqs předvídatelné periodicita rovnoměrné rozložení cena 20 | Page

LCG RNG Lineární Kongruentní Generátor rovnoměrné rozložení cena nejjednodušší Mersenne Twister Generator rovnoměrné rozložení cena Xn = (a Xn-1 + c) mod m c a m jsou nesoudělná čísla a ∈ {1, 2, ..., m-1} X0 počáteční hodnota 21 | Page

LCG RNG Periodicita m = 11, a = 3, c = 4, X0 = 8 vzniká konečným prostorem paměti počítače závislá na hodnotách m, a, c čím více požadavků na náhodná čísla tím větší pravděpodobnost m = 11, a = 3, c = 4, X0 = 8 Xn = (3 Xn-1 + 4) mod 11 V: {6, 0, 4, 5, 8, 6, 0, 4, 5, 8, 6, 0, 4, 5, 8, 6, … } 22 | Page

Generátor náhodných čísel je jádrem GA RNG v GA Generátor náhodných čísel je jádrem GA odhaduje hodnoty parametrů v definovaných intervalech Kvalita RNG ovlivňuje kvalitu a rychlost optimalizace GA může uvíznout v lokálním minimu GA může degenerovat 23 | Page

HRNG Hydrologická data jsou výborným zdrojem náhodných čísel srážky, teploty, průtoky, ... normální rozložení asymptotická periodicita Hydro-Random Number Generator (HRNG) založen na LCG náhodnost určena hydrologickými daty 24 | Page

HRNG Xn= (a f(t)Xn−1 + c) mod m f(t) vrací skalár z časové řady hydrologických dat c a m jsou nesoudělná čísla a ∈ {1, 2, ..., m-1} X0 počáteční hodnota m = 11, a = 3, c = 4, X0 = 8, S = (8, 7, 7, 6, 5, 4, 3, 3, 3, 2, 2, 2, 2, 2, 2, 3) V: {9, 6, 9, 1, 8, 1, 2, 0, 4, 6, 7, 2, 5, 1, 10, 6, ....} 25 | Page

HRNG f(t) ovlivní distribuční funkci RNG transformace pomocí Box-Muller algoritmu 26 | Page

Asymptotická složitost je O(1) Validace HRNG Asymptotická složitost je O(1) založeno na Mersenne Twister Generator – O(1) Box-Muller transformace – O(1) skryté velké konstanty Rychlost Mersenne Twister Generator ccs 25 Mreqs HRNG ccs 7 Mreqs 27 | Page

Validace HRNG Diehard testy Chi-squared Test testováno na 3.107 náhodných číslech Chi-squared Test validace normální rozložení σ2 = 1,3 a μ = 0,5 28 | Page

Hydro-random number generator (HRNG) vychází z PRNG náhodnost je dána hydrologickými daty normální rozložení 29 | Page

Optimalizační Framework PRNG 30 | Page

Rychlost optimalizace SAC-SMA výsledky Spojitá funkce pro ET a UNIT-HG Senzitivní analýza GA Rychlost optimalizace SAC-SMA výsledky Spojitá funkce pro ET a UNIT-HG 31 | Page

Senzitivní analýza GA hodnoty parametrů GA ovlivňují kvalitu optimalizace HRNG může redukovat tento dopad – výhoda pro uživatele hydrology – rychlost - parametrizace GA zásadně ovlivňuje kvalitu optimalizace. - Hgenerátor do určité míry eliminuje tuto zkutečnost, jak znázorňuje obrázek - Osa X reprezentuje dva klíčové genetické parametry. Popilation size a generation limit, které určují jak dlouho má algoritmus běžet - Na ose Y je RMSE, neboli hodnota fitnes funkce - Je evidentní, že Pgenerátor je náchylnější na kvalitu optimalizace 32 | Page 32

Rychlost Optimalizace PRNG potřebuje cca 90k iterací pro 5 mm HRNG potřebuje cca 10k iterací 33 | Page

Několikanásobné Spuštění PRNG snadněji uvízne v lokálním minimu vždy vrací stejnou hodnou fitness funkce statistické informace o průběhu optimalizace jsou jiné GA zkouší i jiné cesty, ale uvízne HRNG je schopné najít lepší řešení Pokud spustíme optimalizaci toho samého problému několikráte, tak Pgenerátor uvízne v lokálním minimu Zajímavé je, že ostatní ukazatele, které trasují průběh algoritmu jsou jiné, takže algoritmus se vždy snaží jít jinou cestou, ale uvízne v lokálním minimu 34 | Page 34

SAC-SMA Výsledky 35 | Page

Spojité Funkce 36 | Page

Spojité Funkce 37 | Page

Shrnutí HRNG může být použit pro automatickou kalibraci srážko- odtokového modelu rychlejší optimalizační proces redukuje závislost kvality optimalizace na nastavení GA parametrů API je stejné snadná integrace do původních frameworků možné vyzkoušet i v nehydrologických úlohách 38 | Page

Shrnutí HRNG může, ale nemusí najít lepší řešení není to všelék na všechny hydrologické problémy přítomnost hydrologa je stále nutná Distribuční funkce RNG různé rozdělení může hrát roli 39 | Page

“Hydrologické modelování je více umění než vědou” 40 | Page