Akcelerace genetických algoritmů na grafických kartách 4. část Mikuláš Dítě Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
Připomenutí problému udržování tyče na vozíku pěstování vozíků zdlouhavý výpočet fitness funkce
Paměťová náročnost přenesení dat do paměti GPU CPUCPU + GPU
Další optimalizace pouze GPU start zápis na GPU čtení z GPU každá generace paralelní výpočet vlastní implementace rand() a další výpočty vlastní implementace rand() a další výpočty
Porovnání CPU, GPU+CPU a GPU
Porovnání
Pokrok projektu implementace na GPU v CUDA vytvořeno testovací prostředí naměřeno snížit čas zápisu do paměti GPU zvětšit diverzitu (vzdálenost) jedinců a dále vylepšovat genetický algoritmus
Závěr celkově je výpočet pouze na GPU rychlejší než kombinace s CPU, ale minimalistická implementace OpenCL zpomaluje mohli bychom získat další zrychlení – speciálně navrženým kernelem pro ROM na GPU – použitím HW random (šum z okolí, …) – … ?
Odkazy Ing. Miroslav Čepek (Katedra počítačů FEL ČVUT) Ing. Vladimír Pospíšil (Cesta k vědě) Poděkování
Zdroje [1] BROWNLEE, J. The pole balancing problem. [online]. [cit ]. Dostupné z pdf [2] Genetic algorithm. [online]. [cit ]. Dostupné z [3] NP-hard. [online]. [cit ]. Dostupné z [4] KOZOLA, S. Improving Optimization Performance with Parallel Computing. [online]. [cit ]. Dostupné z allel-optimization.html