Akcelerace genetických algoritmů na grafických kartách 5. část Mikuláš Dítě
Připomenutí problému udržování tyče na vozíku pěstování konstant zdlouhavý výpočet fitness funkce
Paměťová náročnost přenesení dat do paměti GPU CPUCPU + GPU
Další optimalizace pouze GPU start zápis na GPU čtení z GPU každá generace paralelní výpočet vlastní implementace rand() a další výpočty vlastní implementace rand() a další výpočty
Porovnání CPU, GPU+CPU a GPU
Porovnání
OpenCL vs CUDA programování pro grafickou kartu OpenCL je (víc) multiplatformní – 1.1 vyšla ještě 2010 CUDA vytvořila Nvidia – 4.0 stable (květen 2011)
CUDA maximální rozměr textury x
Odkazy Ing. Miroslav Čepek (Katedra počítačů FEL ČVUT) Ing. Vladimír Pospíšil (Cesta k vědě) Poděkování
Zdroje [1] BROWNLEE, J. The pole balancing problem. [online]. [cit ]. Dostupné z pdf [2] Genetic algorithm. [online]. [cit ]. Dostupné z [3] NP-hard. [online]. [cit ]. Dostupné z [4] KOZOLA, S. Improving Optimization Performance with Parallel Computing. [online]. [cit ]. Dostupné z allel-optimization.html