GAs and Premature Convergence  Premature convergence - GAs converge too early to suboptimal solution o as the population evolves, only a little new can.

Slides:



Advertisements
Podobné prezentace
GA a predčasná konvergence Předčasná konvergence - výpočet konverguje příliš rychle k nějakému neoptimálnímu řešení Co způsobuje předčasnou konvergenci?
Advertisements

TEORIE HER III. Hry a jejich bohové CO BYLO MINULE.
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o. Osvoboditelů 380, Louny Číslo projektuCZ.1.07/1.5.00/ Číslo sady31Číslo DUM.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
0 / 1X36DSA 2005The complexity of different algorithms varies: O(n), Ω(n 2 ), Θ(n·log 2 (n)), … Různé algoritmy mají různou složitost: O(n), Ω(n 2 ), Θ(n·log.
PRESENT SIMPLE FOR ELEMNTARY STUDENTS Author: Mgr. Jan Hájek.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_178 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Mgr. Eleonora Klasová Předmět.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
1 / 2X36DSA 2005The complexity of different algorithms varies: O(n), Ω(n 2 ), Θ(n·log 2 (n)), … Různé algoritmy mají různou složitost: O(n), Ω(n 2 ), Θ(n·log.
y.cz Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Roman Chovanec Název šablonyIII/2.
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu VY_32_INOVACE_ 007 Název školy Gymnázium, Tachov, Pionýrská 1370 Autor Mgr.Stanislava Antropiusová.
GA a predčasná konvergence Předčasná konvergence - výpočet konverguje příliš rychle k nějakému neoptimálnímu řešení Co způsobuje předčasnou konvergenci?
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM Businessland / Introductions 06B2 AutorLadislava Pechová Období vytvořeníŘíjen.
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o. Osvoboditelů 380, Louny Číslo projektu CZ.1.07/1.5.00/ Číslo sady 05Číslo.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM Businessland / Making Contracts 06B16 AutorLadislava Pechová Období vytvořeníLeden.
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o. Osvoboditelů 380, Louny Číslo projektu CZ.1.07/1.5.00/ Číslo sady 03 Číslo.
Pracovní list - pro tisk Vloženo z stress.pptx Začátek.
The world of work Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
y.cz Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Roman Chovanec Název šablonyIII/2.
ŠKOLA: Gymnázium, Tanvald, Školní 305, příspěvková organizace ČÍSLO PROJEKTU: CZ.1.07/1.5.00/ NÁZEV PROJEKTU: Šablony – Gymnázium Tanvald ČÍSLO.
ŠKOLA: Gymnázium, Tanvald, Školní 305, příspěvková organizace ČÍSLO PROJEKTU : CZ.1.07/1.5.00/ NÁZEV PROJEKTU: Šablony – Gymnázium Tanvald ČÍSLO.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_019 Název školyGymnázium, Tachov, Pionýrská 1370 Autor Mgr. Stanislava Antropiusová Předmět.
1 Škola: Gymnázium, Brno, Slovanské náměstí 7 Šablona: III/2 – Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN prostřednictvím.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:
1 / 3The complexity of different algorithms varies: O(n), Ω(n 2 ), Θ(n·log 2 (n)), … Různé algoritmy mají různou složitost: O(n), Ω(n 2 ), Θ(n·log 2 (n)),
Tutorial: Physics Topic: Catalyst Prepared by : RNDr. Ondřej Jeřábek Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/ je spolufinancován.
Tutorial: Obchodní akademie Topic: Creating Formulas Prepared by : Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Scissor Jack (Nůžkový zvedák)
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
Tutorial: Obchodní akademie Topic: Logical Functions Prepared by: Mgr. Zdeněk Hrdina Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/ je.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Jméno autora: Mgr. Mária Filipová Datum vytvoření: Číslo DUMu: VY_32_INOVACE_09_AJ_EP Ročník: 1. – 4. ročník Vzdělávací oblast:Jazyk a jazyková.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
Tutorial: Engineering technology Topic: Pin connections Prepared by: Ing. Jaroslav Hábl Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/
Statistická analýza dat
 Piston pumps are a type of water pumps which cause the liquid to flow using one or more oscillating pistons.
y.cz Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Roman Chovanec Název šablonyIII/2.
Název a adresa školy: Střední odborné učiliště stavební, Opava, příspěvková organizace, Boženy Němcové 22/2309, Opava Název operačního programu:OP.
y.cz Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Roman Chovanec Název šablonyIII/2.
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
Tercie 2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Tvůrce anglické verze: ThMgr. Ing. Jiří Foller Projekt: S anglickým jazykem do dalších.
y.cz Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Roman Chovanec Název šablonyIII/2.
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
Podpora rozvoje cizích jazyků pro Evropu 21. stol. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento projekt je spolufinancován Evropským sociálním fondem a státním.
NÁZEV ŠKOLY: Základní škola Strančice, okres Praha - východ AUTOR: Mgr. Lenka Kulhavá NÁZEV: VY_32_INOVACE_ O 09 TEMA: Angličtina ČÍSLO PROJEKTU:
Tutorial:Business Academy Topic: Stock in trade Prepared by:Ing. Marcela Zlatníková Projekt Anglicky v odborných předmětech, CZ.1.07/1.3.09/ je.
Gymnázium, Brno, Elgartova 3 GE - Vyšší kvalita výuky CZ.1.07/1.5.00/ III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Téma: English Grammar.
Driving around the USA Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín Tematická oblast Angličtina: The USA Datum vytvoření
N ÁZEV ŠKOLY : ZŠ V ARNSDORF, E DISONOVA 2821, OKRES D ĚČÍN, PŘÍSPĚVKOVÁ ORGANIZACE J AZYK A JAZYKOVÁ KOMUNIKACE, A NGLICKÝ JAZYK, V ÁNOCE A UTOR : M ICHAELA.
Identity, society Tematická oblast Angličtina: The UK Datum vytvoření
DIGITÁLNÍ UČEBNÍ MATERIÁL
NÁZEV ŠKOLY: Základní škola Strančice, okres Praha - východ
GE - Vyšší kvalita výuky
Jiří Šafr jiri.safr(AT)seznam.cz Poslední aktualizace 25/6/2014
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Jiří Šafr FHS UK, SOÚ AV ČR, v.v.i. jiri.safr(zavináč)seznam.cz
Název školy: ZŠ Varnsdorf, Edisonova 2821, okres Děčín, příspěvková organizace Jazyk a jazyková komunikace, Anglický jazyk, Minulý čas prostý pravidelných.
PLANT POPULATIONS 2014 Výukový materiál EK
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace
Živá fáze.
Mainframe History Marek Ďuriš Mainframe History 12/28/2018
Quantum Chemistry / Quantum Mechanics
Různé algoritmy mají různou složitost: O(n), Ω(n2), Θ(n·log2(n)), …
Summary.
Účetní schémata MS Dynamics NAV RTC-základy
Transkript prezentace:

GAs and Premature Convergence  Premature convergence - GAs converge too early to suboptimal solution o as the population evolves, only a little new can be produced  Reasons for premature convergence: o improper selection pressure o insufficient population size o deception o improper representation and genetic operators

Motivation and Realization  Motivation – to maintain a diversity of the evolved population and extend the explorative power of the algorithm  Realization o Convergence of the population is allowed up to specified extent o Convergence at individual positions of the representation is controlled o Convergence rate – specifies a maximal difference in the frequency of ones and zeroes in every column of the population –ranges from 0 to PopSize/2 o Principal condition – at any position of the representation neither ones nor zeroes can exceed the frequency constraint o Specific way of modifying the population genotype

Algorithm of GALCO 1. Generate initial population 2. Choose parents 3. Create offspring 4. if (offspring > parents) then replace parents with offspring else{ find(replacement) replace_with_mask(child1, replacement) find(replacement) replace_with_mask(child2, replacement) } 5. if (not finished) then go to step 2

Operator replace_with_mask Mask – vector of integer counters; stores a number of 1s for each bit of the representation 50

Testovací úlohy - statické  F101(x, y)  Deceptive function  Hierarchická funkce  Royal Road Problem

GALCO – vliv parametru C

GALCO vs. SGA

GALCO – vliv parametru C

GALCO vs. SGA

Multimodal Optimization Initial population SIGA with without

Multimodal Optimization (cont.) Initial populationGALCOSIGA

GA s reálně kódovanou binární rep. (GARB)  Pseudo-binární rep. - bity kódovány reálným číslem r   0.0, 1.0  o interpretace(r)= 1, pro r > 0.5 = 0, pro r < 0.5  redundance kódu o Příklad: ch1 = [ ] ch2 = [ ] interpretace(ch1) = interpretace(ch2) = [ ]  Síla genů – vyjadřuje míru stability genů o Čím blíže k 0.5 tím je gen slabší (nestabilnější) o „Jedničkové geny“: 0.92 > 0.86 > 0.65 > 0.62 o „Nulové geny“: 0.07 > 0.19 > 0.23 > 0.41

Gene-strength adjustment mechanism  Geny chromozomů vzniklých při křížení jsou upraveny o v závislosti na jejich interpretaci o a relativní frequenci jedniček (nul) na dané pozici v populaci P[] př.: P[ ]  v populaci jena 1. pozici 82% jedniček, na 2. pozici 17% jedniček, na 3. pozici 35% jedniček, na 4. pozici 68% jedniček.  Geny, které v populaci převládají jsou oslabovány; ostatní jsou posilovány.

Posilování a oslabování genů  Oslabování gen’ = gen + c*(1.0-P[i]), když (gen<0.5) a (P[i]<0.5) (gen má hodnotu nula a v populaci na i-té pozici převažují nuly) a gen’ = gen – c*P[i], když (gen>0.5) a (P[i]>0.5)  Posilování gen’ = gen – c*(P[i]), když (gen 0.5) (gen má hodnotu nula a v populaci na i-té pozici převažují jedničky) a gen’ = gen + c*(1.0-P[i]), když (gen>0.5) a (P[i]<0.5)  Konstanta c určuje rychlost adaptace genů: c  (0.0,0.2 

Stabilizace slibných jedinců  Potomci, kteří jsou lepší než jejich rodiče by měli být stabilnější než ostatní vygenerovaná nekvalitní řešení o Chromozomy slibných jedinců jsou vygenerovány se silnými geny ch = (0.71, 0.45, 0.18, 0.57)  ch’= (0.97, 0.03, 0.02, 0.99) o Geny slibných jedinců přežijí více generací aniž by byly zmeněny v důsledku oslabování

Pseudocode for GARB 1begin 2initialize(OldPop) 3repeat 4calculate P[] from OldPop 5repeat 6select Parents from OldPop 7generate Children 8adjust Children genes 9evaluate Children 10if Child is better than Parents 11then rescale Child 12insert Children to NewPop 13until NewPop is completed 14switch OldPop and NewPop 15until termination condition 16end

Testovací úlohy - dynamické  Ošmerův dynamický problém g(x,t) = 1-exp(-200(x-c(t)) 2 ) c(t) = 0,04(  t/20  )  Minimum g(x,t)=0.0 se mění každých 20 generací  Oscillating Knapsack Problem 14 objektů, w i =2 i, i =0,...,13 f(x)=1/(1+target-  w i x i )  Target osciluje mezi hodnotami a 2837, které se v binárním vyjádření liší o 9 bitů

Výsledky na statických problémech DF3 H-IFF F101

Výsledky na statických problémech

Výsledky na dynamických problémech Oscillating knapsack problem

Výsledky na dynamických problémech Ošmerův dynamický problém Bezprostředně po změně opt.Celkově AlgoritmusMTEStDevMTEStDev GARB c = 0: GARB c = 0: GARB c = 0: GARB c = 0: GARB c = 0: SGA binaryN/AN/A SGA GrayN/AN/A CBM-BN/AN/A  MTE – Mean Tracking Error [%] – střední odchylka nejlepšího jedince v populaci a optimálního řešení počítaná přes všechny gen.

Zotavení z homogenní populace

Weakness of Simple Selectorecombinative GAs  Scale poorely on hard problems, largely the result of their mixing behaviour o Inability of SGA to correctly identify and adequately mix the appropriate BBs in subsequent generations o Exponential computation complexity of SGA  Crossover operators or other exchange emchanisms are needed such that adapt to the problem at hand o Linkage adaptation

Naivní přístupy – operátor inverze  Obrátí pořadí genů náhodně vybraného podřetězce v chromozomu – (1,1) | (2,0)(3,0)(4,1) | (5,1)  po inverzi (1,1) (4,1)(3,0)(2,0) (5,1)  Nepoužitelné z důvodu nevyváženosti signálu pro zlepšování linkage oproti signálu pro učení allel. o t α < t λ - alely podstupují přímější selekci než linkage  GA se rozhodne pro optimální nastavení alel dříve než zjistí, které kombinace genů zformovat dohromady a vzájemně mixovat. o Řešení: obrátit nerovnítko na t α > t λ (ALE JAK?)

Competent GAs  Can solve o hard problems (multimodal, deceptive, high degree of subsolution interaction, noise,...), o quickly, o accurately, o reliably.  Messy GAs – mGA, fmGA, gemGA  Learning linkage GAs – LLGA  Compact GAs – cGA, ECGA  Bayesian optimization algorithm - BOA

Messy Genetic Algorithms - mGAs  Inspirationfrom the nature – evolution starts from the simplest forms of life  mGA departed from SGA in four ways: o messy codings o messy operators o separation of processing into three heterogeneous phases o epoch-wise iteration to improve the complexity of solution

mGA’s codings  Tagged alleles: o Variable-length strings: (name 1, allele 1 ) … (name N, allele N ) ((4,0) (1,1) (2,0) (4,1) (4,1) (5,1))  Over-specification – multiple gene instances (gene 4) o Majority voting – would express deceptive genes too readily o First-come first-served (left to right expression) - positional priority  Underspecification – missing gene instances (gene 3) o Average schema value – variance is too high o Competitive template – solution locally optimal with respect to k-bit perturbations

Messy operators: cut & splice  Cut – divides a single string into two parts  Splice – joins the head of one string with the tail of the other one o When short strings are mated – probability of cut is small  mostly the string will be just spliced –the strings’ length is doubled o When long string are mated – probability of cut is large  one- point crossover

mGAs: three heterogeneous phases  Initialization o Enumerative initialization of the population with all sub-strings of a certain length k<<l  ( l k )2 k  O(l k ) computations o Guaranteed that all BBs of certain size are present in the population  Primordial phase o Only selection used to dope the population with good BBs o Good linkage groups are selected before their alleles are allowed to be mixed  Juxtapositional phase o selection + cut&splice o Mixing of the BBs

Fast messy genetic algorithms - fmGAs  Probabilistically complete enumeration o Population of strings of length l’ close to l is generated o Assumption: each string contains many different BBs of length k<<l  Building block filtering – extracts highly-fit and effectively linked BBs o Repeated (1) selection and (2) gene deletion o Only O(l) computations to converge  Extended thresholding – tournaments are held only between strings that have a threshold number of genes in common  fmGA vs mGA: 150-bit long problem, 30  5-bit deceptive function o 1.9  10 5 vs. 5.9  10 8 evaluations

Gene expression messy GA - gemGA  Messy ??? o No variable-length strings o No under- or over-specification o No left-to-right expression  Messy use of heterogeneous phases of processing in gemGA o Linkage learning phase - first identifies linkage groups o Mixing phase – selection + recombination –exchanges good allele combinations within those groups to find optimal solution

gemGA: The idea  Linkage learning phase o Transcription I (antimutation) –Each string undergoes l one-bit perturbations –Improvements are ignored ?!? (bit does not belong to optimal BB) –Changes that degrade the structure are marked as possible linkage groups candidates Ex.: two 3-bit deceptive BBs marked not marked (degrades) (improves) o Transcription II –Identifies the exact relations among the genes by checking nonlinearities IF  f(X’ i ) +  f(X’ j ) !=  f(X’ ij ) THEN link(i,j)

Linkage Learning GA - LLGA  More “messy” than gemGA o Variable-length strings o Left-to-right expression o Always over-specification  NO primordial or juxtapositional phase – more SGA like  Idea: o Probabilistic expression that slows down the convergence of alleles o Crossover that adapts linkage at the same time that alleles are exchanged

LLGA – Probabilistic expression Clockwise interpretation  (3,1)(2,0)(5,1)(1,1)(4,0) 

LLGA – probabilistic expression cont.  The allele 1 is expressed with the probability δ/l and 1/l respectively  The allele 0 is expressed with the probability (l-δ)/l and (l-1)/l respectively

LLGA: Effect of PE on BBs  Assume a 6-bit problem where BB requiring genes 4, 5, and 6 to take on values of 1 in a trap function. o Initially the block 111 will be expressed roughly 1/8 th of the time o After the linkage evolved properly the BB success rate increases (6,1) (4,1) (5,1) (4,0) (5,0) (6,0) expressed most of the time almost never expressed  Extended probabilistic expression EPE-q o q is the number of copies of unexpressed allele (q=2)

LLGA – introns Introns – non-coding genes (97% of DNA is non-coding) o Number of introns required for proper functioning grows exponentially  compressed introns

Probabilistic Model-Building GAs 1.Initialize population at random 2.Select promising solutions 3.Build probabilistic model of selected solutions 4.Sample built model to generate new solutions 5.Incorporate new solutions into original population 6.Go to 2 (if not finished)

5-bit trap problem

UMDA performance

UMDA with “good” statistics

Extended compact GA - ECGA  Marginal product model (MPM) o Groups of bits (partitions) treated as chunks o Partitions represent subproblem o Onemax: [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] o Traps: [ ] [ ]

Learning structure in ECGA  Two components o Scoring metrics: minimal description length (MDL) –Number of bits for storing probabilities: C m = log 2 N  i 2 Si –Number of bits storing population using model: C p = N  i E(M i ) –Minimize C = C m + C p o Search procedure: a greedy algorithm –Start with one-bit groups –Merge two groups for most improvement –No more improvement possible  finish.

ECGA model [0,2,5][1,4][3] , 010, , 101,

ECGA example