Evoluce sekvence DNA
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Molekulární hodiny
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Molekulární hodiny
Mechanismy vzniku molekulárních znaků Základní druhy mutací Bodové mutace (nukleotidové substituce, inserce, delece) Řetězcové mutace (delece, inserce, transposice, inverse) Genové změny (obsah genů v genomu, alozymy) Chromosomové (translokace, rozpad, fúze) Genomové (polyploidizace)
Mechanismy vzniku molekulárních znaků Základní druhy mutací Bodové mutace (nukleotidové substituce, inserce, delece) Velká část mutací na pozorovatelných na molekulární úrovni se na úrovni fenotypu neprojeví a je tedy selekčně neutrálních.
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Molekulární hodiny
Fixace mutací v populaci Selekce (negativní, pozitivní) Tahy (mutační, reparační, molekulární) Genetický posun Svezení se
Vliv selekce na genofond druhu a populace Rychlá fixace některých mutací (pozitivní selekce) Geny angažované v imunitě nebo v sexualitě
Zvýšená frekvence nesynonymních mutací v genech spojených s imunitou místo vázající antigen 20 60 80 100 40 nukleotidové záměny (100) D2 doména DPB vs DPB DPB vs DQB DPB vs DRB DQB vs DQB DQB vs DRB DRB vs DRB nesynonymní synonymní Poměr počtu nesynonymních a synonymních substitucí v různých oblastech molekul MHC II. Graf ukazuje počty nesynonymních (tmavé sloupce) a synonymních (prázdné sloupce) substitucí na nesynonymní nebo synonymní místo ve dvou oblastech molekul MHC II. Porovnávány byly jednak produkty různých MHC-genů (tučné písmo), jednak různé alely stejných MHC-genů (obyčejné písmo). V oblasti vázající antigeny, přesněji řečeno peptidy, převažují nesynonymní substituce, naopak v ostatních doménách, podobně jako je tomu u většiny jiných proteinů, převažují substituce synonymní. Převahu nesynonymních substitucí v místech vázajících antigen lze nejsnáze vysvětlit působením pozitivní selekce, která je vzhledem k relativně vysoké divergenci právě jednotlivých alel stejného MHC-genu ve srovnání s divergencí jednotlivých genů (srovnej s poměry ve druhé doméně) nejspíše selekce závislá na frekvenci. Data podle Hughese a Neie (1989), upraveno podle Pagea a Holmese (2001).
Zvýšená frekvence nesynonymních mutací v genech spojených s rozmnožováním 0,30 0,25 0,20 substituční rychlost 0,15 0,10 0,05 nesynonymní (Kn) synonymní (Ks) Kn/Ks D. melanogaster a D. simulans, srovnáváno 10 genů pro proteiny spojené s rozmnožováním (šedé sloupce) a 46 genů jiných (bílé sloupce)
Vliv selekce na genofond druhu a populace Rychlá fixace některých mutací (pozitivní selekce) Geny angažované v imunitě nebo v sexualitě Eliminace většiny nových mutací v kódujících oblastech (negativní selekce) Konzervativní geny (možno odhadnout z poměru synonymních a nesynonymních substitucí)
Vliv selekce na genofond druhu a populace Rychlá fixace některých mutací (pozitivní selekce) Geny angažované v imunitě nebo v sexualitě Eliminace většiny nových mutací v kódujících oblastech (negativní selekce) Konzervativní geny (možno odhadnout z poměru synonymních a nesynonymních substitucí) Dlouhodobé udržování polymorfismu (stabilizující [balancing] selekce)
Fixace mutací v populaci Selekce (negativní, pozitivní) Tahy (mutační, reparační, molekulární) Genetický posun Svezení se
Molekulární (a jiné) tahy Velmi rychlé, týkají se zejména repetitivních sekvencí, Synchronizovaná evoluce Lze využít k rozpoznávání diskontinuity v genofondu, podstatně hůře ve fylogenetických studiích. Mutační tah (tlak, bias) - nebezpečí vzniku homoplasií
Mutační tah mechanismy mutačního a reparačního tahu mutacionismus evoluce genomu Isochory paradox genetické komplexity
Mutační tah mechanismy mutačního a reparačního tahu mutacionismus evoluce genomu Isochory paradox genetické komplexity
Mutační tah Reparační tah X C G T A 5’ 3’ reparace deaminace met T reparace deaminace A substituce
Mutační tah mechanismy mutačního a reparačního tahu mutacionismus (evoluční trendy a zábrany) evoluce genomu Isochory paradox genetické komplexity
Mutační tah mechanismy mutačního a reparačního tahu mutacionismus evoluce genomu Isochory paradox genetické komplexity
a) b) c) d) deaminace MET-cytosinu reparace GT GC 5’-ATxxxxCG-3’ 3’-TAxxxxGC-5’ 5’-ATxxxxTG-3’ 3’-TAxxxxGC-5’ 5’-ATxxxxCG-3’ 3’-TAxxxxGC-5’ b) substituce A G reparace GT GC m m m 5’-ATxxxxCG-3’ 3’-TAxxxxGC-5’ 5’-GTxxxxCG-3’ 3’-TAxxxxGC-5’ 5’-GTxxxxCG-3’ 3’-CAxxxxGC-5’ c) nízký obsah GC párů lokální dočasná denaturace DNA deaminace MET-cytosinu pokles zastoupení GC párů d) vysoký obsah GC párů absence lokální denaturace pokles deaminace MET-cytosinu vzestup zastoupení GC párů
Paradox genetické komplexity mnoho rostlin, někteří živočichové živočichové, některé rostliny houby bakterie 106 107 108 109 1010 1011 velikost genomu (počet párů bazí)
Evoluční tahy Mutační tah Reparační tah Molekulární tah
Molekulární tah mechanismy genová konverze sklouznutí nelegitimní rekombinace retrotransposice význam pro evoluci (synchronizovaná evoluce) význam pro molekulární taxonomii (repetice, mikrosatelity)
Role molekulárního tahu v divergenci druhů b)
Fixace mutací v populaci Selekce (negativní, pozitivní) Tahy (molekulární, meiotický, mutační, reparační) Genetický posun Svezení se
Genetický drift (posun) Za dostatečně dlouhou dobu v konečné populaci zůstanou pouze kopie jediné z původně přítomných “alel”. Pravděpodobnost, že to budou kopie právě jedné vybrané “alely” např. mutované, je pro diploidní druh rovna: P = 1/2N N: počet jedinců v populaci Obecněji: Pravděpodobnost fixace určité neutrální alely je rovna její frekvenci v populaci.
Genetický drift P=2s (malé selekční koeficienty, velká populace) Pro selekčně významné alely přibližně platí: P=2s (malé selekční koeficienty, velká populace) O osudu mutace rozhoduje selekce tehdy, když: Abs(s) > 1/Ne Doba (podmíněná) fixace neutrální mutace: T = 4 Ne (Generací) Doba (podmíněná) fixace selekčně významné mutace: T = (2/s) ln (2 Ne) (Generací)
Doba potřebná k fixaci mutace (Příklad) Savec, generační doba 2 roky, efektivní velikost populace 106 jedinců Neutrální mutace: 8 milionů let Mutace se selekčním koeficientem ±0,01: 5800 let
Substituční rychlost Mutační rychlost u (počet mutací/kopii genu/generaci) Počet mutací v daném genu v celé populaci: 2Nu Substituční rychlost K (počet mutací fixovaných v populaci za generaci): K: počet mutací pravděpodobnost fixace jedné mutace K= 2Nu 1/2N = u Pro selekčně významné výhodné mutace: K = 4Nsu
Průběh fixací neutrálních mutací ve velkých a malých populacích Velká populace Malá populace
Fixace mutací v populaci Selekce (negativní, pozitivní) Tahy (molekulární, meiotický, mutační, reparační) Genetický posun Svezení se
Genetické svezení se (draft) Osud mutace je ovlivněn charakterem genů s nimiž je ve vazbě Hill-Robertsonův efekt (nemusí být vazba) Evoluční vymetení a selekce na pozadí Působení draftu v nerekombinujících oblastech genomu (pohlavní chromosomy, organelová DNA, inverze) Fixace negativních mutací ve velkých populacích
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Molekulární hodiny
Vztah mezi divergencí sekvencí a počtem substitucí ACTGAACGTAACGC ACTGAACGTAACGC ACTGAACGTAACGC A C T G A C T A A T T C Koincidence Paralelismus Konvergence Zpětná substituce Jednoduchá substituce Vícenásobná substit. A A TG T A G GAATCGC A C TG A A A GAATCGC
Jukes-Cantorův jednoparametrový model α A G α α α α C T α Odhad podílu substitucí od okamžiku divergence K = -3/4 ln(1 - 4/3 p) Odhad rozptylu K V(K) = (p(1 -p))/(L(1 - 4/3 p)2) Jukes,T.H. Cantor, C.R. (1969) In: Mammalian protein metabolism. Munro,H.N. (Ed.) Acad.Press, New York
Převod z relativní na absolutní časovou škálu T = K substituční rychlost C B A T2 T2 = (2KABT1)/(KAC + KBC) T1 = (KAC + KBC)T2/2KAB T1
stáří molekulární (milionů let) 600 500 žralok 400 kapr stáří molekulární (milionů let) skokan 300 slepice aligátor 200 kunovec (vačnatec) 100 kráva (kalibrační bod) pavián 100 200 300 400 500 600 stáří paleontologické (milionů let)
Substituční rychlost r = K(2T) (K -počet substitucí mezi dvěma druhy, T -doba od odvětvení obou druhů) Gen Nesynonymní (10-9) Synonymní (10-9) ribosomální protein S14 0,02 2,16 ribosomální protein S17 0,06 2,69 aktin 0,01 2,92 myosin 0,10 2,15 somatotropin 1,34 3,79 albumin 0,92 5,16 amylasa 0,63 3,42 Ig VH 1,10 4,76 interferon 3,06 5,50
Rozdíly v substitučních rychlostech mezi proteiny Variabilita pro nesynonymní mutace je mnohem větší než pro synonymní Substituční rychlost pro synonymní mutace je zpravidla mnohem větší než pro nesynonymní Velkou roli patrně hraje intenzita negativní selekce. Změny ve funkci proteinu mohou výrazně ovlivnit substituční rychlost.
Hromadění nesynonymních substitucí v genech savců cytosolická aspartát aminotransferáza aspartát aminotransferáza mitochondriální interleukin-6 interleukin-2 prolaktin interleukin-1β thrombomodulin laktoferin interleukin 1α IGF vázající protein aktivátor plasminogen urokinásy albumin somatotropin interleukin -7 alkalická fosfatáza střevní kortikotropin uvolňující faktor receptor somatotropinu fibrinogen γ IGF vázající protein 3 inhibitor aktivátoru plasminogenu terminální transferáza receptor TGF β3 β-1,4-galatosyl transferáza neurofysin II neurofysin I insulinu podobný růstový faktor 2 kyselá fosfatáza typu 5 ŕeceptor luteinizačního hormónu proopiomelanokortin alkalická fosfatáza jaterní TGF α1 neuroleukin β receptor acetylcholinu hexokináza I ornitin dekarboxyláza opsin protein disulfid osomeráza TGF β3 laktát dehydrogenáza A α receptor acetylcholinu insulinu podobný růstový faktor 1 D2 receptor dopaminu transporter glukozy TGF β2 ATP synthetáza α myelin proteolipid konexin ATP synthetáza β karboxypeptidáza 0,8 0,6 substituce/nukleotid 0,4 0,2
Rozdíly v substitučních rychlostech mezi různými oblastmi genomu Oblast počet substitucí 5' netranskribovaná oblast genu 4,0 4-degenerované pozice 8,6 introny 8,1 3' netranskribovaná oblast genu 8,8 pseudogeny 9,1 Rozdíly mezi kravskými a kozími globinovými geny a pseudogeny (substitucí/nukleotid/109 let).
Rozdíly v substitučních rychlostech mezi různými oblastmi genomu substitucí/nukleotid za 109 let
Rozdíly v substituční rychlosti mezi jednotlivými druhu (taxony) Ryby – rychleji než savci Hlodavci – rychleji, není jisté zda i synonymní mutace Lidoopi – zpomalení, člověk ještě pomalejší Drosofila 10 rychleji než obratlovci Vliv mutační rychlosti (reparační mechanismy) Demografické faktory (rostoucí populace, malá nebo fluktuující populace) Intenzita rekombinací a svezení se
Efekt generační doby Rychlost synonymních nukleotidových substitucí pro některé dvojice druhů. Doba divergence Rychlost (mil. let) (x 109/rok/nukleotid) člověk-šimpanz 7 (5-10) 1,3 (0,9-1,9) kráva-koza 17 (12-25) 4,2 (2,9-6,0) myš-krysa 15 (10-30) 7,9 (3,9-11,8)
Rozdíly v substituční rychlosti v genu pro albumin mezi liniemi (relativní jednotky) x3 (0,121) člověk x2 (0,192) krysa x1 (0,613) slepice za 75 mil od divergence myši a člověka došlo k substituci v každé druhé bázi, dvakrát více jich bylo v myší linii
Rozdíly v mezi synonymními a nesynonymními mutacemi Synonymní – generační doba má vliv Nesynonymní (proteiny) – patrně nemá vliv Vysvětlení Teorie mírně škodlivých mutací (negativní korelace generační doby a velikosti populace). Svezení se (hitchhiking, genetic draft) a změna prostředí za generační dobu.
Teorie mírně škodlivých mutací populační denzita (1/km) délka těla tělesná hmotnost (g) generační doba
Závislost substituční rychlosti pro mírně škodlivé mutace na velikosti populace 0,002 0,0015 draft (hitchhiking) substituční rychlost 0,0010 0,0005 genetický drift 5000 10000 15000 20000 velikost populace
Změny v substitučních rychlostech v čase Wallis M. 2001 J.Mol.Evol. 53, 10-18. Studium změn substituční rychlosti v genech pro 8 savčích hormonů v průběhu delších období fylogeneze. Pro 6 hormonů se rychlost v čase signifikantně měnila. V některých případech v období zrychlené evoluce vzrostla substituční rychlost až 50. Celkově 62% substitucí v genech nastalo během období zahrnujících pouze 15 % sledované doby. Epizody zrychlené evoluce se přitom časově neshodovaly pro jednotlivé proteiny.
Somatotropin x Prolaktin possum slepec křeček krysa myš morče slon kůň pes prase lama srnec kráva ovce králík lori makak člověk 1 2 5 1 2 2 2 1 12 1 17 2 1 5 50 4 4 71 1 100 1 150 (16) čas (mil. let) 200 possum křeček krysa myš slon kůň kočka prase velbloud kráva ovce králík makak člověk 8 22 8 1 3 8 3 3 37 3 1 51 8 21 14 5 50 33 2 59 100 150 (13) čas (mil. let) 200
Vlastnosti molekulárních hodin V jednotlivých genech jdou nestejně rychle V jednotlivých liniích jdou nestejně rychle Hlodavci > kopytníci > primáti > člověk Drosophila 5-10 rychleji než obratlovci Při změně funkce genu či po jeho duplikaci se mění rychlost hodin U neutrálních mutací existuje efekt generační doby, u záměnových mutací v proteinech nikoli
Problémy s využíváním molekulárních hodin Pravidelnost chodu molekulárních hodin (správná kalibrace, větší počet genů) Často příliš široké intervaly spolehlivosti (co nejvíce výchozích dat) Kalibrace molekulárních hodin (slepě nespoléhat na „nezávislá“ data, kalibrace pro metazoa nejčastěji jen jeden bod savci-ptáci) Mutačně „saturované“ sekvence simulují platnost molekulárních hodin (Slow-Fast m.)
Závěr Na molekulární úrovni existuje množství znaků (několika kategorií) které je možno použít v molekulární fylogenetice Většina znaku se šíří a je fixována genetickým posunem, pro některé účely je však vhodné používat znaky šířící se jinými mechanismy I polymorfismus v molekulárních znacích nám může poskytnout informaci použitelnou k řešení řady otázek Nerovnoměrnost v používání synonymních kodónů často komplikuje fylogenetické studie, je možné ji však pro některé účely využít Molekulární hodiny existují, je však třeba se s nimi naučit zacházet huejedjjkekllkek