Evoluce molekulárních znaků
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
Mechanismy vzniku molekulárních znaků Základní druhy mutací Bodové mutace (substituce, inserce, delece) Řetězcové mutace (delece, inserce, transposice, inverse) Genové změny (obsah genů v genomu, alozymy) Chromosomové (translokace, rozpad, fůze) Genomové (polyploidizace)
Bodové mutace Výhody Dostatečná frekvence (mnoho dat) Metodická přístupnost (sekvenování) Neutralita Lze použít na různých taxonomických úrovních Molekulární hodiny
Bodové mutace Nevýhody Reverzibilita Homoplazie Snadná metodická přístupnost...
Řetězcové mutace Výhody a nevýhody Často jsou ireverzibilní - menší riziko homoplázií Horší metodická přístupnost (jak co se týká získávání dat, tak co jejich zpracovávání) Menší zkušenosti
Genové mutace Výhody a nevýhody Rozumná metodická přístupnost Využitelnost na nejrůznějších taxonomických úrovních Odrážejí částečně i anagenezi Nejsou selekčně neutrální Možnost homoplázií Vzájemná závislost (co je jeden znak?)
Záměnové mutace Transverze - transice (pyrimidin C, T, puriny A, G) Transice (4×) A G, G A, C T, T C Transverze (8×) A C, A T, C A, C G, T A, T G, G C, G T Synonymní, nesynonymní synonymní x silent!!! (splicing) nesynonymní (missense, nonsense)
Relativní frekvence různých typů substitucí v kódující sekvenci Substitucí 1. pozice 2. pozice 3. pozice 1-3. pozice celkem 183(100%) 183(100%) 183(100%) 549(100%) synonymních 8(4%) 0(0%) 126(69%) 134(25%) missense 166(91%) 176(96%) 50(27%) 392(71%) nonsense 9(5%) 7(4%) 7(4%) 23(4%) (Jedná se pouze o teoretické hodnoty vypočtené na podkladě struktury genetického kódu.)
Mutační rychlost Savčí jaderná DNA 3-5 10-9 subst/nucl/rok Inserce v mikrosatelitech 10-3 Indels/nucl/rok Savčí mitochondrie 3-5 10-8 subst/nucl/rok Raus sarkoma virus 1,4 10-4 subst/nucl/cyklus
Rozdíly v mutačních rychlostech v závislosti na typu mutace Velké rozdíly existují ve frekvenci transicí a transversí Savčí jaderné geny: transice 60-70 % všech substitucí (teoreticky 33 %) V savčích mitochondriích 43 % Některé nukleotidy mutují častěji než jiné (např. G a C v savčích jaderných genech)
Frekvence jednotlivých typů substitučních mutací Nový Původní A T C G A - 3,4 4,5 12,5 T 3,3 - 13,8 3,3 C 4,2 20,7 - 4,6 G 20,4 4,4 4,9 - celkem 27,9 28,5 23,2 20,5 Procento nukleotidových záměn fij, 105 pseudogenů u člověka
Nerovnoměrnost v mutačních rychlostech v závislosti na pozici Horká místa (hotspots) 5'- CG -3' 5'- TG -3' (metylace) 5'- TT -3‘ ledacos (vytváření dimérů - jen u prokaryot) Palindromy 5'- GCCGGC -3' u prokaryot Repetice purin-pyrimidin dimerů (GCGCGCGC ) - zaujímají Z-konformaci -časté delece
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
Fixace mutací v populaci Selekce (negativní, pozitivní) Tahy (molekulární, meiotický, mutační, reparační) Genetický posun Svezení se
Vliv selekce na genofond druhu a populace Rychlá fixace některých mutací (pozitivní selekce) Genetické svezení se (hitchhiking) Geny angažované v imunitě nebo v sexualitě Eliminace většiny nových mutací v kódujících oblastech (negativní selekce) Konzervativní geny (možno odhadnout z poměru synonymních a nesynonymních substitucí) Dlouhodobé udržování polymorfismu (stabilizující [balancing] selekce)
Molekulární (a jiné) tahy Velmi rychlé, týkají se zejména repetitivních sekvencí, Synchronizovaná evoluce Lze využít k rozpoznávání diskontinuity v genofondu, podstatně hůře ve fylogenetických studiích. Mutační tah (tlak, bias) - nebezpečí vzniku homoplasií
Genetický drift (posun) Za dostatečně dlouhou dobu v konečné populaci zůstanou pouze kopie jediné z původně přítomných “alel”. Pravděpodobnost, že to budou kopie právě jedné vybrané “alely” např. mutované, je pro diploidní druh rovna: P = 1/2N N: počet jedinců v populaci Obecněji: Pravděpodobnost fixace určité neutrální alely je rovna její frekvenci v populaci.
t0 t1 t2 t3 t4 t5 t6 t7 t8
Genetický posun P=2s (malé selekční koeficienty, velká populace) Pro selekčně významné alely přibližně platí: P=2s (malé selekční koeficienty, velká populace) O osudu mutace rozhoduje selekce tehdy, když: Abs(s) > 1/Ne Doba (podmíněná) fixace neutrální mutace: T = 4 Ne (Generací) Doba (podmíněná) fixace selekčně významné mutace: T = (2/s) ln (2 Ne) (Generací)
Průběh fixací mutací driftem 1,0 velká populace frekvence mutace 0,5 t T malá populace 1,0 frekvence mutace 0,5 čas
Neutralita substitučních mutací Testováno pomocí McDonald-Kreitmanova testu (2 x 2 kontingenční tabulka)
Výsledky testů neutrality Průkaz pozitivní selekce u některých genů Průkaz stabilizující (balancing) selekce u některých genů Výskyt mírně negativních mutací v mtDNA Pozitivní korelace mezi mírou diverzity a rekombinační aktivitou v daném úseku
Substituční rychlost Mutační rychlost u (počet mutací/gen/generaci) Počet mutací v daném genu v celé populaci: 2Nu Substituční rychlost (počet mutací fixovaných v populaci za generaci): K: počet mutací x pravděpodobnost fixace jedné mutace K= 2Nu x 1/2N = u Pro selekčně významné výhodné mutace: K = 4Nsu
Doba potřebná k fixaci mutace (Příklad) Savec, generační doba 2 roky, efektivní velikost populace 106 jedinců Neutrální mutace: 8 milionů let Mutace se selekčním koeficientem ±0,01: 5800 let
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
Genetický polymorfismus Polymorfní geny - věc definice, většinou geny, jejichž nejhojnější alela má frekvenci menší než 99% Měřítko stupně vnitropopulačního polymorfismu: P - podíl polymorfních lokusů (z celkového počtu studovaných lokusů) Genová diverzita – index heterozygotnosti (frekvence heterozygotů) Pro jeden lokus a m alel : h = 1 - Σxi2 (xi –frekvence i-té alely) Průměrná genová diverzita pro všechny (n)studované lokusy: H = 1/n Σ hi
Závislost polymorfismu na intenzitě rekombinace Drosophila melanogaster Korelační koeficient c=0,42 polymorfismus Intenzita rekombinace
Nukleotidová diversita GAGGTGCAACAG GCGGTGCAACAG GTGGTGCAACAG GGGGTGCAACAG GAGGTGCAACAG GAGGACCAACAG GAGGTGCATCAA GGGGTGGAACAG Nukleotidová diversita Π = Σ x y π ij i j ij x frekvence i-té alely i y frekvence j-té alely j π proporce rozdílných nukleotidů mezi i-tou a j-tou ij alelou
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
Nerovnoměrnost v používání jednotlivých kodónů (codon-usage bias) RSCU (relative synonymous codon usage) X n -počet synonymních kodónů (1-6) i RSCU = n X -počet výskytů i-tého kodónu i 1 i Σ x i n i=1 CAI (codon adaptation index) √ L CAI = L w Π i i=1 RSCU i w = i RSCU max
Nerovnoměrnost v používání jednotlivých kodónů Větší nerovnoměrnost vykazují proteiny s menší frekvencí nesynonymních mutací (tj. proteiny, které jsou vystaveny intenzivnější selekci). Na grafu jsou geny drosofily.
Nerovnoměrností v používání synonymních kodónů u E. coli a Buchnera 40 30 Podle Wernegreen a Moran Mol. Biol. Evol. 16: 83-97, 1999 nerovnoměrnost v používání kodónů (x2) 20 10 7,82 3,84 0,2 0,4 0,6 0,8 index využití preferovaných kodónů (CAI)
Obsah Druhy molekulárních znaků Mechanismy šíření a fixace molekulárních znaků Polymorfismus Nerovnoměrnost v používání synonymních kodónů Molekulární hodiny
α globulinové molekulární hodiny 600 500 žralok 400 kapr Page a Holmes, Molecular evolution. A phylogenetic approach, 2001 stáří molekulární (milionů let) skokan 300 kuře aligátor 200 kunovec (vačnatec) 100 kráva (kalibrační bod) pavián stáří = doba od odvětvení od linie vedoucí k člověku 100 200 300 400 500 600 stáří paleontologické (milionů let)
Substituční rychlost r = K(2T) (K -počet substitucí mezi dvěma druhy, T -doba od odvětvení obou druhů) Gen Nesynonymní (10-9) Synonymní (10-9) ribosomální protein S14 0,02 2,16 ribosomální protein S17 0,06 2,69 aktin 0,01 2,92 myosin 0,10 2,15 somatotropin 1,34 3,79 albumin 0,92 5,16 amylasa 0,63 3,42 Ig VH 1,10 4,76 interferon 3,06 5,50
Rozdíly v substitučních rychlostech mezi proteiny Variabilita pro nesynonymní mutace je mnohem větší než pro synonymní Substituční rychlost pro synonymní mutace je většinou mnohem větší než pro nesynonymní Velkou roli patrně hraje negativní selekce na pozadí. Změny ve funkci proteinu mohou výrazně ovlivnit substituční rychlost.
Rozdíly v substitučních rychlostech mezi různými oblastmi genomu Oblast počet substitucí 5' netranskribovaná oblast genu 4,0 4-degenerované pozice 8,6 introny 8,1 3' netranskribovaná oblast genu 8,8 pseudogeny 9,1 Rozdíly mezi kravskými a kozími globinovými geny a pseudogeny (substitucí/nukleotid/109 let).
Rozdíly v substitučních rychlostech mezi různými oblastmi genomu čtyřikrát degenerované pozice pseudogeny introny přiléhající 3’ oblast 4 netranslatovaná 3’ oblast přiléhající 5’ oblast nepřekládaná 5’ oblast dvakrát degenerované pozice 3 nedegenerované pozice substitucí na bázi za 109 let 2 1 geny pseudogeny
Test rovnoměrnosti chodu molekulárních hodin ve dvou větvích (Relative rate test, Margoliash 1963 a Sarih & Wilson 1973) KAB = KOA + KOB KAC = KOA + KOC KBC = KOB + KOC
Test rovnoměrnosti chodu molekulárních hodin II ??? O KOA - KOB = 0 KOA - KOB = KAC - KBC = d V(d) = V(KAC) + V(KBC) + 2V(KOC) A B C p - p 2 p -proporce neshodných nukleotidů, V(K) = L -délka sekvence 4 ( ) L 1- p 3 Abs(d) ≥ 2SE d P ≤ 5% 3 ( ) 4/3 K OC 1 - e p = Abs(d) ≥ 2,7SE d P ≤ 1% 4 OC
Rozdíly v substituční rychlosti mezi jednotlivými druhu (taxony) Ryby – rychleji než savci Hlodavci – rychleji, není jisté zda i synonymní mutace Lidoopi – zpomalení, člověk ještě pomalejší Drosofila 10x rychleji než obratlovci Vliv mutační rychlosti (reparační mechanismy) Demografické faktory (rostoucí populace, malá nebo fluktuující populace) Intenzita rekombinací a svezení se
Efekt generační doby Rychlost synonymních nukleotidových substitucí pro některé dvojice druhů. Doba divergence Rychlost (mil. let) (x 109/rok/nukleotid) člověk-šimpanz 7 (5-10) 1,3 (0,9-1,9) kráva-koza 17 (12-25) 4,2 (2,9-6,0) myš-krysa 15 (10-30) 7,9 (3,9-11,8)
Rozdíly v mezi synonymními a nesynonymními mutacemi Synonymní – generační doba má vliv Nesynonymní (proteiny) – patrně nemá vliv Vysvětlení Teorie mírně škodlivých mutací (negativní korelace generační doby a velikosti populace). Svezení se (hitchhiking, genetic draft) a změna prostředí za generační dobu.
Efekt intenzity metabolismu Martin a Palumbi, PNAS USA 90: 4087-4091, 1993 10 hlodavci psi koně husy primati medvědi divergence sekvencí (%/milion let) želvy 1 mloci velryby pstruzi žáby želvy mořské želvy žraloci 0,1 0,01 0,1 1 10 100 1000 10000 100000 tělesná hmotnost (kg)
Změny v substitučních rychlostech v čase Wallis M. 2001 J.Mol.Evol. 53, 10-18. Studium změn substituční rychlosti v genech pro 8 savčích hormonů v průběhu delších období fylogeneze. Pro 6 hormonů se rychlost v čase signifikantně měnila. V některých případech v období zrychlené evoluce vzrostla substituční rychlost až 50x. Celkově 62 % substitucí v genech nastalo během období zahrnujících pouze 15% sledované doby. Epizody zrychlené evoluce se přitom časově neshodovaly pro jednotlivé proteiny.
a) somatotropin čas (mil. let) possum slepec křeček krysa myš morče slon kůň pes prase lama srnec kráva ovce králík lori makak člověk 1 2 2 5 2 2 1 1 1 2 12 5 1 17 4 50 71 4 1 100 1 150 (16) čas (mil. let) 200
b) prolaktin čas (mil. let) possum křeček krysa myš slon kůň kočka prase velbloud kráva ovce králík makak člověk 1 8 8 3 8 3 3 22 1 3 8 21 51 5 14 37 50 33 2 59 100 150 (13) čas (mil. let) 200
Vlastnosti molekulárních hodin V jednotlivých genech jdou nestejně rychle V jednotlivých liniích jdou nestejně rychle Hlodavci > kopytníci > primáti > člověk Drosophila 5-10x rychleji než obratlovci Při změně funkce genu či po jeho duplikaci se mění rychlost hodin U neutrálních mutací existuje efekt generační doby, u záměnových mutací v proteinech nikoli
Problémy s využíváním molekulárních hodin Pravidelnost chodu molekulárních hodin (správná kalibrace, větší počet genů) Často příliš široké intervaly spolehlivosti (co nejvíce výchozích dat) Kalibrace molekulárních hodin (slepě nespoléhat na „nezávislá“ data, kalibrace pro metazoa jen jeden bod savci-ptáci) Mutačně „saturované“ sekvence simulují platnost molekulárních hodin (Slow-Fast m.)
Závěr Na molekulární úrovni existuje množství znaků (několika kategorií) které je možno použít v molekulární fylogenetice Většina znaku se šíří a je fixována genetickým posunem, pro některé účely je však vhodné používat znaky šířící se jinými mechanismy I polymorfismus v molekulárních znacích nám může poskytnout informaci použitelnou k řešení řady otázek Nerovnoměrnost v používání synonymních kodónů často komplikuje fylogenetické studie, je možné ji však pro některé účely využít Molekulární hodiny existují, je však třeba se s nimi naučit zacházet huejedjjkekllkek