Co je to molekulární fylogenetika a molekulární taxonomie Zvláštnosti molekulárních znaků Metody získávání experimentálních dat Metody zpracovávání dat Biologická interpretace MOLEKULÁRNÍ FYLOGENETIKA A TAXONOMIE Náplň kurzu
ROZPIS PŘEDNÁŠEK Zahájení kurzu, taxonomie a molekulárně biologické znaky, metody sekvenace DNA Alignment sekvencí (Marián Novotný) Databáze sekvencí a vyhledávání v nich (Marián Novotný) Získávání nesekvenčních molekulárních dat - multilokusové metody (RAPD, RFPL aj.), mikrosatelity, minisatelity, izoenzymová a alozymová analýza, imunologické metody SNP, evoluce sekvencí, odhad evoluční vzálenosti Fylogenetické stromy I. - Proteinové distance, konstrukce fylogenetických stromů z matice distancí, anatomie stromů Fylogenetické stromy II. Rate heterogeneity, prohledávání prostoru stromů, maximální parsimonie Fylogenetické stromy III. - Metoda maximum likelihood, Bayéská metoda Praktikum : Získávání sekvencí z veřejných databází Fylogenetické stromy IV. - Multigenové analýzy, určení věrohodnosti větvení stromů, nalezení kořene, testy topologie, datování pomocí molekulárních hodin Praktikum : Tvorba alignmentu, tvorba stromů ze sekvencí DNA Identifikace jedinců, určování rodičovství, DNA barcoding Speciace a hybridizace, kryptické druhy, příklady (Radka Reifová) Praktikum : Tvorba stromů ze sekvencí proteinů Vnitrodruhová fylogeneze, struktura populace a genový tok, fylogeografie, příklady Praktikum : Bayéské metody, molekulární hodiny Speciace a hybridizace, kryptické druhy, příklady (Radka Reifová) Prezentace studentů Praktikum : multigenové analýzy, testy, distanční data, analýza migrace
Součásti zkoušky: Písemná část (5 příkladů) – maximální zisk 10 bodů Ústní část – maximální zisk 10 bodů Nepovinný esej (2-3 strany) a jeho prezentace (10 min.) – 4 body Hodnocení: bodů – dobře bodů – velmi dobře 18 a více - výborně ZKOUŠKA
MATERIÁLY KE STUDIU WEB (Hampl): Moodle: klíč k zápisu „moltax“ WEB (Flegr): KNIHY Flegr J. Evoluční biologie, Academia Kapitoly: IX.Evoluce sekvence DNA a XXIV. Molekulární fylogenetika Avise J.C. Molecular markers, natural history and evolution. Sinauer Associates, Inc., 2004 Felsenstein J. Inferring phylogenies. Sinauer Associates, Inc., 2004 Lindell Bromham Reading the story of the DNA. Oxford University press Higgs P. a Attwood T.K. Bioinformatics and molecular evolution. Blackwell publishing Sapp: The new foundation of evolution. Oxford university press 2009 Yang: Computational Molecular Evolution. Oxford university press 2006 Hillis a kol.: Molecular Systematics (2nd edition). Sinauer Associates 1996 Wiley a Lieberman: Phylogenetics (2nd edition). Wiley-Blackwell 2011
MOLEKULÁRNÍ TAXONOMIE Co to je za obor? Taxonomie (systematika) využívající molekulárně biologické znaky. Taxonomie (systematika) = Snaží se katalogizovat biodiverzitu a uspořádat ji do systému obvykle hierarchicky řazených skupin. Rozdíly v sekvenci DNA (potažmo proteinů). Nepatří sem znaky na jiným molekulách (lipidy, polysacharidy, proteoglykany, terciární struktury proteinů aj.)
FYLOGENETIKA Podle většinového názoru taxonomů je nejlepším přirozeným systémem organizmů ten, který odráží průběh jejich fylogeneze. Fylogenetika – zabývá se vznikem a vývojem linií organizmů. Rekonstruje průběh kladogeneze (větvení), ale všímá si i anageneze vývoje vlastností organizmů v rámci linie.
TAXONY Základním požadavkem na přirozený taxon je jeho monofyletičnost. Monofyletický taxon je takový, jehož členové si jsou vzájemně příbuzní více, než je kdokoli z nich příbuzný druhu mimo jinak řečeno, takový, který zahrnuje všechny potomky jednoho předka Polyfyletický (nepřípustný) Parafyletický (přípustný pro evoluční taxonomy) Monofyletický (přípustný pro evoluční taxonomy i kladisty)
TAXONY Na základě znalosti fylogeneze lze určit, které taxony vytvářet nesmíme, není však možné určit, které taxony vytvářet máme nebo musíme.
ZNAK VS. FORMA ZNAKU ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG Alignment sekvencí Znakem rozumíme část těla, rys či vlastnost, která je kvazi-nezávislá na ostatních znacích. Formou znaku rozumíme popis znaku konkrétního organizmu používaný pro srovnání s jiným.
ZNAKY A JEJICH FORMY Existují různé názory na použitelnost znaků pro rekonstrukci fylogeneze: Fenetika (podobnost) – používá všechny znaky Kladistika (důraz na příbuznost) – používá výhradně synapomorfie x 1, y 1, z 1 = plesiomofie x 2 = synapomorfie pro BCD y 2 = autapomorfie pro B z 2 = homoplázie (konvergence) pro ED x 1 y 1 z 1
PŘÍSTUPY K POUŽITÍ ZNAKŮ Numerická taxonomie (60. minuleho století) – první pokus o objektivizaci taxonomie. Kladli důraz na použití velkého množství dat a vyvinuli matematické postupy, jak z nich vypočítat celkovou podobnost (nebo naopak odlišnost - distanci) mezi taxony. Je to tzv. fenetický přístup. Kritizováni kladisty za to, že jim nevadí homoplázie. Metody konstrukce stromů označované jako fenetické (založené na distancích) byly nebo jsou kladisty neprávem zavrhovány. Kladistické metody (maximální parsimonie) se v praxi dostávají do podobných obtíží, nemají vodítko, jak rozeznat homoplázie a konflikty mezi znaky řeší nakonec podobně jako „fenetické“ metody.
HOMOLOGIE Homologie jsou podobnosti mezi komplexními strukturami nebo vzory, které jsou způsobeny kontinuitou biologické informace. (Riedl a Hazsprunar) Synapomorfie a symplesionorfie = homologie Homoplásie ≠ homologie, je to analogie, Musíme si uvědomit zda posuzujeme homologii znaku nebo konkrétní formy znaku
HOMOLOGIE Homologický vztah indikuje: Odpovídající poloha Podobnost v detailech ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG Alignment sekvencí
HOMOLOGIE Homologický vztah vyvrací: Přítomnost obou struktur u jednoho druhu Inkongruence s mnoha jinými znaky Homonomie
HOMOLOGIE Homologický vztah vyvrací: Přítomnost obou struktur u jednoho druhu Inkongruence s mnoha jinými znaky Homonomie
MOLEKULÁRNÍ TAXONOMIE Co to je za obor? Taxonomie (systematika) využívající molekulárně biologické znaky. Taxonomie (systematika) = Snaží se katalogizovat biodiverzitu a uspořádat ji do systému obvykle hierarchicky řazených skupin. Rozdíly v sekvenci DNA (potažmo proteinů). Nepatří sem znaky na jiným molekulách (lipidy, polysacharidy, proteoglykany, terciární struktury proteinů aj.)
PŘEKVAPIVÉ MNOŽSTVÍ POLYMORFISMU Liší se asi ve 3 miliónech nukleotidů Kdyby tyto různé alely genů měnily fitness, byly by přírodním výběrem rychle eliminovány nebo naopak fixovány a žádný polymorfismus bychom v daných místech nepozorovali.
NEUTRÁLNÍ TEORIE EVOLUCE Naprostá většina substitucí na úrovni DNA je selekčně neutrální neutrálních, mutanti mají stejnou fitness. Tyto mutace jsou pro selekci neviditelné a jejich fixaci či eliminaci způsobuje genetický drift (posun). Ten je u velkých populací pomalý, obě alely tam přetrvávají dlouho dobu a my je detekujeme jako polymorfismy. Liší se asi ve 3 miliónech nukleotidů
GENETICKÝ DRIFT
Aby bylo jasno: Neutrální teorie netvrdí, že většina genů je postradatelná, ale tvrdí, že většina forem (alel) téhož genu je funkčně stejně dobrá. Neutrální teorie netvrdí, že nejsou mutace se škodlivým efektem, které jsou eliminovány přírodním výběrem, ale tvrdí že takových mutací je menšina. Neutrální teorie nezavrhuje darwinistickou adaptivní evoluci poháněnou přírodním výběrem, ale tvrdí, že většina mutací je pro přírodní výběr „neviditelná“ a k adaptivní evoluci nepřispívá. Neutrální teorie nejlépe vysvětluje, kde se bere tolik polymorfismu (rozdílů) v DNA. NEUTRÁLNÍ TEORIE EVOLUCE
VÝHODY MOLEKULÁRNÍCH ZNAKŮ 1. Jsou genetické Víme jak se dědí, nezávisí na prostředí ani genetickém pozadí. Je to právě ta úroveň kde vznikají evoluční novinky – mutace v DNA. 2. Je jich obrovské množství: Velikost genomů se pohybuje od 0,5*10 6 – 600*10 9. Lidský genom obsahuje přes 3 miliardy párů bazí. Odhaduje se, že lidé se mezi sebou liší v 0,1% tj 3 miliónech bazí.
3. Jsou selekčně neutrální Podle nich snadněji rozlišíme homologii a homoplázii Sup africký Kondor andský VÝHODY MOLEKULÁRNÍCH ZNAKŮ
ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 4. Jsou použitelné od těch nejvzdálenějších srovnání … VÝHODY MOLEKULÁRNÍCH ZNAKŮ
4. … až po porovnávání jedinců téhož druhu VÝHODY MOLEKULÁRNÍCH ZNAKŮ
5. Dají se jednoznačně popsat 6. Jsou nezávislé 7. Jsou lépe vážitelné 8. Lépe se kvantifikuje stupeň nejistoty ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 1 2 VÝHODY MOLEKULÁRNÍCH ZNAKŮ
Molekulární hodiny Informace o populaci VÝHODY MOLEKULÁRNÍCH ZNAKŮ
Neposkytují informaci o anagenezi Cena Někdy destruktivní charakter NEVÝHODY MOLEKULÁRNÍCH ZNAKŮ
HISTORIE – 60. LÉTA Linus Pauling, Emile Zuckerkandl (Molecules as Documents of Evolutionary History, 1964) Robert Sokal, Peter Sneath (Numerical taxonomy, 1963) Willi Henning (Phylogenetic systematics, 1966) Luigi Cavalli-Sforza, Anthony Edwards (metody maximální parsimonie a maximum likelihood, )
HISTORIE – 60. – 90. LÉTA Margaret Dayhoff (Atlas of protein sequence and structure, 1965) Motoo Kimura (Neutral theory of evolution, 1968) Joe Felsenstein (PHYLIP - Phylogeny Inference Package, 1995, artefakty fylogenetických metod – long branch attraction) (David Swofford – PAUP ) Masatoshi Nei (substituční modely, 80. léta)
ZÁVĚR Přirozený systém je založen na znalosti fylogeneze organizmů Je dovoleno vytvářet jen monofyletické případně parafyletické taxony Molekulární znaky mají spoustu důležitých výhod Molekulární znaky jsou vhodné pro studium studium kladogeneze nikoli anageneze Molekulární znaky vznikají převážně neutrální evolucí a k jejich fixací přispívá genetický drift
SEKVENACE DNA
Cyklus 1 Cyklus 2 Jednostranně ohraničené řetězce vznikají pouze z původní DNA templátu. Oboustranně ohraničené řetězce jsou samy sobě templátem, jejich počet roste geometrickou řadou a po 30 – 40 cyklech zcela převáží nad ostatní DNA ve vzorku. Cyklická reakce zahrnující denaturaci templátu, nasednutí primeru a polymeraci. PCR
SANGEROVA METODA - I PCR Amplifikace Vložení do plazmidu Sekvenace
SANGEROVA METODA - II G GG G Kapilární elektroforéza
NEXT GENERATION SEQUENCING Díky masivní paralelizaci (najednou sekvenují milióny templátů ) dokáží v krátkém čase vygenerovat obrovské množství sekvencí. Cena za 1 bázi podstatně klesá.
454 – EMULZNÍ PCR
454 – DESTIČKA
454 - CHEMIE
454 - VÝSTUP
ION TORRENT
ILLUMINA – VAZBA NA SKLÍČKO
ILLUMINA - AMPLIFIKACE
ILLUMINA - ČTENÍ
REAL TIME SEQUENCING Pacific biosciences
ZÁVĚR TechnologieDélka čteníMnožství na jeden běh Sanger1000 bp36 Kb bp0,7 Gb Ion Torrent400 bp2 Gb Illumina300 bp (125 bp)15 GB (1000 Gb) Pacbio RS8500 bp375 Mb Porovnání některých parametrů technologií sekvenace DNA Metody jsou různě vhodné k různým účelům. Na „de novo“ sekvenování je nejvhodnější Sanger a 454 a Pacbio RS. Illumina je lepší na re-sekvenování. Někdy je dobré metody kombinovat.