Fylogenetická evoluční analýza

Slides:



Advertisements
Podobné prezentace
O PŮVODU DRUHŮ A UČIVU ROZTOMILÝCH DĚTÍ
Advertisements

Sedm základních nástrojů managementu jakosti
“Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky.”
Obecně použitelné odvození
Fylogeografie Studuje geografickou strukturaci populací Navazuje na evoluční biologii, ochranu živ. prostř., taxonomii.
Mgr. Iva Martincová UBO AVČR v.v.i. Studenec Masarykova univerzita
Hodnocení způsobilosti měřících systémů
Plošná interpolace (aproximace)
Architektury a techniky DS Tvorba efektivních příkazů I Přednáška č. 3 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Zarovnávání biologických sekvencí
Genetické algoritmy. V průběhu výpočtu používají náhodné operace. Algoritmus není jednoznačný, může projít více cestami. Nezaručují nalezení řešení.
ADT Strom.
Robustní vyrovnání Věra Pavlíčková, únor 2014.
Matice distancí v mnohorozměrné analýze. Distanční matice – proč se objevují? Vzdálenosti mezi objekty v terénu Vzdálenosti mezi taxony ve fylogenetickém.
Shlukovací algoritmy založené na vzorkování
MOLEKULÁRNÍ TAXONOMIE
Jak se pozná nejlepší strom?
REDUKCE DAT Díváme-li se na soubory jako na text, pak je tento text redundantní. Redundance vyplývá z:  některé fráze nebo slova se opakují  existuje.
Shluková analýza.
Imunologické, mikrosatelity, SSCP, SINE
Text: Reprodukce nálevníků Metody získávání vědeckých poznatků
Využití v systematické biologii
Skutečný počet substitucí na jednu pozici Počet pozorovaných rozdílů 0,75 DNA 0,95 PROTEINY SUBSTITUČNÍ SATURACE p.
Genetická diverzita hospodářských zvířat
Shluková analýza.
Základy molekulární taxonomie J.Flegr, Praha 2008.
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Bioinformatika Predikce genů, Fylogenetická analýza
Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,
Použití molekulárních znaků v systematice
Sekvence A Sekvence B D = ut Zjištění rozdílů (p) Korekce na mnohonásobné substituce Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC Bereme nebo.
Generování sítě MIDAS GTS. Prvky pro generování sítě MIDAS má několik typů prvků, jež využívá pro generování sítě. Každý prvek je určen svými uzly (konstrukčně).
Jak „dispersal limitation“ ovlivňuje druhovou bohatost společenstva Anna Vlachovská.
Sekvenování.
rozdělení metod využitelnost jednotlivých metod náročnost metod používání metod perspektivy.
GENETICKÁ A FENOTYPOVÁ
8. Syntéza a aplikace výsledků fylogenetických analýz
JAK NAJÍT NEJLEPŠÍ STROM
Základní principy geografického výzkumu
Normální rozdělení a ověření normality dat
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
Rozhodování ve veřejné správě Přednáška M. Horáková.
Úvod do systému rostlin
ROZHODOVÁNÍ Osnova: 1. Východiska
Optimalizace versus simulace 8.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
„AFLP, amplified fragment length polymorphism“
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
ÚVOD DO FYLOGENETICKÉ ANALÝZY II..
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. Algoritmus – najde jen jeden.
SMAMII-8 Detekce polymorfismů v genomech. Metody molekulární diagnostiky Se zaměřují na vyhledávání rozdílů v sekvencích DNA a Identifikaci polymorfismů.
Biotechnologie, technologie budoucnosti Aleš Eichmeier.
Základní informace o předmětu1. Přednášející: RNDr. Martin Hála, CSc. katedra matematiky, B105, Další informace a soubory ke stažení.
Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea Tóthová MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/
Ukládání dat biodiverzity a jejich vizualizace
Nepřímá DNA diagnostika
Obecně použitelné odvození
Simplexová metoda.
Jak se pozná nejlepší strom?
Metody analýzy mikroorganismů II
F. A. Fernandéz, F. M. Lutzoni et S. M. Huhndorf (1999):
Dominika verešová Kateřina Sapáková
Obecně použitelné odvození
MiRNA
GENOVÝ STROM X DRUHOVÝ STROM
Induktivní statistika
Prakticky identické postupy:
Transkript prezentace:

Fylogenetická evoluční analýza Pro zajímavost… Důležité…

Fylogeneze = vývoj druhu (vývoj nových druhů) procesem evoluce. Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. Evoluce bioinformatika

Fylogeneze Fylogeneze nezahrnuje pouze podobnosti a rozdíly mezi organismy (taxonomie)… …ale také jejich evoluční vztahy.

Fylogenetická data Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. Prvotně používány MORFOLOGICKÉ znaky. Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají.

Molekulární fylogenetická data Jediný experiment může poskytnout informace o mnoha znacích. Jednotlivé stavy jsou jednoznačné a nezaměnitelné (A x C x G x T). Na rozdíl od morfologických znaků (tvar), u nichž existuje mnoho přechodových forem. Molekulární data se dají snadno převést do „číselné“ formy. Vhodné pro matematické a statistické analýzy. Každá nukleotidová pozice v sekvenci může být považována za jeden ZNAK, který se vyskytuje ve ČTYŘECH rozdílných STAVECH. AAGACGGCACCGACAACGACTACAACGACGCCGTCGTGGTGATCAACTGGCCGCTCGGCT AGGATGGTACCGACATGGACTACAACGACTCCATCGTCATCCTGAACTGGCCGCTGGGCT GGGACGGCAACGGC-TGGAC--CAAGGGCGCCTACACCGCCACGAACTGA---------- ACGACGTGCCCGGAACCTATGGCAATAACTCCGGC-TCGTTCAGTGTCAATATTGGAAAG

Proteinové sekvence x DNA sekvence Pro fylogenetickou analýzu využívány PŘEVÁŽNĚ DNA sekvence. DNA poskytuje mnohem více fylogenetických informací než protein. Tiché mutace Variabilita uspořádání genomu (kódující x nekódují oblasti) PCR, automatické sekvencování

Fylogenetický strom (strom) Terminální (externí) uzly Cíl fylogenetické analýzy - fylogenetický strom popisující evoluční vztahy mezi studovanými organismy. Fylogenetický strom (strom) Větve Terminální (externí) uzly Interní uzly Periferní větve Vnitřní větve Současné taxony (geny) = terminální (externí) uzly, vrcholy Interní uzly = rozdělení společného „předka“ Délky větví = uměrné velikosti změny v průběhu evoluce

Fylogenetický strom Fylogenetický strom BEZ KOŘENE (unrooted). Není známý nejstarší společný předek (bod). Vypovídá pouze o příbuzenských vztazích mezi geny, ne o „cestě“ kterou se evoluce ubírala. Fylogenetický strom S KOŘENEM (rooted). Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“

Fylogenetický strom S KOŘENEM (rooted). Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“

„Genový“ strom x „druhový strom“ Genový strom – odvozen ze srovnání ortologních genů. Předpokládá se, že bude přesnější než strom získaný pomocí morfologických dat. Genový strom druhový strom. Genový strom – vnitřní uzly představují rozdělení původního GENU (mutace). Druhový strom – vnitřní uzly představují rozdělení populace původního DRUHU do dvou skupin (geografická izolace). ¹

„Genový“ strom x „druhový strom“ Mutace a vznik nového druhu se s největší pravděpodobností neodehrají současně. Mutace předchází separaci – v populaci se nacházejí obě alely genu. Po rozdělení populací může dojít ke ztrátě jedné alely.

„Genový“ strom x „druhový strom“

Tvorba evolučních stromů „Alignment“ sekvencí – nezbytný pro vytvoření stromu. Vyhodnocení rozdílů mezi jednotlivými nukletidovými sekvencemi, většinou „multiple alignment“.

Jak převést „multiple alignment“ na strom? Neexistuje „nejlepší metoda“. Několik metod je používáno souběžně, žádnou nelze označit za lepší než ostatní. Distanční matice. Slouží k určení délky větví. 4/20

Jak převést „multiple alignment“ na strom? Neighbor-joining method– „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matici.

Jak převést „multiple alignment“ na strom? Neighbor-joining method – „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matrici. + Jednoduché = rychlé + Vhodné pro velké soubory dat + Vhodné pro prvotní analýzu - Informace z alignmentu velmi zredukována - Poskytuje pouze jeden výsledný strom

Jak převést „multiple alignment“ na strom? Metody maximální úspornosti – maximum parsimony method. Předpokládá (správně???), že evoluce jde nejkratší možnou cestou, tj. správný fylogenetický strom je ten, který požaduje minimum nukleotidových změn, aby bylo dosaženo daného rozdílů mezi sekvencemi. + Preciznější - Větší nároky na manipulaci s daty - Čím vice sekvencí, tím více topologií stromů je nutné vyzkoušet - 5 sekvencí = 15 stromů, 10 sekvencí = 2 027 025 stromů

Jak převést „multiple alignment“ na strom? Parsimonie: Fitchova parsimonie Wagnerova parsimonie (reverzibilita změn) Dollova parsimonie („novinka“ může zaniknout) Caminova-Sokalova parsimonie (změny ireverzibilní) Vážená parsimonie Generalizovaná parsimonie Metoda maximální pravděpodobnosti Metoda minimální evoluce

Software pro fylogenetickou analýzu BioNJ (Neighbor-joining method) PAUP - Phylogenetic Analysis Using Parsimony http://paup.csit.fsu.edu/index.html

Software pro fylogenetickou analýzu PHYLIP – PHYLogeny Inference Package http://evolution.genetics.washington.edu/phylip.html

Software pro fylogenetickou analýzu http://abacus.gene.ucl.ac.uk/software/paml.html http://macclade.org/index.html

Shrnutí Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. Morfologická data/molekulární data (sekvence). Fylogenetické stromy: topologie (příbuznost + evoluce). Tvorba stromů: alignment + parsimonie, Neighbor-joining method, … BioNJ, PAUP, PHYLIP, PAML

Použitá literatura