Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea Tóthová MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Obecně použitelné odvození
Single Nucleotide Polymorphism
Fylogeografie Studuje geografickou strukturaci populací Navazuje na evoluční biologii, ochranu živ. prostř., taxonomii.
Rekonstrukce povrchu objektů z řezů Obhajoba rigorózní práce 25. června 2003 Radek Sviták
Studium lidského genomu
Hodnocení způsobilosti měřících systémů
Sociologie – metody a techniky sociologického výzkumu
Architektury a techniky DS Tvorba efektivních příkazů I Přednáška č. 3 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Metody psychologie PhDr. Eva Tomešová, PhD.. Jak psychologové dospějí k závěrům o neznámém?  Používají VĚDECKOU METODU: IDENTIFIKACE VĚDECKÉ OTÁZKY FORMULACE.
FORMALIZACE PROJEKTU DO SÍŤOVÉHO GRAFU
Biologická diverzita a Indexy biodiverzity
Teorie psychodiagnostiky a psychometrie
Varianty výzkumu Kroky výzkumu Výběrový soubor
Shluková analýza.
Předmět sociologie Věda společenská a behaviorální
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Imunologické, mikrosatelity, SSCP, SINE
Hodnocení, realizace a kontrolní etapa. Hodnotí se tři skupiny kriterií: A)Prospěšnost – žádoucnost 1. Jak navržená strategie pomáhá dosažení cílů? 2.
Text: Reprodukce nálevníků Metody získávání vědeckých poznatků
Vybrané metody analýzy
Využití v systematické biologii
Projekt HUGO – milníky - I
Skutečný počet substitucí na jednu pozici Počet pozorovaných rozdílů 0,75 DNA 0,95 PROTEINY SUBSTITUČNÍ SATURACE p.
Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu
Účel procedury: První a závazný krok jakékoli seriozní komparativní studie. Umožňuje vyloučit možnost, že distribuce studovaného znaku (vlastnosti, vzorce.
Makrozoobentos a klasifikace toků Jarkovský J. 2,3, Kubošová K. 2,3, Zahrádková S. 1, Brabec K. 1, Kokeš J. 4, Klapka R. 2,3 1) Ústav botaniky a zoologie,
Filtrace web stránek s využitím profilu uživatele Petr Doskočil
Použití molekulárních znaků v systematice
Sekvence A Sekvence B D = ut Zjištění rozdílů (p) Korekce na mnohonásobné substituce Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC Bereme nebo.
Z POPULAČNÍ BIOLOGIE VELKÝCH RYBOVITÝCH OBRATLOVCŮ
Jak „dispersal limitation“ ovlivňuje druhovou bohatost společenstva Anna Vlachovská.
Rozhodovací proces, podpory rozhodovacích procesů
BLAST (basic local alignment search tool) Vyhledává podobné sekvence v databázích. Stal se nástrojem pro všechno. Určitou dobu kolektiv autorů držel krok.
rozdělení metod využitelnost jednotlivých metod náročnost metod používání metod perspektivy.
8. Syntéza a aplikace výsledků fylogenetických analýz
Na cestě k ASP Jiří Voříšek VŠE - KIT publikováno: červen 2002.
JAK NAJÍT NEJLEPŠÍ STROM
Základní principy geografického výzkumu
Počítačové sítě Terezie Gřundělová Historie Vznik a vývoj je spjat s rozvojem počítačů a výpočetní techniky První rozmach v padesátých letech.
Výzkum veřejného mínění a jeho realizace
Marketingový průzkum Milan Mrázek Matematika & Business
Kombinovaná analýza srážek z meteorologických radarů a srážkoměrů a jejich užití v hydrologických modelech Milan Šálek
„AFLP, amplified fragment length polymorphism“
ÚVOD DO FYLOGENETICKÉ ANALÝZY II..
Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. Algoritmus – najde jen jeden.
Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu
aneb Assessment Centre a Development Centre
Proč s aplikací pracovat?. Aplikace Stopy mé Ekoškoly má jednoduché ovládání a snadno prezentovatelné výstupy. Zábavnější práci s analýzou Kvalitní a.
SNPs Single Nucleotide Polymorphism Polymorfimus DNA, kdy se jedinci nebo druhy liší v jedné nukleotidové záměně AAGCCTA AAGCTTA V tomto případě mluvíme.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Inf Sítě mobilních telefonů a GPS. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Gender Pay Gap a jeho determinanty s využitím dat EU-SILC 2005 PhDr. Martina Mysíková IES FSV UK ČSÚ.
Biotechnologie, technologie budoucnosti Aleš Eichmeier.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Možná podpora na získání ETV certifikátu z OP PIK Ing. Radek Navrátil, září 2016.
Testování biometrického systému založeného na dynamice podpisu
Obecně použitelné odvození
Varianty výzkumu Kroky výzkumu Výběrový soubor
Kritéria kvality metod a výzkumného šetření
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE
F. A. Fernandéz, F. M. Lutzoni et S. M. Huhndorf (1999):
Metoda molekulární dynamiky
Fylogenetická evoluční analýza
Studium lidského genomu
Dominika verešová Kateřina Sapáková
Pokročilé neparametrické metody Validační techniky
Jak získáváme znaky pomocí sekvenace unikátních lokusů
Induktivní statistika
Transkript prezentace:

Metodologie molekulární fylogeneze a taxonomie hmyzu Bi7770 Andrea Tóthová MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/

Vertikální: kompletné genomy, hluboké, ale omezené informace několik druhů a jedinců úspěšně ukončeno u člověka, Drosophily a některých plodin Horizontální: krátké cílené sekvence, plytké, ale široké informace mnoho druhů a jedinců např. DNA barcoding Dva pohledy genomiky

Problémy s konceptem druhu a jeho aplikacemi Problémy s druhovou identifikací Systém znaků – morfologie, genetika, atd. Přístup k existujícím informacím Snižování odbornosti Snižování dostupných služeb Genomika a Internet nabízí nové možnosti Historické výzvy

Asociace vývojových stádií, zpracovaných částí a dimorfických pohlaví

DNA barcode je krátká genová sekvence standardizované části genomu použitá k druhové identifikaci Systém čárového kódu

Interné ID pro všechny organizmy na Zemi

Tvoří species komplexy Jejich parazitoidi (Tachinidae) také (Dittrich et al 2006) Leguminivora ptychora na luštěninách je také species komplex Ale někteří škůdci jsou široko rozšíření, např. Spoladea recurvalis a Maruca vitrata Příklad: Afričtí motýli

Rychlé a efektivní Čeleď Sphingidae – vzorky 49 druhů za 6 měsíců (téměř kompletní lokální fauna) DNA barcoding rozlišil druhy jak v lokálním, tak v globálním měřítku Místní knihovny můžou být rychle srovnány a přispět ke globálním knihovnám

Jak Barcoding funguje Tvorba referenční knihovny: Správně určený jedinec (vouchers) Vzorek tkáně DNA extrakce, PCR amplifikace DNA sekvenování Odeslání dat do GenBanku Použití referenční knihovny : Neurčené druhy Tkáň, DNA, sekvenování Srovnání s referenčními sekvencemi

Jak se to vše děje od jedince přes sekvenci po druh?

Produkce dat v r PCR amplifikační jednotka ABI 3100 sekvenátor Stovky vzorků denně, cena od několika centů po dolary

Produkce dat v r Rychlejší a přenosnější systém – stovky vzorků za hodinu Integrované DNA mikročipy Stolní mikrofluidné systémy

Produkce dat v budoucnosti? Získání dat kdekoli, hned Cena několik haléřů Link do referenční databáze Taxonomická GPS Použitelné nespecialisty

CBOL – organizace členů od r Více než 170 organizací z více než 50 zemí (z toho 54 organizací z 20 rozvojových zemí)

1. Vyvinout a zvednout standardy komunity 2. Barcode projekty plnit databáze 3. Globalní participace a koordinace 4. Přijetí taxonomickou komunitou 5. Koordinace s jinými oblastmi vědy 6. Přijetí regulačními agenturami 7. Vyvíjení produktů soukromými společnostmi Mise CBOLu: uvést DNA Barcoding jako globální standard

Propojení GenBanku s vouchery

Ceratopogonidae – 105 barcoding sekvencí

Fish Barcode of Life (FISH-BOL) mořských/sladkovodných druhů do r All Birds Barcoding Initiative (ABBI) druhů do r Tephritidae – škůdců/prospěšných druhů do r Komáry druhů do r Ohrožené druhy Trees of the world Globální projekty CBOL

CBOL staví na současných taxonomických poznatcích Sequence knihovny založeny na voucher jedincích, co dělá vědu opakovatelnou a testovatelnou Voucher jedince propojují historické, současné a budoucí výzkumy Příklad: CSIRO studie na bzučivkách mapující rezistence na insekticidy a zjišťování historie pomocí DNA z muzejních jedinců (PNAS 103: 8757) Staré a nové techniky

DNA Taxonomie – pomoc při řešení problému nebo vnášení chaosu? První záznamy COI do GenBanku – 1996, od té doby ca sekvencí dvoukřídlých V současnosti – ca popsaných druhů dipter – méně než 1% je zařazeno do „Barcoding procesu“ Stanovení hranic druhu – podobnost sekvencí (pairwise distances) - PROBLÉM Světové sbírky hmyzu – nemožnost použít materiál pro analýzy - PROBLÉM COI nevhodný pro odlišení blízkých druhů Fylogenetická rekonstrukce příbuzenských vztahů – možné řešení – multigenový přístup Taxonomie založená výlučně/převážně na DNA analýze – zkreslený pohled Potřeba propojit s ostatními přístupy – INTEGRATIVNÍ TAXONOMIE

GenBank Několik databází – Nucleotide, Protein, PubMed, CoreNucleotide, Structure, Genome, etc. Věrohodnost sekvencí vyšší než v databázích CBOLu Součástí je BLAST - „multialign tool“

Po zadání hesla – Insect…

BLAST

FLY TREE , 30 mil. USD, 649 taxonů, desítky tisíc bp

OUTPUTS

MEGA v. 5 – úprava sekvencí (alignment)

Fylogenetické analýzy Metody FA – dva přístupy 1. Algoritmus – jde přímo k výsledku, co je jediný strom (odpadá srovnání vzájemně si konkurujících stromů) – metody shlukové analýzy (UPGMA), Neighbour-joining (NJ) – obě využívají data vzdáleností (distance) 2. Kritérium optimálnosti – dva kroky – definování kritéria, podle kterého je hodnocen každý strom určitým skóre, které se použije k následnému srovnání všech stromů - použití specifického algoritmu pro výpočet funkce (kritérium optimálnosti) a pro získání stromu s nejlepší hodnotou této funkce Fylogenetický strom – hypotéza, která vznikla co nejlepším odhadem na základe omezeného zdroje informací

Jaká by měla vybraná metoda být? Výkonnost – „tempus fugit“ nebo „time is money“ pomoc – heuristické metody hledání v případe vyššího počtu taxonů či znaků Síla – kolik dat musíme shromáždit, aby byly výsledky správné Konzistence – s pridáváním dalších znaků spějeme k správnému výsledku Robustnost – do jakej míry vedou drobné odchýlky od vstupných předpokladů k nesprávným závěrům Falzifikovatelnost – určení nevhodnosti modelu na základě odchýlky od předpokladu IDEÁLNÍ METODA NEEXISTUJE…

Metoda maximální parsimonie – úspornosti (MP) Jedna z nejpoužívanějších metod - rychlá, jednoduchá preferuje jednoduší hypotézy před složitějšími (široká filozofická platnost), tzn. vybere možnost (strom) s minimálním počtem evolučních kroků nutných k vysvětlení vstupních dat Ne všechny znaky jsou použitelné, parsimony - informative Dobrá pochopitelnost, jednoduchost, rychlost, nízký počet předpokladů (předpokládá, že jakákoli evoluční změna je vzácná, takže MP strom se dá považovat za nejlepší odhad skutečné evoluce) Nekonzistentnost, přitažlivost dlouhých větví (LBA) + -

Metoda maximální pravděpodobnosti (Maximum likelihood, ML) - posuzují se jednotlivé hypotézy o evoluční historii zkoumaných taxonů z hlediska pravděpodobnosti, že jsou v souladu se získanými daty, výsledek – maximálně pravděpodobný odhad Tři součásti - vstupné data evoluční model fylogenetický strom s topologií i délkou větví Vysoká výpočetní náročnost - Nízka náchylnosť k chybě, robustnost vůči odchýlkám +

Bayesian inference Výpočet pravděpodobnosti na základě specifikovaného modelu a na základě toho, co jsme o charakteru dat zjistili VÝHODY – menší časová náročnost, strom zohledňující fylogenetický signál v datasetu, možnost použít i pro smíšený dataset Princip přístupu jako u ML Základ – strom s danou topologií a délkami větví, model nukleotidových substitucí a rozložení substitučních frekvencí mezi jednotlivými nukleotidy

Distanční metody Založené na podobnostech (vzdálenostech, rozdílech) Poznání skutečné evoluční vzdálenosti mezi všemi členy studovaného souboru taxonů umožňuje velmi lehkou rekonstrukci evoluční historie těchto taxonů Opakované změny jednoho znaku – korigované distance (jako u pravděpodobnosti) Nekorigovaná vzdálenost – p-distance Korekce: JC, F81, K2P, F84, GTR

Předpříprava Úprava sekvencí (Sequencher) Vytvoření alignmentu (MEGA) -.fas,.nex Analýza MP (Paup) Analýza NJ (Paup, MEGA) Vytvoření souboru pro MrModeltest (PAUP) MrModeltest Příprava souboru pro MrBayes Ukázka práce s SequenceMatrix pro velké datasety