MOLEKULÁRNÍ TAXONOMIE Rozpis přednášek (9:50-11:20) 2. 5. - Molekulární hodiny, forenzní věda Praktikum 5. 5.: Tvorba stromů ze sekvencí proteinů 19. 5. (učebna 312) Vnitrodruhová fylogeneze, struktura populace a genový tok, fylogeografie, příklady – odevzdání nepovinného eseje Praktikum 12. 5.: multigenové analýzy, testy, distanční data, analýza migrace 23. 5. - Prezentace studentů
MOLEKULÁRNÍ HODINY proč mohou fungovat µ - mutační rychlost (počet nově vzniklých mutací za jednotku času u jednoho jedince) µ*Ne – počet nově vzniklých mutací za jednotku času u v populaci (Ne = efektivní velikost populace) 1/Ne – pravděpodobnost fixace mutace Rychlost fixace nových mutací v populaci µ*Ne* 1/Ne = µ Nezávisí na velikosti populace!!!
ZDROJE CHYBY tikají nepravidelně
ZDROJE CHYBY tikají nepravidelně 95 %
ZDROJE CHYBY tikají různě rychle v různých genech r = K(2T) (K -počet substitucí mezi dvěma druhy, T -doba od odvětvení obou druhů) Gen Nesynonymní (10-9) Synonymní (10-9) ribosomální protein S14 0,02 2,16 ribosomální protein S17 0,06 2,69 aktin 0,01 2,92 myosin 0,10 2,15 somatotropin 1,34 3,79 albumin 0,92 5,16 amylasa 0,63 3,42 Ig VH 1,10 4,76 interferon 3,06 5,50
tikají různě rychle u různých skupin ZDROJE CHYBY tikají různě rychle u různých skupin Martin a Palumbi, PNAS USA 90: 4087-4091, 1993 10 hlodavci psi koně husy primati medvědi divergence sekvencí (%/milion let) želvy 1 mloci velryby pstruzi žáby želvy mořské želvy žraloci 0,1 0,01 0,1 1 10 100 1000 10000 100000 tělesná hmotnost (kg)
REKONSTRUKCE FYLOGENEZE S TÍM POČÍTÁ ut Sekvence A Sekvence B Substituční rychlost Časový interval 0,2 B 0,2 B 0,1 0,05 0,3 C 0,2 0,1 X 0,13 D 0,1 D 0,25 C 0,4 0,383 A A
TEST ROVNOMĚRNOSTI CHODU MH Likelihood ratio test δ=2(ln L1-lnL0 ) lnL1….věrohodnost stromu podle složitějšího modelu lnL0….věrohodnost stromu podle jednoduššího modelu , platnosti hodin (nulová hypotéza) Hodnota statistiky δ je vždy větší než 0. Pokud je jednodušší model obsažen ve složitějším modelu, má tato statistika zhruba rozložení χ2 se stupni volnosti odpovídajícími rozdílu v počtu volných parametrů mezi modely (v tomto případě 4).
GLOBÁLNÍ HODINY v1=v2=t1μ v4=v5=t4μ v3=v6+v1=t2μ v8+v4=v7+v6+v1=t3μ Pokud platí globální hodiny a máme k dispozici alespoň jeden kalibrační bod, můžeme rozpřáhnout t(čas) a μ(substituční rychlost). Protože platí vztahy uvedení níže, nebudeme metodou likelihood optimalizovat délky větví v1-v8 ale časy t1, t3 a t5 udávající hloubky uzlů a jednotnou globální substituční rychlost μ. v1=v2=t1μ v4=v5=t4μ v3=v6+v1=t2μ v8+v4=v7+v6+v1=t3μ t1 t4 t2 t3 t2 je v tomto příkladu kalibrační bod
LOKÁLNÍ HODINY Strom rozdělíme na několik oblastí a v každé předpokládáme platnost lokálních hodin. Pro každou oblast stromu potřebujeme kalibrační bod. μ2 μ1 t1 t4 t2 t3
RELAXOVANÉ HODINY v1=t1μ1 v2=t1μ2 v3=t2μ3 v4=t4μ4 v5=t4μ5 v6=(t2-t1)μ6 Aby byla umožněna různá substituční rychlost a abychom mohli počítat likelihood, přidělují se větvím v1-v8 jejich substituční rychlosti. Ty jsou buď navzájem nezávislé a tahají se z nějakého rozložení, nebo se substituční rychlost dceřiné větve odvíjí od rychlosti mateřské větve podle nějakého vztahu. v1=t1μ1 v2=t1μ2 v3=t2μ3 v4=t4μ4 v5=t4μ5 v6=(t2-t1)μ6 v7=(t3-t2)μ7 v8= (t3-t4)μ8 t1 t4 t2 t3
ZDROJE CHYBY kalibrace Kalibrační body (často fosílie) nutno interpretovat opatrně Datování fosílie je vždy nepřesné (konfidenční interval) Postavení fosílie na stromu je obtížné určit. Sedí někde na větvi ne přesne na uzlu Fosílie ukazují na spodní hranici vzniku skupiny a nevíme, jak dlouho se daná skupina organizmů vyskytovala předtím než je první známá fosílie.
ZDROJE CHYBY kalibrace Kalibrační body (často fosílie) nutno interpretovat opatrně Naopak např. vznik ostrova, na kterém skupina organizmů vznikla udává horní hranici jejího vzniku.
KONFIDENČNÍ INTERVALY
PŘÍKLAD Epidemie HIV a hepatitidy C v nemocnici Al-Fateh v Benhazi, Libye - 1998
PŘÍKLAD
MOLEKULÁRNÍ HODINY – SHRNUTÍ Tikají nepravidelně, v jednotlivých genech a liniích jdou nestejně rychle Rychlost hodin se mění během evoluce Nutnost kalibrace a kalibrační body třeba interpretovat uvážlivě Výsledkem není jedna hodnota, ale interval. Intervaly bývají obvykle nepříjemně široké, ale i tak mohou někdy přinést odpověď na otázku. Čím více dat tím užší budou intervaly spolehlivosti Lepší široké intervaly, které obsahují skutečnou hodnotu (složitější modely) než užší intervaly, které jsou zcela špatně (jednoduché, nesprávně zvolené modely)
Mikrosatelity
RESTRIKČNÍ ANALÝZY VNTR – Variable Number of Tantem Repeats Využívá polymorfismus v počtu kopií tandemových repetic – minisatelitů (10-60 nt). Tento polymorfismus je velmi variabilní i mezi jedinci téhož druhu. Celkovou DNA naštípeme restrikční endonukleázou, která neštěpí uvnitř minisatelitu. Naštípanou DNA přeblotujeme na membránu a hybridizujeme se značenou próbou proti minisatelitu, pokud chceme zviditelnit všechny lokusy (obrázek v pravo), nebo proti minisatelitu a unikátní sekvenci v sousedství, pokud chceme zviditelnit jen jeden lokus (obrázek dole).
FORENZNÍ GENETIKA
IDENTIFIKACE
URČOVÁNÍ RODIČOVSTVÍ Stejně jako v případě identifikace se používají obvykle mikrosatelity a VNTR (minisatelity). Po odečtení znaků pocházejících od matky (M) musí ostatní znaky pocházet od otce (Pα nebo Pβ). Pravděpodobnost otcovství se vypočte na základě těchto znaků stejně jako v případě identifikace jedince.
HUSICE SNĚŽNÁ
RUSKÁ CARSKÁ RODINA Car Mikuláš II a jeho rodina – carevna Alexandra a děti Olga, Tatiana, Maria, Anastasia a carevič Alexej.
MT DNA, CONTROLNÍ OBLAST Kontrolní oblast (D-loop) nejpolymorfnější objast mtDNA HAPLOTYP: polymorfismy na jediné chromatidě, které jsou statisticky sdruženy.
Frekvence obvyklejšího haplotypu cara (C) = 0,08% Frekvence haplotypu carevny = 0.05% Pravděpodobnost, že to nejsou Romanovci, ale náhodní lidé = 0,08 * 0,05 = 0,004 %
RUSKÁ CARSKÁ RODINA Pravděpodobnost, že vzorek je potomken cara a carveny / pravděpodobnost, že je nepříbuzný = 4*1012 80*1012
RUSKÁ CARSKÁ RODINA 17 mikrosatelitních lokusů na Y chromozomu ukázalo příbuznost Cara Mikuláše, careviče Alexeje a Andreje Andrejeviče Romanova (Californie) ukázalo naprostou shodu. Mezi 10 243 haplotypy Y chromozomu v databázi YHDR nebyl ani jeden shodný s tímto haplotypem.
RUSKÁ CARSKÁ RODINA
DNA BARCODING http://www.barcodeoflife.org/