Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Obecně použitelné odvození

Podobné prezentace


Prezentace na téma: "Obecně použitelné odvození"— Transkript prezentace:

1 Obecně použitelné odvození
Jukes-Cantor Obecně použitelné odvození A G C T -u u/3 u/3 u/3 A u/3 -u u/3 u/3 G u/3 u/3 -u u/3 C u/3 u/3 u/3 -u T 4/3 ut 4/3 ut JC K2P D = ut = -3/4 ln(1- 4/3 p) D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q)

2 P(t)=eQt, průměrná relativní rychlost=1 pak D=t
DALŠÍ MODELY GTR General time reversible + A G C T α ε β δ γ ζ Rovnovážné frekvence nukleotidů πA πC πG πT Parametry: frekvence (rychlost) záměn (αβγδεζ) a frekvence nukleotidů (πA πC πG πT) se odvozují z analyzovaných sekvencí zároveň s výpočtem D metodou maximum likelihood (příští přednáška). P(t)=eQt, průměrná relativní rychlost=1 pak D=t

3 SITE RATE HETEROGENEITY
8 Sekvence A Sekvence B Sekvence A Sekvence B 1/4 8 = 1/4 D = -3/4 ln(1- 4/3 p) Pokud p se blíží ¾ pak D se blíží 8

4 SITE RATE HETEROGENEITY
8 Sekvence A Sekvence B Sekvence A Sekvence B 1/8 4/8 r1=2 r2=0 5/8 D = -3/4 ln(1- 4/3 p) p= 3/8 → D=0,52 ( )1/2 2 8 +( )1/2 8 8 =(1/4)1/2 +(1)1/2 = 5/8 pi = 0,5 …v praxi další neznámá i

5 SITE RATE HETEROGENEITY
r1 r2 r3 r4 r5 r6 P(t) = eQt P(t) = erQt Taxon A C C C T G G Taxon B A C T T G A P(t) = ∫0 f(r) erQt Jin a Nei model D = -3/4 α[1-(1- 4/3 p)-1/α] u/3 -u α=0,5 p=0,5 pak D=3 α=10 p=0,5 pak D=0,87

6 SITE RATE HETEROGENEITY
r1 r2 r3 r4 r5 r6 P(t) = eQt P(t) = erQt Taxon A C C C T G G Taxon B A C T T G A P(t) = ∫0 f(r) erQt P(t) = 1/4 er1Qt + 1/4 er2Qt + 1/4 er3Qt + 1/4 er4Qt P(t) = 1/4 e0,0334Qt + 1/4 e0,2519Qt + 1/4 e0,8203Qt + 1/4 e2,8994Qt

7 JAK NAJÍT NEJLEPŠÍ STROM

8 Jak se pozná nejlepší strom?
Strom, který nejlépe „vysvětlí“ alignment našich sekvencí. Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. Algoritmus – najde jen jeden strom postupným přidáváním sekvencí, klastrovací analýza (distanční metody).

9 SKÓROVÁNÍ STROMŮ

10 Q = ∑ ∑wij (Dij - dij)2 NEJMENŠÍ ČTVERCE A B A C A D B C B D C D A B D
n n i=1 j=1 C Skóre

11 KOLIK JE MOŽNÝCH STROMŮ?
Počet možných topologií strmě roste

12 POČET TOPOLOGIÍ STRMNĚ ROSTE
Pro zakořeněné topologie (2n-3)!! nezakořeněné topologie (2n-5)!! (2*5-3)!! = 3*5*7 = 105 Faktoriál lichých čísel Stáří vesmíru 4,7*1017 sekund, procesor 3,4*109 operací/s 1027 operací za dobu trvání vesmíru Počet zakořeněných topologií pro různé množství taxonů

13 JAK PROHLEDÁVAT STROMOVÝ PROSTOR
Vztahuje se nejen na maximální parsimonii, ale na téměř všechny nealgoritmické metody (nejmenší čtverce, minimální evoluce, maximum likelihood...)

14 HEURISTICKÉ HLEDÁNÍ

15 Nearest-Neighbour Interchange
JAK KRÁČET? NNI Nearest-Neighbour Interchange

16 Subtree Pruning and Regrafting
JAK KRÁČET? SPR Subtree Pruning and Regrafting

17 Tree Bisection and Reconnection
JAK KRÁČET? TBR Tree Bisection and Reconnection

18 Heuristické hledání 11 10 8

19 KDE ZAČÍT A NEBÝT ÚPLNĚ MIMO?
Taxon addition Pořadí v jakém jsou taxony přidávány ovlivní výsledek

20 GLOBÁLNÍ A LOKÁLNÍ MAXIMA
Globální maximum je zde Začne zde Skončí zde

21 GLOBÁLNÍ A LOKÁLNÍ MAXIMA
Globální maximum je zde

22 BRANCH AND BOUND SEARCH

23 BRANCH AND BOUND SEARCH

24 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG

25 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG G G G
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG G G G G C C C C G C G C

26 2 2 1 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 2 2 G G G G G G G G C C C C G 1 C G C G C

27 1 2 2 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 1 2 G A G A G A G G G A A G 2 G A A A A G

28 MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {C} {A} {C} {C} {A} {G}
{C, A}* {C} {A, G}* {C, A, G}* {C, A}

29 MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {T} {G} {T} {T} {G} {C}
{T, G}* {T} {G, C}* {T, G, C}* {T, G} XYXXYZ = 3 změny YXXXXX = 1 změna

30 MAXIMÁLNÍ PARSIMONIE Varianty parsimonie
Camin-Sokal parsimonie – známe původní stav, změny možné jen jedním směrem, reverze se nedějí (SINE elementy) Dollo parsimonie – daný (komplexní) znak může vzniknou jen jednou, ztrácet se může opakovaně v různých liniích Vážená parsimonie – různým typům záměn přisuzuje různou váhu

31 MAXIMÁLNÍ PARSIMONIE Parsimonie je znaková metoda – vychází přímo ze znaků (např. pozic alignmentu). Skóre stromu nám říká, jaký je nejmenší počet změn ve všech znacích, ke kterému muselo dojít, pokud by evoluce proběhla podle dané topologie. Základní varianta parsimonie považuje všechny typy změn za stejně pravděpodobné. Parsimonie nebere v úvahu substituční saturaci. Pravděpodobnost záměny nezávisí na délce větve.

32 INCONSISTENCE PARSIMONIE
q A C B D Uvažujme, že evoluce proběhla podle stromu vlevo. Na stromu se vyskytovaly větve dvou různých délek, kterým odpovídají pravděpodobnosti změny p a q.

33 LONG BRANCH ATTRACTION
p B q q q D p C A C p p q q q B D


Stáhnout ppt "Obecně použitelné odvození"

Podobné prezentace


Reklamy Google