Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jukes-Cantor Obecně použitelné odvození 4/3 ut u/3 -u u/3 -u u/3 -u A GCT A G C T D = ut = -3/4 ln(1- 4/3 p) D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P -

Podobné prezentace


Prezentace na téma: "Jukes-Cantor Obecně použitelné odvození 4/3 ut u/3 -u u/3 -u u/3 -u A GCT A G C T D = ut = -3/4 ln(1- 4/3 p) D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P -"— Transkript prezentace:

1 Jukes-Cantor Obecně použitelné odvození 4/3 ut u/3 -u u/3 -u u/3 -u A GCT A G C T D = ut = -3/4 ln(1- 4/3 p) D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) JC K2P

2 A G C T α εβ δ γ ζ GTR General time reversible + DALŠÍ MODELY Rovnovážné frekvence nukleotidů π A π C π G π T Parametry: frekvence (rychlost) záměn ( αβγδεζ ) a frekvence nukleotidů ( π A π C π G π T ) se odvozují z analyzovaných sekvencí zároveň s výpočtem D metodou maximum likelihood (přednáška 4. 4.). P(t)=e Qt, celková rychlost=1 pak D=t

3 SITE HETEROGENEITY P(t) = e Qt P(t) = e rQt Taxon A C C C T G G Taxon B A C T T G A r1 r2 r3 r4 r5 r6 P(t) = ∫ 0 f(r) e rQt ∞ Jin a Nei model D = -3/4 α[1-(1- 4/3 p) -1/α ] α=0,5 p=0,5 pak D=3 α=10 p=0,5 pak D=0,87 u/3 -u u/3 -u u/3 -u

4 SITE HETEROGENEITY Taxon A C C C T G G Taxon B A C T T G A r1 r2 r3 r4 r5 r6 P(t) = 1/4 e r1Qt + 1/4 e r2Qt + 1/4 e r3Qt + 1/4 e r4Qt P(t) = e Qt P(t) = e rQt P(t) = ∫ 0 f(r) e rQt ∞ P(t) = 1/4 e 0,0334Qt + 1/4 e 0,2519Qt + 1/4 e 0,8203Qt + 1/4 e 2,8994Qt

5 JAK NAJÍT NEJLEPŠÍ STROM

6 •Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. •Algoritmus – najde jen jeden strom postupným přidáváním sekvencí, klastrovací analýza (distanční metody). Strom, který nejlépe „vysvětlí“ alignment našich sekvencí. Jak se pozná nejlepší strom?

7 SKÓROVÁNÍ STROMŮ

8 AB AC AD BC BD C D Skóre Q = ∑ ∑w ij (D ij - d ij ) 2 n i=1 j=1 B C D A NEJMENŠÍ ČTVERCE

9 KOLIK JE MOŽNÝCH STROMŮ? Počet možných topologií strmě roste

10 Počet zakořeněných topologií pro různé množství taxonů POČET TOPOLOGIÍ STRMNĚ ROSTE Pro zakořeněné topologie (2n-3)!! nezakořeněné topologie (2n-5)!! (2*5-3) = 3*5*7 = 105 Faktoriál lichých čísel Stáří vesmíru 4,7*10 17 sekund, procesor 3,4*10 9 operací/s operací za dobu trvání vesmíru

11 JAK PROHLEDÁVAT STROMOVÝ PROSTOR Vztahuje se nejen na maximální parsimonii, ale na téměř všechny nealgoritmické metody (nejmenší čtverce, minimální evoluce, maximum likelihood...)

12 HEURISTICKÉ HLEDÁNÍ

13 JAK KRÁČET? NNI Nearest-Neighbour Interchange

14 SPR Subtree Pruning and Regrafting JAK KRÁČET?

15 TBR Tree Bisection and Reconnection

16 Heuristické hledání

17 KDE ZAČÍT A NEBÝT ÚPLNĚ MIMO? Taxon addition Pořadí v jakém jsou taxony přidávány ovlivní výsledek

18 Globální maximum je zde Začne zde Skončí zde GLOBÁLNÍ A LOKÁLNÍ MAXIMA

19 Globální maximum je zde GLOBÁLNÍ A LOKÁLNÍ MAXIMA

20 BRANCH AND BOUND SEARCH

21

22 Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG MAXIMÁLNÍ PARSIMONIE

23 Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. G G G G G G CC C C C C MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG

24 Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. G G G G G G CC C C C C G GG G G C MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG

25 Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. G G A G G GA G GA G G MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG A A A A A A 2 2 1

26 MAXIMÁLNÍ PARSIMONIE {C} {A} {C} {C} {A} {G} {C, A}* {C} {A, G}* {C, A, G}* {C, A} Fitchův algoritmus

27 MAXIMÁLNÍ PARSIMONIE {T} {G} {T} {T} {G} {C} {T, G}* {T} {G, C}* {T, G, C}* {T, G} Fitchův algoritmus XYXXYZ = 3 změny YXXXXX = 1 změna

28 MAXIMÁLNÍ PARSIMONIE Varianty parsimonie • Camin-Sokal parsimonie – známe původní stav, změny možné jen jedním směrem, reverze se nedějí (SINE elementy) •Dollo parsimonie – daný (komplexní) znak může vzniknou jen jednou, ztrácet se může opakovaně v různých liniích • Vážená parsimonie – různým typům záměn přisuzuje různou váhu

29 MAXIMÁLNÍ PARSIMONIE • Parsimonie je znaková metoda – vychází přímo ze znaků (např. pozic alignmentu). • Skóre stromu nám říká, jaký je nejmenší počet změn ve všech znacích, ke kterému muselo dojít, pokud by evoluce proběhla podle dané topologie. • Parsimonie nebere v úvahu substituční saturaci. Pravděpodobnost záměny nezávisí na délce větve. • Základní varianta parsimonie považuje všechny typy změn za stejně pravděpodobné.

30 INCONSISTENCE PARSIMONIE pp q qq A C BD Uvažujme, že evoluce proběhla podle stromu vlevo. Na stromu se vyskytovaly větve dvou různých délek, kterým odpovídají pravděpodobnosti změny p a q.

31 LONG BRANCH ATTRACTION A C B D AC BD p p p p q q q q qq


Stáhnout ppt "Jukes-Cantor Obecně použitelné odvození 4/3 ut u/3 -u u/3 -u u/3 -u A GCT A G C T D = ut = -3/4 ln(1- 4/3 p) D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P -"

Podobné prezentace


Reklamy Google