Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
JAK NAJÍT NEJLEPŠÍ STROM
2
Jak se pozná nejlepší strom?
Strom, který nejlépe „vysvětlí“ alignment našich sekvencí. Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. Algoritmus – najde jen jeden strom postupným přidáváním sekvencí, klastrovací analýza (distanční metody).
3
SKÓROVÁNÍ STROMŮ
4
NEJMENŠÍ ČTVERCE Q = ∑ ∑wij (Dij - dij)2 A B A C A D B C B D C D A B D
n n i=1 j=1 C Skóre
5
MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
6
MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG G G G
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG G G G G C C C C G C G C
7
2 2 1 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 2 2 G G G G G G G G C C C C G 1 C G C G C
8
1 2 2 MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG
Postup maximální parsimonie předvedu na příkladu z předchozího slidu. Příbuzenské vztahy mezi 4 taxony můžeme znázornit 3 způsoby (stromy, topologiemi). Která odpovídá skutečnosti? MP považuje za pravdivou tu, která vysvětlí přítomnost znaků pomocí nejmenšího počtu mutací. Ukážeme si to na 1 znaku. Ten nabývá u našich taxonů těchto podob. Předpokládejme, že u předků se vyskytovaly G…. MAXIMÁLNÍ PARSIMONIE ACCTGGATGC ACTTGAATGC ACTTCGATGG ACTTCAAGGG 1 2 G A G A G A G G G A A G 2 G A A A A G
9
MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {C} {A} {C} {C} {A} {G}
{C, A}* {C} {A, G}* {C, A, G}* {C, A}
10
MAXIMÁLNÍ PARSIMONIE Fitchův algoritmus {T} {G} {T} {T} {G} {C}
{T, G}* {T} {G, C}* {T, G, C}* {T, G} XYXXYZ = 3 změny YXXXXX = 1 změna
11
MAXIMÁLNÍ PARSIMONIE Parsimonie a délky větví
12
MAXIMÁLNÍ PARSIMONIE Varianty parsimonie
Camin-Sokal parsimonie – známe původní stav, změny možné jej jedním směrem, reverze se nedějí (SINE elementy) Dollo parsimonie – daný (komplexní) znak může vzniknou jen jednou, ztrácet se může opakovaně v různých liniích Vážená parsimonie – různým typům záměn přisuzuje různou váhu
13
MAXIMÁLNÍ PARSIMONIE Parsimonie je znaková metoda – vychází přímo ze znaků (např. pozic alignmentu). Skóre stromu nám říká, jaký je nejmenší počet změn ve všech znacích, ke kterému muselo dojít, pokud by evoluce proběhla podle dané topologie. Parsimonie nebere v úvahu substituční saturaci. Základní varianta parsimonie považuje všechny typy změn za stejně pravděpodobné.
14
JAK PROHLEDÁVAT STROMOVÝ PROSTOR
Vztahuje se nejen na maximální parsimonii, ale na téměř všechny nealgoritmické metody (nejmenší čtverce, minimální evoluce, maximum likelihood...)
15
POČET MOŽNÝCH TOPOLOGIÍ STRMNĚ ROSTE
16
POČET TOPOLOGIÍ STRMNĚ ROSTE
Pro zakořeněné topologie (2n-3)!! nezakořeněné topologie (2n-5)!! (2*5-3) = 3*5*7 = 105 Faktoriál lichých čísel Počet zakořeněných topologií pro různé množství taxonů
17
HEURISTICKÉ HLEDÁNÍ
18
KDE ZAČÍT A NEBÝT ÚPLNĚ MIMO?
Taxon addition Pořadí v jakém jsou taxony přidávány ovlivní výsledek
19
Nearest-Neighbour Interchange
JAK KRÁČET? NNI Nearest-Neighbour Interchange
20
Subtree Pruning and Regrafting
JAK KRÁČET? SPR Subtree Pruning and Regrafting
21
Tree Bisection and Reconnection
JAK KRÁČET? TBR Tree Bisection and Reconnection
22
Heuristické hledání 11 10 8
23
GLOBÁLNÍ A LOKÁLNÍ MAXIMA
Globální maximum je zde Začne zde Skončí zde
24
GLOBÁLNÍ A LOKÁLNÍ MAXIMA
Globální maximum je zde
25
BRANCH AND BOUND SEARCH
26
BRANCH AND BOUND SEARCH
27
INCONSISTENCE PARSIMONIE
q A C B D Uvažujme, že evoluce proběhla podle stromu vlevo. Na stromu se vyskytovaly větve dvou různých délek, kterým odpovídají pravděpodobnosti záměn p a q.
28
INCONSISTENCE PARSIMONIE
Znaky, které zjišťujeme mohou nabývat dvou forem 0 a 1. Pro každou (ze 3 možných) topologií “hlasuje” jeden vzor znaků A – X B – X C – Y D – Y A – X B – Y C – X D – Y A – X B – Y C – Y D – X A (X) C (Y) A (X) A (X) C (Y) B (Y) B (X) D (Y) D (Y) D (X) B (Y) C (X) Parsimonie vybere topologii, jejíž vzor v množině znaků převáží
29
INCONSISTENCE PARSIMONIE
Pravděpodobnost vzoru 0011 bude následující 1 p p 1 1 ½(1-p)(1-q)(1-q)pq q q q 1
30
INCONSISTENCE PARSIMONIE
Pravděpodobnost vzoru 0011 bude následující 1 p p 1 1 ½(1-p)(1-q)(1-q)pq ½(1-p)(1-q)q(1-p)(1-q) q q q 1
31
INCONSISTENCE PARSIMONIE
Pravděpodobnost vzoru 0011 bude následující 1 p p 1 1 ½(1-p)(1-q)(1-q)pq ½(1-p)(1-q)q(1-p)(1-q) q q q 1
32
INCONSISTENCE PARSIMONIE
Pravděpodobnost vzoru 0011 bude následující 1 p p 1 1 ½(1-p)(1-q)(1-q)pq ½(1-p)(1-q)q(1-p)(1-q) ½pq(1-q)pq q q q 1
33
INCONSISTENCE PARSIMONIE
Pravděpodobnost vzoru 0011 bude následující 1 p p 1 1 ½(1-p)(1-q)(1-q)pq ½(1-p)(1-q)q(1-p)(1-q) ½pq(1-q)pq ½pq(1-q)(1-p)(1-q) q q q 1 P1100= ½ [(1-p)(1-q)2pq+ (1-p) 2(1-q) 2 q+ p 2 q 3+ pq(1-q) 2(1-p)] PXXYY= [(1-p)(1-q)2pq+ (1-p) 2(1-q) 2 q+ p 2 q 3+ pq(1-q) 2(1-p)]
34
INCONSISTENCE PARSIMONIE
A – X B – X C – Y D – Y A – X B – Y C – X D – Y A – X B – Y C – Y D – X A (X) C (Y) A (X) A (X) C (Y) B (Y) B (X) D (Y) D (Y) D (X) B (Y) C (X) PXXYY= [(1-p)(1-q)2pq+ (1-p) 2(1-q) 2 q+ p 2 q 3+ pq(1-q) 2(1-p)] PXYXY = …… PXYYX = …… PXYXY - PXYYX > 0
35
INCONSISTENCE PARSIMONIE
A – X B – X C – Y D – Y A – X B – Y C – X D – Y A – X B – Y C – Y D – X A (X) C (Y) A (X) A (X) C (Y) B (Y) B (X) D (Y) D (Y) D (X) B (Y) C (X) PXXYY= [(1-p)(1-q)2pq+ (1-p) 2(1-q) 2 q+ p 2 q 3+ pq(1-q) 2(1-p)] PXYXY = …… PXYYX = …… PXXYY - PXYXY > 0 q(1-q) > p2
36
LONG BRANCH ATTRACTION
p B q q q D p C A C p p q q q B D
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.