Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Stanovení genetické vzdálenosti ( Na základě molekulárně biologických dat )

Podobné prezentace


Prezentace na téma: "Stanovení genetické vzdálenosti ( Na základě molekulárně biologických dat )"— Transkript prezentace:

1 Stanovení genetické vzdálenosti ( Na základě molekulárně biologických dat )

2 2 Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

3 3 Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

4 Dvě základní metody: Měření vzdálenosti mezi dvojicemi OTU Hybridizace DNA Imunologické metody Výpočtem z dat znakového charakteru Sekvence DNA DNA fingerprinting metody ( RAPD, RFLP) Restrikční mapování Isoenzymy

5 Vzdálenosti ze sekvencí DNA Provedeme alignment sekvencí Spočteme podíl neshodných míst p = počet neshodných míst / délka sekvence Provedeme korekci na vícenásobné mutace Jukes Cantorova metoda (jednoparametrová) K = -3/4 ln(1 - 4/3p) Kimurova metoda (dvouparametrová) K = ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) P -proporce transicí, Q -proporce transverzí

6 6 Odhad počtu mutací od okamžiku divergence K = 12, p = 3 ACTGAACGTAACGC Jednoduchá substituce Vícenásobná substituce Zpětná substituce CTCT TCTC GTCTCT Koincidence

7 7 Jukes-Cantorův jednoparametrový model Jukes,T.H. Cantor, C.R. (1969) In: Mammalian protein metabolism. Munro,H.N. (Ed.) Acad.Press, New York AG C T α Odhad podílu substitucí od okamžiku divergence K = -3/4 ln(1 - 4/3 p) Odhad rozptylu K V(K) = (p(1 -p))/(L(1 - 4/3 p) 2 ) ααα α α

8 Dvouparametrový Kimurův model: Odhad podílu substitucí od okamžiku divergence K = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) Odhad rozptylu K V(K) = [a 2 P + c 2 Q -(aP +cQ) 2 ]/L c = (a + b)/2 L= délka sekvence AG C T Kimura,M. (1980) J.Mol.Evol. 16: P - transice, Q -transverse α α ββββ

9 Další metody výpočtu genetických distancí Tajima-Nei 1984 (bere v úvahu nestejné frekvence jednotlivých nukleotidů) Gojobori 1982 (šestiparametrový model) Tamura-Nei 1993 (šestiparametrový model) Lanave 1984 (devítiparametrový (12?) model) Lake 1994 (aditivnost distancí -paralineární d.) Lockhart 1994 (LogDet) (paralineární)

10 Porovnání jednotlivých metod Modely s větším počtem parametrů jsou flexibilnější a většinou přesnější než metody jednoduché. Obsahují však často větší množství předpokladů a pro kratší úseky dávají horší výsledky. Někdy je nelze použít (např kvůli dělení nulou či logaritmování nuly). Simulace ukázala, že pro K 1 však tyto metody často nelze použít, v takovém případě lze doporučit Tajima-Nei.

11 Výpočet distancí pro úseky kódující proteiny Používané algoritmy berou v úvahu, že nesynonymní mutace bývají fixovány jinak často, než mutace synonymní (pro většinu genů méně často). Nejčastěji se využívá metoda, kterou vyvinul Li v roce 1985 a modifikoval v roce Je třeba vždy brát v úvahu, jaký genetický kód daný organismus používá (universální x mitochondriální x jiné kódy). Výsledkem výpočtu je K s a K a (frekvence synonymních a nesynonymních mutací).

12 Vzdálenost na podkladě sekvencí proteinů Při výpočtu se bere v úvahu podobnost či odlišnost zaměněných aminokyselin. Většinou se vychází z empiricky sestavených tabulek frekvencí jednotlivých typů záměn (20 x 20). Odhady genetické vzdálenosti jsou podstatně přesnější. Porovnáváme-li kódující úseky DNA je vždy výhodné přeložit je do sekvence proteinu a počítat podobnosti proteinů. Nutno využívat specielní programy (např. MEGA).

13 Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

14 Z počtu shodných restrikčních míst 1. Sestavíme restrikční mapy pro každou OTU 2. Pro každou dvojici sekvencí (x, y) spočteme všechna restrikční místa (M x, M y ) a dále místa vyskytující se v obou sekvencích ( M xy ) 3. Vypočteme podíl shodných restrikčních míst S = 2M xy /(M x + M y ) 4. Vypočteme odhad podílu nukleotidů, ve kterých se sekvence neshodují p = 1 - S 1/r r -délka restrikčního místa 5. Vypočteme odhad počtu mutací z počtu neshodných nukleotidů, (např. J-C metodou) K = -3/4 ln(1 - 4/3p)

15 Z podobnosti RFLP (RAPD) vzoru 1. Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (M x, M y ) a dále fragmenty vyskytující se v obou elektroforetogramech (M xy ) 2. Vypočteme podíl shodných fragmentů S = 2M xy /(M x + M y ) 3.Vypočteme odhad pravděpodobnosti, že fragment zůstane od okamžiku divergence obou sekvencí nezměněn (G) metodou postupných iterací G = (S (3 - 2G)) 1/4 G 0 = S 1/4, obvykle stačí 5-7 iterací 4. Vypočteme odhad podílu substitucí z G K = (2/r)ln(G)

16 Z podobnosti RAPD vzoru Koeficient genetické vzdálenosti dle. Nei a Li 1979, PNAS 76, 1979 Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (M x, M y ) a dále fragmenty vyskytující se v obou elektroforetogramech ( M xy ) Vypočteme podíl shodných fragmentů I = 2M xy /(M x + M y ) a z něj distanci NLD= 1- I Jiné možnosti: Jednoduchý koeficient shody SMC nebo Jaccardův koeficient (teoreticky méně vhodné ale...).

17 Příklad na výpočet vzdálenosti z podobnosti RFLP vzorů DNA štěpena BamHI, EcoRI, HindIII (r = 6) Aegilops sharonensis -čtyři fragmenty (M s =4) Aegilops bicornis -pět fragmentů (M b =5) Počet společných fragmentů - jeden (M sb =1) S = 2M xy /(M x + M y ) = 2/9 = 0,222 G 0 = S 1/4 = 0,222 1/4 = 0,687 G = (S (3 - 2G)) 1/4 : G = 0,687, 0,775, 0,753,... 0,758 K = (2/r)ln(G) = (2/6)ln(0,758) = 0,092

18 Příklad výpočtu počtu substitucí Délka sekvence 200 bp, transicí: 20, transversí 4 L=200, P=20/200=0,1, Q=4/200=0,02 Kimura: K= 0,5 ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) = = 0,5 ln(1/(1-0,2 -0,02)) + 1/4 ln(1/(1-0,04)) = 0,13 Jukes-Cantor: p=24/200=0,12 K = -3/4 ln(1 - 4/3p)=0,13 L=200, transice: 50, transverse:16 Kimura K=0,48, Jukes-Cantor K=0,43

19 Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

20 Genetická vzdálenost dvou populací vypočtená z frekvence alel Rogersova vzdálenost (pro alely 1..i) R= (0,5 Σ(x Ai - x Bi ) 2 ) 0,5 (1 lokus) Pro víc lokusů -aritm. průměr z R Neiovská vzdálenost D= -ln I, I= Σ x i y i /(Σ x i 2 Σ y i 2 ) 0,5 ) Pro víc lokusů: I=J xy /(J x J y ) 0,5 J xy, J x a J y jsou postupně aritm. průměry z Σ x i y i, Σ x i 2 a Σ y i 2 pro všechny lokusy

21 Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

22 Přímé metody zjišťování genetických vzdáleností Imunologické Zkřížené imunologické reakce Metody kvantifikace (KFR, ELISA, precipitační techniky, RIA) DNA hybridizace Na membráně V roztoku

23 DNA hybridizace Výpočet rozdílu středních teplot tání homoduplexů a heteroduplexu ∆T m =((T mA + T mB )/2) - T ms Výpočet odhadu podílu neshodných pozic p = c ∆ T m c = 0,01 - 0,015 Výpočet odhadu podílu substitucí od okamžiku divergence obou OTU K = -3/4 ln(1 - 4/3 p)

24 Závěry 1. Existuje řada metod pro určení genetických vzdáleností na základě znakových dat, ať již přímých, nebo nepřímých (přepočtem) 2. Volba určitého koeficientu genetické vzdálenosti může podstatně ovlivnit přesnost našich výsledků, zejména při výpočtu délky větví, topologie stromu často správná i při použití nejjednodušších metod 3. Ne vždy je nejsložitější metoda i tou nejlepší, vzhledem k ceně je však obvykle účelné vyzkoušet více možností


Stáhnout ppt "Stanovení genetické vzdálenosti ( Na základě molekulárně biologických dat )"

Podobné prezentace


Reklamy Google