Stanovení genetické vzdálenosti

Slides:



Advertisements
Podobné prezentace
Statistika.
Advertisements

Stanovení objemu stojících stromů
IX. Řešení úloh v testech Scio z obecných studijních předpokladů
Výpočet zásoby porostu na zkusných plochách při požadované přesnosti
Obecně použitelné odvození
Testování neparametrických hypotéz
Single Nucleotide Polymorphism
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
Odhady parametrů základního souboru
Polymorfismy DNA a jejich využití ve forenzní genetice
Cvičení 6 – 25. října 2010 Heteroskedasticita
ZÁKLADY EKONOMETRIE 7. cvičení Heteroskedasticita
Zarovnávání biologických sekvencí
Genetické algoritmy. V průběhu výpočtu používají náhodné operace. Algoritmus není jednoznačný, může projít více cestami. Nezaručují nalezení řešení.
Prof. Ing. Václav Řehout, CSc.
Aplikace metrických indexovacích metod na data získaná hmotnostní spektrometrií Jiří Novák
Aplikace metrických indexovacích metod na data získaná hmotnostní spektrometrií Ing. Jiří Novák
Dědičnost ukazatelů fyzické zdatnosti
Morfologická křivka kmene
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
PROTEIN MASS FINGERPRINT. DNA/RNA MASS FINGERPRINT.
Markery asistovaná selekce
Základy informatiky přednášky Efektivní kódy.
Odhad genetických parametrů
Statistika Vypracoval: Mgr. Lukáš Bičík
CHYBY MĚŘENÍ.
Shluková analýza.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Imunologické, mikrosatelity, SSCP, SINE
Evoluce molekulárních znaků
VLASTNOSTI MOTORICKÝCH TESTŮ Oddělení antropomotoriky, rekreologie a metodologie Katedra kinantropologie, humanitních věd a managementu sportu © 2009 FTVS.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Číselné soustavy david rozlílek ME4B
Využití v systematické biologii
Mgr. et Mgr. Pavel Římovský, Bc. Jaroslav Mudrák
Projekt HUGO – milníky - I
Skutečný počet substitucí na jednu pozici Počet pozorovaných rozdílů 0,75 DNA 0,95 PROTEINY SUBSTITUČNÍ SATURACE p.
Statistika Ukazatelé variability
Genetická diverzita hospodářských zvířat
Markery asistovaná selekce - MAS
Základy molekulární taxonomie J.Flegr, Praha 2008.
Lineární regrese.
STRATEGIE MOLEKULÁRNÍ GENETIKY
Použití molekulárních znaků v systematice
Sekvence A Sekvence B D = ut Zjištění rozdílů (p) Korekce na mnohonásobné substituce Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC Bereme nebo.
Experimentální fyzika I. 2
Evoluce sekvence DNA.
DNA Hybridizační techniky
rozdělení metod využitelnost jednotlivých metod náročnost metod používání metod perspektivy.
GENETICKÁ A FENOTYPOVÁ
 VZNIK GENETICKÉ PROMĚNLIVOSTI = nejdůležitější mikroevoluční
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
Pearsonův test dobré shody chí kvadrát
Restrikční mapování.
„AFLP, amplified fragment length polymorphism“
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
SNPs Single Nucleotide Polymorphism Polymorfimus DNA, kdy se jedinci nebo druhy liší v jedné nukleotidové záměně AAGCCTA AAGCTTA V tomto případě mluvíme.
Volná kombinovatelnost – geny se nachází v různých nehomologických chromozomech počet genů > počtu páru homologických chromozomů např. Drosophila melanogaster.
Obecně použitelné odvození
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
UŽITÁ HYDROLOGIE A VODNÍ HOSPODÁŘSTVÍ KRAJINY
GENETICKÁ A FENOTYPOVÁ
Fylogenetická evoluční analýza
Jak získáváme znaky pomocí sekvenace unikátních lokusů
Mutace.
Lineární regrese.
Jak získáváme znaky pomocí sekvenace unikátních lokusů
* Měřítko plánu, mapy Matematika – 7. ročník *
Základy statistiky.
Transkript prezentace:

Stanovení genetické vzdálenosti (Na základě molekulárně biologických dat)

Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami 2

Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami 3

Dvě základní metody: Měření vzdálenosti mezi dvojicemi OTU Hybridizace DNA Imunologické metody Výpočtem z dat znakového charakteru Sekvence DNA DNA fingerprinting metody ( RAPD, RFLP) Restrikční mapování Isoenzymy

Vzdálenosti ze sekvencí DNA Provedeme alignment sekvencí Spočteme podíl neshodných míst p = počet neshodných míst / délka sekvence Provedeme korekci na vícenásobné mutace Jukes Cantorova metoda (jednoparametrová) K = -3/4 ln(1 - 4/3p) Kimurova metoda (dvouparametrová) K = ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) P -proporce transicí, Q -proporce transverzí

Odhad počtu mutací od okamžiku divergence ACTGAACGTAACGC C T G C T T T C Koincidence Jednoduchá substituce Zpětná substituce Vícenásobná substituce K = 12, p = 3 6

Jukes-Cantorův jednoparametrový model Jukes,T.H. Cantor, C.R. (1969) In: Mammalian protein metabolism. Munro,H.N. (Ed.) Acad.Press, New York α A G α α α α C α T Odhad podílu substitucí od okamžiku divergence K = -3/4 ln(1 - 4/3 p) Odhad rozptylu K V(K) = (p(1 -p))/(L(1 - 4/3 p)2) 7

Dvouparametrový Kimurův model: Kimura,M. (1980) J.Mol.Evol. 16: 111-120. α A G β β β β C α T Odhad podílu substitucí od okamžiku divergence K = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) Odhad rozptylu K V(K) = [a2P + c2Q -(aP +cQ)2]/L c = (a + b)/2 L= délka sekvence P - transice, Q -transverse

Další metody výpočtu genetických distancí Tajima-Nei 1984 (bere v úvahu nestejné frekvence jednotlivých nukleotidů) Gojobori 1982 (šestiparametrový model) Tamura-Nei 1993 (šestiparametrový model) Lanave 1984 (devítiparametrový (12?) model) Lake 1994 (aditivnost distancí -paralineární d.) Lockhart 1994 (LogDet) (paralineární)

Porovnání jednotlivých metod Modely s větším počtem parametrů jsou flexibilnější a většinou přesnější než metody jednoduché. Obsahují však často větší množství předpokladů a pro kratší úseky dávají horší výsledky. Někdy je nelze použít (např kvůli dělení nulou či logaritmování nuly). Simulace ukázala, že pro K< 0,5 dávají poměrně přesné výsledky i nejjednoduší metody (Jukes-Cantor, Kimura). Pro větší distance (a dostatečně dlouhé sekvence) je lépe použít Lanave, Gojobori či Tamura-Nei. Pro K > 1 však tyto metody často nelze použít, v takovém případě lze doporučit Tajima-Nei.

Výpočet distancí pro úseky kódující proteiny Používané algoritmy berou v úvahu, že nesynonymní mutace bývají fixovány jinak často, než mutace synonymní (pro většinu genů méně často). Nejčastěji se využívá metoda, kterou vyvinul Li v roce 1985 a modifikoval v roce 1993. Je třeba vždy brát v úvahu, jaký genetický kód daný organismus používá (universální x mitochondriální x jiné kódy). Výsledkem výpočtu je Ks a Ka (frekvence synonymních a nesynonymních mutací).

Vzdálenost na podkladě sekvencí proteinů Při výpočtu se bere v úvahu podobnost či odlišnost zaměněných aminokyselin. Většinou se vychází z empiricky sestavených tabulek frekvencí jednotlivých typů záměn (20 x 20). Odhady genetické vzdálenosti jsou podstatně přesnější. Porovnáváme-li kódující úseky DNA je vždy výhodné přeložit je do sekvence proteinu a počítat podobnosti proteinů. Nutno využívat specielní programy (např. MEGA).

Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

Z počtu shodných restrikčních míst 1. Sestavíme restrikční mapy pro každou OTU 2. Pro každou dvojici sekvencí (x, y) spočteme všechna restrikční místa (Mx, My) a dále místa vyskytující se v obou sekvencích ( Mxy) 3. Vypočteme podíl shodných restrikčních míst S = 2Mxy/(Mx + My) 4. Vypočteme odhad podílu nukleotidů, ve kterých se sekvence neshodují p = 1 - S1/r r -délka restrikčního místa 5. Vypočteme odhad počtu mutací z počtu neshodných nukleotidů, (např. J-C metodou) K = -3/4 ln(1 - 4/3p)

Z podobnosti RFLP (RAPD) vzoru 1. Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech (Mxy) 2. Vypočteme podíl shodných fragmentů S = 2Mxy/(Mx + My) 3.Vypočteme odhad pravděpodobnosti, že fragment zůstane od okamžiku divergence obou sekvencí nezměněn (G) metodou postupných iterací G = (S (3 - 2G))1/4 G0 = S1/4, obvykle stačí 5-7 iterací 4. Vypočteme odhad podílu substitucí z G K = (2/r)ln(G)

Z podobnosti RAPD vzoru Koeficient genetické vzdálenosti dle. Nei a Li 1979, PNAS 76, 1979 Pro každou dvojici sekvencí (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech ( Mxy) Vypočteme podíl shodných fragmentů I = 2Mxy/(Mx + My) a z něj distanci NLD= 1- I Jiné možnosti: Jednoduchý koeficient shody SMC nebo Jaccardův koeficient (teoreticky méně vhodné ale...).

Příklad na výpočet vzdálenosti z podobnosti RFLP vzorů DNA štěpena BamHI, EcoRI, HindIII (r = 6) Aegilops sharonensis -čtyři fragmenty (Ms=4) Aegilops bicornis -pět fragmentů (Mb=5) Počet společných fragmentů - jeden (Msb=1) S = 2Mxy/(Mx + My) = 2/9 = 0,222 G0 = S1/4 = 0,2221/4 = 0,687 G = (S (3 - 2G))1/4 : G = 0,687, 0,775, 0,753, ... 0,758 K = (2/r)ln(G) = (2/6)ln(0,758) = 0,092

Příklad výpočtu počtu substitucí Délka sekvence 200 bp, transicí: 20, transversí 4 L=200, P=20/200=0,1, Q=4/200=0,02 Kimura: K= 0,5 ln (1/(1 -2P -Q)) + 1/4 ln(1/(1 - 2Q)) = = 0,5 ln(1/(1-0,2 -0,02)) + 1/4 ln(1/(1-0,04)) = 0,13 Jukes-Cantor: p=24/200=0,12 K = -3/4 ln(1 - 4/3p)=0,13 L=200, transice: 50, transverse:16 Kimura K=0,48, Jukes-Cantor K=0,43

Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

Genetická vzdálenost dvou populací vypočtená z frekvence alel Rogersova vzdálenost (pro alely 1..i) R= (0,5 Σ(xAi - xBi)2)0,5 (1 lokus) Pro víc lokusů -aritm. průměr z R Neiovská vzdálenost D= -ln I , I= Σ xiyi/(Σ xi2 Σ yi2)0,5) Pro víc lokusů: I=Jxy /(JxJy)0,5 Jxy, Jx a Jy jsou postupně aritm. průměry z Σ xiyi, Σ xi2 a Σ yi2 pro všechny lokusy

Obsah Metody výpočtu genetických vzdáleností na základě sekvenačních dat Nepřímé metody výpočtu genetických vzdáleností ze sekvencí Výpočty genetických vzdáleností na podkladě jiných typů znakových dat Měření genetických vzdáleností experimentálními metodami

Přímé metody zjišťování genetických vzdáleností Imunologické Zkřížené imunologické reakce Metody kvantifikace (KFR, ELISA, precipitační techniky, RIA) DNA hybridizace Na membráně V roztoku

DNA hybridizace Výpočet rozdílu středních teplot tání homoduplexů a heteroduplexu ∆Tm=((TmA + TmB)/2) - Tms Výpočet odhadu podílu neshodných pozic p = c ∆ Tm c = 0,01 - 0,015 Výpočet odhadu podílu substitucí od okamžiku divergence obou OTU K = -3/4 ln(1 - 4/3 p)

Závěry 1. Existuje řada metod pro určení genetických vzdáleností na základě znakových dat, ať již přímých, nebo nepřímých (přepočtem) 2. Volba určitého koeficientu genetické vzdálenosti může podstatně ovlivnit přesnost našich výsledků, zejména při výpočtu délky větví, topologie stromu často správná i při použití nejjednodušších metod 3. Ne vždy je nejsložitější metoda i tou nejlepší, vzhledem k ceně je však obvykle účelné vyzkoušet více možností