Single Nucleotide Polymorphism SNPs Single Nucleotide Polymorphism Polymorfimus DNA, kdy se jedinci nebo druhy liší v jedné nukleotidové záměně AAGCCTA AAGCTTA V tomto případě mluvíme o alelách C a T. Téměž všechny SNPy mají jen 2 alely. Genom dvou lidí se liší zhruba v 3 mil. bazí (ne všechno jsou SNP).
SNP DETEKCE – SSCP Single-Strand Conformation Polymorphism PCR denaturace renaturace vertikální elektroforéza + + + _ _ _ vizualizace
SNPs – hybridizační metody 500 000 lidských SNPs
SNPs – enzymatické metody Primer extension – např. Infinium (Illumina)
Srovnání metod Čistě distanční DNA Proteinové Znakové Fingerprinting (“otisk prstu DNA”) – souhrné označení pro metody poskytující velice variabilní elektroforetické vzory – VNTR RFLP, RAPD, AFLF.
Srovnání metod Metoda DNA hybri Dizace Isozymy Mikro satelity RFLF (VNTR) SINE RAPD AFLP SNP Počet lokusů Všechny Jeden Mnoho Jeden / mnoho Repliko vatelnost Různá Vysoká vysoká Povaha znaků Distance Kodominantní Vzácná událost Domi nantní Kodo minantní Rozlišení Střední Vysoké Nízké Jedno duchost provedení Těžké duché Doba trvání Krátká Dlouhá
Distance z podobnosti vzorů RAPD/RFLP Koeficient genetické vzdálenosti dle. Nei a Li 1979, PNAS 76, 1979 Pro každou dvojici (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech ( Mxy) Vypočteme podíl shodných fragmentů I = 2Mxy/(Mx + My) a z něj distanci D= 1- I X Y
Distance z frekvence alel Rogersova vzdálenost (pro alely 1..i) D= (0,5 Σ(xAi - xBi)2)0,5 (1 lokus) Pro víc lokusů -aritm. průměr z R
VÝPOČET „p“ p = nd/n p = 3/14 = 0,21 p = ΔTm . 0,01 (0,015) p = podíl rozdílných nukleotidů mezi sekvencemi 2 taxonů p = nd/n AATGTAGGAATCGC ACTGAAAGAATCGC p = 3/14 = 0,21 Odhad p z reasociační kinetiky DNA-DNA hybridizace p = ΔTm . 0,01 (0,015)
VÝPOČET „p“ Odhad p z podílu shodných restrikčních míst 1. Sestavíme restrikční mapy pro každou OTU 2. Pro každou dvojici sekvencí (x, y) spočteme všechna restrikční místa (Mx, My) a dále místa vyskytující se v obou sekvencích ( Mxy) 3. Vypočteme podíl shodných restrikčních míst S = 2Mxy/(Mx + My) 4. Vypočteme odhad podílu nukleotidů, ve kterých se sekvence neshodují p = 1 - S1/r r -délka restrikčního místa
POČET SUBSTITUCÍ JE VYŠŠÍ NEŽ „p“ ACTGAACGTAACGC C T G C T T T C Koincidence Jednoduchá substituce Zpětná substituce Vícenásobná substituce K = 12, p = 3 Vidíme jen 3 rozdíly (p), ale ve skutečnosti došlo ke dvanácti substitucím (ut).
SUBSTITUČNÍ SATURACE 0,95 PROTEINY 0,75 DNA Odhad počtu substitucí na jednu pozici 0,95 PROTEINY 0,75 DNA Skutečný počet substitucí na jednu pozici
ODHAD POČTU SUBSTITUCÍ ut Sekvence A Sekvence B Substituční rychlost Časový interval Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC
příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce u = substituční rychlost u/3 = rychlost substituce za jednu konkrétní bázi (např. A -> G) A G C T u/3 Rychlost substituce za kteroukoli bázi i sebe sama 4/3 u Počet substitucí za čas t 4/3 ut u/3 Pravděpodobnost, že za čas t k žádné události nedojde e -4/3 ut Odvozeno z Poissonova rozložení
příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce Pravděpodobnost, že za čas t k žádné události nedojde e -4/3 ut A G C T u/3 Pravděpodobnost, že za čas t k události dojde 1- e -4/3 ut Pravděpodobnost, že dojde ke konkrétní události P (C|A) = 1/4 (1- e -4/3 ut) u/3 Pravděpodobnost, že dojde ke změně p = 3/4 (1- e -4/3 ut)
ODHAD POČTU SUBSTITUCÍ ut Sekvence A Sekvence B Substituční rychlost Časový interval Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC p = počet neshodných míst/ délka sekvence 1-p = „sequence identity“
příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce Pravděpodobnost, že dojde ke změně p = 3/4 (1- e -4/3 ut) A G C T u/3 Korigovaný počet substitucí D = ut = -3/4 ln(1- 4/3 p) Rozptyl D: V(D) = (p(1 -p))/(L(1 - 4/3 p)2) L= délka sekvence u/3
příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce A G C T u/3 Korigovaný počet substitucí D = ut = -3/4 ln(1- 4/3 p) Příklad naší sekvence: D= -3/4 ln(1- 4/3 * 0,21) D= 0,246 u/3
DALŠÍ MODELY Kimura 2P A G C T D = 0,5 ln(a) + 1/4 ln(b) Kimura 2 parametrový A G C T α β α D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) P – podíl transic Q – podíl transverzí Rozptyl D: V(D) = [a2P + c2Q -(aP +cQ)2]/L c = (a + b)/2 L= délka sekvence
DALŠÍ MODELY Kimura 2P A G C T D = 0,5 ln(a) + 1/4 ln(b) Kimura 2 parametrový A G C T α β α D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) Příklad naší sekvence: P=2/14=0,14 Q=1/14=0,07 a = 1/(1 – 2*0,14 – 0,07) = 1,54 b = 1/(1 -2*0,07) = 1,16 D = 0,5 ln(1,54) + 1/4ln(1,16)=0,254
General time reversible DALŠÍ MODELY GTR General time reversible + A G C T α ε β δ γ ζ Rovnovážné frekvence nukleotidů πA πC πG πT Parametry: frekvence (rychlost) záměn (αβγδεζ) a frekvence nukleotidů (πA πC πG πT) se odvozují z analyzovaných sekvencí.
RŮZNÉ MODELY FUNGUJÍ RŮZNĚ
dxy = -ln (det Fxy) = -ln (0.002) = 6,216 LogDet distance dxy = -ln (det Fxy) Sekvence A Alignment 900 pozic Sekvence B Fxy =[ ] 0,249 0,006 0,027 0,009 0,003 0,166 0,001 0,018 0,027 0,006 0,256 0,004 0,006 0,021 0,009 0,194 dxy = -ln (det Fxy) = -ln (0.002) = 6,216