Single Nucleotide Polymorphism

Slides:



Advertisements
Podobné prezentace
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Advertisements

Cvičení 9 – Ekonomická funkce nelineární v parametrech :
Obecně použitelné odvození
Testování statistických hypotéz
Odhady parametrů základního souboru
Chováme králíčky Liší se tato tři králičí plemena hmotností?
Polymorfismy DNA a jejich využití ve forenzní genetice
Zarovnávání biologických sekvencí
Poznámky identifikaci SNP
Prof. Ing. Václav Řehout, CSc.
Měřítko mapy a plánu 1 : a na mapě ve skutečnosti na plánu
10_Podobná zobrazení V geometrii o dvou útvarech říkáme, že jsou podobné, pokud je druhý z nich v určitém měřítku zmenšeným nebo zvětšeným obrazem prvého.
Taxonomie x1, y1, z1 = plesiomofie
MOLEKULÁRNÍ TAXONOMIE Zkouška Součásti zkoušky: Písemná část (5 příkladů) – maximální zisk 10 bodů - k ruce můžete mít jakékoli materiály - kalkulačka.
ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN
Získávání informací Získání informací o reálném systému
TRIGONOMETRIE OBECNÉHO TROJÚHELNÍKU
PROTEIN MASS FINGERPRINT. DNA/RNA MASS FINGERPRINT.
Markery asistovaná selekce
Odhad genetických parametrů
Jak se pozná nejlepší strom?
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Fingerprinting techniky
Imunologické, mikrosatelity, SSCP, SINE
Odhady parametrů základního souboru
Stanovení genetické vzdálenosti
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Polymorfizmy detekované speciálními metodami s vysokou rozlišovací schopností Stanovení jednonukleotidových polymorfizmů (Single Nucleotide Polymorphisms.
Využití v systematické biologii
Projekt HUGO – milníky - I
Skutečný počet substitucí na jednu pozici Počet pozorovaných rozdílů 0,75 DNA 0,95 PROTEINY SUBSTITUČNÍ SATURACE p.
Genetická diverzita hospodářských zvířat
STRATEGIE MOLEKULÁRNÍ GENETIKY
Použití molekulárních znaků v systematice
Sekvence A Sekvence B D = ut Zjištění rozdílů (p) Korekce na mnohonásobné substituce Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC Bereme nebo.
DNA Hybridizační techniky
rozdělení metod využitelnost jednotlivých metod náročnost metod používání metod perspektivy.
GENETICKÁ A FENOTYPOVÁ
JAK NAJÍT NEJLEPŠÍ STROM
Polymorfismus lidské DNA.
DNA diagnostika.
Hustota pravděpodobnosti – případ dvou proměnných
„AFLP, amplified fragment length polymorphism“
Praktikum z genetiky rostlin JS 2014 Genetická analýza a genetické markery Genetická analýza a identifikace počtu genů odolnosti k padlí u ječmene. Určení.
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
Prohledávání stromového prostoru – heuristické hledání, Marcov chain Monte Carlo – a skórování stromů podle různých kritérií. Algoritmus – najde jen jeden.
SMAMII-8 Detekce polymorfismů v genomech. Metody molekulární diagnostiky Se zaměřují na vyhledávání rozdílů v sekvencích DNA a Identifikaci polymorfismů.
SNPs Single Nucleotide Polymorphism Polymorfimus DNA, kdy se jedinci nebo druhy liší v jedné nukleotidové záměně AAGCCTA AAGCTTA V tomto případě mluvíme.
MOLEKULÁRNÍ TAXONOMIE Zkouška Součásti zkoušky: Písemná část (5 příkladů) – maximální zisk 10 bodů - k ruce můžete mít jakékoli materiály - kalkulačka.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Projekt HAPMAP Popis haplotypů
DATA Taxon A CCCTGG Taxon B ACTTGA HYPOTÉZA Evoluční model: GTR + Γ Vzdálenost (délka větve ) A B t MAXIMUM LIKELIHOOD L = P(A|C,t) x P(C|C,t) x P(C|T,t)…..
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Obecně použitelné odvození
Jak se pozná nejlepší strom?
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Základy statistické indukce
Odhady parametrů základního souboru
Základy genetiky = ? X Proč jsme podobní rodičům?
GENETICKÁ A FENOTYPOVÁ
Fylogenetická evoluční analýza
Jana Michalová Tereza Nováková Radka Ocásková
Ivana Eštočinová, Pavla Fabulová, Markéta Formánková
Ostatní metody získávání molekulárních dat
Jak získáváme znaky pomocí sekvenace unikátních lokusů
Obecně použitelné odvození
Jak získáváme znaky pomocí sekvenace unikátních lokusů
SUBSTITUČNÍ SATURACE 0,95 PROTEINY 0,75 DNA p
Základy genetiky = ? X Proč jsme podobní rodičům?
Základy statistiky.
Transkript prezentace:

Single Nucleotide Polymorphism SNPs Single Nucleotide Polymorphism Polymorfimus DNA, kdy se jedinci nebo druhy liší v jedné nukleotidové záměně AAGCCTA AAGCTTA V tomto případě mluvíme o alelách C a T. Téměž všechny SNPy mají jen 2 alely. Genom dvou lidí se liší zhruba v 3 mil. bazí (ne všechno jsou SNP).

SNP DETEKCE – SSCP Single-Strand Conformation Polymorphism PCR denaturace renaturace vertikální elektroforéza + + + _ _ _ vizualizace

SNPs – hybridizační metody 500 000 lidských SNPs

SNPs – enzymatické metody Primer extension – např. Infinium (Illumina)

Srovnání metod Čistě distanční DNA Proteinové Znakové Fingerprinting (“otisk prstu DNA”) – souhrné označení pro metody poskytující velice variabilní elektroforetické vzory – VNTR RFLP, RAPD, AFLF.

Srovnání metod Metoda DNA hybri Dizace Isozymy Mikro satelity RFLF (VNTR) SINE RAPD AFLP SNP Počet lokusů Všechny Jeden Mnoho Jeden / mnoho Repliko vatelnost Různá Vysoká vysoká Povaha znaků Distance Kodominantní Vzácná událost Domi nantní Kodo minantní Rozlišení Střední Vysoké Nízké Jedno duchost provedení Těžké duché Doba trvání Krátká Dlouhá

Distance z podobnosti vzorů RAPD/RFLP Koeficient genetické vzdálenosti dle. Nei a Li 1979, PNAS 76, 1979 Pro každou dvojici (x, y) spočteme všechny fragmenty (Mx, My) a dále fragmenty vyskytující se v obou elektroforetogramech ( Mxy) Vypočteme podíl shodných fragmentů I = 2Mxy/(Mx + My) a z něj distanci D= 1- I X Y

Distance z frekvence alel Rogersova vzdálenost (pro alely 1..i) D= (0,5 Σ(xAi - xBi)2)0,5 (1 lokus) Pro víc lokusů -aritm. průměr z R

VÝPOČET „p“ p = nd/n p = 3/14 = 0,21 p = ΔTm . 0,01 (0,015) p = podíl rozdílných nukleotidů mezi sekvencemi 2 taxonů p = nd/n AATGTAGGAATCGC ACTGAAAGAATCGC p = 3/14 = 0,21 Odhad p z reasociační kinetiky DNA-DNA hybridizace p = ΔTm . 0,01 (0,015)

VÝPOČET „p“ Odhad p z podílu shodných restrikčních míst 1. Sestavíme restrikční mapy pro každou OTU 2. Pro každou dvojici sekvencí (x, y) spočteme všechna restrikční místa (Mx, My) a dále místa vyskytující se v obou sekvencích ( Mxy) 3. Vypočteme podíl shodných restrikčních míst S = 2Mxy/(Mx + My) 4. Vypočteme odhad podílu nukleotidů, ve kterých se sekvence neshodují p = 1 - S1/r r -délka restrikčního místa

POČET SUBSTITUCÍ JE VYŠŠÍ NEŽ „p“ ACTGAACGTAACGC C T G C T T T C Koincidence Jednoduchá substituce Zpětná substituce Vícenásobná substituce K = 12, p = 3 Vidíme jen 3 rozdíly (p), ale ve skutečnosti došlo ke dvanácti substitucím (ut).

SUBSTITUČNÍ SATURACE 0,95 PROTEINY 0,75 DNA Odhad počtu substitucí na jednu pozici 0,95 PROTEINY 0,75 DNA Skutečný počet substitucí na jednu pozici

ODHAD POČTU SUBSTITUCÍ ut Sekvence A Sekvence B Substituční rychlost Časový interval Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC

příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce u = substituční rychlost u/3 = rychlost substituce za jednu konkrétní bázi (např. A -> G) A G C T u/3 Rychlost substituce za kteroukoli bázi i sebe sama 4/3 u Počet substitucí za čas t 4/3 ut u/3 Pravděpodobnost, že za čas t k žádné události nedojde e -4/3 ut Odvozeno z Poissonova rozložení

příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce Pravděpodobnost, že za čas t k žádné události nedojde e -4/3 ut A G C T u/3 Pravděpodobnost, že za čas t k události dojde 1- e -4/3 ut Pravděpodobnost, že dojde ke konkrétní události P (C|A) = 1/4 (1- e -4/3 ut) u/3 Pravděpodobnost, že dojde ke změně p = 3/4 (1- e -4/3 ut)

ODHAD POČTU SUBSTITUCÍ ut Sekvence A Sekvence B Substituční rychlost Časový interval Sekvence A - AATGTAGGAATCGC Sekvence B - ACTGAAAGAATCGC p = počet neshodných míst/ délka sekvence 1-p = „sequence identity“

příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce Pravděpodobnost, že dojde ke změně p = 3/4 (1- e -4/3 ut) A G C T u/3 Korigovaný počet substitucí D = ut = -3/4 ln(1- 4/3 p) Rozptyl D: V(D) = (p(1 -p))/(L(1 - 4/3 p)2) L= délka sekvence u/3

příklad korekce na mnohonásobné substituce Jukes-Cantor příklad korekce na mnohonásobné substituce A G C T u/3 Korigovaný počet substitucí D = ut = -3/4 ln(1- 4/3 p) Příklad naší sekvence: D= -3/4 ln(1- 4/3 * 0,21) D= 0,246 u/3

DALŠÍ MODELY Kimura 2P A G C T D = 0,5 ln(a) + 1/4 ln(b) Kimura 2 parametrový A G C T α β α D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) P – podíl transic Q – podíl transverzí Rozptyl D: V(D) = [a2P + c2Q -(aP +cQ)2]/L c = (a + b)/2 L= délka sekvence

DALŠÍ MODELY Kimura 2P A G C T D = 0,5 ln(a) + 1/4 ln(b) Kimura 2 parametrový A G C T α β α D = 0,5 ln(a) + 1/4 ln(b) a = 1/(1 - 2P - Q) b = 1/(1 -2Q) Příklad naší sekvence: P=2/14=0,14 Q=1/14=0,07 a = 1/(1 – 2*0,14 – 0,07) = 1,54 b = 1/(1 -2*0,07) = 1,16 D = 0,5 ln(1,54) + 1/4ln(1,16)=0,254

General time reversible DALŠÍ MODELY GTR General time reversible + A G C T α ε β δ γ ζ Rovnovážné frekvence nukleotidů πA πC πG πT Parametry: frekvence (rychlost) záměn (αβγδεζ) a frekvence nukleotidů (πA πC πG πT) se odvozují z analyzovaných sekvencí.

RŮZNÉ MODELY FUNGUJÍ RŮZNĚ

dxy = -ln (det Fxy) = -ln (0.002) = 6,216 LogDet distance dxy = -ln (det Fxy) Sekvence A Alignment 900 pozic Sekvence B Fxy =[ ] 0,249 0,006 0,027 0,009 0,003 0,166 0,001 0,018 0,027 0,006 0,256 0,004 0,006 0,021 0,009 0,194 dxy = -ln (det Fxy) = -ln (0.002) = 6,216