MOLEKULÁRNÍ TAXONOMIE

Slides:



Advertisements
Podobné prezentace
Vestavné mikropočítačové systémy
Advertisements

Statistické testy z náhodného výběru vyvozuji závěry ohledně základního souboru často potřebuji porovnat dva výběry mezi sebou, porovnat průměr náhodného.
Základní škola a Mateřská škola, Šumná, okres Znojmo OP VK 1
Statistické metody pro testování asociace genů a nemocí
Otáčivé účinky síly (Učebnice strana 70)
Single Nucleotide Polymorphism
Fylogeografie Studuje geografickou strukturaci populací Navazuje na evoluční biologii, ochranu živ. prostř., taxonomii.
A5M33IZS – Informační a znalostní systémy Testování modelů.
VII. Řešení úloh v testech Scio z matematiky
Odhady parametrů základního souboru
Polymorfismy DNA a jejich využití ve forenzní genetice
Zarovnávání biologických sekvencí
Statistická chyba a hladina statistické významnosti
Diskrétní rozdělení a jejich použití
t-rozdělení, jeho použití
Taxonomie x1, y1, z1 = plesiomofie
MOLEKULÁRNÍ TAXONOMIE Zkouška Součásti zkoušky: Písemná část (5 příkladů) – maximální zisk 10 bodů - k ruce můžete mít jakékoli materiály - kalkulačka.
Získávání informací Získání informací o reálném systému
Markery asistovaná selekce
Testování hypotéz (ordinální data)
Pravděpodobnost a statistika opakování základních pojmů
Statistická chyba a hladina statistické významnosti
III. Řešení úloh v testech Scio z matematiky
Genetika populací, rodokmen
1 Národní informační středisko pro podporu jakosti.
Náhodná proměnná Rozdělení.
Náhoda, generátory náhodných čísel
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Imunologické, mikrosatelity, SSCP, SINE
Evoluce molekulárních znaků
MOLEKULÁRNÍ TAXONOMIE
Mechanika tuhého tělesa
Stanovení genetické vzdálenosti
Porovnání středních hodnot: t-test, ANOVA, Tukeyho m.v.p.
Odhady parametrů základního souboru. A) GNR B) neznámé r. ZS (přesné parametry) : ,   VS (odhady parametrů): x, s x.
Využití v systematické biologii
Odhady odhady bodové a intervalové odhady
Slovní úlohy řešené soustavou rovnic
Statistika Ukazatelé variability
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
STRATEGIE MOLEKULÁRNÍ GENETIKY
Ekonometrie „ … ekonometrie je kvantitativní ekonomická disciplína, která se zabývá především měřením v ekonomice na základě analýzy reálných statistických.
Použití molekulárních znaků v systematice
0,20,40,60,80 nerovnoměrnost v používání kodónů (  2 ) index využití preferovaných kodónů (CAI) ,84 7,82.
GENETICKÁ A FENOTYPOVÁ
Polymorfismus lidské DNA.
PSY717 – statistická analýza dat
Genový tok a evoluční tahy
Analýza variance (ANOVA). ANOVA slouží k porovnávání středních hodnot 2 a více náhodných proměnných. Tam, kde se používal dvouvýběrový t-test, je možno.
Praktikum z genetiky rostlin JS Genetické mapování mutace lycopodioformis Arabidopsis thaliana Genetické mapování genu odolnosti k padlí.
MOLEKULÁRNÍ TAXONOMIE Zkouška Součásti zkoušky: Písemná část (5 příkladů) – maximální zisk 10 bodů - k ruce můžete mít jakékoli materiály - kalkulačka.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
NEPOVINNÝ ESEJ Rozsah textu 2-3 strany, důraz na metodiku Prezentace 10 min. ( po přednášce) Proč ho psát? Získáte 4 body ke zkoušce Bodování.
Testování hypotéz Otestujte,… Ověřte,… Prokažte,… že střední věk (tj.  ) …činí 40 let (= 40) …je alespoň 40 let (≥ 40)
Odhady odhady bodové a intervalové odhady
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Induktivní statistika
Induktivní statistika
Induktivní statistika
- váhy jednotlivých studií
Fylogenetická evoluční analýza
Úvod do statistického testování
NEPOVINNÝ ESEJ Rozsah textu 2-3 strany, důraz na metodiku
Jak získáváme znaky pomocí sekvenace unikátních lokusů
GENOVÝ STROM X DRUHOVÝ STROM
Vnitrodruhové vztahy Reifová a Munclinger – Evoluční genetika (ZS)
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Transkript prezentace:

MOLEKULÁRNÍ TAXONOMIE Rozpis přednášek (9:50-11:20) 2. 5. - Molekulární hodiny, forenzní věda Praktikum 5. 5.: Tvorba stromů ze sekvencí proteinů 19. 5. (učebna 312) Vnitrodruhová fylogeneze, struktura populace a genový tok, fylogeografie, příklady – odevzdání nepovinného eseje Praktikum 12. 5.: multigenové analýzy, testy, distanční data, analýza migrace 23. 5. - Prezentace studentů

MOLEKULÁRNÍ HODINY proč mohou fungovat µ - mutační rychlost (počet nově vzniklých mutací za jednotku času u jednoho jedince) µ*Ne – počet nově vzniklých mutací za jednotku času u v populaci (Ne = efektivní velikost populace) 1/Ne – pravděpodobnost fixace mutace Rychlost fixace nových mutací v populaci µ*Ne* 1/Ne = µ Nezávisí na velikosti populace!!!

ZDROJE CHYBY tikají nepravidelně

ZDROJE CHYBY tikají nepravidelně 95 %

ZDROJE CHYBY tikají různě rychle v různých genech r = K(2T) (K -počet substitucí mezi dvěma druhy, T -doba od odvětvení obou druhů) Gen Nesynonymní (10-9) Synonymní (10-9) ribosomální protein S14 0,02 2,16 ribosomální protein S17 0,06 2,69 aktin 0,01 2,92 myosin 0,10 2,15 somatotropin 1,34 3,79 albumin 0,92 5,16 amylasa 0,63 3,42 Ig VH 1,10 4,76 interferon 3,06 5,50

tikají různě rychle u různých skupin ZDROJE CHYBY tikají různě rychle u různých skupin Martin a Palumbi, PNAS USA 90: 4087-4091, 1993 10 hlodavci psi koně husy primati medvědi divergence sekvencí (%/milion let) želvy 1 mloci velryby pstruzi žáby želvy mořské želvy žraloci 0,1 0,01 0,1 1 10 100 1000 10000 100000 tělesná hmotnost (kg)

REKONSTRUKCE FYLOGENEZE S TÍM POČÍTÁ ut Sekvence A Sekvence B Substituční rychlost Časový interval 0,2 B 0,2 B 0,1 0,05 0,3 C 0,2 0,1 X 0,13 D 0,1 D 0,25 C 0,4 0,383 A A

TEST ROVNOMĚRNOSTI CHODU MH Likelihood ratio test δ=2(ln L1-lnL0 ) lnL1….věrohodnost stromu podle složitějšího modelu lnL0….věrohodnost stromu podle jednoduššího modelu , platnosti hodin (nulová hypotéza) Hodnota statistiky δ je vždy větší než 0. Pokud je jednodušší model obsažen ve složitějším modelu, má tato statistika zhruba rozložení χ2 se stupni volnosti odpovídajícími rozdílu v počtu volných parametrů mezi modely (v tomto případě 4).

GLOBÁLNÍ HODINY v1=v2=t1μ v4=v5=t4μ v3=v6+v1=t2μ v8+v4=v7+v6+v1=t3μ Pokud platí globální hodiny a máme k dispozici alespoň jeden kalibrační bod, můžeme rozpřáhnout t(čas) a μ(substituční rychlost). Protože platí vztahy uvedení níže, nebudeme metodou likelihood optimalizovat délky větví v1-v8 ale časy t1, t3 a t5 udávající hloubky uzlů a jednotnou globální substituční rychlost μ. v1=v2=t1μ v4=v5=t4μ v3=v6+v1=t2μ v8+v4=v7+v6+v1=t3μ t1 t4 t2 t3 t2 je v tomto příkladu kalibrační bod

LOKÁLNÍ HODINY Strom rozdělíme na několik oblastí a v každé předpokládáme platnost lokálních hodin. Pro každou oblast stromu potřebujeme kalibrační bod. μ2 μ1 t1 t4 t2 t3

RELAXOVANÉ HODINY v1=t1μ1 v2=t1μ2 v3=t2μ3 v4=t4μ4 v5=t4μ5 v6=(t2-t1)μ6 Aby byla umožněna různá substituční rychlost a abychom mohli počítat likelihood, přidělují se větvím v1-v8 jejich substituční rychlosti. Ty jsou buď navzájem nezávislé a tahají se z nějakého rozložení, nebo se substituční rychlost dceřiné větve odvíjí od rychlosti mateřské větve podle nějakého vztahu. v1=t1μ1 v2=t1μ2 v3=t2μ3 v4=t4μ4 v5=t4μ5 v6=(t2-t1)μ6 v7=(t3-t2)μ7 v8= (t3-t4)μ8 t1 t4 t2 t3

ZDROJE CHYBY kalibrace Kalibrační body (často fosílie) nutno interpretovat opatrně Datování fosílie je vždy nepřesné (konfidenční interval) Postavení fosílie na stromu je obtížné určit. Sedí někde na větvi ne přesne na uzlu Fosílie ukazují na spodní hranici vzniku skupiny a nevíme, jak dlouho se daná skupina organizmů vyskytovala předtím než je první známá fosílie.

ZDROJE CHYBY kalibrace Kalibrační body (často fosílie) nutno interpretovat opatrně Naopak např. vznik ostrova, na kterém skupina organizmů vznikla udává horní hranici jejího vzniku.

KONFIDENČNÍ INTERVALY

PŘÍKLAD Epidemie HIV a hepatitidy C v nemocnici Al-Fateh v Benhazi, Libye - 1998

PŘÍKLAD

MOLEKULÁRNÍ HODINY – SHRNUTÍ Tikají nepravidelně, v jednotlivých genech a liniích jdou nestejně rychle Rychlost hodin se mění během evoluce Nutnost kalibrace a kalibrační body třeba interpretovat uvážlivě Výsledkem není jedna hodnota, ale interval. Intervaly bývají obvykle nepříjemně široké, ale i tak mohou někdy přinést odpověď na otázku. Čím více dat tím užší budou intervaly spolehlivosti Lepší široké intervaly, které obsahují skutečnou hodnotu (složitější modely) než užší intervaly, které jsou zcela špatně (jednoduché, nesprávně zvolené modely)

Mikrosatelity

RESTRIKČNÍ ANALÝZY VNTR – Variable Number of Tantem Repeats Využívá polymorfismus v počtu kopií tandemových repetic – minisatelitů (10-60 nt). Tento polymorfismus je velmi variabilní i mezi jedinci téhož druhu. Celkovou DNA naštípeme restrikční endonukleázou, která neštěpí uvnitř minisatelitu. Naštípanou DNA přeblotujeme na membránu a hybridizujeme se značenou próbou proti minisatelitu, pokud chceme zviditelnit všechny lokusy (obrázek v pravo), nebo proti minisatelitu a unikátní sekvenci v sousedství, pokud chceme zviditelnit jen jeden lokus (obrázek dole).

FORENZNÍ GENETIKA

IDENTIFIKACE

URČOVÁNÍ RODIČOVSTVÍ Stejně jako v případě identifikace se používají obvykle mikrosatelity a VNTR (minisatelity). Po odečtení znaků pocházejících od matky (M) musí ostatní znaky pocházet od otce (Pα nebo Pβ). Pravděpodobnost otcovství se vypočte na základě těchto znaků stejně jako v případě identifikace jedince.

HUSICE SNĚŽNÁ

RUSKÁ CARSKÁ RODINA Car Mikuláš II a jeho rodina – carevna Alexandra a děti Olga, Tatiana, Maria, Anastasia a carevič Alexej.

MT DNA, CONTROLNÍ OBLAST Kontrolní oblast (D-loop) nejpolymorfnější objast mtDNA HAPLOTYP: polymorfismy na jediné chromatidě, které jsou statisticky sdruženy.

Frekvence obvyklejšího haplotypu cara (C) = 0,08% Frekvence haplotypu carevny = 0.05% Pravděpodobnost, že to nejsou Romanovci, ale náhodní lidé = 0,08 * 0,05 = 0,004 %

RUSKÁ CARSKÁ RODINA Pravděpodobnost, že vzorek je potomken cara a carveny / pravděpodobnost, že je nepříbuzný = 4*1012 80*1012

RUSKÁ CARSKÁ RODINA 17 mikrosatelitních lokusů na Y chromozomu ukázalo příbuznost Cara Mikuláše, careviče Alexeje a Andreje Andrejeviče Romanova (Californie) ukázalo naprostou shodu. Mezi 10 243 haplotypy Y chromozomu v databázi YHDR nebyl ani jeden shodný s tímto haplotypem.

RUSKÁ CARSKÁ RODINA

DNA BARCODING http://www.barcodeoflife.org/