statistické parametry STR typingu

Slides:



Advertisements
Podobné prezentace
AUTOR: Ing. Helena Zapletalová
Advertisements

Statistická indukce Teorie odhadu.
Statistické metody pro testování asociace genů a nemocí
Testování neparametrických hypotéz
Fylogeografie Studuje geografickou strukturaci populací Navazuje na evoluční biologii, ochranu živ. prostř., taxonomii.
POPULAČNÍ GENETIKA 3 Pravděpodobnost v genetice populací
GENETIKA POPULACÍ 9 KVANTITATIVNÍCH ZNAKŮ
Polymorfismy DNA a jejich využití ve forenzní genetice
POPULAČNÍ GENETIKA 6 faktory narušující rovnováhu populací
Prof. Ing. Václav Řehout, CSc.
Prof. Ing. Václav Řehout, CSc.
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Statistická chyba a hladina statistické významnosti
Hardy – Weibergův zákon
Markery asistovaná selekce
Stránky o genetice Testy z genetiky
Genetika populací, rodokmen
Testování hypotéz vymezení důležitých pojmů
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Název školy: Střední odborná škola stavební Karlovy Vary, Sabinovo náměstí 16, Karlovy Vary Autor: ING. JANA KOVAŘÍKOVÁ Název materiálu: VY_32_INOVACE_11_MARKETINGOVÝ.
Řízení a supervize v sociálních a zdravotnických organizacích
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Autor: Mgr. Tomáš Hasík Určení: Septima, III.G
Autor: Mgr. Tomáš Hasík Určení: Septima, III.G
Kontingenční tabulky Závislost dvou kvalitativních proměnných.
Využití v systematické biologii
Pravděpodobnost a genetická prognóza
Projekt OP VK č. CZ.1.07/1.5.00/ Šablony Mendelova střední škola, Nový Jičín Tento projekt je spolufinancován ESF a státním rozpočtem ČR. Byl uskutečněn.
Genetická diverzita hospodářských zvířat
Markery asistovaná selekce - MAS
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Genetická variabilita populací  Pacient je obrazem rodiny a následně populace, ke které patří  Distribuci genů v populaci, a to jak jsou četnosti genů.
Populační genetika.
Populační genetika.
Genetika populací kvalitativních znaků
GENETICKÁ A FENOTYPOVÁ
 VZNIK GENETICKÉ PROMĚNLIVOSTI = nejdůležitější mikroevoluční
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Ochrana rostlinného a živočišného genofondu
NÁHODNÉ PROCESY V POPULACÍCH NÁHODNÉ PROCESY V POPULACÍCH Náhodný výběr gamet z genofondu:
PSY717 – statistická analýza dat
Základy pedagogické metodologie
Analýza populační variability a struktury
Příklady z populační genetiky
Mendelistická genetika
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
Populační genetika Fenotypy, genotypy RNDr Z.Polívková
Inferenční statistika - úvod
Populace a krevní skupiny Autor: Mgr. Jitka MaškováDatum: Gymnázium, Třeboň, Na Sadech 308.
EU peníze středním školám Název vzdělávacího materiálu: Genetika populací – řešené příklady Číslo vzdělávacího materiálu: ICT10/14 Šablona: III/2 Inovace.
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Genetika populací Doc. Ing. Karel Mach, Csc.. Genetika populací Populace = každá větší skupina organismů (rostlin, zvířat,…) stejného původu (rozšířená.
Testování hypotéz Testování hypotéz o rozdílu průměrů  t-test pro nezávislé výběry  t-test pro závislé výběry.
EU peníze středním školám Název vzdělávacího materiálu: Genetika populací – teoretický základ Číslo vzdělávacího materiálu: ICT10 /13 Šablona: III/2 Inovace.
NÁZEV ŠKOLY: ČÍSLO PROJEKTU: NÁZEV MATERIÁLU: TÉMA SADY: ROČNÍK:
Induktivní statistika
Induktivní statistika
Gymnázium, Třeboň, Na Sadech 308
Gymnázium, Třeboň, Na Sadech 308
- váhy jednotlivých studií
Hardyův – Weinbergův zákon genetické rovnováhy v populacích
Základy zpracování geologických dat Rozdělení pravděpodobnosti
GENETICKÁ A FENOTYPOVÁ
Typy proměnných Kvalitativní/kategorická binární - ano/ne
Neparametrické testy pro porovnání polohy
7. Kontingenční tabulky a χ2 test
Induktivní statistika
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Transkript prezentace:

statistické parametry STR typingu

STR typing a statistika Mám typický multialelický autozomální STR lokus „A“ známo je celkem 9 alel (1-9) každá z těchto alel má nějakou frekvenci ve studované populaci 1 2 3 4 5 6 7 8 9 0,02 0,08 0,11 0,24 0,09 0,21 0,15 0,01 Jak ale vlastně zjistím frekvenci alel v populaci? → musím udělat populační studii

Co to je „REPREZENTATIVNÍ VZOREK“? Co to je „DOSTATEČNĚ VELKÝ“? Populační studie „Vezmi reprezentativní vzorek dostatečně velký, aby tvá data byla relevantní, a genotypuj ho.“ Co to je „REPREZENTATIVNÍ VZOREK“? → jen sladké mámení... nikdy nemáme plně reprezentativní vzorek dané populace, můžeme se mu jen blížit JAKÉ BUDOU HLAVNÍ POŽADAVKY NA REPREZENTATIVNOST? Co to je „DOSTATEČNĚ VELKÝ“? → záleží na nás, s jakou přesností chceme získat údaj o alelických frekvencích – čím větší vzorek, tím přesnější data (tzn. menší SD) a tím menší problém s řídkými tabulkami (viz později) MOHU DOSÁHNOUT 100% PŘESNOSTI ZÍSKANÝCH DAT?

Populační studie každou osobu genotypuji – tzn. stanovím sestavu jejích alel stanovím četnost výskytu každé alely POZOR! – heterozygot 2/3 – započítávám 1x alelu 2 a 1x alelu 3 homozygot 3/3 – započítávám 2x alelu 3 pak stanovím frekvence jednotlivých alel – pro alelu X platí: P(X) = n(X) / N 1 2 3 4 5 6 7 8 9 32 44 48 36 42 60 400 0,02 0,08 0,11 0,24 0,09 0,21 0,15 0,01

K tomu potřebujeme v populační genetice Svatý Grál Populační studie ..tolik stanovení frekvence alel. Toto mohu udělat u jakéhokoli polymorfismu, mohu to udělat u libovolného genetického markeru, biochemického markeru, morfologického markeru, mohu to udělat i pro polymorfismus barvy auta atd. Ale to je jen začátek! Už známe frekvence, ale teď musíme ověřit, jak se alely chovají, abychom mohli dále hodnotit K tomu potřebujeme v populační genetice Svatý Grál CO JE SVATÝM GRÁLEM POPULAČNÍ GENETIKY?

HW - equilibrium Ve skutečnosti žádná populace v HWE neexistuje  pouze se jí některé blíží Co jsou základní předpoklady HWE? nekonečná velikost populace žádné mutace žádná selekce náhodný pohlavní výběr ALE toto je jeden nesmysl větší než druhý!

NEKONEČNÁ VELIKOST POPULACE HW - equilibrium NEKONEČNÁ VELIKOST POPULACE Nekonečnost populace je nezbytným předpokladem, který eliminuje náhodné změny frekvencí alel JAK TAKOVÝM NÁHODNÝM ZMĚNÁM ŘÍKÁME? Každá populace je konečná = je tvořena konečným počtem jedinců, nicméně má-li alespoň rozumnou velikost, je vliv driftu zanedbatelný a HWE poskytuje dobré odhady (Mluvit o HWE v Zadní Lhotě pod Kulíškem, kde žije 5 lidí a 3 psi, je nesmysl… )

MOHOU EXISTOVAT POLYMORFNÍ STR LOKUSY, KTERÉ NEMUTUJÍ? HW - equilibrium ŽÁDNÉ MUTACE Neexistence mutací je dalším nezbytným předpokladem, který eliminuje náhodné změny frekvencí alel MOHOU EXISTOVAT POLYMORFNÍ STR LOKUSY, KTERÉ NEMUTUJÍ? Opět platí, že dochází-li k mutacím pouze v rozumné míře, je jejich vliv zanedbatelný a HWE poskytuje dobré odhady (Což takhle odborná studie alelických změn populace Černobylského okrsku za posledních 30 let…)

HW - equilibrium ŽÁDNÁ SELEKCE Neexistence selekce je nezbytným předpokladem, který eliminuje nenáhodné změny frekvencí alel Jednotlivé alely samy o sobě nesmějí přinášet nějakou selekční výhodu resektive nevýhodu. EXISTUJÍ STR LOKUSY, KTERÉ TOTO PŘINÁŠEJÍ? Pokud samy alely nejsou předmětem selekce, nesmí se tímto předmětem selekce stát ani nepřímo – nesmí existovat genová vazba mezi daným STR lokusem a nějakým funkčním genem, který je selektován JAK NAZÝVÁME TUTO NEPŘÍMOU SELEKCI? (Mohou se někdy v budoucnu stát i nekódující STR samy o sobě předmětem selekce? „Vzhledem k vysoké homozygozitě Vašich STR lokusů jste byl z výběrového řízení na místo ředitele ZOO vyřazen.“) ŽÁDNÁ SELEKCE

HW - equilibrium NÁHODNÝ POHLAVNÍ VÝBĚR Neexistence závislého výběru partnera je dalším nezbytným předpokladem, který eliminuje nenáhodné změny frekvencí alel Jednotlivé alely samy o sobě nesmějí být předmětem pohlavního výběru. Pokud samy alely nejsou předmětem PV, nesmí se tímto předmětem PV stát ani nepřímo – nesmí existovat genová vazba mezi daným STR lokusem a nějakým funkčním genem, který je PV (Mohou se někdy v budoucnu stát i nekódující STR samy o sobě předmětem PV? „Blondýna, 30 let, příslušnice mitotypu Uršula, by se ráda seznámila se sportovně založeným nositelem Y-haplotypu J2. Zn. Společná evoluce.“)

HW - equilibrium p2 + 2pq + q2 = 1 p2 + q2 + r2 + 2pq + 2pr + 2qr = 1 VÝSLEDEK V populaci, která je z hlediska sledovaného lokusu v HW rovnováze, se vše řídí jednoduchou kombinatorikou a teorií pravděpodobnosti – jako „házení kostkami“ Frekvence jednotlivých genotypů lze vidět jako polynom n-tého stupně, kde n je počet alel u 2 alel p2 + 2pq + q2 = 1 u 3 alel p2 + q2 + r2 + 2pq + 2pr + 2qr = 1

HW - equilibrium frekvence homozygotů P/P je p2 VÝSLEDEK OBECNĚ BUDE PLATIT, ŽE: frekvence homozygotů P/P je p2 frekvence heterozygotů P/Q je 2pq počet osob, které nemají žádnou alelu P, je (1-p) 2 počet osob, které mají alespoň jednu alelu P, je 1-(1-p) 2 počet osob, které nemají žádnou alelu P ani Q, je (1-p-q) 2 počet osob, které mají alespoň jednu alelu P nebo Q, je 1-(1-p-q) 2 MAGICKÝ ČTVEREC

Father gametes (sperm) Resulting genotype combinations and frequencies Mother gametes (egg) AA Aa p2 2pq aa q2 A a p q AA aA A p2 qp p Father gametes (sperm) a Aa aa q pq q2 Figure 19.3 A cross-multiplication (Punnett) square showing Hardy-Weinberg frequencies resulting from combining two alleles A and a with frequencies p and q, respectively. Note that p + q = 1 and that the Hardy-Weinberg genotype proportions are simply a binomial expansion of (p+q)2, or p2 + 2pq + q2. Punnett square Freq (A) = p Freq (a) = q p + q = 1 (p + q)2 = p2 + 2pq + q2 Figure 19.3, J.M. Butler (2005) Forensic DNA Typing, 2nd Edition © 2005 Elsevier Academic Press

NĚKOLIK jednoduchých ÚLOH mám tyto frekvence alel: 1 2 3 4 5 6 7 8 9 0,02 0,08 0,11 0,24 0,09 0,21 0,15 0,01 kolik % je v populaci osob s genotypem 9/9 ? kolik % osob má alespoň jednu alelu 4 ? kolik % osob má právě jednu alelu 8 ? kolik % osob má všechny alely kratší než 6? (tzn. má jen alely 1,2,3,4,5) kolik % spermií v celé populaci nese alelu 7 ?

HW - equilibrium frekvence homozygotů P/P je p2 OVĚŘENÍ PLATÍ-LI V POPULACI HWE, MUSÍ PLATIT: frekvence homozygotů P/P je p2 frekvence heterozygotů P/Q je 2pq pro všechny genotypy dané populace Porovnám, jak moc se tyto očekávané frekvence budou blížit skutečným frekvencím

mám lokus A s alelami 1 (p1=0,1), 2 (p2=0,3) a 3 (p3=0,6) HW - equilibrium OVĚŘENÍ mám lokus A s alelami 1 (p1=0,1), 2 (p2=0,3) a 3 (p3=0,6) genotyp 1/1 2/2 3/3 1/2 1/3 2/3 Očekávaná četnost 0,01 0,09 0,36 0,06 0,12 Pozorovaná četnost 0,02 0,39 0,13 0,34 rozdíl 0,03 musím posoudit, zda tyto rozdíly mezi očekávaným a pozorovaným mohou být pouze dílem náhody, či zda jsou signifikantní a ukazují, že HWE neplatí jak? - 2

Důsledky pro forenzní výpočty HW - equilibrium Důsledky pro forenzní výpočty pokud zjistím, že pro lokus HWE neplatí, nemohu ho používat pro testování, protože nemohu počítat frekvence jednotlivých genotypů pokud zjistím, že pro lokus HWE platí, pracuji při hodnocení důkazů s frekvencemi tak, jak je počítá HWE