Statistické metody pro testování asociace genů a nemocí

Slides:



Advertisements
Podobné prezentace
AUTOR: Ing. Helena Zapletalová
Advertisements

Registrační číslo projektu: CZ.1.07/1.5.00/ Číslo DUM:
Dědičnost krevních skupin
Testování parametrických hypotéz
Testování hypotéz Jana Zvárová
Vazba úplná, neúplná, Morgan, Bateson
Genetika člověka.
NORMOVANÉ NORMÁLNÍ ROZDĚLENÍ
POPULAČNÍ GENETIKA 3 Pravděpodobnost v genetice populací
4 Pravděpodobnost a genetické prognózování
Základní genetické pojmy – AZ kvíz
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
POPULAČNÍ GENETIKA 6 faktory narušující rovnováhu populací
Prof. Ing. Václav Řehout, CSc.
Prof. Ing. Václav Řehout, CSc.
Testování závislosti kvalitativních znaků
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
Hardy – Weibergův zákon
Získávání informací Získání informací o reálném systému
Zábavná matematika.
Odhad genetických parametrů
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
Stránky o genetice Testy z genetiky
Genetika populací, rodokmen
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Náhoda, generátory náhodných čísel
Teoretické základy šlechtění lesních dřevin Milan Lstibůrek 2005.
8. listopadu 2004Statistika (D360P03Z) 6. předn.1 chování výběrového průměru nechť X 1, X 2,…,X n jsou nezávislé náhodné veličiny s libovolným rozdělením.
Využití v systematické biologii
1 Škola:Chomutovské soukromé gymnázium Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Moderní škola Název materiálu:VY_32_INOVACE_BIOLOGIE 2_20 Tematická.
Diskrétní rozdělení Karel Zvára 1.
Populační genetika je teoretickým základem šlechtění hospodářských zvířat; umožňuje sledování frekvencí genů a genotypů a tím i cílevědomé řízení změn.
Lineární regresní model Statistická inference Tomáš Cahlík 4. týden.
Genetická variabilita populací  Pacient je obrazem rodiny a následně populace, ke které patří  Distribuci genů v populaci, a to jak jsou četnosti genů.
Test dobré shody Fisherův přesný test McNemar test
Populační genetika.
Heritabilita multifaktoriálních chorob, Dědičnost vázaná na pohlaví
GENETICKÁ A FENOTYPOVÁ
 VZNIK GENETICKÉ PROMĚNLIVOSTI = nejdůležitější mikroevoluční
Ekologie malých populací Jakub Těšitel. Malé populace # stochastická (náhodně podmíněná) dynamika # velké odchylky od Hardy-Weinbergovské rovnováhy #
Výpočty rizik monogenních chorob
Normální rozdělení. U 65 náhodně vybraných živě narozených dětí byla zkoumána jejich porodní hmotnost [g] a délka [cm].
Příklady z populační genetiky
Mendelistická genetika
Vazba genů seminář č. 405 Dědičnost
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
Tvůrce: Mgr. Šárka Vopěnková
2014 Výukový materiál GE Tvůrce: Mgr. Šárka Vopěnková Projekt: S anglickým jazykem do dalších předmětů Registrační číslo: CZ.1.07/1.1.36/
EU peníze středním školám Název vzdělávacího materiálu: Úvod do genetiky – Mendelovská genetika Číslo vzdělávacího materiálu: ICT10 /2 Šablona: III/2 Inovace.
EU peníze středním školám Název vzdělávacího materiálu: Vazba genů – teoretický základ Číslo vzdělávacího materiálu: ICT10/7 Šablona: III/2 Inovace a zkvalitnění.
EU peníze středním školám Název vzdělávacího materiálu: Genetika populací – řešené příklady Číslo vzdělávacího materiálu: ICT10/14 Šablona: III/2 Inovace.
Název školy Gymnázium, střední odborná škola, střední odborné učiliště a vyšší odborná škola, Hořice Číslo projektu CZ.1.07/1.5.00/ Název materiálu.
Genetika populací Doc. Ing. Karel Mach, Csc.. Genetika populací Populace = každá větší skupina organismů (rostlin, zvířat,…) stejného původu (rozšířená.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
EU peníze středním školám Název vzdělávacího materiálu: Genetika populací – teoretický základ Číslo vzdělávacího materiálu: ICT10 /13 Šablona: III/2 Inovace.
Projekt HAPMAP Popis haplotypů
Vazba genů I Autor: Mgr. Jitka MaškováDatum: Gymnázium, Třeboň, Na Sadech 308.
Induktivní statistika
Gymnázium, Třeboň, Na Sadech 308
Gymnázium, Třeboň, Na Sadech 308
Genetika Přírodopis 9. r..
VY_32_INOVACE_19_28_Genetika
Hardyův – Weinbergův zákon genetické rovnováhy v populacích
Gymnázium, Třeboň, Na Sadech 308
Genetické zákony.
Genetika.
7. Kontingenční tabulky a χ2 test
Gymnázium, Třeboň, Na Sadech 308
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Transkript prezentace:

Statistické metody pro testování asociace genů a nemocí Jana Zvárová

Statistické metody pro testování asociace genů a nemocí Literatura: Zvárová J.: Základy statistiky pro biomedicínské obory, Univerzita Karlova v Praze, Nakladatelství Karolinum 2004 (Kapitola 1, Kapitola 3, Kapitola 4 (4.1, 4.3), Kapitola 7, Kapitola 10, Kapitola 11) Zvárová J., Mazura I.: Stochastická genetika, Univerzita Karlova v Praze, Nakladatelství Karolinum 2002 (Kapitola 2 ( 2.1.2, 2.1.3, 2.5) Kapitola 4, Kapitola 6, Dodatek A.1

Hlavní histokompatibilní systém člověka (HLA) Reprezentuje antigeny, které jsou produkty genů určité oblasti chromozomů. Systém HLA člověka je skupina genů, které se nacházejí na krátkém ramenu chromozómu 6. Soubor alel HLA na jednom chromozómu (haplotyp HLA) se prakticky vždy odevzdává z generace na generaci jako celek. Proto má každý jedinec jeden haplotyp společný s každým rodičem. Je tedy 25% pravděpodobnost, že dva sourozenci se budou shodovat v obou haplotypech, a tím ve všech antigenech systému HLA.

Genetická charakteristika populace Odráží frekvence jednotlivých alel každého jedince v populaci v daném genetickém lokusu. Frekvence alely v populaci je výsledkem působení faktorů dědičnosti faktorů vnějšího prostředí.

Genetický drift Genetický drift :Náhodná změna pravděpodobnosti výskytu alely v populaci. Ztráta alely Fixace alely Vazebná nerovnováha

Hardyova-Weinbergerova rovnováha Uvažujme k alel A1, A2, ..., Ak s pravděpodobnostmi výskytu 1, 2, ...,k = 1. Hardyova-Weinbergerova rovnováha označuje stav, kdy genotypy vznikají nezávislým kombinováním alel. tedy pravděpodobnosti výskytu genotypu AiAj jsou ii = i2 a ij = 2ij pro i<j.

Příklad vylučovatelství skupinově specifických substancí Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se,se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Ve skupině 162 dětí jejichž rodiče byli heterozygotní vylučovatelé bylo nalezeno 68 heterozygotních vylučovatelů, 46 nevylučovatelů a 48 homozygotních vylučovatelů. Ověřte na 5% hladině významnosti, zda lze předpokládat platnost Hardyovy-Weinbergovy rovnováhy.

Příklad vylučovatelství skupinově specifických substancí Počet nevylučovatelů (46), homozygotních (48) a heterozygotních (68) vylučovatelů.

Pozorované a očekávané četnosti nevylučovatelů, homozygotních a heterozygotních vylučovatelů ve skupině 162 dětí. Skupina homozygotní vylučovatel (Se, Se) heterozygotní vylučovatel (Se, se) nevylučovatel (se,se) Celkem Pozorované četnosti 48 68 46 162 Očekávané četnosti 40,5 81 2 = 4,22 Nezjistili jsme statisticky významnou odchylku od Hardyovy-Weinbergovy rovnováhy na 5% hladině.

Metoda porovnávání genotypových frekvencí antigenu u nemocných Antigenový lokus A A přítomnost HLA alely a nepřítomnost HLA alely Lokus nemoci D D přítomnost alely nemoci d nepřítomnost alely nemoci

Modely dědičnosti Recesivní model Penetrance jsou pravděpodobnosti výskytu nemoci N u jedince s možnými genotypy DD, Dd, dd . f2 = P(NDD) f1 = P(NDd) f0 = P(Ndd) k je pravděpodobnost, že alela obsahující alelu D obsahuje i alelu A Recesivní model f2 > f1 = f0 Dominantní model f2 = f1 >f0 Intermediární model f2 > f1 >f0 Aditivní model f2 > f1 >f0 a f2 =2 f1 . Striktně před názvem modelu znamená, že f0=0.

Modely dědičnosti Sledovaná nemoc vykazuje asociaci s určitým antigenem A systému HLA, ale při konfrontaci s reálnými daty výskyt alely A u nemocných neodpovídá žádnému modelu dědičnosti. Předpokládejme, že antigen A je ve vazbě s jiným genem D, který skutečně způsobuje danou nemoc.Tento gen nemusí být ze systému HLA a my jej neznáme. Máme-li k dispozici naměřená data, která uvádějí počty nemocných s určitým genotypem vzhledem k lokusu A, můžeme odhadnout očekávané počty nemocných pro různé chování genu D.

Odhady parametru k ve skupině n nemocných s pozorovanými četnostmi antigenových tříd nAA, nAa, naa Striktně recesivní model (MLE) Striktně aditivní a striktně dominantní s malou pravděpodobností P(D) Striktně aditivní (MOM) kSR = (2nAA+ nAa)/2n kSD = řešení kvadratické rovnice, není nestranný odhad kSA = ((2nAA+ nAa)/n)-P(A)

Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001 Příklad: Odhadněte model dědičnosti antigenu BfF1 z dat o výskytu inzulinově závislého diabetu mellitus pro A=BfF1,P(A)=0,129 Model k nAA nAa naa 2 p Striktně recesivní (MLE) 0,520 13,80 25,46 11,77 0,19 0,666 Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001 Striktně aditivní (MOM) 0,910 5,99 41,02 3,99 25,33 Pozorování - 13 27 11

Přímé ověřování asociace HLA antigenu a nemoci Příklad: Z dat populační ověřte na 5% hladině významnosti hypotézu, že procento osob s antigenem HLA-DR4 je stejné u nemocných progresivní polyartritídou a zdravých osob.

Progresivní polyartritída Výskyt antigenu HLA-DR4 u nemocných progresivní polyartritídou a zdravých kontrol Skupina HLA-DR4 pozitivní (%) negativní (%) Celkem (%) Progresivní polyartritída 46 (14,94) 28 (9,09) 74 (24,03) Zdravé kontroly 50 (16,23) 184 (59,74) 234 (75,97) 212 (68,83) 96 (31,17) 308 2 = 43,61 , p<0,0001 Procenta HLA-DR4 pozitivních ve skupinách se statisticky významně liší na 5% hladině.

LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172 Příklad. Z dat v souboru 172 osob, u nichž byly sledovány genotypy DQ, LDLR, GYPA, HBGG, D7S8 a GC, ověřte nulovou hypotézu o nezávislosti genů LDLR a HBGG na 5% hladině významnosti. U obou genů označíme A a a jejich alely. Pozorované četnosti tabulka. LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172 2 = 1,39 , p = 0,850 Hypotézu o nezávislosti obou genů tedy nezamítáme na 5% hladině významnosti.

Genetická identifikace jedince Analýza příbuzenství Jak jsou lidé příbuzní? Genetická evidence Věrohodnostní poměr

Co je věrohodnostní poměr LR (Likelihood Ratio) LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B) k pravděpodobnosti, že se jev vyskytne, když podmínka neplatí (jev ¬B). LR = P(A|B) / P(A|¬B)

Co je věrohodnostní poměr LR tak může například porovnávat dvě možná vysvětlení zjištěných údajů Příklad: Muž a dítě mají stejnou alelu Q (jev A) Vysvětlení: muž je otcem (jev B) muž není otcem (jev ¬B)

Genetická informace při určování otcovství Určování otcovství na základě genetických poznatků probíhá ve třech krocích: Pokus o vyloučení označeného muže z otcovství; Stanovení pravděpodobnosti otcovství pokud nebylo možno označeného muže vyloučit; Pozitivní určení otcovství.

A. Vyloučení otcovství V tomto případě se u dítěte, jeho matky a muže označeného za otce stanoví krevní a sérová skupina, HLA antigeny, polymorfismy DNA a další znaky. Při vylučování otcovství předpokládáme, že Matka dítěte je nesporná; Můžeme zanedbat existenci mutací; Všechny varianty při vyšetřování genetických systémů lze spolehlivě určit.

Dva způsoby vyloučení otcovství Z otcovství je vyloučen muž, o kterém můžeme s určitostí tvrdit, že nemá ve svém genotypu alelu, kterou má dítě, přičemž ji nemohlo zdědit od matky. Vidíme, že jsou dva způsoby, jak otcovství vyloučit: Ani matka ani označený muž nemají alelu, kterou má dítě; Dítě nemá ve svém genotypu alelu, kterou by mu označený muž, kdyby byl otcem musel předat.

Fenotypy mužů vyloučených z otcovství v sérovém systému Hp s alelami Hp1 a Hp2

Vylučovací schopnost polymorfismu Vylučovací schopnost polymorfismu udává pravděpodobnost, že pomocí vyšetření určitého polymorfismu se podaří vyloučit otcovství. Je tím větší, čím je v tomto polymorfismu více heterozygotů v populaci. Tuto pravděpodobnost lze vypočítat, jsou-li splněny ještě dva další předpoklady. Populace, ze které pochází testované osoby, je panmiktická; Známe pravděpodobnosti jednotlivých genů nebo máme jejich kvalitní odhady.

Pravděpodobnosti vyloučení z otcovství, spočtené pouze ze znalosti fenotypu matky a dítěte, při vyšetření alel systému Hp, kde P(Hp1)=  a P(Hp2)= (1- )

Pokud pravděpodobnost vyloučení z otcovství (při znalosti fenotypu matky a dítěte) vyjde malá a označený muž nemá fenotyp, který by jej vyloučil z otcovství, uvažovaný genetický systém příliš k určení otcovství nepřispívá. Pi je pravděpodobnost vyloučení v i-tém genetickém systému; Uvažujeme k-nezávislých systémů; Kombinovaná pravděpodobnost vyloučení z otcovství je P=1-[(1-P1)...(1- Pk)].

Vylučovací schopnost Vi pro i-tý genetický systém Vi je spočtena jako Pravděpodobnost fenotypové kombinace matky a dítěte X Pravděpodobnost Pi vyloučení z otcovství i-tým systémem

Kombinovaná vylučovací schopnost V pro k nezávislých genetických systémů V=1- [ (1-V1)… (1-Vk)] V praxi se dá spočítat, že vylučovací schopnost všech krevních skupinových systémů, sérových skupin, známých enzymových variant a HLA systému je větší než 99 %. Pokud by se tedy používaly všechny tyto polymorfismy, nebylo by možno vyloučit z otcovství méně než 1 % ze všech neprávem označených mužů.

Výpočet vylučovací schopnosti Vi systému Hp Vi=(1-)[1-(1-)]

B.Stanovení pravděpodobnosti otcovství Používá se Essen-Möllerův postup založený na Bayesově vzorci. Kromě výše uvedených předpokladů dále předpokládáme, že známe: Apriorní pravděpodobnost P(O), že označený muž je otcem; Podmíněnou pravděpodobnost P(AlO) výskytu fenotypu A v případě, že označený muž je otcem; Podmíněnou pravděpodobnost P(Al¬O) výskytu fenotypu A v případě, že označený muž není otcem. Potom pro P(O)=0,5 dostáváme P(OlA) = P(AlO) / [P(AlO)+P(A)]=1/(1+W), kde W= P(A)/P(AlO) je kritická hodnota pravděpodobnosti otcovství

Výpočet pravděpodobnosti otcovství označeného muže v systému Hp, kde Apriorní pravděpodobnost P(O), že označený muž je otcem, je P(O)=0,5; Populační pravděpodobnost výskytu alely Hp1 je P(Hp1)=  =0,387; Označený muž, stejně jako dítě i jeho matka mají fenotyp (Hp1, Hp1). Potom podle výše uvedeného postupu dopočítáme P(Ol(Hp1, Hp1) = 0,8065.

P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] . Výpočet pravděpodobnosti otcovství pro více nezávislých genetických systémů Označme Wi kritickou hodnotu otcovství pro sledovanou hodnotu fenotypu Ai v i-tém genetickém systému. Potom za předpokladu nezávislosti k sledovaných systémů dostáváme celkovou pravděpodobnost otcovství jako P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] . V praxi se takto spočtená pravděpodobnost posuzuje v kontextu s pravděpodobností polysomatického srovnávání. Tím se vyřeší velká část sporných případů paternity.

C. Pozitivní určení otcovství Metoda, která umožní určit otcovství označeného muže téměř s jistotou. Opírá se o vyšetření hypervariabilních DNA minisatelitů pomocí hybridizace se speciální sondou. Sonda detekuje současně několik desítek (40-60) hypervariabilních oblastí v DNA, které se v autoradiogramu projeví jako série několika desítek pruhů - DNA obtisků. Tato metoda určování sporného otcovství se pokládá za velmi spolehlivou. Je však finančně a metodicky velmi náročná.

Výpočet věrohodnostního poměr pro paternitu pro konkrétní genotypy Data: Matka=PS, Dítě=PQ, Muž=RQ při vysvětlení 1: muž je otcem dítěte (2ps)(2qr)(1/4) PS RQ PQ PS PQ RQ při vysvětlení 2: muž není otcem dítěte; přítomnost Q je náhoda (2ps)(2qr)(q/2) LR=1/(2q) Pro q=1/20, data 10 krát více svědčí pro vysvětlení, že muž je otcem

Index paternity PI = X/Y, kde X=P(genotypů| muž je otec) Y=P(genotypů| muž není otec) Interpretace: Věrohodnost pro paternitu oproti věrohodnosti bez paternity za předpokladu, že zbývající evidence je stejně rozdělena Evidence je PI krát charakterističtější pro paternitu

Příklad Použijme data, která shromáždili Velemínský a Dobisíková (Současná česká antropologie, Masarykova univerzita, Brno 1994), když se zabývali příbuzností kosterních pozůstatků z rodinné hrobky Šporků. Použili kombinaci 4 epigenetických znaků (foramen fortale, foramen ethmoidale, foramenpalatinum minus, foramen spinosum incompl.), jejichž populační pravděpodobnosti jsou po řadě 0,415, 0,481, 0,176 a 0,182.

Příklad Pravděpodobnost současného výskytu těchto znaků v populaci (jev G) je dána součinem těchto pravděpodobností, tedy hodnotou P(G) =0, 006394, což je P(G/¬O), kde jev O znamená „je otcem“ a jev ¬O znamená „není otcem“. Když u každého znaku předpokládáme, že mohl být zděděn po otci s pravděpodobností 0,5, pak pro čtveřicí nezávislých znaků dostaneme P(G/O)=0,54=0,0625. Odtud je pravděpodobnost, že Josef Špork je opravdu otcem Moritze Šporka P(OlG) = P(GlO) / [P(GlO)+P(G)]=1/(1+W), kde W= P(G)/P(GlO), tedy P(OlG)=1/(1+(0, 006394/0,0625))=0,907, tedy pravděpodobnost, že Josef Špork je opravdu otcem Moritze Sporka je 0,907.