Statistické metody pro testování asociace genů a nemocí

Statistické metody pro testování asociace genů a nemocí
Jana Zvárová

Statistické metody pro testování asociace genů a nemocí
Literatura: Zvárová J.: Základy statistiky pro biomedicínské obory, Univerzita Karlova v Praze, Nakladatelství Karolinum 2004 (Kapitola 1, Kapitola 3, Kapitola 4 (4.1, 4.3), Kapitola 7, Kapitola 10, Kapitola 11) Zvárová J., Mazura I.: Stochastická genetika, Univerzita Karlova v Praze, Nakladatelství Karolinum 2002 (Kapitola 2 ( 2.1.2, 2.1.3, 2.5) Kapitola 4, Kapitola 6, Dodatek A.1

Hlavní histokompatibilní systém člověka (HLA)
Reprezentuje antigeny, které jsou produkty genů určité oblasti chromozomů. Systém HLA člověka je skupina genů, které se nacházejí na krátkém ramenu chromozómu 6. Soubor alel HLA na jednom chromozómu (haplotyp HLA) se prakticky vždy odevzdává z generace na generaci jako celek. Proto má každý jedinec jeden haplotyp společný s každým rodičem. Je tedy 25% pravděpodobnost, že dva sourozenci se budou shodovat v obou haplotypech, a tím ve všech antigenech systému HLA.

Genetická charakteristika populace
Odráží frekvence jednotlivých alel každého jedince v populaci v daném genetickém lokusu. Frekvence alely v populaci je výsledkem působení faktorů dědičnosti faktorů vnějšího prostředí.

Genetický drift Genetický drift :Náhodná změna pravděpodobnosti výskytu alely v populaci. Ztráta alely Fixace alely Vazebná nerovnováha

Hardyova-Weinbergerova rovnováha
Uvažujme k alel A1, A2, ..., Ak s pravděpodobnostmi výskytu 1, 2, ...,k = 1. Hardyova-Weinbergerova rovnováha označuje stav, kdy genotypy vznikají nezávislým kombinováním alel. tedy pravděpodobnosti výskytu genotypu AiAj jsou ii = i2 a ij = 2ij pro i<j.

Příklad vylučovatelství skupinově specifických substancí
Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se,se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Ve skupině 162 dětí jejichž rodiče byli heterozygotní vylučovatelé bylo nalezeno 68 heterozygotních vylučovatelů, 46 nevylučovatelů a 48 homozygotních vylučovatelů. Ověřte na 5% hladině významnosti, zda lze předpokládat platnost Hardyovy-Weinbergovy rovnováhy.

Příklad vylučovatelství skupinově specifických substancí
Počet nevylučovatelů (46), homozygotních (48) a heterozygotních (68) vylučovatelů.

Pozorované a očekávané četnosti nevylučovatelů, homozygotních a heterozygotních vylučovatelů ve skupině 162 dětí. Skupina homozygotní vylučovatel (Se, Se) heterozygotní vylučovatel (Se, se) nevylučovatel (se,se) Celkem Pozorované četnosti 48 68 46 162 Očekávané četnosti 40,5 81 2 = 4,22 Nezjistili jsme statisticky významnou odchylku od Hardyovy-Weinbergovy rovnováhy na 5% hladině.

Metoda porovnávání genotypových frekvencí antigenu u nemocných
Antigenový lokus A A přítomnost HLA alely a nepřítomnost HLA alely Lokus nemoci D D přítomnost alely nemoci d nepřítomnost alely nemoci

Modely dědičnosti Recesivní model
Penetrance jsou pravděpodobnosti výskytu nemoci N u jedince s možnými genotypy DD, Dd, dd . f2 = P(NDD) f1 = P(NDd) f0 = P(Ndd) k je pravděpodobnost, že alela obsahující alelu D obsahuje i alelu A Recesivní model f2 > f1 = f0 Dominantní model f2 = f1 >f0 Intermediární model f2 > f1 >f0 Aditivní model f2 > f1 >f0 a f2 =2 f1 . Striktně před názvem modelu znamená, že f0=0.

Modely dědičnosti Sledovaná nemoc vykazuje asociaci s určitým antigenem A systému HLA, ale při konfrontaci s reálnými daty výskyt alely A u nemocných neodpovídá žádnému modelu dědičnosti. Předpokládejme, že antigen A je ve vazbě s jiným genem D, který skutečně způsobuje danou nemoc.Tento gen nemusí být ze systému HLA a my jej neznáme. Máme-li k dispozici naměřená data, která uvádějí počty nemocných s určitým genotypem vzhledem k lokusu A, můžeme odhadnout očekávané počty nemocných pro různé chování genu D.

Odhady parametru k ve skupině n nemocných s pozorovanými četnostmi antigenových tříd nAA, nAa, naa
Striktně recesivní model (MLE) Striktně aditivní a striktně dominantní s malou pravděpodobností P(D) Striktně aditivní (MOM) kSR = (2nAA+ nAa)/2n kSD = řešení kvadratické rovnice, není nestranný odhad kSA = ((2nAA+ nAa)/n)-P(A)

Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001
Příklad: Odhadněte model dědičnosti antigenu BfF1 z dat o výskytu inzulinově závislého diabetu mellitus pro A=BfF1,P(A)=0,129 Model k nAA nAa naa 2 p Striktně recesivní (MLE) 0,520 13,80 25,46 11,77 0,19 0,666 Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001 Striktně aditivní (MOM) 0,910 5,99 41,02 3,99 25,33 Pozorování - 13 27 11

Přímé ověřování asociace HLA antigenu a nemoci
Příklad: Z dat populační ověřte na 5% hladině významnosti hypotézu, že procento osob s antigenem HLA-DR4 je stejné u nemocných progresivní polyartritídou a zdravých osob.

Progresivní polyartritída
Výskyt antigenu HLA-DR4 u nemocných progresivní polyartritídou a zdravých kontrol Skupina HLA-DR4 pozitivní (%) negativní (%) Celkem (%) Progresivní polyartritída 46 (14,94) 28 (9,09) 74 (24,03) Zdravé kontroly 50 (16,23) 184 (59,74) 234 (75,97) 212 (68,83) 96 (31,17) 308 2 = 43,61 , p<0, Procenta HLA-DR4 pozitivních ve skupinách se statisticky významně liší na 5% hladině.

LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172
Příklad. Z dat v souboru 172 osob, u nichž byly sledovány genotypy DQ, LDLR, GYPA, HBGG, D7S8 a GC, ověřte nulovou hypotézu o nezávislosti genů LDLR a HBGG na 5% hladině významnosti. U obou genů označíme A a a jejich alely. Pozorované četnosti tabulka. LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172 2 = 1,39 , p = 0, Hypotézu o nezávislosti obou genů tedy nezamítáme na 5% hladině významnosti.

Genetická identifikace jedince Analýza příbuzenství
Jak jsou lidé příbuzní? Genetická evidence Věrohodnostní poměr

Co je věrohodnostní poměr LR (Likelihood Ratio)
LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B) k pravděpodobnosti, že se jev vyskytne, když podmínka neplatí (jev ¬B). LR = P(A|B) / P(A|¬B)

Co je věrohodnostní poměr
LR tak může například porovnávat dvě možná vysvětlení zjištěných údajů Příklad: Muž a dítě mají stejnou alelu Q (jev A) Vysvětlení: muž je otcem (jev B) muž není otcem (jev ¬B)

Genetická informace při určování otcovství
Určování otcovství na základě genetických poznatků probíhá ve třech krocích: Pokus o vyloučení označeného muže z otcovství; Stanovení pravděpodobnosti otcovství pokud nebylo možno označeného muže vyloučit; Pozitivní určení otcovství.

A. Vyloučení otcovství V tomto případě se u dítěte, jeho matky a muže označeného za otce stanoví krevní a sérová skupina, HLA antigeny, polymorfismy DNA a další znaky. Při vylučování otcovství předpokládáme, že Matka dítěte je nesporná; Můžeme zanedbat existenci mutací; Všechny varianty při vyšetřování genetických systémů lze spolehlivě určit.

Dva způsoby vyloučení otcovství
Z otcovství je vyloučen muž, o kterém můžeme s určitostí tvrdit, že nemá ve svém genotypu alelu, kterou má dítě, přičemž ji nemohlo zdědit od matky. Vidíme, že jsou dva způsoby, jak otcovství vyloučit: Ani matka ani označený muž nemají alelu, kterou má dítě; Dítě nemá ve svém genotypu alelu, kterou by mu označený muž, kdyby byl otcem musel předat.

Fenotypy mužů vyloučených z otcovství v sérovém systému Hp s alelami Hp1 a Hp2

Vylučovací schopnost polymorfismu
Vylučovací schopnost polymorfismu udává pravděpodobnost, že pomocí vyšetření určitého polymorfismu se podaří vyloučit otcovství. Je tím větší, čím je v tomto polymorfismu více heterozygotů v populaci. Tuto pravděpodobnost lze vypočítat, jsou-li splněny ještě dva další předpoklady. Populace, ze které pochází testované osoby, je panmiktická; Známe pravděpodobnosti jednotlivých genů nebo máme jejich kvalitní odhady.

Pravděpodobnosti vyloučení z otcovství, spočtené pouze ze znalosti fenotypu matky a dítěte, při vyšetření alel systému Hp, kde P(Hp1)=  a P(Hp2)= (1- )

Pokud pravděpodobnost vyloučení z otcovství (při znalosti fenotypu matky a dítěte) vyjde malá a označený muž nemá fenotyp, který by jej vyloučil z otcovství, uvažovaný genetický systém příliš k určení otcovství nepřispívá. Pi je pravděpodobnost vyloučení v i-tém genetickém systému; Uvažujeme k-nezávislých systémů; Kombinovaná pravděpodobnost vyloučení z otcovství je P=1-[(1-P1)...(1- Pk)].

Vylučovací schopnost Vi pro i-tý genetický systém
Vi je spočtena jako Pravděpodobnost fenotypové kombinace matky a dítěte X Pravděpodobnost Pi vyloučení z otcovství i-tým systémem

Kombinovaná vylučovací schopnost V pro k nezávislých genetických systémů
V=1- [ (1-V1)… (1-Vk)] V praxi se dá spočítat, že vylučovací schopnost všech krevních skupinových systémů, sérových skupin, známých enzymových variant a HLA systému je větší než 99 %. Pokud by se tedy používaly všechny tyto polymorfismy, nebylo by možno vyloučit z otcovství méně než 1 % ze všech neprávem označených mužů.

Výpočet vylučovací schopnosti Vi systému Hp Vi=(1-)[1-(1-)]

B.Stanovení pravděpodobnosti otcovství
Používá se Essen-Möllerův postup založený na Bayesově vzorci. Kromě výše uvedených předpokladů dále předpokládáme, že známe: Apriorní pravděpodobnost P(O), že označený muž je otcem; Podmíněnou pravděpodobnost P(AlO) výskytu fenotypu A v případě, že označený muž je otcem; Podmíněnou pravděpodobnost P(Al¬O) výskytu fenotypu A v případě, že označený muž není otcem. Potom pro P(O)=0,5 dostáváme P(OlA) = P(AlO) / [P(AlO)+P(A)]=1/(1+W), kde W= P(A)/P(AlO) je kritická hodnota pravděpodobnosti otcovství

Výpočet pravděpodobnosti otcovství označeného muže v systému Hp, kde
Apriorní pravděpodobnost P(O), že označený muž je otcem, je P(O)=0,5; Populační pravděpodobnost výskytu alely Hp1 je P(Hp1)=  =0,387; Označený muž, stejně jako dítě i jeho matka mají fenotyp (Hp1, Hp1). Potom podle výše uvedeného postupu dopočítáme P(Ol(Hp1, Hp1) = 0,8065.

P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] .
Výpočet pravděpodobnosti otcovství pro více nezávislých genetických systémů Označme Wi kritickou hodnotu otcovství pro sledovanou hodnotu fenotypu Ai v i-tém genetickém systému. Potom za předpokladu nezávislosti k sledovaných systémů dostáváme celkovou pravděpodobnost otcovství jako P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] . V praxi se takto spočtená pravděpodobnost posuzuje v kontextu s pravděpodobností polysomatického srovnávání. Tím se vyřeší velká část sporných případů paternity.

C. Pozitivní určení otcovství
Metoda, která umožní určit otcovství označeného muže téměř s jistotou. Opírá se o vyšetření hypervariabilních DNA minisatelitů pomocí hybridizace se speciální sondou. Sonda detekuje současně několik desítek (40-60) hypervariabilních oblastí v DNA, které se v autoradiogramu projeví jako série několika desítek pruhů - DNA obtisků. Tato metoda určování sporného otcovství se pokládá za velmi spolehlivou. Je však finančně a metodicky velmi náročná.

Výpočet věrohodnostního poměr pro paternitu pro konkrétní genotypy
Data: Matka=PS, Dítě=PQ, Muž=RQ při vysvětlení 1: muž je otcem dítěte (2ps)(2qr)(1/4) PS RQ PQ PS PQ RQ při vysvětlení 2: muž není otcem dítěte; přítomnost Q je náhoda (2ps)(2qr)(q/2) LR=1/(2q) Pro q=1/20, data 10 krát více svědčí pro vysvětlení, že muž je otcem

Index paternity PI = X/Y, kde X=P(genotypů| muž je otec)
Y=P(genotypů| muž není otec) Interpretace: Věrohodnost pro paternitu oproti věrohodnosti bez paternity za předpokladu, že zbývající evidence je stejně rozdělena Evidence je PI krát charakterističtější pro paternitu

Příklad Použijme data, která shromáždili Velemínský a Dobisíková (Současná česká antropologie, Masarykova univerzita, Brno 1994), když se zabývali příbuzností kosterních pozůstatků z rodinné hrobky Šporků. Použili kombinaci 4 epigenetických znaků (foramen fortale, foramen ethmoidale, foramenpalatinum minus, foramen spinosum incompl.), jejichž populační pravděpodobnosti jsou po řadě 0,415, 0,481, 0,176 a 0,182.

Příklad Pravděpodobnost současného výskytu těchto znaků v populaci (jev G) je dána součinem těchto pravděpodobností, tedy hodnotou P(G) =0, , což je P(G/¬O), kde jev O znamená „je otcem“ a jev ¬O znamená „není otcem“. Když u každého znaku předpokládáme, že mohl být zděděn po otci s pravděpodobností 0,5, pak pro čtveřicí nezávislých znaků dostaneme P(G/O)=0,54=0,0625. Odtud je pravděpodobnost, že Josef Špork je opravdu otcem Moritze Šporka P(OlG) = P(GlO) / [P(GlO)+P(G)]=1/(1+W), kde W= P(G)/P(GlO), tedy P(OlG)=1/(1+(0, /0,0625))=0,907, tedy pravděpodobnost, že Josef Špork je opravdu otcem Moritze Sporka je 0,907.

Statistické metody pro testování asociace genů a nemocí

Podobné prezentace

Prezentace na téma: "Statistické metody pro testování asociace genů a nemocí"— Transkript prezentace:

Podobné prezentace

O projektu

Kontaktní formulář

Přihlásit se

Přihlásit se přes sociální síť:

Statistické metody pro testování asociace genů a nemocí

Podobné prezentace

Prezentace na téma: "Statistické metody pro testování asociace genů a nemocí"— Transkript prezentace:

Podobné prezentace

O projektu

Kontaktní formulář