Statistické metody pro testování asociace genů a nemocí Jana Zvárová
Statistické metody pro testování asociace genů a nemocí Literatura: Zvárová J.: Základy statistiky pro biomedicínské obory, Univerzita Karlova v Praze, Nakladatelství Karolinum 2004 (Kapitola 1, Kapitola 3, Kapitola 4 (4.1, 4.3), Kapitola 7, Kapitola 10, Kapitola 11) Zvárová J., Mazura I.: Stochastická genetika, Univerzita Karlova v Praze, Nakladatelství Karolinum 2002 (Kapitola 2 ( 2.1.2, 2.1.3, 2.5) Kapitola 4, Kapitola 6, Dodatek A.1
Hlavní histokompatibilní systém člověka (HLA) Reprezentuje antigeny, které jsou produkty genů určité oblasti chromozomů. Systém HLA člověka je skupina genů, které se nacházejí na krátkém ramenu chromozómu 6. Soubor alel HLA na jednom chromozómu (haplotyp HLA) se prakticky vždy odevzdává z generace na generaci jako celek. Proto má každý jedinec jeden haplotyp společný s každým rodičem. Je tedy 25% pravděpodobnost, že dva sourozenci se budou shodovat v obou haplotypech, a tím ve všech antigenech systému HLA.
Genetická charakteristika populace Odráží frekvence jednotlivých alel každého jedince v populaci v daném genetickém lokusu. Frekvence alely v populaci je výsledkem působení faktorů dědičnosti faktorů vnějšího prostředí.
Genetický drift Genetický drift :Náhodná změna pravděpodobnosti výskytu alely v populaci. Ztráta alely Fixace alely Vazebná nerovnováha
Hardyova-Weinbergerova rovnováha Uvažujme k alel A1, A2, ..., Ak s pravděpodobnostmi výskytu 1, 2, ...,k = 1. Hardyova-Weinbergerova rovnováha označuje stav, kdy genotypy vznikají nezávislým kombinováním alel. tedy pravděpodobnosti výskytu genotypu AiAj jsou ii = i2 a ij = 2ij pro i<j.
Příklad vylučovatelství skupinově specifických substancí Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se,se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). Ve skupině 162 dětí jejichž rodiče byli heterozygotní vylučovatelé bylo nalezeno 68 heterozygotních vylučovatelů, 46 nevylučovatelů a 48 homozygotních vylučovatelů. Ověřte na 5% hladině významnosti, zda lze předpokládat platnost Hardyovy-Weinbergovy rovnováhy.
Příklad vylučovatelství skupinově specifických substancí Počet nevylučovatelů (46), homozygotních (48) a heterozygotních (68) vylučovatelů.
Pozorované a očekávané četnosti nevylučovatelů, homozygotních a heterozygotních vylučovatelů ve skupině 162 dětí. Skupina homozygotní vylučovatel (Se, Se) heterozygotní vylučovatel (Se, se) nevylučovatel (se,se) Celkem Pozorované četnosti 48 68 46 162 Očekávané četnosti 40,5 81 2 = 4,22 Nezjistili jsme statisticky významnou odchylku od Hardyovy-Weinbergovy rovnováhy na 5% hladině.
Metoda porovnávání genotypových frekvencí antigenu u nemocných Antigenový lokus A A přítomnost HLA alely a nepřítomnost HLA alely Lokus nemoci D D přítomnost alely nemoci d nepřítomnost alely nemoci
Modely dědičnosti Recesivní model Penetrance jsou pravděpodobnosti výskytu nemoci N u jedince s možnými genotypy DD, Dd, dd . f2 = P(NDD) f1 = P(NDd) f0 = P(Ndd) k je pravděpodobnost, že alela obsahující alelu D obsahuje i alelu A Recesivní model f2 > f1 = f0 Dominantní model f2 = f1 >f0 Intermediární model f2 > f1 >f0 Aditivní model f2 > f1 >f0 a f2 =2 f1 . Striktně před názvem modelu znamená, že f0=0.
Modely dědičnosti Sledovaná nemoc vykazuje asociaci s určitým antigenem A systému HLA, ale při konfrontaci s reálnými daty výskyt alely A u nemocných neodpovídá žádnému modelu dědičnosti. Předpokládejme, že antigen A je ve vazbě s jiným genem D, který skutečně způsobuje danou nemoc.Tento gen nemusí být ze systému HLA a my jej neznáme. Máme-li k dispozici naměřená data, která uvádějí počty nemocných s určitým genotypem vzhledem k lokusu A, můžeme odhadnout očekávané počty nemocných pro různé chování genu D.
Odhady parametru k ve skupině n nemocných s pozorovanými četnostmi antigenových tříd nAA, nAa, naa Striktně recesivní model (MLE) Striktně aditivní a striktně dominantní s malou pravděpodobností P(D) Striktně aditivní (MOM) kSR = (2nAA+ nAa)/2n kSD = řešení kvadratické rovnice, není nestranný odhad kSA = ((2nAA+ nAa)/n)-P(A)
Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001 Příklad: Odhadněte model dědičnosti antigenu BfF1 z dat o výskytu inzulinově závislého diabetu mellitus pro A=BfF1,P(A)=0,129 Model k nAA nAa naa 2 p Striktně recesivní (MLE) 0,520 13,80 25,46 11,77 0,19 0,666 Striktně aditivní (MLE) 0,761 5,00 35,57 10,63 14,76 0,001 Striktně aditivní (MOM) 0,910 5,99 41,02 3,99 25,33 Pozorování - 13 27 11
Přímé ověřování asociace HLA antigenu a nemoci Příklad: Z dat populační ověřte na 5% hladině významnosti hypotézu, že procento osob s antigenem HLA-DR4 je stejné u nemocných progresivní polyartritídou a zdravých osob.
Progresivní polyartritída Výskyt antigenu HLA-DR4 u nemocných progresivní polyartritídou a zdravých kontrol Skupina HLA-DR4 pozitivní (%) negativní (%) Celkem (%) Progresivní polyartritída 46 (14,94) 28 (9,09) 74 (24,03) Zdravé kontroly 50 (16,23) 184 (59,74) 234 (75,97) 212 (68,83) 96 (31,17) 308 2 = 43,61 , p<0,0001 Procenta HLA-DR4 pozitivních ve skupinách se statisticky významně liší na 5% hladině.
LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172 Příklad. Z dat v souboru 172 osob, u nichž byly sledovány genotypy DQ, LDLR, GYPA, HBGG, D7S8 a GC, ověřte nulovou hypotézu o nezávislosti genů LDLR a HBGG na 5% hladině významnosti. U obou genů označíme A a a jejich alely. Pozorované četnosti tabulka. LDLR HBGG AA Aa aa Celkem 6 16 10 32 47 17 80 11 33 60 96 43 172 2 = 1,39 , p = 0,850 Hypotézu o nezávislosti obou genů tedy nezamítáme na 5% hladině významnosti.
Genetická identifikace jedince Analýza příbuzenství Jak jsou lidé příbuzní? Genetická evidence Věrohodnostní poměr
Co je věrohodnostní poměr LR (Likelihood Ratio) LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B) k pravděpodobnosti, že se jev vyskytne, když podmínka neplatí (jev ¬B). LR = P(A|B) / P(A|¬B)
Co je věrohodnostní poměr LR tak může například porovnávat dvě možná vysvětlení zjištěných údajů Příklad: Muž a dítě mají stejnou alelu Q (jev A) Vysvětlení: muž je otcem (jev B) muž není otcem (jev ¬B)
Genetická informace při určování otcovství Určování otcovství na základě genetických poznatků probíhá ve třech krocích: Pokus o vyloučení označeného muže z otcovství; Stanovení pravděpodobnosti otcovství pokud nebylo možno označeného muže vyloučit; Pozitivní určení otcovství.
A. Vyloučení otcovství V tomto případě se u dítěte, jeho matky a muže označeného za otce stanoví krevní a sérová skupina, HLA antigeny, polymorfismy DNA a další znaky. Při vylučování otcovství předpokládáme, že Matka dítěte je nesporná; Můžeme zanedbat existenci mutací; Všechny varianty při vyšetřování genetických systémů lze spolehlivě určit.
Dva způsoby vyloučení otcovství Z otcovství je vyloučen muž, o kterém můžeme s určitostí tvrdit, že nemá ve svém genotypu alelu, kterou má dítě, přičemž ji nemohlo zdědit od matky. Vidíme, že jsou dva způsoby, jak otcovství vyloučit: Ani matka ani označený muž nemají alelu, kterou má dítě; Dítě nemá ve svém genotypu alelu, kterou by mu označený muž, kdyby byl otcem musel předat.
Fenotypy mužů vyloučených z otcovství v sérovém systému Hp s alelami Hp1 a Hp2
Vylučovací schopnost polymorfismu Vylučovací schopnost polymorfismu udává pravděpodobnost, že pomocí vyšetření určitého polymorfismu se podaří vyloučit otcovství. Je tím větší, čím je v tomto polymorfismu více heterozygotů v populaci. Tuto pravděpodobnost lze vypočítat, jsou-li splněny ještě dva další předpoklady. Populace, ze které pochází testované osoby, je panmiktická; Známe pravděpodobnosti jednotlivých genů nebo máme jejich kvalitní odhady.
Pravděpodobnosti vyloučení z otcovství, spočtené pouze ze znalosti fenotypu matky a dítěte, při vyšetření alel systému Hp, kde P(Hp1)= a P(Hp2)= (1- )
Pokud pravděpodobnost vyloučení z otcovství (při znalosti fenotypu matky a dítěte) vyjde malá a označený muž nemá fenotyp, který by jej vyloučil z otcovství, uvažovaný genetický systém příliš k určení otcovství nepřispívá. Pi je pravděpodobnost vyloučení v i-tém genetickém systému; Uvažujeme k-nezávislých systémů; Kombinovaná pravděpodobnost vyloučení z otcovství je P=1-[(1-P1)...(1- Pk)].
Vylučovací schopnost Vi pro i-tý genetický systém Vi je spočtena jako Pravděpodobnost fenotypové kombinace matky a dítěte X Pravděpodobnost Pi vyloučení z otcovství i-tým systémem
Kombinovaná vylučovací schopnost V pro k nezávislých genetických systémů V=1- [ (1-V1)… (1-Vk)] V praxi se dá spočítat, že vylučovací schopnost všech krevních skupinových systémů, sérových skupin, známých enzymových variant a HLA systému je větší než 99 %. Pokud by se tedy používaly všechny tyto polymorfismy, nebylo by možno vyloučit z otcovství méně než 1 % ze všech neprávem označených mužů.
Výpočet vylučovací schopnosti Vi systému Hp Vi=(1-)[1-(1-)]
B.Stanovení pravděpodobnosti otcovství Používá se Essen-Möllerův postup založený na Bayesově vzorci. Kromě výše uvedených předpokladů dále předpokládáme, že známe: Apriorní pravděpodobnost P(O), že označený muž je otcem; Podmíněnou pravděpodobnost P(AlO) výskytu fenotypu A v případě, že označený muž je otcem; Podmíněnou pravděpodobnost P(Al¬O) výskytu fenotypu A v případě, že označený muž není otcem. Potom pro P(O)=0,5 dostáváme P(OlA) = P(AlO) / [P(AlO)+P(A)]=1/(1+W), kde W= P(A)/P(AlO) je kritická hodnota pravděpodobnosti otcovství
Výpočet pravděpodobnosti otcovství označeného muže v systému Hp, kde Apriorní pravděpodobnost P(O), že označený muž je otcem, je P(O)=0,5; Populační pravděpodobnost výskytu alely Hp1 je P(Hp1)= =0,387; Označený muž, stejně jako dítě i jeho matka mají fenotyp (Hp1, Hp1). Potom podle výše uvedeného postupu dopočítáme P(Ol(Hp1, Hp1) = 0,8065.
P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] . Výpočet pravděpodobnosti otcovství pro více nezávislých genetických systémů Označme Wi kritickou hodnotu otcovství pro sledovanou hodnotu fenotypu Ai v i-tém genetickém systému. Potom za předpokladu nezávislosti k sledovaných systémů dostáváme celkovou pravděpodobnost otcovství jako P(Ol(A1,A2,...,Ak) = 1/[1+W1+…+Wk] . V praxi se takto spočtená pravděpodobnost posuzuje v kontextu s pravděpodobností polysomatického srovnávání. Tím se vyřeší velká část sporných případů paternity.
C. Pozitivní určení otcovství Metoda, která umožní určit otcovství označeného muže téměř s jistotou. Opírá se o vyšetření hypervariabilních DNA minisatelitů pomocí hybridizace se speciální sondou. Sonda detekuje současně několik desítek (40-60) hypervariabilních oblastí v DNA, které se v autoradiogramu projeví jako série několika desítek pruhů - DNA obtisků. Tato metoda určování sporného otcovství se pokládá za velmi spolehlivou. Je však finančně a metodicky velmi náročná.
Výpočet věrohodnostního poměr pro paternitu pro konkrétní genotypy Data: Matka=PS, Dítě=PQ, Muž=RQ při vysvětlení 1: muž je otcem dítěte (2ps)(2qr)(1/4) PS RQ PQ PS PQ RQ při vysvětlení 2: muž není otcem dítěte; přítomnost Q je náhoda (2ps)(2qr)(q/2) LR=1/(2q) Pro q=1/20, data 10 krát více svědčí pro vysvětlení, že muž je otcem
Index paternity PI = X/Y, kde X=P(genotypů| muž je otec) Y=P(genotypů| muž není otec) Interpretace: Věrohodnost pro paternitu oproti věrohodnosti bez paternity za předpokladu, že zbývající evidence je stejně rozdělena Evidence je PI krát charakterističtější pro paternitu
Příklad Použijme data, která shromáždili Velemínský a Dobisíková (Současná česká antropologie, Masarykova univerzita, Brno 1994), když se zabývali příbuzností kosterních pozůstatků z rodinné hrobky Šporků. Použili kombinaci 4 epigenetických znaků (foramen fortale, foramen ethmoidale, foramenpalatinum minus, foramen spinosum incompl.), jejichž populační pravděpodobnosti jsou po řadě 0,415, 0,481, 0,176 a 0,182.
Příklad Pravděpodobnost současného výskytu těchto znaků v populaci (jev G) je dána součinem těchto pravděpodobností, tedy hodnotou P(G) =0, 006394, což je P(G/¬O), kde jev O znamená „je otcem“ a jev ¬O znamená „není otcem“. Když u každého znaku předpokládáme, že mohl být zděděn po otci s pravděpodobností 0,5, pak pro čtveřicí nezávislých znaků dostaneme P(G/O)=0,54=0,0625. Odtud je pravděpodobnost, že Josef Špork je opravdu otcem Moritze Šporka P(OlG) = P(GlO) / [P(GlO)+P(G)]=1/(1+W), kde W= P(G)/P(GlO), tedy P(OlG)=1/(1+(0, 006394/0,0625))=0,907, tedy pravděpodobnost, že Josef Špork je opravdu otcem Moritze Sporka je 0,907.