Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Statistické metody pro testování asociace genů a nemocí Jana Zvárová.

Podobné prezentace


Prezentace na téma: "Statistické metody pro testování asociace genů a nemocí Jana Zvárová."— Transkript prezentace:

1 Statistické metody pro testování asociace genů a nemocí Jana Zvárová

2 Statistické metody pro testování asociace genů a nemocí Literatura: Zvárová J.: Základy statistiky pro biomedicínské obory, Univerzita Karlova v Praze, Nakladatelství Karolinum 2004 (Kapitola 1, Kapitola 3, Kapitola 4 (4.1, 4.3), Kapitola 7, Kapitola 10, Kapitola 11) Zvárová J., Mazura I.: Stochastická genetika, Univerzita Karlova v Praze, Nakladatelství Karolinum 2002 (Kapitola 2 ( 2.1.2, 2.1.3, 2.5) Kapitola 4, Kapitola 6, Dodatek A.1

3 Hlavní histokompatibilní systém člověka (HLA) •Reprezentuje antigeny, které jsou produkty genů určité oblasti chromozomů. –Systém HLA člověka je skupina genů, které se nacházejí na krátkém ramenu chromozómu 6. •Soubor alel HLA na jednom chromozómu (haplotyp HLA) se prakticky vždy odevzdává z generace na generaci jako celek. –Proto má každý jedinec jeden haplotyp společný s každým rodičem. Je tedy 25% pravděpodobnost, že dva sourozenci se budou shodovat v obou haplotypech, a tím ve všech antigenech systému HLA.

4 Genetická charakteristika populace •Odráží frekvence jednotlivých alel každého jedince v populaci v daném genetickém lokusu. •Frekvence alely v populaci je výsledkem působení –faktorů dědičnosti –faktorů vnějšího prostředí.

5 Genetický drift •Genetický drift :Náhodná změna pravděpodobnosti výskytu alely v populaci. –Ztráta alely –Fixace alely –Vazebná nerovnováha

6 Hardyova-Weinbergerova rovnováha •Uvažujme k alel A 1, A 2,..., A k s pravděpodobnostmi výskytu  1,  2,...,  k = 1. •Hardyova-Weinbergerova rovnováha označuje stav, kdy genotypy vznikají nezávislým kombinováním alel. –tedy pravděpodobnosti výskytu genotypu A i A j jsou  ii =  i 2 a  ij = 2  i  j pro i

7 Příklad vylučovatelství skupinově specifických substancí •Vylučovatelství skupinově specifických substancí ABH je podmíněno dominantní alelou Se, nevylučovatelství je podmíněno recesivní alelou se. Jestliže rodiče jsou heterozygotní vylučovatelé (Se, se), jejich potomek může být nevylučovatel (se,se), homozygotní vylučovatel (Se, Se) nebo heterozygotní vylučovatel (Se, se). •Ve skupině 162 dětí jejichž rodiče byli heterozygotní vylučovatelé bylo nalezeno 68 heterozygotních vylučovatelů, 46 nevylučovatelů a 48 homozygotních vylučovatelů. Ověřte na 5% hladině významnosti, zda lze předpokládat platnost Hardyovy-Weinbergovy rovnováhy.

8 Příklad vylučovatelství skupinově specifických substancí Počet nevylučovatelů (46), homozygotních (48) a heterozygotních (68) vylučovatelů.

9 Pozorované a očekávané četnosti nevylučovatelů, homozygotních a heterozygotních vylučovatelů ve skupině 162 dětí.  2 = 4,22 Nezjistili jsme statisticky významnou odchylku od Hardyovy-Weinbergovy rovnováhy na 5% hladině. Skupina homozygotní vylučovatel (Se, Se) heterozygotní vylučovatel (Se, se) nevylučovatel (se,se) Celkem Pozorované četnosti Očekávané četnosti 40,58140,5162

10 •Antigenový lokus A –A přítomnost HLA alely –a nepřítomnost HLA alely •Lokus nemoci D –D přítomnost alely nemoci –d nepřítomnost alely nemoci Metoda porovnávání genotypových frekvencí antigenu u nemocných

11 Penetrance jsou pravděpodobnosti výskytu nemoci N u jedince s možnými genotypy DD, Dd, dd. f 2 = P(N  DD) f 1 = P(N  Dd) f 0 = P(N  dd) k je pravděpodobnost, že alela obsahující alelu D obsahuje i alelu A Recesivní model f 2 > f 1 = f 0 Dominantní model f 2 = f 1 >f 0 Intermediární model f 2 > f 1 >f 0 Aditivní model f 2 > f 1 >f 0 a f 2 =2 f 1. Striktně před názvem modelu znamená, že f 0 =0. Modely dědičnosti

12 •Sledovaná nemoc vykazuje asociaci s určitým antigenem A systému HLA, ale při konfrontaci s reálnými daty výskyt alely A u nemocných neodpovídá žádnému modelu dědičnosti. •Předpokládejme, že antigen A je ve vazbě s jiným genem D, který skutečně způsobuje danou nemoc.Tento gen nemusí být ze systému HLA a my jej neznáme. •Máme-li k dispozici naměřená data, která uvádějí počty nemocných s určitým genotypem vzhledem k lokusu A, můžeme odhadnout očekávané počty nemocných pro různé chování genu D. Modely dědičnosti

13 Odhady parametru k ve skupině n nemocných s pozorovanými četnostmi antigenových tříd n AA, n Aa, n aa •Striktně recesivní model (MLE) •Striktně aditivní a striktně dominantní s malou pravděpodobností P(D) •Striktně aditivní (MOM) k SR = (2n AA + n Aa )/2n k SD = řešení kvadratické rovnice, není nestranný odhad k SA = ((2n AA + n Aa )/n)-P(A)

14 Příklad: Odhadněte model dědičnosti antigenu BfF1 z dat o výskytu inzulinově závislého diabetu mellitus pro A=BfF1,P(A)=0,129 Modelkn AA n Aa n aa 22 p Striktně recesivní (MLE) 0,52013,8025,4611,770,190,666 Striktně aditivní (MLE) 0,7615,0035,5710,6314,760,001 Striktně aditivní (MOM) 0,9105,9941,023,9925,330,001 Pozorování

15 Přímé ověřování asociace HLA antigenu a nemoci •Příklad: Z dat populační ověřte na 5% hladině významnosti hypotézu, že procento osob s antigenem HLA-DR4 je stejné u nemocných progresivní polyartritídou a zdravých osob.

16 SkupinaHLA-DR4 pozitivní (%) HLA-DR4 negativní (%) Celkem (%) Progresivní polyartritída 46 (14,94)28 (9,09)74 (24,03) Zdravé kontroly 50 (16,23)184 (59,74)234 (75,97) Celkem212 (68,83)96 (31,17)308  2 = 43,61, p<0,0001 Procenta HLA-DR4 pozitivních ve skupinách se statisticky významně liší na 5% hladině. Výskyt antigenu HLA-DR4 u nemocných progresivní polyartritídou a zdravých kontrol

17 Příklad. Z dat v souboru 172 osob, u nichž byly sledovány genotypy DQ , LDLR, GYPA, HBGG, D7S8 a GC, ověřte nulovou hypotézu o nezávislosti genů LDLR a HBGG na 5% hladině významnosti. U obou genů označíme A a a jejich alely. Pozorované četnosti tabulka.  2 = 1,39, p = 0,850 Hypotézu o nezávislosti obou genů tedy nezamítáme na 5% hladině významnosti. LDLR HBGG AAAaAaaCelkem AA AaAa a Celkem

18 •Jak jsou lidé příbuzní? –Genetická evidence –Věrohodnostní poměr Genetická identifikace jedince Analýza příbuzenství

19 •LR udává podíl pravděpodobnosti, že se vyskytne nějaký jev A za určité podmínky (jev B) k pravděpodobnosti, že se jev vyskytne, když podmínka neplatí (jev ¬B). LR = P(A|B) / P(A|¬B) Co je věrohodnostní poměr LR (Likelihood Ratio)

20 •LR tak může například porovnávat dvě možná vysvětlení zjištěných údajů Příklad: Muž a dítě mají stejnou alelu Q (jev A) Vysvětlení: –muž je otcem (jev B) –muž není otcem (jev ¬B) Co je věrohodnostní poměr

21 Určování otcovství na základě genetických poznatků probíhá ve třech krocích: A.Pokus o vyloučení označeného muže z otcovství; B.Stanovení pravděpodobnosti otcovství pokud nebylo možno označeného muže vyloučit; C.Pozitivní určení otcovství. Genetická informace při určování otcovství

22 •V tomto případě se u dítěte, jeho matky a muže označeného za otce stanoví krevní a sérová skupina, HLA antigeny, polymorfismy DNA a další znaky. Při vylučování otcovství předpokládáme, že –Matka dítěte je nesporná; –Můžeme zanedbat existenci mutací; –Všechny varianty při vyšetřování genetických systémů lze spolehlivě určit. A. Vyloučení otcovství

23 •Z otcovství je vyloučen muž, o kterém můžeme s určitostí tvrdit, že nemá ve svém genotypu alelu, kterou má dítě, přičemž ji nemohlo zdědit od matky. Vidíme, že jsou dva způsoby, jak otcovství vyloučit: –Ani matka ani označený muž nemají alelu, kterou má dítě; –Dítě nemá ve svém genotypu alelu, kterou by mu označený muž, kdyby byl otcem musel předat. Dva způsoby vyloučení otcovství

24 Fenotypy mužů vyloučených z otcovství v sérovém systému Hp s alelami Hp1 a Hp2

25 •Vylučovací schopnost polymorfismu udává pravděpodobnost, že pomocí vyšetření určitého polymorfismu se podaří vyloučit otcovství. Je tím větší, čím je v tomto polymorfismu více heterozygotů v populaci. Tuto pravděpodobnost lze vypočítat, jsou-li splněny ještě dva další předpoklady. –Populace, ze které pochází testované osoby, je panmiktická; –Známe pravděpodobnosti jednotlivých genů nebo máme jejich kvalitní odhady. Vylučovací schopnost polymorfismu

26 Pravděpodobnosti vyloučení z otcovství, spočtené pouze ze znalosti fenotypu matky a dítěte, při vyšetření alel systému Hp, kde P(Hp1)=  a P(Hp2)= (1-  )

27 Pokud pravděpodobnost vyloučení z otcovství (při znalosti fenotypu matky a dítěte) vyjde malá a označený muž nemá fenotyp, který by jej vyloučil z otcovství, uvažovaný genetický systém příliš k určení otcovství nepřispívá. •P i je pravděpodobnost vyloučení v i-tém genetickém systému; •Uvažujeme k-nezávislých systémů; •Kombinovaná pravděpodobnost vyloučení z otcovství je P=1-[(1-P 1 )...(1- P k )].

28 Vylučovací schopnost V i pro i-tý genetický systém •V i je spočtena jako Pravděpodobnost fenotypové kombinace matky a dítěte X Pravděpodobnost P i vyloučení z otcovství i-tým systémem

29 Kombinovaná vylučovací schopnost V pro k nezávislých genetických systémů V=1- [ (1-V 1 )… (1-V k )] •V praxi se dá spočítat, že vylučovací schopnost všech krevních skupinových systémů, sérových skupin, známých enzymových variant a HLA systému je větší než 99 %. •Pokud by se tedy používaly všechny tyto polymorfismy, nebylo by možno vyloučit z otcovství méně než 1 % ze všech neprávem označených mužů.

30 Výpočet vylučovací schopnosti V i systému Hp V i =  (1-  )[1-  (1-  )]

31 •Používá se Essen-Möllerův postup založený na Bayesově vzorci. Kromě výše uvedených předpokladů dále předpokládáme, že známe: –Apriorní pravděpodobnost P(O), že označený muž je otcem; –Podmíněnou pravděpodobnost P(AlO) výskytu fenotypu A v případě, že označený muž je otcem; –Podmíněnou pravděpodobnost P(Al¬O) výskytu fenotypu A v případě, že označený muž není otcem. Potom pro P(O)=0,5 dostáváme P(OlA) = P(AlO) / [P(AlO)+P(A)]=1/(1+W), kde W= P(A)/P(AlO) je kritická hodnota pravděpodobnosti otcovství B.Stanovení pravděpodobnosti otcovství

32 •Apriorní pravděpodobnost P(O), že označený muž je otcem, je P(O)=0,5; •Populační pravděpodobnost výskytu alely Hp1 je P(Hp1)=  =0,387; •Označený muž, stejně jako dítě i jeho matka mají fenotyp (Hp1, Hp1). Potom podle výše uvedeného postupu dopočítáme P(Ol(Hp1, Hp1) = 0,8065. Výpočet pravděpodobnosti otcovství označeného muže v systému Hp, kde

33 •Označme W i kritickou hodnotu otcovství pro sledovanou hodnotu fenotypu A i v i-tém genetickém systému. •Potom za předpokladu nezávislosti k sledovaných systémů dostáváme celkovou pravděpodobnost otcovství jako P(Ol(A 1,A 2,...,A k ) = 1/[1+W 1 +…+W k ]. •V praxi se takto spočtená pravděpodobnost posuzuje v kontextu s pravděpodobností polysomatického srovnávání. Tím se vyřeší velká část sporných případů paternity. Výpočet pravděpodobnosti otcovství pro více nezávislých genetických systémů

34 •Metoda, která umožní určit otcovství označeného muže téměř s jistotou. Opírá se o vyšetření hypervariabilních DNA minisatelitů pomocí hybridizace se speciální sondou. Sonda detekuje současně několik desítek (40-60) hypervariabilních oblastí v DNA, které se v autoradiogramu projeví jako série několika desítek pruhů - DNA obtisků. •Tato metoda určování sporného otcovství se pokládá za velmi spolehlivou. Je však finančně a metodicky velmi náročná. C. Pozitivní určení otcovství

35 Výpočet věrohodnostního poměr pro paternitu pro konkrétní genotypy Data: Matka=PS, Dítě=PQ, Muž=RQ –při vysvětlení 1: muž je otcem dítěte •(2ps)(2qr)(1/4) PSPS PQ RQ –při vysvětlení 2: muž není otcem dítěte; přítomnost Q je náhoda •(2ps)(2qr)(q/2) •LR=1/(2q) –Pro q=1/20, data 10 krát více svědčí pro vysvětlení, že muž je otcem PSRQ PQ

36 Index paternity •PI = X/Y, kde –X=P(genotypů| muž je otec) –Y=P(genotypů| muž není otec) •Interpretace: –Věrohodnost pro paternitu oproti věrohodnosti bez paternity za předpokladu, že zbývající evidence je stejně rozdělena –Evidence je PI krát charakterističtější pro paternitu

37 Příklad •Použijme data, která shromáždili Velemínský a Dobisíková (Současná česká antropologie, Masarykova univerzita, Brno 1994), když se zabývali příbuzností kosterních pozůstatků z rodinné hrobky Šporků. Použili kombinaci 4 epigenetických znaků (foramen fortale, foramen ethmoidale, foramenpalatinum minus, foramen spinosum incompl.), jejichž populační pravděpodobnosti jsou po řadě 0,415, 0,481, 0,176 a 0,182.

38 •Pravděpodobnost současného výskytu těchto znaků v populaci (jev G) je dána součinem těchto pravděpodobností, tedy hodnotou P(G) =0, , což je P(G/¬O), kde jev O znamená „je otcem“ a jev ¬O znamená „není otcem“. •Když u každého znaku předpokládáme, že mohl být zděděn po otci s pravděpodobností 0,5, pak pro čtveřicí nezávislých znaků dostaneme P(G/O)=0,5 4 =0,0625. •Odtud je pravděpodobnost, že Josef Špork je opravdu otcem Moritze Šporka P(OlG) = P(GlO) / [P(GlO)+P(G)]=1/(1+W), kde W= P(G)/P(GlO), tedy P(OlG)=1/(1+(0, /0,0625))=0,907, tedy pravděpodobnost, že Josef Špork je opravdu otcem Moritze Sporka je 0,907. Příklad


Stáhnout ppt "Statistické metody pro testování asociace genů a nemocí Jana Zvárová."

Podobné prezentace


Reklamy Google