Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Měření asociací v epidemiologických studiích Marek Malý.

Podobné prezentace


Prezentace na téma: "Měření asociací v epidemiologických studiích Marek Malý."— Transkript prezentace:

1 Měření asociací v epidemiologických studiích Marek Malý

2 Individuální a skupinová data Klinický přístup (=individuální) –Lékař vždy léčí konkrétního pacienta, ale každý pacient se podstatným způsobem v mnoha rysech liší od jiných pacientů Skupinový přístup –Vzhledem k velké variabilitě biologického materiálu nevyplývá z jednoho pozorování žádná obecná informace. Nutno popsat a porovnat rozložení dat u skupin osob.

3 Zabývá se studiem a kvantifikací výskytu nemocí ve skupinách lidí. Soustřeďuje se na vyhodnocování hypotéz o příčinách nemocí a hledá souvislosti mezi výskytem nemoci a charakteristikami osob a jejich životního prostředí. Epidemiologie

4 Formulace teoretického problému Formulace pracovních hypotéz Stanovení primárních a sekundárních cílů studie Rozhodnutí o cílové a studované populaci, opora výběru Plán studie, rozsah výběru Rozhodnutí o technice sběru informací Konstrukce nástrojů pro tento sběr (dotazníky, …) Pilotní studie / Předvýzkum Sběr dat Vkládání dat do počítače, kontrola chyb Vlastní analýza dat Interpretace, závěry, případné zobecnění Kroky při realizaci studie

5 OBSERVAČNÍ (POZOROVACÍ) [DESKRIPTIVNÍ, ANALYTICKÉ] »popisy jednotlivých případů či série případů –ekologické studie –průřezové studie –studie případů a kontrol –kohortové studie INTERVENČNÍ (EXPERIMENTÁLNÍ) –klinické studie –terénní intervenční studie Typy epidemiologických studií

6 Kvantitativní (numerické) –diskrétní (zpravidla celočíselné - počty) –spojité (jakákoli hodnota v určitém rozsahu je možná; omezení dáno jen přesností měření) Kvalitativní (kategoriální) –binární (dvě kategorie; ano-ne) –nominální (několik kategorií bez uspořádání) –ordinální (několik kategorií s uspořádáním) Typy jevů a proměnných

7 Popis frekvence výskytu onemocnění: incidence, prevalence Zkoumání vztahu mezi dvěma proměnnými –Expozice (rizik. faktor): ano x ne, příp. ordinální či spojitá vel. –Následek (onemocnění): ano x ne, příp. ordinální veličina Ukazatele asociace (síly vztahu): RR, OR, AR, SMR Testy hypotéz o síle asociace Otázky o kauzalitě Faktory ovlivňující správnou interpretaci zjištěné asociace –zkreslení (bias) –zavádějící faktor (confounder) – „třetí proměnná“ –náhoda (chance) Základní cíle observačních studií

8 Podíl, proporce, rel. četnost (proportion) – bezrozměrný podíl, v němž čitatel je součástí jmenovatele, odhaduje riziko podíl počtu chlapců v celk. počtu narozených dětí Poměr (ratio) –čitatel není součástí jmenovatele; má rozměr poměr počtu narozených dívek k počtu narozených chlapců Míra (rate) –speciální forma podílu zahrnující specifikaci času počet úmrtí na součet osobočasů v riziku Podíl, měra, míra

9 za každou osobu se do ukazatele přičte příspěvek odpovídající délce jejího sledování – „době strávené v riziku“ (ve dnech, v rocích) 12 osob sledovaných po dobu 1 měsíce přispívá stejně jako 1 osoba sledovaná 1 rok u velké populace zhruba stejné jako: průměrná velikost populace x délka sledování významná úloha ve jmenovateli, kde mají být jen osoby „v riziku“ Koncepce osoba-čas (Person-years)

10

11 požadavek kvantifikace výskytu nemoci je v epidemiologickém sledování klíčový je třeba znát – absolutní počet nemocných – velikost populace, z níž nemocní pocházejí – časové období, ve kterém byly údaje shromážděny ukazatelé četnosti (frekvence) nemoci - tzv. ukazatelé nemocnosti - jsou tedy mírou množství nemoci v určitém místě a čase; zpravidla se vyjadřují jako procento či na 1000, resp obyvatel Měření frekvence nemoci

12 Incidence charakterizuje, kolik nových případů se objevilo v populaci v daném časovém intervalu (často roce); vlastně je ukazatelem dynamiky onemocnění, rychlosti nárůstu Prevalence informuje o úrovni nemocnosti v určitém okamžiku, popisuje podíl případů nemoci existujících např. v daném dni (okamžitá), případně měsíci atp. (intervalová) Ukazatele se vztahují na počet exponovaných osob, resp. na součet období, po která byly osoby sledovány (osobočas) Prevalence a incidence

13 počet všech osob se zkoumaným onemocněním ve studované populaci v daném okamžiku (Okamžitá) prevalence = počet osob v populaci ve stejném okamžiku počet případů onemocnění, které se vyskytly ve studované populaci v daném časovém intervalu Intervalová prevalence = součet osobočasů v populaci ve stejném časovém intervalu počet nově zjištěných případů onemocnění ve studované populaci v daném časovém intervalu Incidence = součet osobočasů v populaci ve stejném časovém intervalu počet nově zjištěných případů onemocnění ve studované populaci v daném časovém intervalu Incidence = střední stav studované populace Prevalence a incidence

14

15 Změna incidence odráží změnu v etiologických faktorech (rizikových, protektivních) Změna prevalence odráží změnu v incidenci, v délce trvání onemocnění či v obojím Úroveň prevalence závisí na zakončení nemoci (uzdravení, úmrtí) Pokud jsou prevalence, incidence i délka stabilní a prevalence < 10 %, platí přibližně prevalence  incidence  prům. délka onemocnění Incidence a prevalence

16 Průřezová studie

17 Výběr jedinců do studie probíhá k jednomu časovému okamžiku - obecně bez znalosti expozice a nemoci Může zjišťovat prevalenci jak expozice tak nemoci Vhodné zejména pro nemoci, které nejsou rychle fatální, nevhodné pro vzácné nemoci či expozice +Relativně snadný sběr dat, relativně levné –Citlivé vzhledem ke zkreslení (bias) –Nelze stanovit, zda byla dříve expozice či nemoc (kauzalita) Průřezová studie

18 NHANES (National Health and Nutrition Examination Survey) MONICA Průřezová studie - příklady

19 Kohortová studie

20 PRINCIP: Vytvoření skupin na základě údaje o expozici a kompletní dlouhodobé sledování všech skupin (follow-up) stejným způsobem; možno sledovat (v podobě incidence) celé spektrum následků jedné expozice (více nemocí) Na začátku zařazeny jen osoby bez onemocnění Organizace studie: prospektivní, retrospektivní (historická) +Nejúplnější a flexibilní popis vývoje od expozice k nemoci +Může objasnit časové souvislosti mezi expozicí a nemocí, zachytit dynamiku vzniku zkoumané závislosti +Vhodné pro vzácně se vyskytující expozice (příčiny) +Odolnost vůči výběrovému zkreslení –Naprosto nevhodná pro nemoci se vzácným výskytem –Velké finanční a časové nároky –Validitu narušují ztráty jedinců ze sledování Kohortová studie

21 Nemoc Expozice anone Celkem anoaba+b necdc+d Celkema+cb+dn=a+b+c+d Kohortová studie

22 Nemoc Expozice anone Osobočas anoa-PY 1 nec-PY 0 Celkema+c-T=PY 1 +PY 0 Kohortová studie

23 Studie britských lékařů Studie horníků uranových dolů Framinghamská studie Kohortová studie - příklady

24 Studie případů a kontrol

25 PRINCIP: porovnání podílu osob exponovaných zkoumanému (rizikovému) faktoru ve skupině nemocných (PŘÍPADY) a zdravých (KONTROLY) +Vhodné pro studium incidence nemocí vzácných a s dlouhou latencí +Lze studovat více potenciálních příčin nemoci –Založeno na popisu expozice v minulosti – potenciálně nepřesné záznamy či vzpomínky - zkreslení –Neúplná kontrola vlivu dalších proměnných –Často obtížná volba kontrolní skupiny, ta přitom podstatně ovlivňuje validitu –Nelze přímo popsat incidenci mezi exponovanými a neexponovanými Studie případů a kontrol

26 n=a+b+c+db+da+cCelkem c+ddcne a+bbaano Celkem KONTROLAPŘÍPAD Expozice Status Studie případů a kontrol

27 Kouření a rakovina plic (Doll, Hill, BMJ 1950) Alkohol a rakovina jícnu (viz Breslow, Day I, 1980) Hormonální antikoncepce a infarkt myokardu (Rosenberg, Am. J. Epidemiol. 1980) Konzumace kávy a rakovina slinivky břišní (MacMahon, NEJM, 1981) Studie případů a kontrol - příklady

28 Studie případů a kontrol často slouží k prvnímu prověření hypotézy a z nich vycházejí podrobnější a přesnější kohortové studie. V tzv. vnořené studii případů a kontrol (nested case-control study) jsou případy a kontroly vybírány z již existující kohorty, a je pro ně proto k dispozici základní informace o expozici rizikovým faktorům. Detaily se pak dohledávají jen pro menší počet jedinců zařazených ve vnořené studii (zejména se redukuje počet zdravých), což je výhodné zvláště tehdy, když je dohledání nákladné. Studie případů v kohortě (case-cohort study) je založena na analýze dat osob ze subkohorty (vybrané v úvodu kohortové studie) a všech případů onemocnění. Vztah kohortové studie ke studii případů a kontrol

29 Relativní riziko Poměr šancí Atributivní riziko Standardizovaný úmrtnostní index (SMR) UKAZATELE ASOCIACE

30 RIZIKO (RISK) - pravděpodobnost výskytu sledovaného jevu; odhadujeme ji pomocí relativní četnosti (počet nemocných ku počtu všech osob ve skupině); mezi 0 a 1 V exponované skupině: R 1 =a/(a+b) V neexponované skupině: R 2 =c/(c+d) (ABSOLUTNÍ) RIZIKO

31 Bakteriální infekce močových cest Orální antikoncepce anoneCelkem ano ne Celkem R 1 = 27 / 482 = 0,056 R 2 = 77 / 1908 = 0,040 RR = R 1 / R 2 = 1,39 95% CI: (0,91; 2,13) χ 2 = 2,27; p=0,132 Kohortová studie

32 Interval spolehlivosti pro RR lze použít při testování významnosti: testuje se H 0 : RR=1 (hodnota 1 odpovídá tomu, že není žádný rozdíl v riziku onemocnění mezi exponovanou a neexponovanou populací). Pokud hodnota 1 není pokryta 100(1-α)% intervalem spolehlivosti, nulovou hypotézu lze zamítnout na hladině α [např. 95% CI, α=0,05], v opačném případě H 0 nezamítáme. Oproti p-hodnotě získáme navíc představu o přesnosti odhadu parametru a o tom, zda rozsah výběru byl dostatečně veliký. Interpretace intervalu spolehlivosti

33 poměr rizika onemocnění v exponované a v neexponované populaci ukazatel asociace odhadující sílu vazby mezi expozicí a nemocí vyjadřuje, kolikrát je větší riziko následku u exponovaných v porovnání s neexponovanými RR může nabývat hodnot mezi 0 a nekonečnem RR=1.. není vztah mezi expozicí a následkem RR>1.. pozitivní vztah RR<1.. inverzní vztah (expozice chrání před následkem) Relativní riziko

34 Relativní riziko RR

35 ŠANCE (ODDS) - poměr pravděpodobnosti, že ke sledovanému jevu došlo, vzhledem k pravděpodobnosti, že k tomuto jevu nedošlo (počet nemocných ku počtu zdravých); mezi 0 a nekonečnem V exponované skupině: [a/(a+b)] / [b/(a+b)]=a/b V neexponované skupině: [c/(c+d)] / [d/(c+d)]=c/d Šance (ODDS)

36 Infarkt myokardu Orální antikoncepce ano (případ) ne (kontrola)Celkem ano ne Celkem O 1 = 23 / 304 = 0,076 O 2 = 133 / 2816 = 0,047 OR = O 1 / O 2 = 1,60 95% CI: (0,99; 2,58) χ 2 = 4,13; p=0,042 Studie případů a kontrol

37 Interpretace OR je podobná jako u RR, ovšem s použitím šance místo rizika OR může nabývat hodnot mezi 0 a nekonečnem OR je jediná možnost charakterizace velikosti asociace ve studii případů a kontrol OR je dobrým odhadem relativního rizika, pokud je výskyt onemocnění v populaci relativně nízký U onemocnění s častým výskytem (vysokou prevalencí) je nutno RR a OR považovat za dva různé ukazatele ODDS RATIO – poměr šancí OR

38

39 Disease odds ratio Exposure odds ratio ve studii případů a kontrol se zpravidla z populace nevybírá stejný podíl nemocných a zdravých  odhad relativního rizika by byl zkreslený, lze odhadovat jen podíly exponovaných mezi zdravými a mezi nemocnými ODDS RATIO – poměr šancí OR

40 Sledovaný faktor Úmrtí anone Celkem přítomen nepřítomen Celkem Pravděpodobnost 1/3  šance 1/2; pravděpodobnost 1/100  šance 1/99 Úmrtí: RR=(2/100)/(1/100) = 2; OR=(2/98)/(1/99)  2 Přežití: RR=(98/100)/(99/100)  1; OR=(98/2)/(99/1)  0,5 Vztah mezi šancí a pravděpodobností

41 pravděpodobnost, že za platnosti nulové hypotézy H 0 nastane právě takový výsledek, jaký byl pozorován, nebo ještě extrémnější (tj. vzdálenější od H 0 ) malá p-hodnota svědčí proti platnosti H 0 význam slova „malá“ určuje předem zvolená hladina významnosti α, na níže se testování provádí (typicky α=0.05) kdybychom zvolili hladinu významnosti právě rovnou p-hodnotě, byl by výsledek přesně na hranici statistické významnosti P-hodnota (P-VALUE)

42 Intervaly spolehlivosti

43 Čistě statistickými postupy nelze prokázat, zda vztah mezi veličinami je či není kauzální – testuje se, zda existuje asociace/vazba Čím větší je RR nebo OR, tím lze spíše očekávat, že vztah mezi expozicí a následkem je kauzální, i když tomu tak nemusí být ani u velmi silné vazby Pro úvahy o kauzalitě nutno dále posoudit: časový sled, specificitu (příčiny a následku), soulad s dosud známými fakty, biologickou plausibilitu, konzistenci závěrů různých studií Pro interpretaci je kromě vlastní hodnoty RR (OR) vždy nutná znalost intervalu spolehlivosti a rozsahu výběru Síla asociace, kauzalita

44 Jaký je rozdíl ve výpovědi o síle asociace v následujících situacích? OR #1: OR = % CI = ( ) OR #2: OR = % CI = ( ) OR #3:OR = % CI = ( ) OR #4:OR = 6.695% CI = ( ) Síla asociace

45 Příčina úmrtí Pozorovaná úmrtí (O) Očekávaná úmrtí (E) SMR (O/E) (95% int. spol.) Ca plic704138,65,08 (4,71-5,47) Ca jater2213,21,67 (1,04-2,52) Ca žlučníku125,32,26 (1,16-3,94) SMR – standardizovaný úmrtnostní index E – počet případů, který by se v kohortě vyskytl, kdyby v ní platily stejné věkově specifické úmrtnosti jako v obecné populaci ČR Kohortová studie – horníci českých uranových dolů, expozice radonu a jeho dceřiným produktům

46 Ukazatel AR udává, za jakou část případů nemoci je zodpovědná expozice (za předpokladu příčinného vztahu mezi zkoumanou expozicí a následkem). Takto můžeme popsat počet případů nemoci mezi exponovanými, které by se nevyskytly, kdybychom dokázali zcela eliminovat expozici. Z praktického hlediska je takto dáno maximální snížení nemocnosti u exponovaných osob, kterého lze dosáhnout odstraněním rizikového faktoru. Na rozdíl od relativního rizika, které měří sílu asociace mezi expozicí a následkem, atributivní riziko je mírou dopadu této asociace v kontextu studia veřejného zdraví. V porovnání s RR se však ze zjištěné hodnoty AR rizika jen velmi těžko vyvozují zobecnění na jiné populace, neboť AR silně závisí na incidenci/prevalenci v neexponované skupině. Atributivní riziko AR

47 Rozdíl rizik (atributivní riziko)

48 Převrácená hodnota rozdílu rizik, NNT=1/RD, je speciální měrou počtu osob, které připadají na každý další případ nemoci, resp. které by bylo třeba ošetřit, aby se předešlo vzniku jednoho případu. Potřebný počet léčených (Number needed to treat)

49 Odhad podílu nemocných mezi exponovanými, který jde na vrub expozice, „AR v procentech“ Atributivní frakce

50 Incidence leukémie –I E = 9 /  38,65 na –I Ē = 18 /  7,37 na RR = 38,65 / 7,37 = 5,24 –95% CI: (1,93; 10,96) [relativní riziko] RD = 38,65 - 7,37  31,28 na –95% CI: (17,77; 44,78) [rozdíl rizik] AF=(38,65 - 7,37) / 38,65  80,9 % –95% CI: (57,54; 91,43) [atributivní frakce] Kohortová studie s osoboroky – horníci českých uranových dolů

51 Anti- koncepce Ca vaječníků Osoboroky Rizika (rates) na Někdy ,4 Nikdy ,0 RR (rate ratio) = 8,4 / 14,0 = 0,60 RD (risk reduction) = 8,4 na – 14,0 na = 5,6 na PF (prevented fraction) = 1-RR = 5,6 / 14,0 na = 0,40 na  40 % (zabráněná frakce) Hypotetická kohortová studie – protektivní účinky antikoncepce vzhledem k rakovině vaječníků

52 Podíl onemocnění v celé studované populaci exponovaných i neexponovaných, kterým by se předešlo eliminací expozice P E... odhad podílu exponovaných v populaci pomocí podílu exponovaných v kontrolní skupině Populační atributivní frakce

53

54 Úloha náhodné chyby (kontrolována na hladině významnosti) Systematická chyba –bias (zkreslení) –confounding (zavádějící, matoucí, rušivý faktor) –ztráty ze sledování Interpretace studií

55 Zkreslení (bias) Jakákoli systematická chyba, která vznikne při sběru dat, jejich analýze, interpretaci, publikaci či kontrole a která vede k závěrům systematicky se lišícím od skutečnosti. Výběrové zkreslení Informační zkreslení Publikační zkreslení

56

57 EXPOZICE (konzumace alkoholu) CONFOUNDING (kouření cigaret) NÁSLEDEK (rakovina plic) Zavádějící faktor (Confounding factor)

58 Confounding je zkreslení ukazatelů asociace (např. RR nebo OR), které může vzniknout proto, že jsme nekontrolovali další proměnné, které jsou rizikovým faktorem pro studovaný jev (nemoc) Ignorování účinku zavádějícího faktoru vede k chybným odhadům velikosti účinku (které jsou zatíženy zkreslením/bias) Bez možnosti korekce (adjustace) pozorovaného výsledku vzhledem k účinkům zavádějících faktorů není možné odlišit jejich účinek od účinku expozice Adjustace vzhledem k faktoru, který je způsoben zčásti expozicí a je korelován s výsledkem, může do studie zanést bias Koncept confounding

59 1.Musí být ve vztahu (přímém nebo nepřímém) k následku (rizikový faktor pro výskyt jevu) – Faktor musí být skutečnou příčinou nemoci (jinou než studovaná expozice) nebo alespoň indikátorem, markerem rizika – Asociace není sekundární (zprostředkovaná pouhou asociací faktoru s expozicí, která je příčinou nemoci) 2.Musí být (v cílové populaci) asociován se studovanou expozicí – Faktor musí být asociován se studovanou expozicí ve zdrojové populaci (populaci v riziku, v které vznikly studované případy) 3.Nesmí být pouze mezikrokem v řetězci kauzálních dějů od expozice k výskytu studovaného jevu/ následku – Mechanismem účinku se liší od expozice Zavádějící faktor – definiční kritéria

60 PŘI PLÁNOVÁNÍ STUDIE –restrikce –strukturální vyvažování (matching) –randomizace PŘI ANALÝZE STUDIE (potenciální zavádějící faktory musí být identifikovány již při plánování studie a zaznamenány / změřeny při sběru dat) –standardizace –stratifikace (Mantelova-Haenszelova technika) –logistická regrese –složitější modely (analýza rozptylu, Coxův model) Kontrola vlivu zavádějících faktorů

61 Hrubé Specifické Standardizované (přímá a nepřímá standardizace) Ukazatele zdravotnické statistiky

62 Chceme-li porovnávat určité ukazatele, např. úmrtnosti mezi oblastmi, nebo v delším časovém období, nelze používat absolutní ani relativní počty zemřelých (hrubou úmrtnost), a to kvůli závislosti takových ukazatelů na věkovém složení oblasti a skladbě obyvatel podle pohlaví. Metoda přímé standardizace provede přepočet všech údajů, které se mají porovnat, na jednu stejnou pevnou populaci (např. evropský standard - populace osob, která má zastoupení jednotlivých věkových skupin zhruba na úrovni průměrného evropského státu v sedmdesátých letech). Standardizovaná úmrtnost je hypotetický ukazatel, který říká, jaká by byla úmrtnost ve fiktivní standardní populaci, pokud by tam platily stejné zákonitosti umírání jako v dané sledované populaci v daném čase. Sama o sobě nemá příliš velký smysl, ale je nezastupitelná pro účely srovnávání Přímá standardizace

63

64 Základní princip: vytvořit podle hodnot kategoriální „třetí proměnné“ tzv. strata, vrstvy a hodnotit nejprve asociaci v každém stratu zvlášť – pomocí RR, OR, AR Pokud to je vhodné, vytvořit celkový odhad asociace adjustovaný vzhledem k stratifikující proměnné Ne vždy však představuje uvažovaná další proměnná další zavádějící faktor, může mít i jiné postavení Stratifikace

65 při posuzování asociace mezi expozicí a onemocněním může vystupovat „třetí proměnná“ v několika pozicích –zavádějící faktor (confounder) –faktor modifikující účinek (dochází k interakci) –mezikrok v řetězci kauzálních dějů –bez efektu Zavádějící faktor způsobuje zkreslení Faktor modifikující účinek poskytuje důležitou informaci Stratifikace

66 Faktor modi- fikující účinek + _ Interakce: ÚČINEK EXPOZICE SE LIŠÍ V ZÁVISLOSTI NA HODNOTÁCH TŘETÍ PROMĚNNÉ D M C Mezikrok v příčinné posloupnosti bez efektu Confounding: ALTERNATIVNÍ VYSVĚTLENÍ VZNIKU ONEMOCNĚNÍ Možné postavení „třetí proměnné“ při posuzování asociace mezi expozicí (E) a onemocněním (D)

67 Nemoc Expozice anone Celkem anoaiai bibi a i +b i necici didi c i +d i Celkema i +c i b i +d i nini Kohortová studie – i-té stratum

68 N á sledek Expozice Ano Ne Celkem Ano Ne Celkem Odds ratio: 2,3 N á sledek N á sledek Expozice Ano Ne Celkem Ano Ano Ne Ne Celkem Celkem Odds ratio: 1,0 Hrubá (crude) analýza nebere v úvahu žádnou další proměnnou Odhady velikosti relativního rizika specifické pro jednotlivá strata neindikují žádnou asociaci mezi expozicí a následkem Zavádějící faktor

69 Zkonstruovat souhrnný ukazatel asociace jako vážený průměr ukazatelů z jednotlivých strat, např.  (w i OR i ) /  w i ; tím se vezme v úvahu informace každého strata a jejich rozdílnosti z pohledu ukazatele asociace různé možnosti volby vah, závisí na typu ukazatel (OR, RR, AR) i povaze dat –Woolf (1955) –Mantel-Haenszel (1959) Pokud je vliv zavádějícího faktoru podstatný (hrubý a stratifikovaný ukazatel se podstatně liší), nemá hrubý ukazatel smysl –podstatná odlišnost: často se bere 10 %, ale nutno postupovat s ohledem na povahu problému Ošetření vlivu zavádějícího faktoru

70 Zobecnění  2 statistiky pro test nezávislosti v jedné čtyřpolní tabulce  zde jde o test nezávislosti při současné kontrole vlivu zavádějícího faktoru Testuje nulovou hypotézu, že v žádném ze strat neexistuje asociace mezi expozicí a onemocněním Testová statistika se (bez ohledu na počet strat) porovnává s kritickou hodnotou  2 rozložení o 1 stupni volnosti Na tento test lze také nahlížet jako na test hypotézy OR MH =1; lze ovšem také testovat pomocí intervalu spolehlivosti Pozor: výsledek MH  2 testu může být statisticky nevýznamný nejen, když celkově asociace skutečně neexistuje, ale také tehdy, když ukazatele v dílčích tabulkách, které dominují, nebudou homogenní, či budou dokonce protichůdné Mantelova-Haenzelova statistika  2

71 Expozice (asbest) př í pad kontrolaCelkemRel. četnost exponovaných ano mezi př í pady 71,64/100 ne mezi kontrolami44,63/100 Celkem Poměr šancí: 3,13; 95% CI: (2,29; 4,28) Atributivní frakce: 68,1 %; 95% CI: (56,3; 76,7)  2 =53,16; P<0,001 Asociace mezi expozicí asbestu a mesoteliomem pleury u horníků

72 KUŘ Á CI Nemoc (mesoteliom) Expozice (asbest)anoneCelkem ano ne Celkem OR = 3,28; 95% CI: (2,31; 4,65) NEKUŘ Á CI Nemoc (mesoteliom) Expozice (asbest)anoneCelkem ano ne Celkem OR = 2,67; 95% CI: (1,26; 5,64) Poměr šancí (hrubý): 3,13; 95% CI: (2,29; 4,28) Poměr šancí (Mantel-Haenszel): 3,16; 95% CI: (2,32; 4,31)  2 (Mantel-Haenszel): 52,74; P<0,001 Stratifikovaná studie případů a kontrol

73 Odlišné ukazatele asociace v jednotlivých stratech (třeba v závislosti na kouření) Např.vztah mezi užíváním orální antikoncepce a infarktem myokardu je modifikován kouřením – je jiný pro kuřačky a jiný pro nekuřačky Homogenitu strat z pohledu míry asociace je možno formálně testovat pomocí speciálních  2 testů –Woolf –Breslow-Day Tyto testy fungují dobře až při větších rozsazích výběrů, někdy jsou pak ale až příliš citlivé  nutno doplnit expertním posouzením Modifikace efektu

74 N á sledek Expozice Ano Ne Celkem Ano Ne Celkem Odds ratio: 2,3 N á sledek N á sledek Expozice Ano Ne Celkem Ano Ano Ne Ne Celkem Celkem Odds ratio: 4,2 Odds ratio: 1,2 OR ve stratech se diametrálně liší Hrubý ani vážený/adjustovaný odhad nemá smysl Nutno publikovat OR pro všechna strata Modifikace efektu

75 Faktor modifikující účinek? anonene Zavádějící faktor? anonene uvádět stratum- specifické odhady, nikoli sumární uvádět “adjustované” sumární odhady (Mantel- Haenszel) Bez efektu: uvádět hrubé odhady Mezikrok v příčinné posloupnosti (expertní posouzení)? uvádět hrubé odhady neneano Postup posouzení postavení „třetí proměnné“

76 Modeluje vztah (asociaci) mezi jednou či více vysvětlujícími proměnnými x i, které mohou být –dichotomické (ano/ne) –kategoriální (socio-ekonomický status,... ) –spojité (věk,...) a –dichotomickou (binární) proměnnou Y Charakterizace „následku“ dichotomickou proměnnou je nejběžnější situací vyskytující se v biologii a epidemiologii Kódování Y –1=pozitivní odpověď / přítomnost určité charakteristiky (výskyt znaku / onemocnění či naopak přežití) –0=negativní odpověď / nepřítomnost charakteristiky Logistická regrese

77 Průměr binární veličiny si lze představovat jako pravděpodobnost, pak se bude zkoumat, jak je např. pravděpodobnost ICHS závislá na věku (a případně i na dalších proměnných, třeba kuřáckých návycích) Značení –y.. ICHS (1=ano, 0=ne) –P.. pravděpodobnost ICHS –x.. věk Snaha použít místo zde nevhodného modelu lineární regrese y=α + βx model P=α + βx, ale P je pravděpodobnost a má být mezi 0 a 1 Proto se modeluje ln[P/(1-P)]= α + βx, tzv. logit(P) Změna v pravděpodobnosti není úměrná změně v x lineárně, závisí na hodnotě x  nelineární model (logistická funkce) P/(1-P) je šance (odds) odpovědi „ano“ při dané hodnotě x Logistická regrese

78 Pravdě- podobnost onemocnění x Logistická regrese

79 Poměr šancí e  říká, kolikrát se změní šance (odds) na pozitivní výsledek – při změně x z 0 na 1 (v případě dichotomické veličiny) – při změně x o 1 jednotku (obecně, u spojité veličiny)  = změna logaritmu poměru šancí (OR) při jednotkové změně v x Interpretace koeficientu β

80  b = 0 (e b =1)  pravděpodobnost výskytu znaku je stejná na všech úrovních x, není asociace mezi x a y  b > 0 (e b >1)  pravděpodobnost výskytu znaku se s rostoucím x zvyšuje  b < 0 (e b <1)  pravděpodobnost výskytu znaku se s rostoucím x snižuje Lze testovat nulovou hypotézu H 0 : b=0 proti H 1 : b  0 (Waldův test) Interpretace koeficientu β

81 Obecně lze do modelu zařadit více nezávisle proměnných (x i ) různých typů –Dichotomická, ordinální, nominální, spojitá … logit(P)=ln[P/(1-P)]= α + β 1 x 1 + β 2 x β k x k P/(1-P) je šance odpovědi „ano“ při hodnotách x 1 až x k Interpretace b i –změna logaritmu poměru šancí (OR) při jednotkové změně v jedné konkrétní nezávisle proměnné x j při stejných (nezměněných) hodnotách všech ostatních x i, i  j –Míra asociace mezi x j a logaritmem poměru šancí adjustovaná vzhledem k vlivu všech ostatních x i zahrnutých v modelu –e βi lze opět interpretovat jako poměr šancí Vícenásobná logistická regrese

82 Sledováno přežívání v závislosti na věku a pohlaví logit(P)= α + β 1 AGE + β 2 FEMALE Odhady (SPSS) bS.E.WaldDFSig. (P-value) OR= Exp(b) 95% CI for Exp(b) LowerUpper AGE FEMALE Constant logit(P)= 1,633 –0,078AGE + 1,597FEMALE logit(P)= 1,633 –0,078AGE... muži logit(P)= 3,230 –0,078AGE... ženy Logistická regrese

83 Interpretace Pro jakýkoli daný věk je šance přežití pro ženy 4,9 krát větší než pro muže (e 1,597 =4,94); 95% CI: (1,1; 21,6) Šance přežití 40letého vzhledem k 20letému Odhad β 1 je –0.078; e =0.925 je poměr šancí pro jednotkovou změnu věku e -0,078*20 =0,21 je poměr šancí pro změnu o 20 let Logistická regrese

84 10-leté riziko úmrtí pro kardiovaskulární příčiny pro 62letého muže, nediabetika, který kouří 20 cigaret denně, má BMI 25 kg/m 2, STK 140 mm Hg, cholesterol 245 mg/100 ml a puls 80/min je riziko 26.8 % pro nekuřáka (s ostatními parametry stejnými) je riziko 18.8% Příklad - predikce

85 Umožňuje současně adjustovat na vliv více proměnných, které mohou být binární, kategoriální i spojité Závisle proměnná musí být binární Zobecnění na kategoriální závisle proměnnou  model poměrných šancí (proportional odds model) Logistická regrese

86 Expozice ve více kategoriích Test trendu (Armitage) Další možnosti

87 TEST TRENDU konzumace alkoholu a rakovina jícnu Alkohol (g/den) PřípadyKontrolyCELKEMRRPodíl ,006, ,5721, ,8036, ,2367,16 CELKEM χ 2 nezávislost: 158,8; DF=3 –χ 2 linearita: 6,9; DF=2 –χ 2 trend: 151,9; DF=1 ; P<0,001 (Breslow, Day: Statistical Methods in Cancer Research I, 1980)

88 Nulová hypotéza H 0 („nic se neděje“) Alternativní hypotéza H A (co se děje, když H 0 neplatí) Statistický test říká, zda zamítneme H 0 nebo nezamítneme Nezamítnutí není totéž, co přijetí hypotézy Hypotézy

89 Skutečnost Rozhodnutí na základě výběru Nezamítáme H 0 Zamítáme H 0 (statist. významný výsledek) H 0 platí Správné rozhodnutí P=1-α (hladina spolehlivosti) Chyba I. druhu P= α (hladina významnosti) H 0 neplatí, platí H A Chyba II. druhu P=β Správné rozhodnutí P=1- β (síla testu) MOŽNÉ VÝSLEDKY STATISTICKÉHO TESTU A TYPY CHYB

90 ROZSAH VÝBĚRU (DLE POŽADAVKU NA OR)

91

92 Armitage P., Berry G.: Statistical Methods in Medical Research. 2nd ed., Blackwell Scientific Publications, Oxford, 1991 Armitage P., Colton T., eds.: Encyclopedia of Biostatistics. Wiley, Chichester, 1998 Breslow N.E., Day N.E.: Statistical Methods in Cancer Research. Vol. 1 - The analysis of case- control studies. IARC Scientific Publications No. 32. International Agency for Research on Cancer, Lyon, 1980 Breslow N.E., Day N.E.: Statistical Methods in Cancer Research. Vol. 2 - The Design and Analysis of Cohort Studies. IARC Scientific Publications No. 82. International Agency for Research on Cancer, Lyon, 1987 Henneckens C.H., Buring J.: Epidemiology in Medicine. Little, Brown and Company, Boston, 1987 Jewell, N.P.: Statistics for Epidemiology. Chapman&Hall/CRC, Boca Raton, 2004 Newman, S.C.: Biostatistical Methods in Epidemiology. Wiley, New York, 2001 Rothman, K., Greenland, S.: Modern Epidemiology. 2nd ed. Lippincott-Raven, Philadelphia, 1998 Sachs, L.: Applied Statistics. A Handbook of Techniques. Springer-Verlag, New York, 1982 dos Santos Silva I.: Cancer Epidemiology: Principles and Methods. International Agency for Research on Cancer, Lyon, 1999 Woodward, M.: Epidemiology. Study Design and Data Analysis. 2nd ed. Chapman&Hall/CRC, Boca Raton, 2005 Zvárová, J., Malý, M. (ed.): Biomedicínská statistika III. Statistické metody v epidemiologii, svazek 1 a 2. Karolinum, Praha, 2003 Literatura


Stáhnout ppt "Měření asociací v epidemiologických studiích Marek Malý."

Podobné prezentace


Reklamy Google