Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Survival Analysis Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010.

Podobné prezentace


Prezentace na téma: "Survival Analysis Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010."— Transkript prezentace:

1 Survival Analysis Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010

2 Praktický „Background“ Předmětem analýzy přežívání je vyšetřévání jedné nebo více skupin objektů, kde pro každý jednotlivý objekt máme dánu událost (selhání), která nastává po nějakém časovém intervalu (doba do selhání, doba přežití). Příklady doby do selhání zahrnují dobu životnosti součástek, dobu přežívání pacientů v klinických experimentech, dobu trvání stávek, delku doby nezaměstnanosti, dobu potřebnou k vykonání nějakého specifického úkolu….

3 Praktický „Background“ Problémy, které se nejčastěji řeší jsou tedy odhad pravděpodobnostního rozložení doby přežití v dané skupině nebo statistické porovnání dob přežití v několika skupinách. Pokud navíc máme pro každý objekt i několik vysvětlujících proměnných, můžeme analyzovat jejich vliv k na dobu přežívání. Možnost výskytu neúplných pozorování zabraňuje použití klasických metod. Tyto údaje dávají pouze informaci, že za sledovanou dobu k danému jevu nedošlo - cenzorování

4 Proč? Mohu porovnávat průběh křivek přežívání mezi dvěma nebo více skupinami Mohu odhadnout “poločas“ trvání (délky života) spolu s konfidenčním intervalem Mohu testovat vliv kvantitativních proměnných i faktorů na průběh křivky – Cox proportional hazard model, předpokládá konstatní násobné zvýšení či snížení míry rizika

5 Úvod Survival analysis, doménou jsou lékařské aplikace Obecně pro data, ve kterých dochází k tzv. cenzoringu (censoring) Nejčastější tzv. right censoring: sleduji dobu existence jedince nebo jevu a v určitém okamžiku své pozorování ukončím, ale jedinec žije dál, nevím jak dlouho Left censoring x intervalový cenzoring je většinou nepoužitelný Pro data bez cenzoringu existují jednodušší metody (analýza délek života regresí – normální nebo generalized linear models)

6 Příklady Lékařské vědy smrt relaps objevení symptomů začátek nemoci Sociologie rozvod změna zaměstnání zanechání kouření první použití drogy Pedagogika zanechání studia začátek studia na vysoké škole Ekonomie bankrot délka stávky žádost o pomoc v nezaměstnanost

7 eal Example

8 Funkce přežití T je náhodná veličina, která popisuje dobu do selhání. Při popisu rozdělení náhodného chování časů přežití se používá funkce přežití S(t), která udává pro čas t pravděpodobnost přežití jedince: S(t)=P(T≥t), Protože se jedná o pravděpodobnost, nabývá funkce pouze kladných hodnot a má klesající průběh s tím, jak se pravděpodobnost přežití jedince zmenšuje.

9 Funkce přežití Hustota náhodné veličiny T Intenzita selhání (riziková funkce – hazard function)) Vzájemný vztah:

10 Rozdělení pstí pro dobu selhání Exponenciální Gamma rozdělení – intenzita má komplikované vyjádření – dva parametry Weibullovo rozdělení Log-normální rozdělení – intenzita není monotónní a má opět dva parametry Inverzní Gaussovo rodělení – není vhodné pro cenzory

11 Řešení pomocí MLE

12 Neparametrický přístup Pro nás se tedy situace zjednodušila na dva nejběžnější přístupy a to je metoda LIFE-TABLE (epidemiologie, pojišťovnictví, geovědy) a přesnější KAPLAN-MEIEROVY odhady („product limit“, užívá se všude ) Podstatné je rozdělit sledovaný časový úsek na podintervaly. Používat se bude následující označení:

13 Neparametrický přístup n i – počet živých jedinců l i – počet ztracených během I i p i – pravděpodobnost přežití období I i, když na počátku toho období byl naživu w i + l i – počet cenzorovaných pozorování v I i d i – počet selhání během I i w i – počet ukončení bez selhání během I i

14 Neparametrický přístup Potom pro pravděpodobnost přežití platí Metodou LIFE-TABLE se tedy dají odhadnout neznámé p i pomocí p i =1-d i /n i ’, kde n i ’=n i -0.5(w i +l i ).Výsledný odhad je pak

15 Neparametrický přístup Pro zajímavost se dá spočítat i velice hodnotný odhad variance pro tyto odhady. Vychází z Greenwoodovy formule a je ve tvaru: Bohužel se tato metoda nehodí pro malá pozorování!!!!!

16 KAPLAN MEIER Daleko efektivnější je následující úvaha: Pozorujeme data v následující struktuře uspořádaných dvojic: (Y (1),δ 1 ),…, (Y (n),δ n ), kde Y je čas a δ je binární atribut. Rozptyl se dá opět dopočítat pomocí dříve ukázané formule. Dá se rovněž dokázat asymptotická normalita

17 Testování Pro testování rozdílů, shody, neshody a náhody se dá použít navržených testů GEHANUV (Zobecněný wilcox, resp. Mann-whitney) a MANTEL-HANZELUV (založen na posloupnosti čtyřpolních tabulek)

18 Back to eal World

19 BOX - COX Cox navrhl modelovat vztah mezi nezávislými proměnnými a funkcí rizika. Jeho přístup vychází z modelové rovnice: Častěji se modelová rovnice vyjadřuje v logaritmickém tvaru:

20 Hazard atio

21 Dík za pozornost


Stáhnout ppt "Survival Analysis Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010."

Podobné prezentace


Reklamy Google