Aplikace Bayesovy věty v biomedicíně (Vzorový příklad)
Zadání problému: Na zemi vypukla zákeřná nemoc. Tato nemoc je velice krutá, zabíjí každého, kdo tuto nemoc dostane. Bez výjimky. Žádné účinné léky na tuto nemoc neexistují. Nicméně tato nemoc zasáhne pouze jednoho člověka z desetitisíce. Martin si dělá starosti o své zdraví, a proto, aniž by měl jakékoliv příznaky, se rozhodne, že zajde k lékaři, aby mu stanovil diagnózu. Lékař mu vysvětlí, že vyšetření na tuto chorobu je úspěšné v 99 % případů. A je už jedno, zda tuto nemoc máte, nebo nemáte. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Martin podstoupí vyšetření a za chvíli se dozví výsledek. Výsledek je pozitivní, podle vyšetření Martin tuto zákeřnou nemoc skutečná má. Martinovi se zatmělo před očima a už si šel vybírat rakev. Opravdu je to tak nutné? Jaká je pravděpodobnost, že Martin tuto nemoc má?
Zadání problému: Na zemi vypukla zákeřná nemoc. Tato nemoc je velice krutá, zabíjí každého, kdo tuto nemoc dostane. Bez výjimky. Žádné účinné léky na tuto nemoc neexistují. Nicméně tato nemoc zasáhne pouze jednoho člověka z desetitisíce. Martin si dělá starosti o své zdraví, a proto, aniž by měl jakékoliv příznaky, se rozhodne, že zajde k lékaři, aby mu stanovil diagnózu. Lékař mu vysvětlí, že vyšetření na tuto chorobu je úspěšné v 99 % případů. A je už jedno, zda tuto nemoc máte, nebo nemáte. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Martin podstoupí vyšetření a za chvíli se dozví výsledek. Výsledek je pozitivní, podle vyšetření Martin tuto zákeřnou nemoc skutečná má. Martinovi se zatmělo před očima a už si šel vybírat rakev. Opravdu je to tak nutné? Jaká je pravděpodobnost, že Martin tuto nemoc má?
Takovéto problémy směřují k řešení pomocí věty o úplné pravděpodobnosti, popř. pomocí Bayesovy věty.
Označme jevy související s analyzovaným problémem: pacient je nemocen Z pacient je zdráv T+ výsledek testu je pozitivní T- výsledek testu je negativní
pravděpodobnost, že pacient je nemocen Dále označme zadané pravděpodobnosti: P(N) pravděpodobnost, že pacient je nemocen P(Z) pravděpodobnost, že pacient je zdráv P(T+|Z) pravděpodobnost, že výsledek testu je pozitivní, je-li pacient zdráv P(T+|N) pravděpodobnost, že výsledek testu je pozitivní, je-li pacient nemocen P(T-|Z) pravděpodobnost, že výsledek testu je negativní, je-li pacient zdráv P(T-|N) pravděpodobnost, že výsledek testu je negativní, je-li pacient nemocen
Pro přehledný zápis situace použijeme rozhodovací strom.
Nejdříve rozdělíme celou populaci na zdravé a nemocné. Populace N Z Daný stav
T+ N T- Populace Z Daný stav Výsledek testu Podstoupí-li pacient test na protilátky, může být výsledek pozitivní (T+) nebo negativní (T-), ať již je skutečný stav pacienta jakýkoliv. Populace N Z T+ T- Daný stav Výsledek testu
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice prvního větvení zapisujeme pravděpodobnosti výskytu daného stavu. Populace N Z T+ T- Daný stav Výsledek testu
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice prvního větvení zapisujeme pravděpodobnosti výskytu daného stavu. Nemocí trpí jeden pacient z desetitisíce. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 P(N) = 0,0001
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice prvního větvení zapisujeme pravděpodobnosti výskytu daného stavu. Nemocí trpí jeden pacient z desetitisíce. 9 999 pacientů z 10 000 je tedy zdravých. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 P(Z) = 0,9999
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice druhého větvení se pak zapisují podmíněné pravděpodobnosti – “výsledek testu” za předpokladu “daný stav”. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice druhého větvení se pak zapisují podmíněné pravděpodobnosti – “výsledek testu” za předpokladu “daný stav”. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 P(T+|N) = 0,99 správná diagnóza
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice druhého větvení se pak zapisují podmíněné pravděpodobnosti – “výsledek testu” za předpokladu “daný stav”. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 P(T-|N) = 0,01 chybná diagnóza
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice druhého větvení se pak zapisují podmíněné pravděpodobnosti – “výsledek testu” za předpokladu “daný stav”. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 P(T+|Z) = 0,01 chybná diagnóza
T+ N T- Populace Z Daný stav Výsledek testu Na spojnice druhého větvení se pak zapisují podmíněné pravděpodobnosti – “výsledek testu” za předpokladu “daný stav”. Vyšetření má vždy pouze 99% úspěšnost, v 1 % případů lékař určí špatnou diagnózu. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 P(T-|Z) = 0,99 správná diagnóza
T+ N T- Populace Z Daný stav Výsledek testu Chceme-li určit, jaká je pravděpodobnost toho, že nastal “daný stav” a zároveň “výsledek testu”, stačí vynásobit hodnoty uvedené u příslušné větve. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01
T+ N T- Populace Z Daný stav Výsledek testu Chceme-li určit, jaká je pravděpodobnost toho, že nastal “daný stav” a zároveň “výsledek testu”, stačí vynásobit hodnoty uvedené u příslušné větve. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099
T+ N T- Populace Z Daný stav Výsledek testu Chceme-li určit, jaká je pravděpodobnost toho, že nastal “daný stav” a zároveň “výsledek testu”, stačí vynásobit hodnoty uvedené u příslušné větve. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001
T+ N T- Populace Z Daný stav Výsledek testu Chceme-li určit, jaká je pravděpodobnost toho, že nastal “daný stav” a zároveň “výsledek testu”, stačí vynásobit hodnoty uvedené u příslušné větve. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999
T+ N T- Populace Z Daný stav Výsledek testu Chceme-li určit, jaká je pravděpodobnost toho, že nastal “daný stav” a zároveň “výsledek testu”, stačí vynásobit hodnoty uvedené u příslušné větve. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu ROZHODOVACÍ STROM je dokončen. Nyní lze jednoduše najít odpovědi na otázky k analy-zovanému problému. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Podrobí-li se pacient testu na protilátky, s jakou pravděpodobností se dozví, že test byl pozitivní? Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Podrobí-li se pacient testu na protilátky, s jakou pravděpodobností se dozví, že test byl pozitivní? Tuto pravděpodobnost určíme pomocí věty o úplné pravděpodobnosti. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Podrobí-li se pacient testu na protilátky, s jakou pravděpodobností se dozví, že test byl pozitivní? Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
Co tento výsledek znamená? Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Podstoupila-li by celá populace test na protilátky nemoci, bylo by zhruba 1% populace vyděšeno, že trpí smrtelnou nemocí. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Podstoupila-li by celá populace test na protilátky nemoci, bylo by zhruba 1% populace vyděšeno, že trpí smrtelnou nemocí. Ve skutečnosti však nemocí trpí pouze 0,01% populace !!! Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Předtím než se Martin podrobil testu, byla pravděpodobnost toho, že trpí smrtelnou nemoci 0,01%. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899 před testem
poté co se Martin dozvěděl o pozitivním výsledku testu Předtím než se Martin podrobil testu, byla pravděpodobnost toho, že trpí smrtelnou nemoci 0,01%. Nyní Martin ví, že jeho test byl pozitivní. Jaká je pravděpodobnost, že je skutečně nemocen? Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899 před testem poté co se Martin dozvěděl o pozitivním výsledku testu
T+ N T- Populace Z Daný stav Výsledek testu Hledanou pravděpodobnost určíme pomocí Bayesovy věty jako podíl pravděpodobnosti průniku a pravděpodobnosti podmínky, kterou jsme vypočetli pomocí věty o úplné pravděpodobnosti. (P(T+) = 0,010098) Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Hledanou pravděpodobnost určíme pomocí Bayesovy věty jako podíl pravděpodobnosti průniku a pravděpodobnosti podmínky, kterou jsme vypočetli pomocí věty o úplné pravděpodobnosti. (P(T+) = 0,010098) Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Hledanou pravděpodobnost určíme pomocí Bayesovy věty jako podíl pravděpodobnosti průniku a pravděpodobnosti podmínky, kterou jsme vypočetli pomocí věty o úplné pravděpodobnosti. (P(T+) = 0,010098) Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Hledanou pravděpodobnost určíme pomocí Bayesovy věty jako podíl pravděpodobnosti průniku a pravděpodobnosti podmínky, kterou jsme vypočetli pomocí věty o úplné pravděpodobnosti. (P(T+) = 0,010098) Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
T+ N T- Populace Z Daný stav Výsledek testu Vyšel-li Martinovi test na protilátky pozitivní, pak pravděpodobnost, že je Martin nemocen je asi 1,0%. Populace N Z T+ T- Daný stav Výsledek testu 0,0001 0,9999 0,99 0,01 0,000 099 0,000 001 0,009 999 0,9899
Je zřejmé, že nebylo rozumné zatajit Martinovi tuto informaci Je zřejmé, že nebylo rozumné zatajit Martinovi tuto informaci. Je přece rozdíl dozví-li se Martin, že Váš test je pozitivní!
Váš test je pozitivní. Riziko, že jste nemocen stouplo nebo Váš test je pozitivní. Riziko, že jste nemocen stouplo z 0,01% na 1%.