Expertní Systémy Petr Berka 1
Expertní systémy Počítačové programy simulující rozhodovací činnost lidského experta při řešení složitých úloh a využívající vhodně zakódovaných speciálních znalostí převzatých od experta s cílem dosáhnout ve zvolené problémové oblasti kvality rozhodování na úrovni experta.
Role expertního systému kolega asistent
Charakteristické rysy expertního systému oddělení znalostí a mechanismu pro jejich využívání neurčitost v bázi znalostí neurčitost v datech dialogový režim vysvětlovací činnost modularita a transparentnost báze znalostí
Schéma expertního systému
Typy expertních systémů Diagnostické diagnóza (MYCIN, INTERNIST) interpretace (DENDRAL, PROSPECTOR) monitorování (VM) Generativní návrh (R1/XCON) plánování (MOLGEN) predikce (GLAUKOMA)
Diagnostické úlohy získávání a interpretace informací relevantních pro potvrzení přítomnosti nebo nepřítomnosti nějaké závady v systému
Data a znalosti v procesu rozhodování
Způsoby reprezentace znalostí predikátová logika sémantické sítě rámce pravidla případy
Pravidla procedurální sémantika deklarativní sémantika JESTLIŽE situace PAK akce deklarativní sémantika JESTLIŽE předpoklad PAK závěr situace, předpoklad a závěr jsou kombinace tvrzení o stavu světa
Atributy a výroky výrok (auto má červenou barvu) atribut, hodnota (barva_auta = červená) objekt, atribut, hodnota (auto_25: barva = červená) typy atributů: kategoriální (binární, nominální, ordinální) numerické
Inferenční síť uzly = tvrzení (dotazy, cíle, mezilehlé uzly) hrany = pravidla
Metody inference logické metody (dedukce, abdukce, indukce) zpětné nebo přímé řetězení generování a testování využití analogií
Dedukce využívá implikaci ve dvojhodnotové logice modus ponens B A => B, A B modus tollens A => B, B A
Zpětné řetězení Vycházíme z cílů, které chceme odvodit a pokoušíme se nalézt pravidla umožňující tyto cíle potvrdit nebo vyvrátit
Přímé řetězení Vycházíme z faktů, které jsou splněna a a pokoušíme se nalézt aplikovatelná pravidla
Inference v diagnostických systémech prohledávání báze (zpětné nebo přímé řetězení) aplikace pravidla (dedukce) práce s neurčitostí
Vyjádření neurčitosti pseudopravděpodobnosti pravděpodobnosti (Bayesovské sítě) míry důvěry a nedůvěry váhy (algebraická teorie) vyjímky (nemonotonní usuzování)
předpoklad závěr (váha) Algebraická teorie pro znalosti v podobě pravidel předpoklad závěr (váha) výpočet váhy předpokladu (NEG, CONJ, DISJ) výpočet příspěvku pravidla k váze závěru (CTR) složení dílčích příspěvků pravidel se stejným závěrem (GLOB)
Vysvětlování důvody pro vysvětlování typické možnosti vysvětlování uživatel získá větší důvěru v závěry systému tvůrce aplikace může lépe ladit bázi znalostí typické možnosti vysvětlování why (proč systém klade tento dotaz) how (jak systém odvodil své doporučení)
Volba aplikace hodnocení vágnosti a komplexnosti pravidlo telefonního hovoru
Faktory úspěchu Důvody pro aplikaci Zkušenosti z úspěšných projektů expert odchází a je třeba zaškolit zástupce snaha zajistit standardizaci způsobu rozhodování Zkušenosti z úspěšných projektů získejte experta pro spolupráci zaměřte se na koncového uživatele použijte inkrementální způsob vývoje
Vývoj znalostního systému softwarový projekt, klíčovou roli hrají znalosti
Podpora vývoje Softwarový projekt Získávání znalostí „klasické“ metodiky (spirála, vodopád, V) metodika KADS Získávání znalostí techniky elicitace znalostí znalostní modelování znalostní ontologie
Výhody použití expertních systémů zvýšená dostupnost expertízy snížené náklady na provedení expertízy trvalost expertízy opakovatelnost expertízy rychlá odezva
Limitující faktory chybějí efektivnější techniky získávání znalostí chybějí přesné testovací procedury nedostatečné integrování do používaných technologií znalostní inženýři kladou malý důraz na aplikační oblast
Příklad - expertní systém pro hodnocení rizika výskytu aterosklerózy komplikované onemocnění, které probíhá mnoho let bez příznaků. Manifestace aterosklerózy – postižení funkce životně důležitých orgánů (srdce, mozek, ledviny) má dalekosáhlé důsledky nejen zdravotní, ale i ekonomické, sociální, etické. Více než polovina úmrtí osob středního a vyššího věku je u nás stále způsobena aterosklerotickými onemocněními.
Rizikové faktory aterosklerózy neovlivnitelné: pohlaví, věk, osobní anamnéza ovlivnitelné: krevní tlak, hladina cholesterolu, kouření, způsob života stravovací návyky (obezita) tělesná aktivita reakce na stres
Výpočet rizika kardiovaskulární choroby (CVD) systém otázky vhodný pro výsledky NCEP ATP III 11 + 2 všechny pacienty riziko CVD do 10 let Risk assessment tool 4 + 2 riziko IM do 10 let Framingham Risk Assessment 5 + 2 PROCAM Risk Calculator 6 + 3 muže středního věku PROCAM Risk Score 7 + 4 riziko IM nebo úmrtí na CVD do 10 let PROCAM Neural Net 11 + 5 Heart Score pacienty středního věku úmrtí na CVD do 10 let
Kalkulátory Expertní systémy vyhodnocují riziko jako vážený součet všech faktorů uživatel musí zadat přesné odpovědi na všechny otázky expertní systémy vyhodnocují riziko odvozováním v bázi znalostí mohou zpracovávat nejistou nebo chybějící informaci
Expertní systém NEST (1/2) reprezentace znalostí atributy (binární, nominální, numerické) a výroky pravidla: předpoklad závěr (váha), akce kompozicionální - každý literál v závěru má váhu apriorní - kompozicionální pravidla bez předpokladu logická - nekompozicionální pravidla bez vah inference jako kombinace zpětného a přímého řetězení kompozicionální inference pro kompozicionální a apriorní pravidla (kombinování příspěvků pravidel) nekompozicionální inference pro logická pravidla (modus ponens + disjunkce)
Expertní systém NEST (2/2) zpracování neurčitosti neurčitost se může vyskytovat ve znalostech experta i v odpovědích uživatele během konzultace, kompozicionální (kombinování příspěvků všech aplikovatelných pravidel) založeno na algebraické teorii P. Hájka různé sady kombinačních funkcí (MYCIN + PROSPECTOR, Lukasiewiczova vícehodnotová logika, neuronové sítě) dva základní režimy konzultace: dialogový a pomocí dotazníku, implementováno jako stand-alone nebo client-server verze. http://lisp.vse.cz/NEST
Systém NEST – typy odpovědí binární atribut - váha jednoduchý nominální atribut – hodnota a váha množinový nominální atribut – seznam hodnot a jejich vah numerický atribut - hodnota Dotazy nezodpovězené v průběhu konzultace získávají automaticky implicitní váhu „neznámá“ [-1,1] nebo “irelevantní“ [0,0], odpovědi lze rovněž odkládat a po skončení konzultace se k nim vrátit
Systém NEST - příklad dotazu
Systém NEST - výsledek konzultace
Základní informce o systému AtherEx báze znalostí vytvořena ve dvou krocích aplikace metod strojového učení na data shromážděná v epidemiologické studii rizika aterosklerózy získaná pravidla upravena a zpřesněna expertem systém pracuje s rizikovými faktory (otázkami) srozumitelnými laikům (20 faktorů + 1 lab. test) výsledkem konzultace je klasifikace pacienta do jedné ze čtyř skupin z hlediska rizika aterosklerózy http://j116h01.vse.cz
Studie primární prevence aterosklerózy Dlouhodobá (1975-2000) studie rizikových faktorů aterosklerózy v populaci mužů středního věku rozdělených do tří skupin (normal, risk, pathological). zjistit prevalenci rizikových faktorů aterosklerózy u mužů středního věku, sledovat vývoj rizikových faktorů a jejich vlivu na zdravotní stav, zejména s ohledem na výskyt aterosklerotických CVD, sledovat vliv komplexní intervence rizikových faktorů na jejich vývoj a na kardiovaskulární morbiditu a mortalitu, po 10–12 letech trvání studie porovnat profil rizikových faktorů a zdravotní stav mužů v jednotlivých skupinách.
Data STULONG Entry 1417x64 Control 10572x66 Letter 403x62 Death 389x5
Algoritmus KEX pro tvorbu pravidel Rozhodovací pravidla tvaru Ant Class (w) Kompozicionální algoritmus Vytváření pravidel jako proces zpřesňování znalostí (přidej nové - speciálnější - pravidlo jenom pokud se zpřesní schopnost klasifikace) Aplikace pravidel jako kombinace jejich příspěvků založená na pseudo-bayesovském přístupu: http://lispminer.vse.cz
Analýza tabulky ENTRY (1/2) klasifikace založená jen na dosud známých rizikových faktorech, klasifikace založená na atributech týkajících se způsobu života, osobní a rodinné anamnézy (bez speciálních laboratorních vyšetření), klasifikace založená na atributech týkajících se způsobu života a rodinné anamnézy, klasifikace založená pouze na atributech týkajících se způsobu života.
Analýza tabulky ENTRY (2/2) Báze počet pravidel celková správnost správnost pro „nerizikové“ správnost pro „ostatní“ 1 19 87% 83% 88% 2 39 84% 74% 3 32 77% 63% 4 27 73% 48%
Modifikace navržené expertem vytvoření nových cílů „žádné riziko“, „nízké riziko“, „střední riziko“ a „vysoké riziko“ místo původních rizikových skupin, doplnění pravidel ke všem hodnotám atributu v případě, že alespoň jedna hodnota tohoto atributu se objevila v pravidlech generovaných z dat, přidání atributu „cholesterol“.
Implementace použita klient-server verze NESTu (tenký klient = webový prohlížeč) uživatelské rozhranní skrývá detaily o inferenci a zpracování neurčitosti (tvůrce aplikace může měnit podobu dialogu pro jednotlivé báze znalostí) dialogový režim konzultace (s možností změnit odpovědi po skončení konzultace pomocí dotazníku)
Práce se systémem AtherEx (1/2)
Práce se systémem AtherEx (2/2)
Expertní systémy v medicině Generování poplachů a upozornění Diagnostická asistence Kontrola a plánování terapie Vyhledávání informací Rozpoznávání a interpretace snímků (Coiera, 2003) Info o systémech např. na www.computer.privateweb.at/judith www.openclinical.org/
DiagnosisPro - www.diagnosispro.com
DXplain – www.lcs.mgh.havard. edu/projects/dxplain.html
Gideon – www.gideononline.com
Hepaxpert - http://medexpert. imc.akh-wien.ac.at/hepax/
Děkuji za pozornost