KEG Marek RŮŽIČKA EuroMISE – Kardio, VŠE Praha Projekt Stepper – Aplikace pro podporu víceúrovňové formalizace textových dokumentů
KEG Obsah Metodiky víceúrovňové formalizace Souhrn požadavků na aplikaci Uživatelský interface Dodatečné moduly aplikace Možnosti využití Plány do budoucna
KEG Metodika víceúrovňové formalizace Vznikla na základě zkušeností při formalizaci „lékařských doporučených postupů (LDP)“ Ostatní metodiky určené k formalizaci LDP: –Modelově orientované (např. EON, GLIF3, Asgaard) –Dokumentově orientované (GEM, ActiveGuidelines) Snaha vytvořit dokumentově orientovanou metodiku, řešící některé nedostatky výše uvedených
KEG Metodika víceúrovňové formalizace Rozdělení procesu formalizace do několika úrovní Každá úroveň představuje původní dokument v určitém stádiu formalizace doplněný o odkazy do předešlé úrovně Pro ukládání úrovní použit jazyk XML VýhodyVýhody –minimalizaci ztráty obsažených informací –zprůhlednění celého procesu –omezení „subjektivizace“ zpracovávaných znalostí
KEG Původní představa formalizačního procesu Průběh formalizace Identifikace základních znalostních bloků v textu Upřesnění vnitřní struktury znalostních bloků v následujících úrovních Export do výstupního formátu Související činnosti Vyhotovení předpisu pro syntaktický zápis každé úrovně v DTD souboru Anotace znalostních bloků a z nich vzešlých elementů pomocí XLinku pro případné sledování vývoje konkrétních bloků napříč úrovněmi BP lowering... BP lowering... The goal of antihypertensive treatment should be to achieve "optimal" or "normal" BP in young, middle-aged, or diabetic subjects (below 130/85 mm Hg; Table 1.)and at least "high-normal" BP in elderly patients (below 140/90 mm Hg; The goal of antihypertensive treatment should be to achieve "optimal" or "normal" BP in young, middle-aged, or diabetic subjects (below 130/85 mm Hg; Table 1.)and at least "high-normal" BP in elderly patients (below 140/90 mm Hg;
KEG Skutečný průběh formalizace Úroveň 1 – hrubá sémantická struktura Bezproblémové vyznačení znalostních bloků Velmi náročné ruční vyhotovení XLinkových odkazů Úroveň 2 – detailní sémantická struktura Dokument přestává být „čitelný“ Práce s XLinkem je již ručně nemožná Úroveň 3 – znalostní báze Ručně nelze vyhotovit Akutní potřeba softwarové podpory editace
KEG Stepper - požadavky na software Odbourat ruční vyhotovení dokumentu Skrýt XML zápis Automatické vytvoření XLink odkazů Umožnit sledování vývoje znalostního bloku napříč úrovněmi Export do výstupního formátu
KEG Charakteristika Stepperu Programovací jazyk - Java Vlastní DTD i XML parser Částečná podpora XLink/XPointer Zahrnuje XSLT procesor XALAN Vlastní procesor XKBT pravidel
KEG Stepper – Uživatelský interface Úroveň 1 - vyznačení znalostních bloků
KEG Stepper – Uživatelský interface Úrovně 2.. n – upřesnění sémantické struktury
KEG Pravidla Transformační pravidla (XKBT) Definují povolené transformace znalostního bloku při přechodu do následující úrovně Typy pravidel - dekompoziční, agregační apod. Pravidla pro úpravu vazeb mezi atributy v rámci jedné úrovně XML/DTD architektura se tomuto problému nevěnuje a ani XML schémata nejsou ideální Zjednodušuje doplňování hodnot atributů Pomáhá udržovat konzistenci úrovně
KEG Pravidla Systematická taxonomie transformačních pravidel i pravidel pro úpravu vazeb atributů Modul schopný načítat a aplikovat oba typy pravidel Integrovaný editor pravidel
KEG XKBT vs. XSLT Transformační jazyk XKBT (XML knowledge block transformation) XKBT - jazyk určený k transformaci dokumentů XML (obdobně jako XSLT) Na rozdíl od XSLT je kladen důraz na řízenou transformaci Zaměřen na transformaci znalostí tzn. bloků, které je často nutné během transformace interpretovat doménovým expertem
KEG Pohled napříč úrovněmi Dva možné náhledy Dohledávání všech zdrojových pasáží v textu pro zvolenou elementární část modelu Dohledávání všech částí modelu pro určitou pasáž v textu
KEG Možnosti využití Transformace textových dokumentů Aplikovatelné na dokumenty s podobnými vlastnostmi jako mají LDP V případě LDP existuje několik formálních modelů založených na XML – GLIF3, Asgaard Transformace mezi modely pro zachycování znalostí Zrychluje proces transformace (v případě existence odpovídajících sad pravidel) Při úpravách v jednom modelu lze snadno najít dopad změn i na druhý model Sdílení nástrojů pro reprezentaci znalostí
KEG Plány do budoucna Formalizace LDP pro léčbu NAP Testování metodiky na modelu Asgaard Vývoj dalších modulů (např. reprezentace rozhodovacích struktur)