Získávání znalostí z medicínských textů Petr Kolesa EuroMISE Centrum.

Slides:



Advertisements
Podobné prezentace
Na zahrádce s chemií.
Advertisements

Výuka cizích jazyků technických předmětů
Sémantická anotace dat z webovských zdrojů
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
CXPath Dotazování nad heterogenními XML zdroji s pomocí konceptuálního schéma Jan Vávra, 21. dubna 2004
Digitální obrazová informace a systémy PACS
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Vypracoval: Ladislav Navrátil, EI-4 Umělá inteligence Zaměření Expertní systémy.
Koreferát: LISp-Miner a (lékařské) ontologie Vojtěch Svátek.
FORMALIZACE PROJEKTU DO SÍŤOVÉHO GRAFU
Celoživotní vzdělávání a projektová metoda vyuČování
Tvorba snímků v PowerPointu
Algoritmizace a programování
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Koordinační centrum pro EQF (EQF NCP) Setkání zástupců evropských iniciativ NAEP Milada Stalker Antonie Ondrouchová Pavel Hradecký.
Analýza informačního systému
Informatika I Informatika pro 1. ročník 4 letého gymnázia
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
Elektrotechnika v hodinách anglického jazyka
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Systémy pro podporu managementu 2
Databázové systémy Přednáška č. 4 Proces návrhu databáze.
Databázové systémy Přednáška č. 6 Proces návrhu databáze.
Informační systémy TPS,MIS, SIS.
?.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Dokumentace informačního systému
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Ukládání heterogenních dat pomocí rozvolněných objektů Michal Žemlička.
Internet ale velmi výrazně slouží i pro komunikaci, přičemž jednoznačně nejpoužívanějším komunikačním prvkem je . Význam slova lze přeložit.
Umělá inteligence Minského definice: UI je věda o vytváření strojů nebo systémů, které budou při řešení určitého úkolu užívat takového postupu, který –
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Anglické standardy při psaní projektu Osnova kurzu
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
EBSCO Ramis Václavík Centrum informačních a knihovnických služeb Odbor informační podpory studia a výzkumu
Využití ontologií při dobývání znalostí z databází Hana Češpivová.
ISSS 2003 Koncept využitelných stávajících datových zdrojů pro Portál veřejné správy ISSS 2003 Krajský úřad Plzeňského kraje Odbor informatiky Václav Koudele.
Poradenství v obecném řízení
Analýza informačního systému. Podrobně zdokumentovaný cílový stav Paramentry spojené s provozem systému – Cena – Přínosy – Náklady a úspory – …
Kvantitativní metody výzkumu v praxi
B i o c y b e r n e t i c s G r o u p Nový obor - počítače v medicíně a biologii  Proč je management informací ústřední otázkou v biomedicínském výzkumu.
Základní informační zdroje pro zubní lékařství
MorČe morfologické značkování češtiny
10 DŮVODŮ PROČ PÍT ALOE VERA GEL
Projekt LISp-Miner Milan Šimůnek. Milan Šimůnek – Projekt LISp-Miner2 Obsah Význam databází a uchovávaných informací Proces dobývání znalostí z databází.
Text mining – definice inteligentní analýza textu textový data mining
Metody vytváření biomechanického modelů
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
SOCIÁLNÍ DATA JAKO ZDROJ PRO STUDIUM PERCEPCE PROSTORU Vít Voženílek.
Klasifikace nemocí – ICD, ICF
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Selekční jazyky Současné trendy Přednáška č. 5 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
Algoritmizace a programování Algoritmy 2 – Vývojové diagramy (sekvence)
Formy vstupu podniků na mezinárodní trhy Franchising.
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
Seznamy digitálních knihoven
Psát není tak složité, aneb pojďte s námi tvořit Metodický portál.
SOFTWAROVÁ PODPORA PRO VYTVÁŘENÍ FUZZY MODELŮ Knihovna fuzzy procedur Ing. Petr Želasko, VŠB-TU Ostrava.
Vyhledávání na Internetu. Webové vyhledávače Webový vyhledávač je služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované.
1 Elektronické informační zdroje Oční klinika FN Brno Knihovna univerzitního kampusu Mgr. Vladimír Opatrný
SOFTWARE Operační systémy.
V Českých Budějovicích, únor 2017
Veřejný seminář k projektu NIX-ZD.CZ
Standardní postupy a standardní péče – jak na to?
VIKMA06 Rešeršní a studijně rozborová činnost
Právní pohled: marginální skupiny pacientů ve zdravotnictví
Elektronické informační zdroje Katedra porodní asistence 18
Geografické informační systémy
Seznamy digitálních knihoven
Seznamy digitálních knihoven
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Transkript prezentace:

Získávání znalostí z medicínských textů Petr Kolesa EuroMISE Centrum

Osnova Systém pro dotazování na interakce a kontraindikace léků Amilcare - nástroj pro information extraction (IE) PDT – nástroj pro zpracování přirozeného jazyka (NLP). Užití ontologie

Práce Cíl: dotazy nad „databází“ léků interakce, kontraindikace: je možné pacientovi s diagnózou D1, D2, D3, stavem S1, S2 podat lék L, když užívá léky L1, L2 a L3 Znalosti získat z příbalových letáků

Formalizace příbalových letáků Při převodu příbalových letáků do strukturované podoby je třeba, aby se někdo zaručil za správnost převodu. výhoda – člověk stejně musí projít celý text je žádoucí použít deep analysis, supervised learning Člověk transformuje, systém se mu snaží pomáhat.

Ukázka textu Přípravek se nesmí užívat při zeleném očním zákalu, při neprůchodnosti střev, při ztížené průchodnosti vrátníkem, dále při epilepsii a při deliriích. Přípravek se nesmí užívat současně s inhibitory monoaminooxidázy (některé léky proti depresím), ani 14 dní před zahájením nebo po ukončení jejich užívání. Amiptriptylin nesmí užívat kojící ženy.

AMILCARE Dosažené výsledky nízké hodnoty precision (17 %) i recall (14 %) Pokud trénovací a testovací množina stejná – P: 100 % a R: 81 až 85 % Jak zlepšit: Dodat další informace Provést normalizaci textu

Zpracování přirozeného jazyka Přidat morfologické informace: lemma, morf. značka (pád, číslo) Jen lemma: P: 44 %, R: 27 % Lemma + morf. značka: problém nejednoznačnosti Učení jen na morf. značkách Pokud to bude málo, budou dodány informace o povrchové struktuře věty

Normalizace textu Normalizace: překlepy, idiosynkratika (mmHg vs mm Hg) výčtové typy, gazetteers obecná normalizace na úrovni vět je příliš složitá Letáky produkované jednou firmou mají stejnou strukturu.

Co s výsledky IE Vím, kde v textu leží to, co mě zajímá. Co s tím? Krok od povrchové struktury k tomu, co to znamená (slova → koncept) Seznam „synonym“, kanonická fráze navrhne počítač, určí člověk glaukom: zelený zákal, zelený oční zákal, zelený zákal oční Mapování konceptů na ontologii

UMLS Unified Medical Language System vyvíjí National Library of Medicine obsahuje několik zdrojových slovníků ICD-10 (MKN 10) MeSH Snomed CT … „Cílem UMLS je usnadnit vývoj počítačových systémů, které se chovají tak, jako by rozuměli jazyku biomedicíny.“

UMLS – příklad Patří diazepam do skupiny léků ovlivňujících CNS?

Použití ontologie Zdá se, že pro potřeby „léků“ UMLS vyhovuje Problémy: mapování čeština  angličtina rozdílné léky v USA a ČR

Dosavadní výsledky Překvapivě nízká hodnoty precision a recall Pro potřeby IE je třeba text normalizovat: gazetteers Obecné NLP nástroje mají vysokou spolehlivost – není třeba vytvářet specializované medical language processing (MLP) nástroje Mapování na UMLS je obtížné ale možné Vznikl slovník léků distribuovaných v ČR – používá se při získávaní dat z lékařských zpráv.