MediGrid: sémantika a hodnota biomedicínských dat Jan Vejvalka, Petr Lesný, Tomáš Holeček*, Kryštof Slabý, Adéla Jarolímková**, Helena Bouzková*** Fakultní nemocnice Motol a 2. lékařská fakulta, Univerzita Karlova v Praze *Fakulta humanitních studií, Univerzita Karlova v Praze **CESNET, z.s.p.o., Praha ***Národní lékařská knihovna, Praha
IKI 2010, Praha, Cíl Cílem je represenotvat medicínské znalosti (a data) ve formě efektivně zpracovatelné současnými ICT technologiemi jako zdroje, které lze sdílet (nabízet a využívtat) v GRIDovém prostředí (jako jsou výpočetní výkon nebo paměťová kapacita sdíleny ve výpočetních nebo paměťových GRIDech).
IKI 2010, Praha, Přístup 1: zavaleni daty biomedicínská data jsou specifická forma, přesnost, variabilita, kontext musíme vědět, co chceme s daty dělat „výpočetní“ přístup
IKI 2010, Praha, Data, data, data
IKI 2010, Praha, Přístup 2: zavaleni informacemi záplava informací velmi různá kvalita, různá důvěryhodnost bezbřehá důvěra... bezbřehá skepse abstrahujeme od dat „informační“ přístup
IKI 2010, Praha, Informace bez hranic MAP PP MAP PEP BPS/BPD inst. HR ECG BP
IKI 2010, Praha, Data nebo informace? pokus o překlenutí propasti komunikačně náročné, pracné sémantický výpočetně realizovatelný přístup k datům
IKI 2010, Praha, O projektu MediGrid o platforma o k disposici jako služba (GRID) o sémantický přístup k datům o důraz na dokumentovanost o pilotní provoz
IKI 2010, Praha, MediGrid: platforma o naivní o flexibilní o možnost prolínání domén o přímo neřeší ukládání dat
IKI 2010, Praha, MediGrid: jako služba o computational GRID o webservice o distribuovaný systém o vysoký výkon o správa a údržba o ochrana dat, anonymizace
IKI 2010, Praha, MediGrid: sémantický přístup vkládáme jednotlivé znalosti propojujeme je a sdílíme mezi doménami zpětně extrahujeme znalostní sítě
IKI 2010, Praha, Příklad propojení různých domén tělesná zdatnost a nadváha nadváha: BMI?, výška/váha?, percentily zdatnost: VO 2 max?, METs?, VO 2 max/kg?, Z-skóre
IKI 2010, Praha, MediGrid: dokumentovanost autorská odpovědnost (znalosti i implementace) kvalita a důvěra „technické podružnosti“ jako odborný problém
IKI 2010, Praha, Vrstevnatá architektura o zdroj: vlastní popis a další aparát: autor, citace, skóre o koncepty: popis transformací (algoritmů a vztahů) a tříd indikátorů (datových typů) o implementace: spočitatelné algoritmy a jejich provedení, instance dat a jejich validace o review / odůvodněná důvěra / autority o uživatelé (vlastnictví zdroje, odpovědnost, odborná doména), dataflow o finální rozhodnutí je vždy na uživateli
IKI 2010, Praha, Součásti kvalifikovaného rozhodnutí o indikátory, transformace, třídy indikátorů (data, algoritmy, datové typy) o doprovodná informace (požadavky, omezení, kontext) o uživatel (autor, v rámci instituce, odborné domény) o důvěra, opora v literatuře, autorita pro danou doménu o možnost protichůdných transformací a konfliktních tříd indikátorů o finální rozhodnutí je vždy na uživateli
IKI 2010, Praha, Další perspektivy o další mechanismy podpory kvality obsahu o Shibboleth SSO o zpracování dalších domén o data GRID
IKI 2010, Praha, Klíčové vlastnosti MediGridu data a algoritmy dobře dokumentované efektivní propojení různých domén výpočetně realizovatelné informační podpora rozhodování uživatele
IKI 2010, Praha, Děkuju za pozornost