Quo vadis, KEG? Zamyšlení nad vznikem a budoucností “Knowledge Engineering Group”na VŠE Praha V. Svátek, září 2003
Co je KEG? Neformální pracovní skupina v rámci VŠE (občas přesahující i na jiná pracoviště) “Pevnými body” jsou –seminář konaný několikrát v roce –stránka Zaměření na problematiku znalostních technologií, tj. KDD, znalostních systémů, ontologií, značkovacích jazyků... Primární publikační platforma: konference Znalosti
Důvody vzniku KEG Vyplývají z rozvoje tématiky, kterou je obtížné vtěsnat do profilu oficiálních pracovišť (KIZI, LISp, EuroMISE-Kardio) Vnitřní: potřeba rámce pro společné diskuse a výměnu poznatků (zejména doktorandi, studenti!) Vnější: potřeba prezentovat se potenciálním projektovým partnerům (v zahraničí i tuzemsku) jako “silná pracovní skupina”
Hlavní tématické okruhy (nejsou zdaleka disjunktní!) KDD a strojové učení Ontologie, sémantický web, analýza WWW Vývoj znalostních systémů a aplikací Značkovací jazyky, XML technologie Dále návaznosti na tradičnější oblasti: aplikovaná lingvistika, soft computing, information retrieval apod. (ovšem v kombinaci s výše uvedenými)
KDD a strojové učení Na KIZI tradice již od 80. let –systémy ESOD, KEX - J. Ivánek, P. Berka –vycházely z metody GUHA V 90. letech posílení: –vznik projektu LISp-Miner (J. Rauch, M. Šimůnek) –pořádání evropských konferencí: ECML (1997), PKDD (1999), Discovery Challenge od konce 90. let významná grantová podpora: –granty EU: Solomon, MiningMart –síťové projekty Eunite a KDnet –téma č. 1 v rámci EuroMISE - Kardio VŠE
KDD - aktuální stav Podány granty s Lyonem a Ljubljanou; stabilně Discovery Challenge Podpora EuroMISE (do 2004) - orientace na lékařská data LISp-Miner již jako stabilní systém, poskytován na řadu pracovišť; rozvoj nových funkcí zvl. v rámci PhD projektů Drobné experimenty v oblasti text/web mining Dobré pozice na některých konferencích (PKDD, ISMIS atd.)
Ontologie a WWW Tématika zvl. v tuzemsku téměř neznámá, zahrnuje široké spektrum problémů První pokusy o ontologie od konce 90. let –ontologie WWW P. Šimka (1999) –ontologie lékařských doporučení (2000, projekt MGT) Inteligentní systémy pro WWW –metavyhledávač VŠEvěd (1999) –vznik projektu Rainbow (2000)
Ontologie a WWW - pokrač. Od r účast v OntoWeb, získání kontaktů –Karlsruhe - stáž M. Kavalce ( ) –Amsterdam (F. van Harmelen) –účast M. Labského na letní škole SSSW (2003) Skupina volně sdružená okolo Rainbow: –podpora grantem GAČR (inteligentní analýza WWW) –PhD projekty např.: web information extraction, ontology learning, semantic web services...
Znalostní systémy Tradice pravidlových systémů (od 80. let): – SAK (Ivánek, Berka...) –z něj vychází NEST (nová implementace 2003!) Od konce 90. let orientace zejména na WWW: –VŠEvěd, Rainbow –WiseCon - hybridní systém Šance zapojit zpracování neurčitosti do “pravidlové vrstvy” sémantického webu?
Značkovací jazyky “Praktické” využívání - uznávanými experty jsou J. Kosek a V. Sklenák “Znalostní” směr - systém Stepper (M. Růžička) Infrastruktura pro KDD, ontologie aj.; vedle toho ale “žijí svým životem” (XML, XPath, XSLT...)
Průniky témat S problémy na rozhraní tématických oblastí máme asi největší šanci prorazit v mezinárodním výzkumu! (“Jádra” oblastí jsou totiž už obsazena zavedenými komunitami) Např.: –ontologie a značkovací jazyky pro KDD –extrakce informací pro sémantický web –pravidlové systémy s neurčitostí pro sémantický web –ale také kombinace ontologií s prvky soft computing a information retrieval atd.?
Hlavní partneři v tuzemsku Gerstnerova laboratoř FEL ČVUT (O. Štěpánková) KSI MFF UK (J. Pokorný) KI VŠB-TU Ostrava (V. Snášel) ÚI a ÚTIA AV ČR (EuroMISE, P. Hájek, …) Brno – MUNI, VUT
Nabídka diplomových prací V. Svátek, zatím jen pro témata jemu blízká Doporučovací “expertní systém” (v provozu bude asi až v listopadu): Velká část témat je právě “průnikových”