Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Motivace sémantický web neexistuje –kdyby tak úžasná věc existovala... neexistuje infrastruktura pro provozování –uložení dat a metadat, dotazovací nástroje, zpracování odpovědí, protokoly, bezpečnost,... datový stoh – úložiště pro RDF data –číslo entity, typ a hodnota atributu, zdroj, validita, relevance –subjekt – predikát – objekt, reifikace –kontextová ontologie obecné rozhraní –možnost použití libovolného datového úložiště
Infrastruktura
Importéry dat a metadat importéry dat –rozhraní pro import dat –konverzní filtry (databáze, XML, web,...) fyzická konverze - do podoby zpracovatelné datovým úložištěm logická konverze - do tvaru odpovídajícímu metadatům –vyhledávače - spojují sémantický web s webem Egothor - modulární koncepcí umožňuje doplnit moduly pro spolupráci datovým úložištěm importéry metadat –aktualizace metadat
Manuální a automatické importéry manuální importéry –exportní filtry různých datových zdrojů –explicitně naprogramované automatické importéry –ohromné množství nestrukturovaných dat –framework pro heuristické, statistické a pravděpodobnostní algoritmy –vize: umělá inteligence spolupráce s UI AV –vyhledávač Egothor modul pro automatické odvozování sémantiky na základě stažených dat.
Dotazovače rozhraní pro dotazy a získávání odpovědí uživatel typicky nezná strukturu dat –rozsáhlá a dynamická dotazovací moduly –prohlížeč dat řízený sémantikou (Tykadlo) –SPARQL –vícekriteriální dotazovač –vize: dotazy v přirozeném jazyce, lingvistické metody –metody umělé inteligence: 'ukažte, data, co je na vás zajímavého'.
Exekutory 'výsledek dotazu' lze interpretovat různými způsoby tradiční reprezentace vázána na použitý dotazovač –Tykadlo: propojené html stránky –vyhledávač: webové odkazy s popisem –SPARQL: řádky n-tic exekutory –zavedení procesních modelů –úkol exekutoru: provést sémantickou akci interakce dat získaných dotazovačem s ostatním světem –atomické exekutory lze skládat –orchestraci provádí dirigent vzájemné propojení exekutorů za účelem dosažení funkčnosti
Závěr a na tom všem pracujeme stay tuned
Infrastructure for querying semantic data Jiří Dokulil, Jakub Yaghob, Filip Zavoral Dept. of Software Engineering, MFF UK Praha Yaghob J., Zavoral F.: Budování infrastruktury sémantického webu, ITAT 2006 Dokulil J.: Transforming Data from DataPile Structure into RDF, Dateso, Desná, 2006 Dokulil J.: Použití relačních databází pro vyhodnocení SPARQL dotazů, ITAT 2006 Yaghob J., Zavoral F.: Semantic Web Infrastructure using DataPile, Web Intelligence, Hong Kong, 2006 Dokulil J.: Evaluation of SPARQL queries using relational databases, 5th Intl. Semantic Web Conference, Athens, USA, 2006