3.3.2005 1 Corese RDF Semantic Search Engine Marek Růžička ACACIA INRIA, Sophia Antipolis

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Tabulka funkce: V balíku je šest lahví kofoly. Jedna stojí 25 Kč. Sestav tabulku závislosti celkové ceny na počtu zakoupených lahví z jednoho balíku kofoly.
PRŮZKUM NA TÉMA: „Dopady finanční krize“ eficia .
Produkce odpadů 2002 – 2007 obce ORP Šumperk
2 3 Lokalita Pod Javornic kou silnicí 4 směr Solnice směr Javornice směr Vamberk CENTRUM 10min. směr Častolovice.
Zpracování informací a znalostí Booleovský model vyhledávání dokumentů a jeho rozšiřování Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního.
DIGITÁLNÍ MAPOVÝ ARCHIV -moderní přístup k informacím (archiv ČGS) Alena Čejchanová Klára Jančová Archiv České geologické služby.
CXPath Dotazování nad heterogenními XML zdroji s pomocí konceptuálního schéma Jan Vávra, 21. dubna 2004
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Jak se stát miláčkem vyhledávačů
Tréninkový deník Kondiční trénink Jaroslava Chovancová Učo:191699APAK/PR33.semestr.
ZŠ Benešov, Jiráskova 888 Společná setkání nad výtvarnými díly 3 Instalation of paper – 8. r., VVp Mgr. Lenka Pavlíková.
Spektra zatížení Milan Růžička 1 Dynamická pevnost a životnost
Adoptuj panenku a zachráníš dítě! Agáta 1 Ája 2.
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Lego Mindstorms Martin Flusser.
AutorMgr. Lenka Závrská Anotace Očekávaný přínos Tematická oblastOperace s reálnými čísly Téma PředmětMatematika RočníkPrvní Obor vzděláváníUčební obory.
Student: Ing. Olga Minaříková školitel: doc.akad.soch. Miroslav Zvonek, PhD. srpen 2009.
Hra je určená pro dvě družstva nebo dva žáky – červené x modré Po kliknutí na tlačítko s číslicí se zobrazí otázka, s otázkou se zároveň zobrazí napovídající.
Dynamické rozvozní úlohy
XML, RDF a Dublin Core Petr Žabička
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Elektrický obvod a jeho části
Uživatelé, Role, Schémata
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
ARITMETICKÁ POSLOUPNOST I
ZOHO OFFICE Vypracovala: Iva Ptáčková, A11B0605P 1.
Gravitační vlny v přesných řešeních Einsteinových rovnic RNDr
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
(nejen) pro sémantický web Alena Lukasová
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
KASKÁDOVÉ STYLY 4.

Projekt PŘEDPOVĚĎ POČASÍ. Předpověď počasí na
Nejmenší společný násobek
předpověď počasí na 14. května 2009 OBLAČNOST 6.00.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
Nový trend ve slunolamech Radek Pelz, ALARIS Czech Republic s.r.o.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
EDITOR BY: SPRESS 15. ledna ledna ledna 2015.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace

Tento Digitální učební materiál vznikl díky finanční podpoře EU- OP Vzdělávání pro konkurenceschopnost. Není – li uvedeno jinak, je tento materiál zpracován.
Soutěž pro dvě družstva
ISWC 2007 Miroslav Vacura. Pattern for Representing Relevance „An Ontology Design Pattern for Representing Relevance in OWL“ - CDR = Context Domain Relevance.
A weak fuzzy description logic with aggregation Peter Vojtáš na Pracovním semináři pořádaném Knowledge Engineering Group Knowledge Engineering.
Jaroslav Šnajberk, Přemek Brada
MS PowerPoint Příloha - šablony.
Konference SI Praha Ladislav Přívozník is:energy czech a.s.
Fyzika 2 – ZS_3 OPTIKA.
Magnetické vlastnosti látek
Sémantický web, ontologie. Sociální sítě.
Aplikace DVB-T Český Telecom, a.s.. 2 Agenda DVB-T MHP Platforma ČTc DVB-T MHP Platforma ČTc – aplikace Shrnutí cílů společnsti Český Telecom, a.s.
Přednost početních operací
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
DIGITÁLNÍ UČEBNÍ MATERIÁL Test určování a zařazování členovců

RDF a RQL Roman Krejčík. RDF a RQL RDF – Resource Description Framework –Jazyk pro ukládání informací v XML –RDF Schema RQL – RDF Query Language –Dotazování.
Sémantizace Webu 4. RDFS Peter Vojtáš.
SWI140 – Technologie Sémantizace Webu OWL Peter Vojtáš, TSW
Vícerozměrný přístup pro indexování XML dat
Dobývání znalostí z databází znalosti
Značkovací jazyky Semantic Web, RDF, OWL.
Transkript prezentace:

Corese RDF Semantic Search Engine Marek Růžička ACACIA INRIA, Sophia Antipolis

CORESE (COnceptual REsource Search Engine) - napsán v Java - vyvíjen cca 5 let - vyhledávání v dokumentech RDF - pro vyhodnocování dotazů využívá konceptuální grafy

RDF RDF - Resource Description Framework Jazyk W3C pro sémantický web Popisuje zdroje na webu Založen na tripletech: resource property value RDF/XML syntaxe RDF Schema (RDF(S)) : RDF Vocabulary Description Language

Ontologie:Ontologie: Anotace:Anotace: Pravidla:Pravidla: Dotazy ?!:Dotazy ?!: Human ManWoman designation nametitle Man: #jnovak name novak interest Topic:SemanticWeb Human:?x member Group:?g Human:?y member Human:?x colleague Human:?y Human:#jnovak interest Topic:?t

Dotazování v RDF dokumentech Komplexní dotaz (corese query language) : ?x rdf:type c:Person ?x c:name ?n ?x c:author ?doc ?doc rdf:type c:Thesis - Při vyhledávání procházet i všechny podtřídy - Aproximace dotazu Pro RDF(S) neexistuje (zatím) vhodný algoritmus

Dotazy v RDF Dotazu {document} -> {createdBy} -> {Person} -> {subject} -> {Science} -> {subject} -> {Science}odpovídá {TechReport} -> {createdBy} -> {Researcher} -> {subject} -> {CognitiveScience} -> {subject} -> {CognitiveScience}nebo {Book} -> {createdBy} -> {Profesor} -> {topic} -> {SocialScience} -> {topic} -> {SocialScience}

Projekce CG Human action Food Man eat Apple eat < action Man < Human Apple < Food Najít výskyt vzoru grafu v cílovém grafu Procházet specializace tříd podle hierarchie

RDF vs. Konceptuální grafy rdfs:Class Concept Type rdf:Property Relation rdfs:Resource Concept rdfs:domain rdfs:rangeSignature RDF Graph CG

Mapování RDF to CG Převedení RDF do konceptuálního grafu RDF Schema ~ CG support RDF ~ CG Využití operace projekce (CG) jako query engine

Inferenční pravidla ?p rdf:type c:Person ?p c:author ?doc ?doc rdf:type c:PhDThesis ?p rdf:type c:PhD

Aproximativní projekce Proč aproximovat projekci? Původní vize sémantického webu je založena na třech silných hypotézách: - je možné navrhnout ontologii objektivně popisující danou doménu - pomocí této ontologie lze popsat zdroje na webu - uživatelé budou vyhledávat informace skrze dotazy založené na stejné ontologii

Aproximativní projekce Human action Food Chimp eat Banana Najít nejlepší aproximaci na základě - ontologické vzdálenosti - příbuznosti tříd a relací - „relation paths“

Ontologická vzdálenost dvou tříd onto_distance(t1, t2)= class_distance(t1, t) + class_distance(t2, t) kde t je nejhlubší společná nadtřída t1 a t2 Vzdálenost mezi třídou a nadtřídou class_distance(t1, t) = min  ½ depth(x) x , xt1 Kde zahrnuje celou cestu mezi t1 a t a depth(x) je maximální hloubka třídy x v celé ontologii

Ontologická vzdálenost 1 1/2 1/4 D(Human, Chimp)=0.25 (1/8 + 1/8) 1/8

Ontologická vzdálenost 1 1/2 1/4 D(Dolphin, Human) =0.75 (2/8 + 2/4) 1/8

Ontologická vzdálenost 1 1/2 1/4 D(Dolphin, Fish) =1.375 (1/8+1/4+2/2) 1/8

Corese Query langage V dotazovacím jazyce lze specifikovat pro které třídy (relace) aproximaci použít a pro které ne. ?x rdf:type c:Person ?x c:name ?n ?x c:author ?doc ?doc <=: c:Thesis Původně navržen v čistě textové podobě aby byl „snadno čitelný i pro uživatele“ Plánovaný přechod na SPARQL (dotazovací jazyk od W3C pro RDF)

Příbuznost tříd Z pohledu některých uživatelů : Zkrátí vzdálenost mezi KnowledgeDissemination a KnowledgeEngineering Globálně se aplikuje pravidlo ( distribuce seeAlso mezi potomky ): ?x rdfs:seeAlso ?y ?z rdfs:subClassOf ?x => ?z rdfs:seeAlso ?y

Příbuznost relací Pomocí seeAlso lze aproximovat i vlastnosti: Použitím seeAlso se ontologická vzdálenost snižuje na vzdálenost dvou tříd se stejnou nadtřídou

Aproximace vlastností Human eat Food Chimp drink Milk

Relation Paths Pro dotaz x R y Corese generuje i dotazy x R z R y, x R z R t R y apod. ?org c:relation[3] ?topic ?org rdf:type c:Organization ?topic rdf:type c:HumanScience Default all::c:relation[3]

CORESE Semantic search engine Ontologies Documents XML 19 Mai 2000 le facteur Users <rdfs:subClassOf rdf:resource="#thing"/> RDF Schema MAS and Corporate Semantic Web RDF Metadata & Annotations Instance of RDF Schema queryanswer URIUNICODE XMLNAMESPACES RDF RDFS ONTOLOGY RULES Web stack QUERIES RDFS RDF Queries Rules CG Support CG Base CG Query CG Rules CG Results PROJECTION INFERENCES Semantic Web server RDF/S

Corese Přestože je napsán v Java, velmi rychlý… Např. pro RDF graf s relacemi vyhodnotí dotaz za 0.01 s (mód bez aproximací – 0 odpovědí) resp s (mód s aproximacemi – 5 odpovědí)

CORESE - implementace 1.KMP : Knowledge Management Platform 2.WebLearn : Semantic Web for eLearning 3.MEAT : Biology DNA MicroArray Experiment 4.Life-line : Cooperative medical reasoning 5.EADS : Research Lab Corporate Memory 6.Escrire : Comparison of CG, DL and Objects 7.Samovar : Car Design Project Memory with Renault 8.Approbatiom : Design Document Management with CSTB 9.Comma : IST Project Corporate Memory Management through Agents

Project Life-line – Virtual Staff

Project Life-line – Virtual Staff

Závěr CORESE - RDF Semantic Search Engine Vyhledávání v RDF(S) pomocí operace projekce v CG Implementován v INRIAe v 9 aplikacích