Sémantický web, ontologie. Sociální sítě.

Slides:



Advertisements
Podobné prezentace
DOTAZOVACÍ JAZYKY slajdy přednášce DBI006
Advertisements

Sociální sítě Ondřej Herman.
Sociální sítě.
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
David Pejčoch XML (Extensible Markup Language) Semistrukturovaná data Obecný značkovací jazyk Vyvinut a standardizován konzorciem W3C Zjednodušená.
HYPERTEXT PREPROCESSOR. PROGRAMOVÁNÍ. DEFINICE POJMŮ Problém Problém nevyřešený, nežádoucí stav obvykle vyžaduje nějaké řešení Neřešitelný problém Neřešitelný.
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Corese RDF Semantic Search Engine Marek Růžička ACACIA INRIA, Sophia Antipolis
Aplikace teorie grafů Základní pojmy teorie grafů
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Statické systémy.
T OOL FOR C OLLABORATIVE XML S CHEMA I NTEGRATION Jiří Meluzín.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Úvod do databází Databáze.
Databáze Jiří Kalousek.
(nejen) pro sémantický web Alena Lukasová
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
D IPLOMOVÁ P RÁCE Databázová reprezentace medicínských informací a lékařských doporučení 2002Josef Špidlen.
Případové usuzování v expertním systému NEST Vladimír Laš, Petr Berka Vysoká škola ekonomická, Praha.
Systémy pro podporu managementu 2
Relační databáze.
Historie databází, jejich význam a základní pojmy
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Sémantizace Webu 3. RDF Peter Vojtáš.
Informatika pro ekonomy II přednáška 10
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Dokumentace objektů a zveřejnění funkcí
Návrh a tvorba WWW Přednáška 5 Úvod do jazyka PHP.
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.
Aplikovaná informatika Zimní semestr 2013/2014. Ing. Bohuslav Růžička, CSc. tajemník katedry K101 kancelář: 215 tel
VLASTNOSTI GRAFŮ Vlastnosti grafů - kap. 3.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
Filtrace web stránek s využitím profilu uživatele Petr Doskočil
Dnešní téma UISK – VPIZ 13 1 ■Technologie věcného pořádání informací a znalostí v 21. století ■dokumenty → data ■data → znalosti ■vizualizace ■ontologické.
Databázové modelování
RDF a RQL Roman Krejčík. RDF a RQL RDF – Resource Description Framework –Jazyk pro ukládání informací v XML –RDF Schema RQL – RDF Query Language –Dotazování.
Databázové systémy Informatika pro ekonomy, př. 18.
4IZ 229 – Cvičení 2 Tvorba báze znalostí Vladimír Laš.
Nové technologie pro webové aplikace v cestovním ruchu Nové technologie pro webové aplikace v cestovním ruchu Pavel Čech Unverzita Hradec Králové.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_01B17 Autor Ing. Jiří Kalousek Období vytvoření Duben 2013.
XQuery Dotazovací jazyk XML Daniel Privalenkov. O čem bude prezentace Nutnost dotazovacího jazyku v XML Rychlý přehled XQuery Několik příkladů.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
XML data na disku jako databáze Kamil Toman
Datovýsklad Datový sklad V budoucích službách státního archivu.
Počítačová chemie (2. přednáška)
1 Bleskové zpravodajství (RSS, RDF, Atom) Ing. Petr Palisa, Triada, spol. s r. o. Problém: obsah webu je strojově čitelný, ale není strojově pochopitelný.
2 Karla Halenková Setkání uživatelů 2001 Báze znalostí produkt pro naplnění uživatelem.
PHP Programy pro tvorbu WWW stránek - 01
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
Sémantický web, ontologie, digitální knihovny. Sémantický web Metody a techniky pro přiřazení významu (sémantiky) informacím na webu Web rozšířený o metadata.
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Perzistence XML dat Kamil Toman
Geografické informační systémy pojetí, definice, součásti
Selekční jazyky Současné trendy Přednáška č. 5 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
Databáze ● úložiště dat s definovaným přístupem ● typy struktury – strom, sekvence, tabulka ● sestává z uspořádaných záznamů ● databáze – struktura – záznam.
Základní škola T. G. Masaryka a Mateřská škola Poříčany, okr. Kolín VY_32_INOVACE_ICT_04 ORGANIZACE DAT V PC Zpracovala: Mgr. Květoslava Štikovcová Číslo.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
XML a datový standard Zdeněk Jirkovec Softwarové Aplikace a systémy.
Úvod do databázových systémů
Unix a Internet 9. SQL server
Dobývání znalostí z databází znalosti
Značkovací jazyky Semantic Web, RDF, OWL.
SOCIÁLNÍ SÍTĚ Číslo projektu CZ.1.07/1.5.00/ Název školy
Informatika pro ekonomy přednáška 8
Transkript prezentace:

Sémantický web, ontologie. Sociální sítě.

Sémantický web Metody a techniky pro přiřazení významu (sémantiky) informacím na webu Web rozšířený o metadata Metadata = data o datech Postaven na formátu RDF

Cíle sémantického webu Integrovat data z různých zdrojů Umožnit výměnu dat mezi aplikacemi napříč celým webem Umožnit kvalitnější strojové vyhledávání informací na webu Umožnit popsat vztahy mezi daty a objekty v reálném světě Přiřadit informacím na webu přesný význam

Metadata v HTML Pomocí <meta> tagů: <meta name="keywords" content="HTML, CSS, XML" /> Cíl: umožnit kvalitnější vyhledávání, než obyčejný full-text search Zneužíváno ve velké míře spammery Neumožňuje definovat vztahy a hierarchie objektů Dnes vyhledávače dávají přednost jiným metodám, než prohledávání <meta> tagů

RDF RDF = Resource Description Framework Framework pro popis zdrojů na webu Navržen tak, aby byl strojově čitelný a pochopitelný Doporučení W3C Různé způsoby serializace (uložení do souboru), př. RDF/XML

Princip RDF Každému zdroji na webu přiřadí trojici: Subject (subjekt, podmět) Predicate (predikát, vlastnost) Object (objekt, předmět) Při definici subjektů a predikátů je typicky potřeba definovat URI (Unique Resource Identifier) pro jednoznačné přiřazení významu. RDF dokumenty lze ukládat do triplestore databází (databáze optimalizované pro RDF trojice) nebo serializovat pomocí XML (formát RDF/XML)

RDF/XML Příklad: „Obloha má modrou barvu.“ Podmět: „obloha“ Vlastnost: „mít barvu“ Předmět: „modrá“ („blue“) Serializace ve formátu RDF/XML: 1: <?xml version="1.0"?> 2: 3: <rdf:RDF 4: xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 5: xmlns:sky="http://fi.muni.cz/rdf/sky/"> 6: <rdf:Description rdf:about="http://fi.muni.cz/rdf/sky"> 7: <sky:color>blue</sky:color> 8: </rdf:Description> 9: </rdf:RDF>

Triplestores Databáze optimalizované pro ukládání RDF trojic (subjekt, predikát, objekt) Mnoho implementací v různých jazycích (C, C#, PHP, Java, Perl) Postaveny buď nad existujícím relačním databázovým strojem (MySQL, PostgreSQL, MS SQL, Oracle), nebo vyvinuty kompletně od začátku přesně pro svůj účel (vyšší efektivita)

Ontologie Model pro popis světa složeného z typů, vlastností a vztahů Využití v sémantickém webu pro přiřazení významu datům (tj. pro tvorbu metadatového modelu) Při tvorbě ontologií je snaha o co nejpřesnější podobnost mezi objekty reálného světa a vlastnostmi modelu

Kategorie ontologií Individua (instance a objekty) Třídy (množiny, kolekce, pojmy, typy, druhy) Atributy (aspekty, stavy, vlastnosti, charakteristiky a parametry, kterých mohou objekty/třídy nabývat) Relace (způsoby, jakými k sobě mohou třídy a individua navzájem patřit) Funkční výrazy (komplexní struktury nad relacemi)

Kategorie ontologií Restrikce (formální popis platného vstupu) Pravidla (Příkazy ve formě if-then (příčina-následek) popisující logické inference, které mohou být odvozeny z výroků v dané formě) Axiomy (výroky (vč. pravidel) v logické formě, které dohromady skládají kompletní teorii, kterou ontologie popisuje. Nemusí obsahovat pouze apriorní znalosti, ale také odvozené teorie z jiných axiomů. Události (změny atributů a relací)

Inference znalostí Pojem inference 1) dobře navržená logická heuristika pro odvozování nových znalostí 2) odvozená znalost Inference znalostí - odvozování nových znalostí na základě existujících (známých) znalostí (inferencí) Využití v sémantickém webu při strojovém vyhledávání nových znalostí

Inferenční enginy Počítačové programy, které zkouší odvodit odpověď z báze znalostí (knowledge base, množina axiomů/výroků/faktů/znalostí/popř. inferencí) Data v bázi znalostí musí být uložena takovým způsobem, aby stroj/engine dokázal odvodit a porozumět jejich významu, tj. musí být explicitně vyjádřena jejich sémantika (samotná data musí být doplněna o metadata)

SPARQL [„spa:kl“] Jazyk / protokol pro inferenci znalostí z RDF dokumentů Umožňuje provádět dotazy nad RDF trojicemi (triplestore databázemi) Podobná syntax jako SQL Výhoda SPARQL: dotazy jsou díky přítomnosti URI v RDF formátu globálně jednoznačné

Sociální sítě propojená skupina lidí, kteří se navzájem ovlivňují Sociální software (socioware) - software, který umožňuje tvořit komunity pomocí počítačových propojení. Virtuální komunita, e-komunita Periferní (tj. lurker – číhající) - externí, nestrukturovaná účast Příchozí (tj. nováček) – nově příchozí je vpuštěn do komunity a může se plně účastnit diskuze Zasvěcenec (tj. stálý člen) – plně uznaný účastník Strážce hranic (tj. vůdce) – podporuje členství a zprostředkovává interakce Odchozí (tj. starý) – proces opouštění komunity kvůli novým vztahům, novým místům, novým vyhlídkám

Sociální sítě Facebook Twitter (tweety, „SMS Internetu“) MySpace – sdílení hudby a videa Orkut – sdílení multimédií, chatování a hledání ztracených přátel. Classmates (Spolužáci.cz) Blackplanet - síť určená pro Afroameričany a jejich přátele Hi5, Friendster, Bebo, …

Modelování a analýza sociálních sítí Grafy Matice Vizualizace Aplikace

Graf Jednoduchý meorientovaný graf je dvojice G = (V, E) , kde V je neprázdná množina vrcholů (uzlů) a E je množina dvouprvkových množin vrcholů, tzv. (neorientovaných) hran. Jednoduchý orientovaný graf je dvojice G = (V, E) , kde V je neprázdná množina vrcholů (uzlů) a E je množina uspořádaných dvojic vrcholů, tzv. (orientovaných) hran.

Maticová reprezentace grafu

Clique - klika social sciences: "clique" popisuje skupinu cca. 2 až 12 (průměr 5 - 6) osob které spolu interagují mnohem častěji a intensivněji než ostatní Teorie grafů: clique je taková podmnožina neorientovaného grafu, ve které jsou každé dva uzly spojené hranou.

Klika - př., graf

Typy klik – př. Punkeři Gangsteři Mean girls Šprti (nerds) Skateři Outsideři Intelektuálové …

Některé další základní relevantní grafové pojmy Cesta Souvislost grafu Cyklus Strom Most Bipartitní graf Orientovaný graf Planární graf, multigraf

Cesta v grafu

Uzavřená cesta

Souvislý graf

Most a bod řezu (cutpoint)

Cyklus

Strom

Bipartitní graf

(ohodnocený) orientovaný graf

Multigraf

Sociální graf senátu USA O'Reilly Media Senatoři jsou propojeni hranou jestliže volí stejně v 65% případů během dvouletého období http://www.slideshare.net/oreillymedia/us-senate-social-graph-1991-present?type=presentation

Vizualizace

Fragment sítě Facebook