Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.

Slides:



Advertisements
Podobné prezentace
Vyhledávací stoje na Internetu. (vyhledavače pro začátečníky)
Advertisements

Obsah prezentace 1.Co je RSS 2.Možnosti využití RSS 3.Popis systému cíleného doručování vědeckých a odborných článků 4.Ukázka systému 5.Závěr.
Modernizace studijních opor Představení LMS Moodle
Korpusová lingvistika (2)
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
D ATABÁZE N VID D ATABÁZE N VID N OVÁ SPECIALIZOVANÁ ONLINE SLUŽBA SPOLEČNOSTI O VID PRO OŠETŘOVATELSTVÍ A DALŠÍ NELÉKAŘSKÉ ZDRAVOTNICKÉ.
Zpracování seminárních a kvalifikačních prací
Organon Interaktivní webová aplikace pro výuku logiky
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Tutoriál EBSCO Discovery Service ~ Jednoduché vyhledávání
Informace – vyhledávání informací
Online nástroje pro Váš lepší web Helena Šimková.
X13PMT 2. seminář Ing. Martin Molhanec, CSc. Garant předmětu ČVUT – FEL, K13113.
VÝUKOVÝ MATERIÁL V RÁMCI PROJEKTU OPVK 1.5 PENÍZE STŘEDNÍM ŠKOLÁM ČÍSLO PROJEKTU:CZ.1.07/1.5.00/ NÁZEV PROJEKTU:ROZVOJ VZDĚLANOSTI ČÍSLO ŠABLONY:
Vyhledávání a analýza dat na internetu 1 Doporučený vyhledávač:
Tutoriál DynaMed ~ Jednoduché prohledávání
Mycroft Mind Sémantický a vizualizační engine nejen pro novou generaci eShopů InterSystems Sympozium
R ESEARCH S TARTERS V EBSCO D ISCOVERY S ERVICE Tutoriál support.ebsco.com.
STRUKTURA OSNOVY KURZU
Úvod do korpusové lingvistiky 4
SubjektSpeciální ZŠ a MŠ AdresaU Červeného kostela 110, TEPLICE Číslo op. programuCZ Název op. programuOP Vzdělávání pro konkurenceschopnost.
ARL klient Stručný přehled funkcí Klient – jiný přístup k datům v systému  Umožňuje používat i další pole v záznamu - Je nezbytný v případě.
Tabulky – vyhledávání (v dalších tabulkách pomocí relací)
Nové funkce v novém Skliku
Název projektu: Šablony Špičák číslo projektu: CZ.1.07/1.4.00/ šablona III/2 autor výukového materiálu: Mgr. Jana Jiroušová, VM vytvořen: únor 2012,
WWW – hypertextový informační systém
ANOTACEPrezentace obsahuje informace o práci s vyhledávačem Google. Druh učebního materiáluDUM Očekávané výstupy Žáci umí použít vyhledávač Google k vyhledávání.
Číslo šablony: III/2 VY_32_INOVACE_P4_1.17 Tematická oblast: Hardware, software a informační sítě OS WIN 7, 1. část Typ: DUM - kombinovaný Předmět: ICT.
Jak získat nové informace (nejen !) v hydrobiologii 1.Knihovna (UP, PřF UP) – fyzicky málo dostupných časopisů 2.Odebírané časopisy s on-line přístupem.
Databázové modelování
Ing. Michal Unzeitig ARTIO s.r.o..  Co je Museo24  Vize a cíle  Role společnosti ARTIO  Technické řešení –CIDOC CRM –Sémantický web Obsah.
2 Petr Žitný znalosti.vema.cz 3 Báze znalostí Nová služba zákazníkům ▸Báze naplněná informacemi, ke které mají uživatelé přímý přístup Základní cíl ▸Poskytovat.
Databáze velké množství dat pevně dané struktury
Jak vyhledávat informace na Internetu?
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Hravá matematika. Seřaď čísla od nejmenšího k největšímu 99, 15, 100, 58, 85, 56, 44, 31, 2, 94, 26, 5 23, 0, 55, 89, 77, 14, 65, 50, 41, 69, 17, 8 55,
Global network of innovation Identity a Access Management v heterogenním prostředí Marta Vohnoutová 19. dubna 2015.
Úvod do studia Strategie vyhledávání zdrojů Robert Zbíral.
Název školy Základní škola Domažlice, Komenského 17 Číslo projektu CZ.1.07/1.4.00/ Název projektu „EU Peníze školám ZŠ Domažlice“ Číslo a název.
Jak učit databáze v tabulkovém procesoru. Učit vlastně databáze na ZŠ ??? Pro: Práce s velkými objemy dat je jedním z hlavních z hlavních využití PC.
Abychom neobjevovali znovu kolo!!! „Východiskem vědeckého studia musí být pečlivé prostudování existující literatury o dané otázce, abychom nezjišťovali.
Jak hledat co nejefektivněji na internetu? Referát Počítačová gramotnost II. Věra Anthová,
Anopress: nová grafika, nové možnosti Mgr. Daniela Uhrová září 2010.
ACB a DIS Využití kompresní metody ACB pro potřeby DIS Tomáš Skopal VŠB-TU Ostrava.
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PŘEDMĚT: ORGANIZACE ZNALOSTÍ PŘEDNÁŠEJÍCÍ: Josef Schwarz Automatická indexace Základní metody a postupy.
KURZ ZÁKLADY PRÁCE S POČÍTAČEM 1 Vyhledávání na internetu Autor: Mgr. Aleš Kozák.
VY_I/2_INOVACE_37_Vyhledávání na internetu Vyhledávání na internetu Miroslav Kaňok.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Internetový vyhledávač Google Elektronické učební materiály - II. stupeň Informatika 9 Autor: Bc. Pavel Šiktanc Jak hledat na internetu??? Hledání pomocí.
Inf WWW – World Wide Web. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Číslo.
ZÁKLADNÍ ŠKOLA, MATEŘSKÁ ŠKOLA, ŠKOLNÍ JÍDELNA A ŠKOLNÍ DRUŽINA BOUZOV, PŘÍSPĚVKOVÁ ORGANIZACE Operační program Vzdělávání pro konkurenceschopnost, č.OP.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Vyhledávání informací Zdroj: pixabay.com. ÚVODEM  Seznámení  Cíl semináře  Zpětná vazba  Prezentace Vaše zkušenosti?
JAK SPRÁVNĚ GŮGLIT. PŘESNÁ SLOVA A FRÁZE nejzákladnější a nejvíce známý vyhledávací trik uvozovky k vyhledání přesné fráze. například provedete následující.
Vyhledávání v Internetu
Výpočetní technika VY_32_INOVACE_17_16_internetový vyhledávač.
Slovní úlohy o pohybu 2 postup na konkrétním příkladu
Dobývání znalostí z databází znalosti
V VY_32_INOVACE_16_MATEMATIKA_2_SLOVNÍ ÚLOHY Dětský domov, Základní škola a Střední škola, Duchcov, Školní 1, příspěvková organizace Registrační číslo:
VIKMA06 Rešeršní a studijně rozborová činnost
Fulltextové vyhledávání
Debrief ke komunikační kampani Praha, 13. května 2016
Automatická indexace Základní metody a postupy
Jak na články? Regionální konference 2009 Jan Šperl
DynaMed ~ Jednoduché prohledávání
Vzor individuální prezentace
Představení Úvod Celé je to pojaté spíše jako představení služby a jejích možností, nežli konkrétní ukázky Lukáš Čochner.
Číslo projektu MŠMT: Číslo materiálu: Název školy: Ročník:
Úvod do korpusové lingvistiky 3
Transkript prezentace:

Bc. Martin Dostal

Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport medicína Musí být k dispozici znalosti k tomuto tématu

K čemu je to dobré? fulltextové vyhledávání sémantické vyhledávání je schopné najít pouze slova, která zadáme může využívat automatické opravy překlepů: měli jste na mysli … lematizaci (hledá např. všechny tvary slova doktor) zkouší pochopit co uživatel hledá a to mu také poskytne v nejlepší možné podobě chce obrázek Prahy, tak ho rovnou uživateli zobrazí hledá jízdní řád, tak nedostane jen odkaz na nějaký článek, ale rovnou mu najde odkud a kdy spoj odjíždí, kolik stojí lístek

Vize do budoucna Syn bude mít zítra narozeniny a já pro něj nemam dárek. Použiju obecnou službu sémantického vyhledávání a zadám dotaz: Co mám koupit Honzíkovi k narozeninám? Služba se podívá na strukturu mojí rodiny a zjistí, že Honzík je můj syn, je mu 7 let, zítra má narozeniny a např. že má blog. znalostní server - statistiky nejžádanějších dárků - filtr kluk, 7let, do 3000 Kč podívá se na Honzíkovo blog a vybere dárky, které se mu nejvíce líbí služba zboží - nalezení nejlepšího prodejce v mém okolí Výsledek bude vypadat takto: Honzík by si asi nejvíce přál vrtulník na dálkové ovládání. Nejlépe tento, který stojí Kč, lze ho koupit v Plzni a kurýrní služba Vám ho může přivést během 45 minut na dobírku. Přejete si ho objednat - ANO nebo NE ?

Co všechno k sémantickému vyhledávání potřebuji? Označený zdroj dat - databázi článků, nebo url znám téma: katastrofy, sport … Ontologii - zápis znalostí týkající se dané problematiky Vhodný algoritmus, který bude hledat informace s využitím ontologie. Pomocné nástroje pro práci s ontologií: lematizace, morfologická analýza Nástroj pro zodpovídání dotazů - snaha pochopit, co uživatel chce a jak mu to dát – desambiguace (zjednoznačnění)

Jaké znalosti k vyhledávání potřebuji? = co by měla ontologie obsahovat: jaké typy katastrof existují a jejich vazby stručnou charakteristiku typů lavina může vznikat pouze na horách lavina = hory, sníh, horská služba apod. záplavy - musí být v okolí řeka záplavy = voda, zatopené sklepy, hasiči apod. -> vytvářím jednoduchou predikátovou logiku

Nástroje pro práci s ontologií Lematizace je metoda převodu slov na jejich základní tvar většinou využívá slovník Morfologická analýza primárně určuje slovní druh a gramatický význam lze využít při pro ověřování vygenerovaných tvarů slov praktický příklad z webu: morfologický analyzátor Ajka, který funguje zároveň i jako lematizátor

Ontologie – metody zápisu OWL Americana

Ontologie – metody zápisu RDF 1 Jiný vlastní formát – zápis s využitím trojic

Problematika zodpovídání dotazů Snaha pochopit, co uživatel chce a to mu dát Lze dělat analýzu vstupu a hledat klíčová slova – názvy míst, činností apod. Případně lze využít šablony pro otázky a relevantní odpovědi: Kdy umřel ? umřel dne v. =

Problematika zodpovídání dotazů Desambiguace metoda zjednoznačnění lemmatizace na základě slovosledu a sémantiky ostatních vět i celého textu: tancích => tank nebo tanec ? pro přesnost desambiguace je potřeba korpus = označkovaná trénovací množina článků korpus by měl být dostatečně velký, ale zároveň zaměřený pouze na téma lematizace a sémantického vyhledávání.

Dotazy ? Dotazy k ontologiím ? Dotazy k implementaci ? Dotazy k vrtulníku ?