VIKMA06 Vyhledávání informací

Slides:



Advertisements
Podobné prezentace
Nový přístup k aplikacím Vema
Advertisements

Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Přednáška č. 5 Proces návrhu databáze
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Tutoriál MEDLINE Complete ~ Vyhledávání support.ebsco.com.
Vyhledávání na Internetu
PROGRAMOVACÍ JAZYKY (c) Tralvex Yeap. All Rights Reserved.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Databáze Jiří Kalousek.
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Návrh a tvorba WWW Přednáška 1
ISWC 2007 Miroslav Vacura. Pattern for Representing Relevance „An Ontology Design Pattern for Representing Relevance in OWL“ - CDR = Context Domain Relevance.
REKS - Regionální knihovnický systém Školení pro dobrovolné knihovníky 4. března 2008.
Relační databáze.
Seznamy digitálních knihoven
Základní pojmy Systém je abstrakce, kterou si lidé vytvářejí v procesu poznávání jako nástroj zkoumání reálných objektů.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Oborová informační brána KIV Jak ji využívat. Bránu KIV vytvořili Hlavní garant: Knihovnický institut NK ČR Technologie: Ústav výpočetní techniky UK v.
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Jazyk PHP Programovací jazyk PHP (Hypertext preprocessor) je skriptovací jazyk, který běží na straně serveru. KLIENT - SERVER Server posílá do vašeho počítače.
Studijní informační zdroje (a jak se k nim dostat) Informační blok k předmětu Jazykový projev (2012/13)
Informace a Informatika. Terminologie Informatika – anglicky information science Zabývá se zpracováním informací nejen na počítačích. Informatika (počítačová.
Web 2.0, folksonomie a uživatelská rozhraní Lenka Němečková Eliška Pavlásková Založeno mimo jiné na prezentacích prof. B. Whitea „The Promise of Rich User.
Ing. Michal Unzeitig ARTIO s.r.o..  Co je Museo24  Vize a cíle  Role společnosti ARTIO  Technické řešení –CIDOC CRM –Sémantický web Obsah.
ProQuest Central Martin Krčál Školení pro studenty FSSBrno, a představení databáze.
Informační kulturní portál
Databáze Lokální systémy a SQL servery VY_32_INOVACE_7B10.
Nové technologie pro webové aplikace v cestovním ruchu Nové technologie pro webové aplikace v cestovním ruchu Pavel Čech Unverzita Hradec Králové.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Datovýsklad Datový sklad V budoucích službách státního archivu.
Ústřední knihovna FSS MU Zprávám z médií a tisku na stopě!
REŠERŠNÍ STRATEGIE Mgr. Anna Vitásková.
Studijní informační zdroje (a jak se k nim dostat) Osnova Prezentace.
Současné trendy v selekčních jazycích Přednáška č. 3 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury.
Seznamy digitálních knihoven
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Selekční jazyky Současné trendy Přednáška č. 6 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
Dana Sigmundová Jak najít a získat dokumenty (nejen) v knihovnách MU ÚK FSS MU, Ústřední knihovna FSS MU.
METALIB a SFX Martin Krčál Školení pro studenty FSSBrno, 29. března 2011 aneb jak vyhledávat skoro ve všech e-zdrojích současně.
13.přednáška – Elektronické zásobování Ing. Jiří Zmatlík, Ph.D. ČVUT, Fakulta elektrotechnická Katedra ekonomiky, manažerství a humanitních věd.
VIKMA06 Rešeršní a studijně rozborová činnost
Selekční jazyky Současné trendy Přednáška č. 5 ( ) Filozofická fakulta Masarykova Univerzity, Kabinet knihovnictví - Ústav české literatury a knihovnictví.
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Workshop, Knihovna AV ČR, 4. října 2010 Mgr. Tomáš Foltýn Kramerius 4 Uživatelské rozhraní Do verze
Seznamy digitálních knihoven
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
M. Balíková, NK ČRSeminář účastníků Souborného katalogu ČR, Soubor věcných autorit aktuální informace
as4u advanced system for you
Vlastnosti souborů Jaroslava Černá.
Dobývání znalostí z databází znalosti
Soubor Soubor v informatice označuje pojmenovanou sadu dat uloženou na nějakém datovém médiu, se kterou lze pracovat nástroji operačního systému jako.
Současné trendy v selekčních jazycích
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
VIKMA06 Rešeršní a studijně rozborová činnost
VIKMA06 Rešeršní a studijně rozborová činnost
Driver Bezplatný portál umožňující přístup k více než
Fulltextové vyhledávání
Současné trendy v selekčních jazycích
VIKMA05 Organizace znalostí
Automatická indexace Základní metody a postupy
Selekční jazyky Současné trendy
VIKMA05 Organizace znalostí
VIKMA06 Vyhledávání informací
VIKMA06 Vyhledávání informací
Elektronické informační zdroje (VIKBA25)
VIKMA06 Rešeršní a studijně rozborová činnost
Seznamy digitálních knihoven
Seznamy digitálních knihoven
Transkript prezentace:

VIKMA06 Vyhledávání informací 25. 11. 2016: Přednáška P09: Vyhledávání netextových informací, vyhledávání a internet FF MU, podzim 2016 Mgr. Josef Schwarz 126172@mail.muni.cz

Netextové informace obraz, zvuk, kombinace internet způsoby přístupu textová složka je marginální internet velký objem netextových informací omezené možnosti vyhledávání vyhledávače (podle popisku – příklad 1, 2, 3) způsoby přístupu prohlížení (příklad 1, 2) vyhledávání (příklad 1)

Indexace netextových inf. podstatně složitější než indexace textových inf. hlediska indexace/vyhledávání hlediska 1 věcnost (ofness)  „tvrdá“ indexace výrazovost (aboutness)  „měkká“ indexace hlediska 2 základní vlastnosti (barva, tvar) logické vlastnosti (vztah mezi objekty) abstraktní vlastnosti (metaforický význam)

Vyhledávání netextových inf. content-based image retrieval (CBIR) vyhledávání podle obsahu automatické zpracování obrazu (image processing) description-based image retrieval (context-based, concept-based) vyhledávání podle popisu (kontextu, pojmového vyjádření) (image indexing)

CBIR vyhledávání na úrovni pixelů objektové vyhledávání QBIC - Query by Image Content (IBM) objektové vyhledávání extrahování obrazových objektů image mining (dolování obrazových informací) extrakce podobných znaků z celé db extrakce všech vlastností bez prvotní znalosti

Vyhledávání podle popisu výhoda: sémantický obsah obrazu nevýhoda: subjektivitainkonzistence indexace způsob indexace závisí na typu kolekce a požadavcích uživatelů indexace biografických vlastností předmětových vlastností fyzických vlastností vztahových vlastností

Řízené slovníky pro popis netextových dokumentů ICONCLASS ATT (Art & Architecture Thesaurus) Thesaurus for Graphic Materials

Aplikační oblasti průmyslové vlastnictví (ochranné známky) lékařství umění a architektura astronomie kriminologie …atd.

Vyhledávání a internet Skrytý web Sémantický web

Neviditelný web

Typy „neviditelnosti“ Nepřehledný web (Opaque web) Soukromý web (Private web) Vlastnický web (Proprietary web) Skutečně neviditelný web (Truly invisible web)

Nepřehledný web Obsahuje soubory, které mohou být, ale z určitých příčin nejsou vyhledávači indexované. Důvody: hloubka indexování (depth of crawling) frekvence indexování (zprávy, inzerce, ceny akcií) maximální počet viditelných výsledků odpojené stránky

Soukromý web Obsahuje stránky, které by robot dokázal zaindexovat, ale správce webu to znemožňuje. stránky chráněné heslem soubor robots.txt metatagy „noindex“, „nofollow“

Vlastnický web Část webu, ke které je přístup pouze po splnění určitých podmínek. stránky vyžadující souhlas s podmínkami pro vstup stránky dostupné po zaplacení poplatku

Skutečně neviditelný web Stránky, které roboty neindexují kvůli svým technickým omezením. dynamicky generované stránky relační databáze (Oracle, MS SQL Server, IBM DB2)

Přednosti hlubokého webu specializovaný obsah – komplexnější informace sofistikovanější uživatelské rozhraní větší důvěryhodnost oborovost

Přístup k hlubokému webu metavyhledávače specializované vyhledávače, katalogy, adresáře oborové (předmětové) vyhledávače, katalogy, adresáře referenční zdroje weby knihoven digitální a virtuální knihovny oborové databáze weby organizací knihy (archivy, e-books) blogy

Výběr vyhledávačů hlubokého webu Complete Planet adresář více než 70 000 databází a specializovaných vyhledávačů ResourceShelf blog s informacemi a novinkami o informačních zdrojích (připravovaný informačními profesionály)

Sémantický web

klasický x sémantický web Tvořen tak, aby jeho obsahu porozuměl pouze člověk Citlivý na použitou terminologii Nalezených dokumentů je obvykle příliš mnoho nebo naopak příliš málo (případně žádné) Výsledkem vyhledávání je pouze jedna stránka Rozšíření klasického webu Obsah ve strojově přístupné formě Vyhledávání podle klíčových slov nahrazeno zodpovídáním dotazů Dotaz je možno zodpovědět na základě extrakce informací z více stránek

Klasická podoba webu <h1>Agilitas Physiotherapy Centre</h1> Welcome to the home page of the Agilitas Physiotherapy Centre. Do you feel pain? Have you had an injury? Let our staff Lisa Davenport, Kelly Townsend (our lovely secretary) and Steve Matthews take care of your body and soul. <h2>Consultation hours</h2> Mon 11am - 7pm<br> Tue 11am - 7pm<br> Wed 3pm - 7pm<br> Thu 11am - 7pm<br> Fri 11am - 3pm<p> But note that we do not offer consultation during the weeks of the <a href=". . .">State Of Origin</a> games.

Web s explicitními metadaty XML + XML schéma RDF + RDF schéma <company> <treatmentOffered>Physiotherapy</treatmentOffered> <companyName>Agilitas Physiotherapy Centre</companyName> <staff> <therapist>Lisa Davenport</therapist> <therapist>Steve Matthews</therapist> <secretary>Kelly Townsend</secretary> </staff> </company>

Sémantický web Základní složky (předpoklady) SW strukturace dokumentů vyjádření sémantiky - ontologie vyhledávací nástroje - agenti standardy syntaktická složka URI strukturální složka XML sémantická složka RDF + RDFS (schéma RDF) OWL, OIL

Vrstvy sémantického webu

Sémantický web – příklady řešení W3C příklad aplikace RDF energetika Výzkum The Open University London, Knowledge Media Institut Magpie Stanford Knowledge Systems Laboratory DAML (agenti) EU, 5. rámcový program On-to-knowledge