Fulltextové technologie a jejich využití v UIS Bc. Miroslav Prachař datamanagement

Slides:



Advertisements
Podobné prezentace
Mgr. Iva Celbová konzultant SEFIRA spol. s r.o.
Advertisements

Hotel Tatra, Velké Karlovice 23. – 25. dubna 2007 S4U – Seminář o Univerzitním informačním systému 1 Osobní management Tomáš Procházka.
Školení MS Word 2007 pro začátečníky RNDr. Milan Zmátlo MěÚ Třebíč, říjen 2011 Vzdělávání v eGON centru Třebíč Tento.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Kateřina Raichová. Materiál je publikován pod licencí Creative Commons. ze sady:3tematický.
Projekt Informační a vzdělávací portál Libereckého kraje I CZ.1.07/1.1.00/ I Školení pro uživatele portálu.
 Vzdělávací mobilita jednotlivců podporuje mobility v oblasti vzdělávání, odborné přípravy a mládeže, rozsáhlé akce Evropské dobrovolné služby a sdílené.
Jméno autora Ing. Ladislav Novák Datum vytvoření prosinec2012 Ročník 6. Vzdělávací oblast obor tematický okruh Informační a komunikační technologie Informatika.
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař.
Číslo projektu CZ.1.07/1.5.00/ Název školy Gymnázium Česká a Olympijských nadějí, České Budějovice, Česká 64 Název materiálu VY_32_INOVACE_IVT_1_KOT_02_CISELNE_SOUSTAVY.
Co je Open Access (OA) Bc. Miroslava Pourová. Open Access = Otevřený přístup mezinárodní iniciativa k zajištění: – trvalého – okamžité – bezplatného přístupu.
Školení pro editory a správce webů základních součástí FF UK
Diplomové práce pro CE WOOD a) Bilance toku materiálu pilařského provozu b) Závislost kvality vstupní suroviny na kvalitu výstupních produktů pilařského.
Autor:Ing. Pavel Brož Předmět/vzdělávací oblast:Informační a komunikační technologie Tematická oblast:Práce se standardním aplikačním programovým vybavením.
Elektronické učební materiály - II. stupeň Informatika – aplikace informačních technologií Autor: Bc. Pavel Šiktanc Internetové stránky Co se všechno naučíme???
Název školy:ZŠ a MŠ Verneřice Autor výukového materiálu:Mgr. Jiří Benda Číslo projektu:CZ.1.07/1.4.00/ Název:VY_32_INOVACE_I.ICT3 Vytvořeno:3. 7.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_30-03 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorRNDr.
Tvorba WWW stránek. Obsah Princip fungování WWW Současné trendy Zásady tvorby WWW stránek Netiketa.
Název školy Střední škola, Základní škola a Mateřská škola, Karviná, p. o. Autor Mgr. Lubomír Stepek AnotacePrezence slouží k procvičení probrané ho učiva.
Postup modelování Kateřina Růžičková. Postup modelování Rozhodnutí modelovat Definice problému Existence modelu, pro daný problém Identifikace modelu.
Kritéria dotazů II Access (10). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro.
Úvod do databází MS Access (1).
Věcné autority v roce 2016
Aplikace nástrojů marketingového mixu ve vybrané společnosti
Ústřední knihovna FSS MU
Oxford WordSmith Tools 4.0
Základní škola a mateřská škola Lázně Kynžvart Autor: Mgr
Výukový materiál zpracován v rámci projektu
Informační a komunikační technologie
Vysoká škola technická a ekonomická v Českých Budějovicích
METODIKA ZAVÁDĚNÍ UIS NA JINÝCH UNIVERZITÁCH
COM – Práce s objektovým modelem jiné aplikace
Práce s PC P1.B Vránek Michal.
Evaluace předmětů studenty (Anketky)
DOKUMENTACE ANEB CO CHCETE ZLEPŠIT
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
Tématické vyhledávání aneb nový Vyber.pm
Číslo v digitálním archivu školy
METODICKÝ LIST PRO ZŠ Pro zpracování vzdělávacích materiálů (VM)v rámci projektu EU peníze školám Operační program Vzdělávání pro konkurenceschopnost   
Optimalizace materiálových toků ve vybrané společnosti
TIPY A RADY PRO PRÁCI S DATABÁZÍ SCOPUS
Název školy: Základní škola a Mateřská škola Kladno, Vodárenská 2115
Fulltextové vyhledávání
WORD Číslování stránek
Implementace steganografických algoritmů
Databáze MS ACCESS 2010.
Střední odborná škola a Střední odborné učiliště, Hradec Králové, Vocelova 1338, příspěvková organizace Registrační číslo projektu: CZ.1.07/1.5.00/
DIGITÁLNÍ UČEBNÍ MATERIÁL
Propojení UIS s knihovnami
Obsahuje asi 4,5 mil. bibliografických záznamů
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Číslo projektu CZ.1.07/1.4.00/ Název sady materiálů
WORD Vkládání obrázků a klipartů
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Informační a komunikační technologie Informatika Operační systémy
NÁZEV ŠKOLY: Základní škola Josefa Bublíka, Bánov
Aplikace vyhledávače Google na zdroje odborných informací
Počítačová cvičení z předmětu Datové sklady
MU002 Informatika II Základy algoritmizace 1/13
Možnost volby vyhledávacího pole
OECD iLibrary Mgr. Alena Filipová
Word Okraje WordArt Pozadí Vodoznak. Word Okraje WordArt Pozadí Vodoznak.
Tento vzdělávací materiál vznikl v rámci projektu EU – peníze školám
Celoživotní vzdělávání učitelů
ANOPRESS IT Centrum informačních a knihovnických služeb VŠE
Ing. Alžběta Králová SEFIRA spol. s r.o.
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
Analýza informačního systému
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
MU002 Informatika II Základy algoritmizace 1/13
Dvousemestrální celouniverzitní předmět: (možná i zkrácená verze jednosemestrální komerční) Úvod do terminologie a psaní textu v univerzitním prostředí.
Transkript prezentace:

Fulltextové technologie a jejich využití v UIS Bc. Miroslav Prachař datamanagement

OBSAH PŘÍSPĚVKU Úvod do fulltextových technologií Stav vyhledávání v UIS Využití fulltextu v UIS Implementace

CO ZNAMENÁ FULLTEXT Metoda vyhledávání, indexování Rozsáhlé soubory Vznik fulltextu – nárůst dat v síti Internet Transformace HTML stránek Inverzní index Prohledávání samotného obsahu dokumentu

VYHLEDÁVÁNÍ V UIS Podle určitého klíče Klíč = charakteristická informace určitého objektu Podřetězce Možnost zadat část klíče Různé metody indexování

PRINCIP INDEXOVÁNÍ V UIS

MOŽNOSTI ZAVEDENÍ FULLTEXTU Vývoj vlastní technologie Google Komerční technologie Oracle – Oracle Text

ORACLE TEXT Indexování, CONTEXT index Hledání slov uvnitř textových dokumentů Zobrazování informací Inverzní index – tzv. tokeny MS WORD, PDF, HTML, čistý text, … Lexer - jazykové přizpůsobení  Diakritika 

PŘÍKLAD DOTAZU SELECT SCORE(1), nazev FROM DOKUMENTY WHERE CONTAINS(DOKUMENT, ’les’, 1) > 0 ORDER BY SCORE(1) DESC; ’les’ -> ’les and pole’ -> ’les & pole’

CONTEXT CZ Produkt firmy SEFIRA Lokalizace ORACLE TEXT pro češtinu Fce CZ, český stoplist, různé operátory Operátor stem ($) Lexikální analýza Slovní základ Speciální datový slovník Sada spec. algoritmů

PŘÍKLAD POUŽITÍ CONTEXT CZ Dotaz: kůň Výsledek: sada dokumentů obsahující koně, koni, koňmi… Dotaz: jíst Výsledek: jedla, jez, jíme…

PŘÍKLAD POUŽITÍ CONTEXT CZ SELECT SCORE(1),id, nazev FROM DOKUMENTY WHERE CONTAINS(nazev, CZ( ’ $studium | $system ’, ’ index ’, 0,0,1,2), 1) > 0 ORDER BY SCORE(1) DESC;

IMPLEMENTACE Testovací fáze Školení SEFIRA DB vrstva Aplikační vrstva

OBLASTI VYUŽITÍ V UIS Dokumentový server Závěrečné práce Pošta TODO, aplikace, zásadní informace… Tematické vyhledávání

Děkuji za pozornost. Dotazy ?