Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilBohumil Novotný
1
Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař
2
Technologie vyhledávání Dohledávání Fulltextová technologie ÚIS Oracle Text ConText CZ Univerzitní informační systém VIII., Karlov 2009
3
Dohledávání Pro krátké řetězce Jména osob, názvy předmětů, publikací, závěrečných prací apod. VARCHAR2, NUMBER Jednoduché Nemožnost zavést složitější operátory Rychlé, spolehlivé Široká použitelnost v aplikacích Univerzitní informační systém VIII., Karlov 2009
4
Fulltextová technologie ÚIS Vyvinutá vlastními silami Založena na tzv. inverzním indexu Pro krátké i delší texty VARCHAR2, NUMBER CLOB, BLOB? Logické vazby mezi hledanými slovy AND, OR, NOT Univerzitní informační systém VIII., Karlov 2009
5
Fulltextová technologie ÚIS Pokročilé operátory Přesná fráze / přesný řetězec Skloňování $studuje → studoval, nestudují… Pravostranné rozšíření univerz* → univerzitní, univerzální… NEAR – hledání slov „blízko sebe“ Univerzitní informační systém VIII., Karlov 2009
6
Fulltextová technologie ÚIS Prezentační funkce Highlighting Náhledy Použitelnost a aplikační rozhraní podobné jako u dohledávacích funkcí Univerzitní informační systém VIII., Karlov 2009
7
Fulltextová technologie ÚIS Klady Vlastní řešení Plná kontrola celého procesu Indexování – vyhledávání – zobrazování Ladění Stabilita Nezávislost Využití standardních prostředků RDBMS Pokročilé funkce Univerzitní informační systém VIII., Karlov 2009
8
Fulltextová technologie ÚIS Zápory Nedostatečná podpora BLOBů Nepříliš vhodná pro extrémně velké objemy textů Slabší podpora tvorby složitějších dotazovacích výrazů Relativně náročnější zavádění Proces indexování rozložen do databázové i aplikační vrstvy Univerzitní informační systém VIII., Karlov 2009
9
Fulltextová technologie ÚIS Využití Překlady, helpdesk, spisová služba… Diskuze Souběžný provoz s Oracle Text „Záložní“ technologie Univerzitní informační systém VIII., Karlov 2009
10
Oracle Text Technologie firmy Oracle Balík standardní součástí RDBMS Oracle Široká škála nástrojů a funkcí pro práci s textovými daty Indexování Vyhledávání Prezentace dat Další podpůrné funkce Univerzitní informační systém VIII., Karlov 2009
11
Oracle Text Několik typů indexů Podpora mnoha typů souborů Textové – html, xml, nestrukturovaný text VARCHAR2, CLOB, XMLType Binární –.doc,.xls,.pdf,.ppt, … BLOB, BFILE Vícejazyčná podpora CZ Univerzitní informační systém VIII., Karlov 2009
12
Oracle Text Zápory Nevyzpytatelnost (do verze 10g) Závislost na verzi databáze Složitá konfigurace Nemožnost zásahu do indexovacího a vyhledávacího mechanismu Univerzitní informační systém VIII., Karlov 2009
13
Oracle Text Přednosti Robustní, propracované řešení Podpora BLOB Přímá integrace s db Oracle Jednodušší práce s indexy Méně náročné na místo Univerzitní informační systém VIII., Karlov 2009
14
Oracle Text Využití Indexování + vyhledávání Diskuze Portálová vyhledávací aplikace Pouze na instalacích s verzí 11g Univerzitní informační systém VIII., Karlov 2009
15
ConText CZ Produkt firmy Sefira Nadstavba pro Oracle Text Skloňování českých slov Lepší práce s diakritikou Český stoplist Existuje i v SK verzi Dá se využít i mimo Oracle Text Univerzitní informační systém VIII., Karlov 2009
16
Budoucnost Rozšiřování na další oblasti Blogy, sylaby předmětů, životopisy, … Pošta Dokumentový server Závěrečné práce Univerzitní informační systém VIII., Karlov 2009
17
Děkuji za pozornost. Univerzitní informační systém VIII., Karlov 2009
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.