Univerzitní informační systém VIII., Karlov 2009 Fulltextové vyhledávání v UIS Miroslav Prachař
Technologie vyhledávání Dohledávání Fulltextová technologie ÚIS Oracle Text ConText CZ Univerzitní informační systém VIII., Karlov 2009
Dohledávání Pro krátké řetězce Jména osob, názvy předmětů, publikací, závěrečných prací apod. VARCHAR2, NUMBER Jednoduché Nemožnost zavést složitější operátory Rychlé, spolehlivé Široká použitelnost v aplikacích Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Vyvinutá vlastními silami Založena na tzv. inverzním indexu Pro krátké i delší texty VARCHAR2, NUMBER CLOB, BLOB? Logické vazby mezi hledanými slovy AND, OR, NOT Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Pokročilé operátory Přesná fráze / přesný řetězec Skloňování $studuje → studoval, nestudují… Pravostranné rozšíření univerz* → univerzitní, univerzální… NEAR – hledání slov „blízko sebe“ Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Prezentační funkce Highlighting Náhledy Použitelnost a aplikační rozhraní podobné jako u dohledávacích funkcí Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Klady Vlastní řešení Plná kontrola celého procesu Indexování – vyhledávání – zobrazování Ladění Stabilita Nezávislost Využití standardních prostředků RDBMS Pokročilé funkce Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Zápory Nedostatečná podpora BLOBů Nepříliš vhodná pro extrémně velké objemy textů Slabší podpora tvorby složitějších dotazovacích výrazů Relativně náročnější zavádění Proces indexování rozložen do databázové i aplikační vrstvy Univerzitní informační systém VIII., Karlov 2009
Fulltextová technologie ÚIS Využití Překlady, helpdesk, spisová služba… Diskuze Souběžný provoz s Oracle Text „Záložní“ technologie Univerzitní informační systém VIII., Karlov 2009
Oracle Text Technologie firmy Oracle Balík standardní součástí RDBMS Oracle Široká škála nástrojů a funkcí pro práci s textovými daty Indexování Vyhledávání Prezentace dat Další podpůrné funkce Univerzitní informační systém VIII., Karlov 2009
Oracle Text Několik typů indexů Podpora mnoha typů souborů Textové – html, xml, nestrukturovaný text VARCHAR2, CLOB, XMLType Binární –.doc,.xls,.pdf,.ppt, … BLOB, BFILE Vícejazyčná podpora CZ Univerzitní informační systém VIII., Karlov 2009
Oracle Text Zápory Nevyzpytatelnost (do verze 10g) Závislost na verzi databáze Složitá konfigurace Nemožnost zásahu do indexovacího a vyhledávacího mechanismu Univerzitní informační systém VIII., Karlov 2009
Oracle Text Přednosti Robustní, propracované řešení Podpora BLOB Přímá integrace s db Oracle Jednodušší práce s indexy Méně náročné na místo Univerzitní informační systém VIII., Karlov 2009
Oracle Text Využití Indexování + vyhledávání Diskuze Portálová vyhledávací aplikace Pouze na instalacích s verzí 11g Univerzitní informační systém VIII., Karlov 2009
ConText CZ Produkt firmy Sefira Nadstavba pro Oracle Text Skloňování českých slov Lepší práce s diakritikou Český stoplist Existuje i v SK verzi Dá se využít i mimo Oracle Text Univerzitní informační systém VIII., Karlov 2009
Budoucnost Rozšiřování na další oblasti Blogy, sylaby předmětů, životopisy, … Pošta Dokumentový server Závěrečné práce Univerzitní informační systém VIII., Karlov 2009
Děkuji za pozornost. Univerzitní informační systém VIII., Karlov 2009