Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
1
Tématické vyhledávání aneb nový Vyber.pm
Miroslav Prachař datamanagement Univerzitní informační systém, Svojanov 2005
2
OBSAH PŘÍSPĚVKU současné možnosti vyhledávání
současné schopnosti a nedostatky modulu Vyber.pm požadavky na modul Vyber.pm nové generace aplikace pro tématické vyhledávání Univerzitní informační systém, Svojanov 2005
3
SOUČASNÉ MOŽNOSTI VYHLEDÁVÁNÍ
vyhledávání patří jistě mezi základní požadavky kladené na moderní, uživatelsky přívětivý IS v UIS MZLU v Brně je tato možnost také implementována je využívána v jednotlivých aplikacích, ve kterých je potřeba nějaký záznam (nebo několik záznamů) dohledat, a to pokud možno jednoduše a rychle dohledává se na základě zadaného řetězce Univerzitní informační systém, Svojanov 2005
4
SOUČASNÉ MOŽNOSTI VYHLEDÁVÁNÍ
toto jednoduché dohledávání přestává stačit je potřeba dohledávat záznamy, které vyhoví složitěji kladeným požadavkům na hledaný záznam (rozvedu později) UIS MZLU v Brně postrádá místo, které by možnosti vyhledávání v systému soustřeďovalo a umožnilo tak uživateli vyhledávání informací v jakési obecnější rovině, než je dohledávání konkrétních typů záznamu v konkrétních aplikacích Univerzitní informační systém, Svojanov 2005
5
MODUL Vyber.pm je to modul, který implementuje mechanismy vyhledávání a svým rozhraním poskytuje potřebné funkce uživatelským aplikacím stávající implementace nedisponuje schopnostmi nutnými pro vyhovění požadavkům na obecnější možnosti vyhledávání požadavky na novou generaci modulu Vyber.pm vychází z několika klíčových skutečností, které je potřeba brát v potaz Univerzitní informační systém, Svojanov 2005
6
MODUL Vyber.pm PRINCIP INDEXOVÁNÍ A DOHLEDÁVÁNÍ
použití databázového indexu pro dohledávání, pro jehož efektivní využití je potřeba data nejprve připravit nutnost speciální datové struktury pro ukládání jednotlivých klíčů (tzv. indexovací tabulky) sruktura: (KLIC,ODKAZ) - uložení všech klíčů vedoucích po zadání k nalezení hodnoty, index definován nad oběma sloupci - rychlost konstrukce klíčů může být z více sloupců různých tabulek, ukládání i jejich podřetězců k jedné indexované tabulce – více zdrojů klíčů Univerzitní informační systém, Svojanov 2005
7
MODUL Vyber.pm 1) různé vztahy objekt - zdroj klíčů:
vztah 1:1 - např. publikace - název vztah 1:n - např. publikace - klíčová slova vztah m:n - např. publikace – autoři stávající implementace modulu Vyber.pm je schopna řešit dohledávání objektů podle vztahu ke klíčům 1:1. S jistými obtížemi lze implementovat i vztah 1:n. Ovšem na vztah m:n modul ve stávající jednoduché verzi není dobře připraven Univerzitní informační systém, Svojanov 2005
8
MODUL Vyber.pm 2) vyskytují se složitější požadavky od uživatele resp. od uživatelské aplikace k dohledání přestává stačit zadat jenom jednoduchý řetězec nebo jeho část, ale vzniká potřeba specifikovat rozsah jeho hledání např. hledat „jen v názvech“, „jen v autorech“ apod. nebo i složitěji: hledat „v názvech a v klíčových slovech a zároveň ne v autorech“ Univerzitní informační systém, Svojanov 2005
9
MODUL Vyber.pm další problematikou, která s tím úzce souvisí, je potřeba implementovat specifikaci logických vazeb mezi zadávanými řetězci. z praktického pohledu tedy jde o možnost použití známých logických operátorů AND, OR a NOT Univerzitní informační systém, Svojanov 2005
10
MODUL Vyber.pm skloubením výše popsaných problémů pak obdržíme dotazy typu: „hledat všechny knihy, které napsal autor v jehož příjmení se vyskytuje řetězec ‘Nov’ a zároveň v názvu nebo klíčových slovech se vyskytuje řetězec ‘holub’“ modulu Vyber.pm tedy aplikace sdělí něco jako Nov (autoři) AND holub (názvy, klíč. slova). po zadání takového požadavku modul Vyber.pm zařídí, že jako výstupní záznam vyhoví kniha Chov holubů, Jaroslav Novák, Brno 2005 ale již nevyhoví např. Nové postupy alternativní medicíny, František Holub, Praha 2004 Univerzitní informační systém, Svojanov 2005
11
MODUL Vyber.pm rozdíl oproti současné jednoduché verzi, kdy je zadán pouze řetězec ‘Nov holub’ je ten, že v současné verzi vyhoví i druhá uvedená kniha, která ovšem zjevně nebyla cílem hledání. Univerzitní informační systém, Svojanov 2005
12
MODUL Vyber.pm 3) omezení výstupu modulu Vyber.pm
co vyhoví zadanému řetězci je potřeba dál efektivně filtrovat - u publikací např. jednoduše podle typu, nebo roku publikace, ale i složitěji, např. podle napojení publikace na projekt, podle práv uživatele na operaci s publikací, apod. zde se jako vhodné řešení nabízí použití kvalifikátorů Univerzitní informační systém, Svojanov 2005
13
MODUL Vyber.pm dále je vhodné zajistit seřazení nalezených výsledků dle „míry vyhovění“ např. vzdálenost hledaných slov (implementace operátoru NEAR), počet výskytů hledaného výrazu, relevantnost nalezených záznamů, abecední řazení... Univerzitní informační systém, Svojanov 2005
14
MODUL Vyber.pm kromě rozšíření modulu je potřeba upravit zdrojový kód modulu tak, aby se v něm nevyskytovali opakující se kusy téměř stejného kódu pro jednotlivé operace, tzn. zobecnění funkcí a vnitřních algoritmů modulu může vést k zefektivnění modulem prováděných operací Univerzitní informační systém, Svojanov 2005
15
APLIKACE TÉMATICKÉ VYHLEDÁVÁNÍ
cíl: zintegrovat a sjednotit současné možnosti vyhledávání v Univerzitním informačním systému MZLU v Brně přinést tak uživateli komfortnější a obecnější možnosti nalézt v UIS potřebné informace vyhledávání v různých oblastech UIS, např. osoby, předměty, publikace, pracoviště, dokumenty... v budoucnu může být aplikace rozšiřována o další oblasti, např. o hledání v životopisech atd. implementace fulltextového vyhledávání Univerzitní informační systém, Svojanov 2005
16
APLIKACE TÉMATICKÉ VYHLEDÁVÁNÍ – ROZHRANÍ
všeobecně známé prvky, uspořádané přehledně a intuitivně tak, aby uživatel mohl využít svých dosavadních návyků z jiných prostředí základní rozhraní: jednoduchý formulář pro zadání hledaného výrazu (výrazů), možno použít logické operátory AND, OR, NOT, příp. NEAR mezi klíči, např.: ‘finan AND podnik’, ‘podnik OR firma NOT finan’ možnost zvolit oblast vyhledávání (osoby, předměty, sylaby, dokumenty...) příp. několik základních (resp. nejvíce používaných) předvoleb Univerzitní informační systém, Svojanov 2005
17
APLIKACE TÉMATICKÉ VYHLEDÁVÁNÍ – ROZHRANÍ
pokročilé (rozšířené) rozhraní: volitelné, lze přepínat mezi základním/pokročilým rozhraním možnost přesnější specifikace požadavků a podmínek, které mají hledané záznamy splňovat více textových polí ve formuláři pro zadávání klíčových slov, určování logických vazeb mezi nimi a rozsahu hledání předvolby pro nastavení chování aplikace, jako např. počet zobrazení nalezených záznamů na stránku a některé další Univerzitní informační systém, Svojanov 2005
18
APLIKACE TÉMATICKÉ VYHLEDÁVÁNÍ
výstup nalezených záznamů pak bude uživateli prezentován v podobě odkazů na jednotlivé záznamy roztříděných podle jednotlivých oblastí hledání je žádoucí, aby by bylo možno fulltextově prohledávat co možná nejvíce oblastí UISu, včetně rozsáhlých textů (jako např. obsahy externích souborů), což vyžaduje zcela odlišnou filosofii indexování, což rozhodně nepatří mezi triviální úkony Univerzitní informační systém, Svojanov 2005
19
APLIKACE TÉMATICKÉ VYHLEDÁVÁNÍ
bude tedy potřeba pečlivě analyzovat možná řešení a zvážit např. i nějaké řešení z komerční sféry třešničkou na dortu by mohlo být zvýraznění hledaných řetězců v části nalezeného textu fulltextovým vyhledáváním Univerzitní informační systém, Svojanov 2005
20
Děkuji za pozornost. Dotazy, připomínky, podněty, návrhy?
Univerzitní informační systém, Svojanov 2005
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.