Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilVáclav Pospíšil
1
ACB a DIS Využití kompresní metody ACB pro potřeby DIS Tomáš Skopal VŠB-TU Ostrava
2
Modifikace struktury kontextového slovníku Abeceda – termy ve slovníku identifikátory termů lexikon termů Perzistentní forma – index B – strom omezená velikost kontextu terminologie - levý a pravý kontext
3
Při čem může kontextový index v DIS pomáhat? Především při hledání významového kontextu, ve kterém se slovo v přirozeném jazyce (často) objevuje Buduje se tak globální index používaných slovních spojení
4
Předzpracování termů Vypuštění nevýznamových slov (and, the, a, that, …) Lemmatizace
5
Dotazování v kontextovém indexu levý kontextpravý kontext
6
Relevance odpovědi algoritmus ACB může při kompresi ohodnocovat počet výskytů jednotlivých kontextů v dokumentech a ukládat ho spolu s kontexty do indexu míra relevance odpovědi potom roste s vyšším ohodnocením kontextu
7
Návrhy použití Nástroj pro rozšiřování dotazu ve fulltextových systémech
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.