ACB a DIS Využití kompresní metody ACB pro potřeby DIS Tomáš Skopal VŠB-TU Ostrava
Modifikace struktury kontextového slovníku Abeceda – termy ve slovníku identifikátory termů lexikon termů Perzistentní forma – index B – strom omezená velikost kontextu terminologie - levý a pravý kontext
Při čem může kontextový index v DIS pomáhat? Především při hledání významového kontextu, ve kterém se slovo v přirozeném jazyce (často) objevuje Buduje se tak globální index používaných slovních spojení
Předzpracování termů Vypuštění nevýznamových slov (and, the, a, that, …) Lemmatizace
Dotazování v kontextovém indexu levý kontextpravý kontext
Relevance odpovědi algoritmus ACB může při kompresi ohodnocovat počet výskytů jednotlivých kontextů v dokumentech a ukládat ho spolu s kontexty do indexu míra relevance odpovědi potom roste s vyšším ohodnocením kontextu
Návrhy použití Nástroj pro rozšiřování dotazu ve fulltextových systémech