Zpracování informací a znalostí Přesnost a úplnost vyhledávání Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství
Ukládání a vyhledávání dokumentů požadavek na informace dokumenty dotaz indexované dokumenty porovnání dotazu s indexovanými dokumenty vyhledané dokumenty
Ukládání a vyhledávání dokumentů – výsledky DOKUMENTY relevantní irelevantní vyhledané a b nevyhledané c d a = počet relevantních vyhledaných dokumentů b = počet irelevantních vyhledaných dokumentů c = počet relevantních nevyhledaných dokumentů d = počet irelevantních nevyhledaných dokumentů
Ukládání a vyhledávání dokumentů - příklad Požadavek na informace: Data mining v sociálních vědách DOKUMENTY relevantní irelevantní vyhledané ? nevyhledané - Poznámka: Systém ProQuest umožňuje formulovat dotaz tak, že k dále naznačeným potížím nedochází.
Příklad – formulace dotazu
Příklad – přehled vyhledaných dokumentů Irelevantní nalezený dokument Relevantní nalezené dokumenty
Příklad vyhledaného irelevantního dokumentu (1. část )
Příklad vyhledaného irelevantního dokumentu (2. část )
Příklad vyhledaného relevantního dokumentu
Příklad jiného vyhledaného relevantního dokumentu (1. část)
Příklad jiného vyhledaného relevantního dokumentu (2. část)
Příklad nevyhledaného relevantního dokumentu Nevyhledán dokument Pixel bar charts: a visualization technique for very large multi-attribute data sets (viz výše)
Úspěšnost vyhledávání dokumentů DOKUMENTY relevantní irelevantní vyhledané a b nevyhledané c d Přesnost = Úplnost =
Vztah přesnosti a úplnosti 1 * * * * * úzké dotazy Přesnost 0.5 široké dotazy 0.5 1 Úplnost