Věcné vyhledávání pomocí SJ

Slides:



Advertisements
Podobné prezentace
Rešeršní činnost Rešeršní strategie a věcné vyhledávání přednášející: Silvie Kořínková Presová Kabinet informačních studií.
Advertisements

Kurz pro doktorandy „ ELEKTRONICKÉ INFORMAČNÍ ZDROJE NA ČVUT “ Mgr. Zdeňka Civínová Ústřední knihovna ČVUT v Praze Únor 2011.
Organizační legitimita: aplikace institucionální teorie a teorie závislosti na zdrojích v rámci výzkumu NNO Magdaléna Šťovíčková SOS FHS UK, 2013/2014.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Kateřina Raichová. Materiál je publikován pod licencí Creative Commons. ze sady:3tematický.
Indexace pomocí SVA Předmět: Selekční jazyky Přednášející: Mgr. Silvie Kořínková Presová presova-dis.
Vypracováno kolektivem autorů České společnosti pro technickou normalizaci Úřad pro technickou normalizaci, metrologii a státní zkušebnictví
5. Klíčové kompetence a základní dovednosti Stanoviska sociálních partnerů.
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Prostředí internetu Číslo DUM: III/2/VT/2/2/27 Vzdělávací předmět: Výpočetní technika Tematická oblast:
Operační program Vzdělávání pro konkurenceschopnost Název projektu: Inovace magisterského studijního programu Fakulty ekonomiky a managementu Registrační.
Jednotlivé osobnosti nejsou jedinečné jenom svými psychickými vlastnostmi, ale také tím, jak VNÍMAJÍ, jak PŘEMÝŠLEJÍ, UČÍ SE, PAMATUJÍ SI apod.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_30-03 Název školy Střední průmyslová škola stavební, České Budějovice, Resslova 2 AutorRNDr.
Elektronická knihovna časopisů EZB Karolína Košťálová Národní knihovna ČR.
Úvod do databází MS Access (1).
VIKMA05 Organizace znalostí
Věcné autority v roce 2016
Finanční účetnictví RADNICE
Název prezentace (DUMu)
Databáze pro hledání odborných informací
Organizace výroby Organizace a řízení výroby
Vnitropodniková komunikace ve vybraném subjektu
Elektronické informační zdroje (VIKBA25)
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu
EIZ - bilance Profesionální informační zdroje
Řešení nerovnic Lineární nerovnice
Pracovní porada Pracovní list.
Kvalitativní výzkum Vybrané otázky: Proč kvalitativní výzkum?
Lineární rovnice a nerovnice I.
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
Číslo projektu CZ.1.07/1.5.00/ Číslo materiálu
INTERNET Číslo projektu CZ.1.07/1.5.00/ Název školy
Pracovní porada Pracovní list.
Metody knihovnické práce (VIKBA04)
Logistika a Supply Chain Management
TIPY A RADY PRO PRÁCI S DATABÁZÍ SCOPUS
MEZILIDSKÁ KOMUNIKACE II.
Kód materiálu: VY_32_INOVACE_14_IMPRESIONISMUS Název materiálu:
KOMPRESE DAT Číslo projektu CZ.1.07/1.5.00/ Název školy
Sémantické aspekty katalogizace VI
Ústřední knihovna FSS MU
Financováno z ESF a státního rozpočtu ČR.
Selekční jazyky (2) Úvod do problematiky Josef Schwarz
Znakový jazyk Znakovaná čeština
SOFTWARE OSOBNÍHO POČÍTAČE
Stimulace tvořivosti – tvůrčí řízení a vedení lidí,
Selekční jazyky I cvičení Ukázky SJ různých typů
VIKMA05 Organizace znalostí
Účetní pravidla, změny v účetních odhadech a chyby
Formální úprava rešerše
VIKMA06 Rešeršní a studijně rozborová činnost
Elektronické informační zdroje pro obor pedagogika
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Číslo projektu Číslo materiálu název školy Autor TEmatický celek
Významné normy Bibliografické citace - obsah, forma, struktura ČSN ISO 690 Úprava písemností psaných strojem nebo zpracovávaných textovými editory ČSN.
Řešení nerovnic Lineární nerovnice
Aktuální právní úprava činnosti školy a nové úkoly zástupce ředitele
Digitální učební materiál
Jak přispívat do Souborného katalogu ČR
Pravidla a doporučené postupy pro vytváření studijních programů
Regionální informace jako přidaná hodnota katalogu krajské knihovny
Jednotná informační brána jako studnice informací pro lékaře
Základy práce s informačními zdroji ZUR163
Materiál byl vytvořen v rámci projektu
Digitální gramotnost Informatické myšlení
Výukový materiál zpracovaný v rámci projektu
název projektu: Šablony Špičák číslo projektu: CZ.1.07/1.4.00/
PŘEDZKOUŠKOVÁ PREZENTACE
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
Úvodní přednáška pro 1. ročník
WorldCat Obsahuje bibliografické záznamy různých druhů dokumentů (knihy, články, CD, video, …) z více než knihoven z celého.
SQL Server 2017: Automatic tuning
Transkript prezentace:

Věcné vyhledávání pomocí SJ Předmět: Selekční jazyky 13. 12. 2013 Přednášející: Mgr. Silvie Kořínková Presová http://kisk.phil.muni.cz/mgr-silvie-korinkova-presova-dis

Úvod do věcného vyhledávání věcné vyhledávání - ang. ekv. - subject searching tj. vyhledávání, kdy uživatel/rešeršér usiluje o nalezení dokumentů k určitému tématu X Uživatel ví, jaký dokument hledá, zná např. autora, část titulu apod. Jeden z klíčových problémů při vyhledávání v rešeršních systémech: Jaké vyhledávací výrazy by měly být vybrány pro formulaci dotazu? Odkud by měly být termíny vybrány?

Interaction in Information Retrieval : Selection and Effectiveness of Search Terms / A. Spink, T. Saracevic Výzkum zdrojů a efektivnosti využití vyhl. výrazů během zprostředkovaného online vyhledávání. Identifikace 5-ti zdrojů: dotaz uživatele – termíny získané z písemně formulované žádosti, formulace informačního problému interakce s uživatelem – využití jeho znalostní struktury, termíny navržené uživatelem během interakce termíny navržené rešeršérem – před či během vyhledávání řízené slovníky termíny zpětné vazby, tj. získané z vyhledaných záznamů – termíny navržené uživatelem či rešeršérem z vyhledaných záznamů, které byly uživatelem uznány jako relevantní

Úvod do věcného vyhledávání Věcné vyhledávání lze realizovat pomocí pořádacích znaků věcných SJ – deskriptorů, předmětových hesel, klasifikačních znaků pomocí přirozeného jazyka V praxi se doporučuje kombinovat vyhledávání pomocí přirozeného jazyka i pomocí věcného SJ – obojí v konkrétních případech přispívá ke zlepšení přesnosti a úplnosti.

Efektivní věcné vyhledávání vyžaduje následující druhy znalostí: Znalost polí, které mohou být pro vyhledávání využity a jejich charakteristiky. Znalost věcného SJ, který systém využívá. Znalost strategií, kde a jak je aplikovat. Znalost vyhledávacích možností systému a jak je použít. Znalost tématu. (Poo, 2005)

Efektivní věcné vyhledávání vyžaduje následující druhy znalostí: Znalost toho, jak převést informační požadavek na informační dotaz. (Poo, 2005) Příklad: Informační požadavek: Využití aplikací webu 2.0 v knihovnách. Informační dotaz zapsaný pomocí dotazovacího jazyka (kódy polí) SU(Web 2.0) AND SU(libraries)

Formulace dotazu pomocí SJ Převedení na pořádací znaky věcného SJ Odvíjí se od schopnosti rešeršéra pracovat s věcným SJ (ale mnohé rešeršní systémy nabízejí řízené termíny po zadání prvního dotazu) Převod může mít různé podoby: termín v seznamu je shodný s řízeným termínem termín v seznamu je synonymem/ekvivalentem – více ekvivalentů – výběr významově shodného řízeného t. pro termín v seznamu existuje pouze širší termín SJ – ztráta specifičnosti původního termínu - v SVA – nelze vyjádřit – pozorování ptáků, použití širší temat. autority ptáci, – emulgátory v SVA – potravinářská aditiva, potravinářská chemie pro termín v seznamu existují pouze specifičtější/podřazené termíny SJ – rozsah původního termínu je redukován např. v SVA – nelze vyjádřit - organizace poznání

Formulace dotazu pomocí SJ - cvičení Jakými jinými tematickými autoritami ze SVA byste nahradili chybný termín organizace poznání/pořádání informací? zpracování dokumentů zpracování informací selekční jazyky katalogizace

Formulace dotazu pomocí SJ - příklad v db ProQuest Informační požadavek: Vzdělávání dospělých v knihovnách se zřetelem na zlepšení jejich informační gramotnosti. Pojmová analýza adult education OR lifelong learning information literacy OR information skills libraries Výrazy z tezauru adult education information literacy

Selekční jazyk - usnadňuje vyhledávání tím, že umožňuje kontrolovat synonyma a kvazisynonyma (tím zvyšuje úplnost - vyhledání relevantních informací v databázi) Hledáme dokumenty o neverbální komunikaci Dotaz ve vyhledávači (např. Google): „nonverbální komunikace“ OR „mimoslovní komunikace“ OR „neverbální komunikace“ – zajištění úplnosti ve vyhledávači Dotaz v systému používajícím SJ, např. v katalogu NK ČR: nonverbální komunikace - Městská knihovna Hodonín - http://www.knihovnahod.cz/ - klíčová slova nonverbální komunikace mimoslovní komunikace neverbální komunikace

Selekční jazyk - usnadňuje vyhledávání tím, že umožňuje rozlišit homonyma, kvalifikátor v závorce (tím zlepšuje přesnost - vyloučení irelevantních výsledků) např. Soubor věcných autorit NK ČR (SVA) postmodernismus (literatura) x postmodernismus (kultura) kult osobnosti x kult x náboženský kult

Selekční jazyk - usnadňuje vyhledávání tím, že poskytuje vysvětlující poznámky např. v tezauru LISTA (EBSCO)poznámka k desktriptoru Automatic indexing Scope Note: Here are entered works on a system in which a computer uses an algorithm to choose index subject headings from a database, with no human intervention. Works on a system in which a human indexer accepts or rejects the computer's choices and can add other headings are entered under "Machine-aided indexing“. v SVA Informační věda - Teoreticko-praktický interdisciplinární vědní obor zaměřený na výzkum a zabezpečení informačně-komunikačních procesů ve společnosti. v tezauru db LISA Information retrieval - Very general - avoid if possible

Selekční jazyk - usnadňuje vyhledávání tím, že zobrazuje vztahy – hierarchické, asociace, ekvivalence – využití při specifikaci či zobecnění dotazu např. v db LISTA (EBSCO) hledáme články o folksonomiích deskriptor FOLKSONOMIES, možnost rozšířit výsledek vyhledávání pomocí asociovaného deskriptoru TAGS (Metadata)

Selekční jazyk - usnadňuje vyhledávání tím, že vyjadřuje termíny, které nejsou obsaženy v názvu např. v katalogu NK ČR Tyranie okamžiku / T. H. Eriksen, Svět je plochý / T. L. Friedman Hrdinové Pacifiku / Edwin P. Hoyt SOD: námořní letectvo -- Spojené státy americké -- 1939-1945 námořní letci -- Spojené státy americké -- 1939-1945 stíhací jednotky -- Spojené státy americké -- 1939-1945 letecké operace -- Spojené státy americké -- 1939-1945 druhá světová válka, 1939-1945 -- Tichý oceán

Selekční jazyk - usnadňuje vyhledávání tím, že odstraňuje problémy se syntaxí Dokument je reprezentován těmito slovy v přirozeném jazyku: např. vyhledávací výrazy: import, export, Česká republika, Norsko Možné významy dovoz do České republiky z Norska dovoz do Norska z České republiky Řešení pomocí PH – dán kontext, hledání pomocí fráze ! Vyzkoušejte v katalogu NK ČR - „letectvo Japonsko“ versus letectvo AND Japonsko , globalizace sociální aspekty versus „globalizace sociální aspekty“

Selekční jazyk Při vyhodnocování relevantnosti výsledků vyhledávání (řazení vyhledaných záznamů) mají selekční jazyky větší váhu než slova přirozeného jazyka PROČ? Pořádací znak SJ byl přiřazen dokumentu na základě obsahové analýzy, z toho plyne indexace/postižení významného tématu, a to je pro vyhodnocení dotazu relevantnější. příklad: db LLIS: http://www.hwwilson.com/Documentation/Wil sonWeb/searchrules.htm

Selekční jazyk – slabé stránky nedostatek specifičnosti SOD - Online katalog Národní knihovny ČR - indexace pomocí SVA

Selekční jazyk – slabé stránky není okamžitá aktualizace – časová prodleva než je termín zahrnut do slovníku SJ slova autora mohou být nesprávně interpretovaná – nepochopení látky časové ztráty související s tvorbou, údržbou a osvojením si SJ

Selekční jazyk – slabé stránky některá témata mohou být při indexování opomenuta – např. Dějiny loutkového divadla v Evropě / Charles Magnin – indexace NK ČR – není zachyceno téma loutky indexace článku Kapucu, A. Getting users to library resources: A Delicious alternative. Journal of Electronic Resources Librarianship [serial online], December 2008; Vol. 20, Issue 4, p228-242 v DB LISTA. Chybí desktriptor FOLKSONOMIES

Selekční jazyk – slabé stránky chyby v indexaci zapříčiňují ztráty rešeršéři se musí učit selekční jazyk nekompatibilita – znesnadnění paralel. vyhledávání, bariéra snadné výměny různé pořádací znaky označující jeden pojem - např. označní pro věcné SJ db LLIS Indexing vocabularies Used for: Controlled vocabulary; Descriptors; Index languages, Index terms; Indexing languages; Vocabulary control db LISA Controlled vocabulary, Index languages, Retrieval languages anglická literatura - notace 820 (DDC) X notace PR (LCC) X notace 821.111 (MDT)

Odlišný zkušenostní rámec indexátora a uživatele Uživatel popisuje něco, co nezná. Na druhé straně indexátor má dokument v ruce, „všechno je před ním“. Indexátor by měl zkoušet předvídat, podle jakých termínů budou vyhledávat uživatelé. Jakou informaci jim daný dokument poskytne, že povede k uspokojení jejich informační potřeby?

Odlišný zkušenostní rámec indexátora a uživatele Indexátoři neindexují dokumenty takovým způsobem, aby zachytili nekonečně mnoho rozmanitých dotazů. Většinou jsou indexována hlavní a dílčí témata, tj. what is in the record. ALE Nekonečně mnoho dotazů může být uspokojeno dokumentem. Jde o úhel pohledu - document-oriented approach x user- centered indexing

Přirozený jazyk - výhody vysoká specifičnost ovlivňuje pozitivně přesnost - např. vlastní jména (osob, institucí apod.) schopnost vyčerpávajícím způsobem pokrýt téma, zvyšuje úplnost - neplatí u neanotovaných záznamů, zejména tam, kde je zahrnut abstrakt a plný text aktualizace – nové termíny jsou okamžitě dostupné slova užitá autorem – nemůže dojít k dezinterpretaci indexátorem snadnější výměna materiálu mezi databázemi – jazyková neslučitelnost odstraněna není třeba se jazyku učit (rodilý mluvčí)

Přirozený jazyk – slabé stránky intelektuální úsilí rešeršéra – problém související se synonymy (formulace dílčích dotazů) a homonymy (nutnost uvedení do kontextu) problémy se syntaxí – nesprávné spojení termínů, asociace – řešení pomocí proximitních operátorů schopnost vyčerpávajícím způsobem pokrýt téma může vést ke ztrátě přesnosti odlišná terminologie u jednotlivých autorů

Doporučená a použitá literatura Aitchison, J.Thesaurus construction and use : a practical manual. London : Aslib, 2000. Kapitola B1, Is a thesaurus necessary?, s. 5-7. ISBN 0851424465 Bates. Indexing and Access for Digital Libraries and the Internet : Human, Database, and Domain Factors. Journal of the American Society for Information Science and Technology. 1998, roč. 49, č. 13. Chu, H. Information representation and retrieval in the digital age. Medford : Information Today, 2007. Kapitola 4, Language in Information Representation and Retrieval, s. 47-58. Poo, D. C. C.; Khoo, C. S. G. Online Catalog Subject Searching. In Encyclopedia of Library and Information Science 1 [online]. 2005, č. 1 [cit. 2007-02-27]. Dostupné na World Wide Web: http://www.dekker.com/sdek/abstract~db=enc~content=a713531961 Spink, A., et. al. Interaction in information retrieval : selection and effectiveness of search terms. Journal of the American Society for Information Science, 1997, roč. 48, č. 8, s. 741-61.