Odborná terminologie knihovnictví a informační vědy očima uživatelů databáze TDKIV Předběžné výsledky projektu Helena Kučerová VOŠIS Praha 1.

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Zpracování informací a znalostí Datové struktury a algoritmy pro vyhledávání informací Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního.
PRŮZKUM NA TÉMA: „Dopady finanční krize“ eficia .
Produkce odpadů 2002 – 2007 obce ORP Šumperk
2 3 Lokalita Pod Javornic kou silnicí 4 směr Solnice směr Javornice směr Vamberk CENTRUM 10min. směr Častolovice.
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 4 Vytvořila: Mgr. Martina Bašová VY_32_Inovace/1_028.
ZŠ BYSTŘICE N. P., NÁDRAŽNÍ 615
DIGITÁLNÍ MAPOVÝ ARCHIV -moderní přístup k informacím (archiv ČGS) Alena Čejchanová Klára Jančová Archiv České geologické služby.
Redukce textů, obsahová analýza, anotace
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Český Internet po (uši v?) krizi Marek Antoš. snímek |datum |dokument | 1. Internetové prostředí 2.
ANL+ Karolína Košťálová Komise pro služby
Aktuální informace o vyšetřování c-erb-2 genu v referenční laboratoři a návrh změny v indikačních kritériích Hajdúch M., Petráková K., Kolář Z., Trojanec.
JIB Jednotná informační brána seminář Digitální knihovna STK Praha, 9. října 2001 Martin Vojnar Jiří Pavlík Naděžda Andrejčíková.
AutorMgr. Lenka Závrská Anotace Očekávaný přínos Tematická oblastOperace s reálnými čísly Téma PředmětMatematika RočníkPrvní Obor vzděláváníUčební obory.
Připraveno v rámci projektu „Projektové financování vysokých škol“ podpořeného FRVŠ pod číslem 72/2011
Porovnání hodnotících škál bolesti v závislosti na kognitivní funkci
ZŠ a MŠ Olšovec, příspěvková organizace Vzdělávací materiál, šablona – Inovace a zkvalitnění výuky směřující k rozvoji matematické gramotnosti žáků základní.
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
NÁZEV ŠKOLY: Základní škola Nový Jičín, Komenského 66, p. o
Summon v osmi minutách v osmi bodech Vladimír Karen Albertina icome Praha s.r.o.
Kdo chce být milionářem ?
Výzkumy volebních preferencí za ČR a kraje od
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Výsledky NetMonitoru a AdMonitoringu za červenec 2008 Sdružení pro internetovou reklamu (SPIR) MEDIARESEARCH, a. s. a GEMIUS, S. A
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
BIBLIOGRAFICKÉ FORMÁTY MARC 21 – UNIMARC-úvod
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Česká terminologická databáze knihovnictví a informační vědy (TDKIV)
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Malátova 17, Praha 5 tel.: · Uplatnění absolventů škol na pracovním trhu Jan Koucký Výsledky projektu.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Základní škola Karviná – Nové Město tř. Družby 1383

Projekt PŘEDPOVĚĎ POČASÍ. Předpověď počasí na
Nejmenší společný násobek
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
, Elektronické služby knihoven prakticky, Praha Portál STM Lucie Hejná Státní technická knihovna
Násobení zlomků – teorie a cvičení VY_32_INOVACE_19
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
EDITOR BY: SPRESS 15. ledna ledna ledna 2015.
Tento Digitální učební materiál vznikl díky finanční podpoře EU- OP Vzdělávání pro konkurenceschopnost. Není – li uvedeno jinak, je tento materiál zpracován.
Číslo projektu CZ.1.07/1.500/ Číslo materiálu VY_42_INOVACE_matematika_22 Název školy Táborské soukromé gymnázium, s. r. o. Autor Bc. Ivana Kotková.
Téma: ABSOLUTNÍ HODNOTA CELÝCH ČÍSEL 2
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Technické kreslení.
E-knihovna pro knihovníky Seminář E-knihy III, NTK,
Oborová informační brána KIV Jak ji využívat. Bránu KIV vytvořili Hlavní garant: Knihovnický institut NK ČR Technologie: Ústav výpočetní techniky UK v.
KIV/ZIS cvičení 6 Tomáš Potužák. Pokračování SQL Klauzule GROUP BY a dotazy nad více tabulkami Stáhnout soubor studenti_dotazy_sql.mdb.
Setkání účastníků neformálního konsorcia Praha
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
Přednost početních operací
Nejprve provedeme výpočet v závorce
1 6 Predikce potřeby Servisní logistika prof. Ing. Václav Legát, DrSc. Technická fakulta ČZU v Praze Katedra jakosti a spolehlivosti strojů
VIKBA20_Elektronické informační zdroje Klára Zemanová, UČO
Vyhledávání je zaměřeno na informační zdroje z oblasti vědy, výzkumu a
Transkript prezentace:

Odborná terminologie knihovnictví a informační vědy očima uživatelů databáze TDKIV Předběžné výsledky projektu Helena Kučerová VOŠIS Praha 1

2 Využít metody kvantitativní analýzy k objevení nových poznatků a námětů, skrytých v uchovávaných uživatelských datech o vyhledávání v TDKIV.  Zadavatel: Redakční rada TDKIV  Řešitel: VOŠIS Praha – 6členný studentský tým  Termín: zimní semestr 2011/2012 Cíl projektu:

Česká terminologická databáze knihovnictví a informační vědy 3  Producent: grant MK ČR 2001 – 2002 NK ČR – tým 50 autorů, lektorů a redaktorů  Obsah: knihovnictví, knihověda, informační věda, informační technologie

TDKIV v číslech: 4 rok vzniku: 2003 počet (preferovaných) termínů: počet ekvivalentů (nepreferovaných termínů): počet dotazů / rok: počet vyhledávaných výrazů / rok: počet uživatelů (UIP adres): 500 průměrná doba strávená v databázi: 1 – 2 minuty

Struktura terminologického hesla 5  termín  anglický ekvivalent  ekvivalent (nepreferovaný termín)  příbuzný termín  výklad termínu (autorský / normativní)  zdroj výkladu  poznámka  třídník (věcná kategorie)  autor / konzultant / lektor / redaktor

Ukázka terminologického hesla 6

7 Možnosti vyhledávání v TDKIV Způsob vyhledávání vyhledávání SEARCH listování SCAN navigace Příbuzný termín Použitý index z více polí FREE TEXT z jednoho pole Zdrojová báze KTD KTDP Pracovní báze

8 Vyhledávání v TDKIV SEARCH

9 Listování v TDKIV SCAN

10 Navigace v TDKIV

Výzkumné otázky: 11 Statistický rozbor a vizualizace:  četnost hledaných a nalezených / nenalezených výrazů  četnost způsobů vyhledávání  čas vyhledávání  rozdělení IP adres Data mining a business intelligence:  příčiny neúspěšných dotazů  společně hledané termíny

Metodika: 12  korpusová terminografie  kvantitativní analýzy, pokus o data mining (bibliomining)  logy z vyhledávání v systému Aleph – data za období březen 2010 – srpen 2011 cca záznamů  MS SQL, dotazování v SQL

13 SELECT a.search_text as hledany_a, COUNT(a.search_text) as pocet_hledani, b.search_text as hledany_b FROM SEARCH_KTD a JOIN SEARCH_KTD b on a.cas = b.cas AND a.ip = b.ip and a.datum = b.datum WHERE a.search_text <> b.search_text AND a.HITS <> 0 and b.HITS <> 0 GROUP BY a.search_TEXT, b.SEARCH_TEXT, a.SEARCH_TEXT+a.DATUM+a.CAS, b.SEARCH_TEXT+b.DATUM+b.CAS HAVING COUNT(a.SEARCH_TEXT) > 5

Struktura dat 14 část IP adresy počítače, ze kterého byl dotaz zadán čas zadání dotazu počet nalezených záznamů způsob vyhledávání (21 – základní vyhledávání, 23 – pokročilé vyhledávání, 29 – vyhledávání v rejstřících…) prohledávaná báze (KTD, KTDP) vyhledávaný výraz

Vyhledávání podle měsíců 15

Vyhledávání podle dní 16

Čas vyhledávání 17

Rozdělení uživatelů 18 Vyhledávání v KTD: vyhledávání (sessions) (cca 10 %) vyhledávání z IP xx (PASNET) počet vyhledávání SCAN % 80 % SEARCH % SCAN % 20 % SEARCH % počet IP adres % 20 % % % 80 % %

Nejvyhledávanější výrazy 19

Úspěšnost vyhledávání 20 počet vyhledávaných výrazů úspěch (>=1 hitů)6 867 (cca 40 %) neúspěch (0 hitů) (cca 60 %)

Nenalezené výrazy 21 1 překlep 2 doporučeno zařadit do TDKIV 3 věcně nerelevantní k TDKIV 4 nesprávný typ vyhledávání 5 jiný jazyk než čeština

Výrazy hledané společně 22

Předběžné shrnutí výsledků 23 Potvrzeno: Kvantitativní metody mohou poskytnout jak náměty ke zkvalitnění použitelnosti a přístupnosti databáze, tak i přímé podněty k terminologické práci  náměty na zařazení nových termínů nebo ekvivalentů do TDKIV  klastry současně hledaných termínů umožňují nacházet sémantické vztahy  odhaleny problémy k řešení:  2/3 vyhledávání končí neúspěchem  1/5 z nenalezených výrazů jsou překlepy  významný podíl dotazů ve slovenštině  dotazy na zkratky erata inforamční průmysl aldinky

A co na to studenti … 24

Plány na další pokračování výzkumu: 25  tvorba vícečetných klastrů  ontologizace TDKIV (syntagmatické → paradigmatické vztahy)  porovnání vyhledávacích výrazů s termíny v databázi  analýza vyhledávacích procesů  „opravdový“ data mining  Další náměty?