Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Jinonické informační pondělky, Praha, 3. 11. 2008 Bibliomining dobývání znalostí z knihovních databází a systémů Radka Římanová Státní technická knihovna.

Podobné prezentace


Prezentace na téma: "Jinonické informační pondělky, Praha, 3. 11. 2008 Bibliomining dobývání znalostí z knihovních databází a systémů Radka Římanová Státní technická knihovna."— Transkript prezentace:

1 Jinonické informační pondělky, Praha, Bibliomining dobývání znalostí z knihovních databází a systémů Radka Římanová Státní technická knihovna ÚISK FF UK

2 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 1 Dolování dat „Dobývání znalostí bývá definováno jako proces netriviální extrakce implicitních dříve neznámých a potenciálně užitečných informací z dat [Fayyad a kol., 1996]. O dobývání znalostí z databází se začíná intenzivněji mluvit v polovině 90. let, kdy si nárůst objemu dat uchovávaných v různých organizacích spolu s potřebou tato data analyzovat vynutil propjení poznatků ze tří oblastí: statistiky, databází a strojového učení.“ [BERKA, 2001]

3 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 2 Dolování dat  BERKA, Petr, Aplikace systémů dobývání znalostí pro analýzu medicínských dat [online]. Praha : EuroMISE Centrum – Kardio, VŠE, 2001, datum poslední aktualizace: [cit ]. Tato studie vznikla v dubnu 2001 v rámci projektu LN 00B 107 MŠMT ČR. Dostupný z WWW:.  BERKA, Petr, Dobývání znalostí z databází. Praha : Academia, s. + 1 CD.

4 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 3 Dolování dat  Termín pochází z ekonomických věd (business inteligence)  Nyní rozšířeno i do dalších oborů – biologie, medicína, technika, pedagogika …knihovnictví  Přínos – pravdivé, nové informace ve vztahu k jiným informacím, nová překvapivá zjištění

5 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 4 Dolování dat a informační věda  Rozvíjí statistické metody  Umožňuje rychlé aplikování zjištěných poznatků do praxe, stejně rychlé jako prostředí ovlivněné IT v dnešní době  Umožňuje použití laboratorní metod pro ověření vědeckých hypotéz

6 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 5 Bibliomining  Nový termín – 2002  Zavedl Scott Nicholson, profesor Syracuse University School of Information Studies NICHOLSON, Scott. Bibliomining : data minig for libraries [online]. Syracuse : Syracuse University - School for Information Studies, c , 05-Jan-2008 [cit ]. Dostupný z WWW:.

7 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 6 Nový termín?

8 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 7 Scott Nicholson   Nar  Library Game Laboratory of Syracuse – 2008 – výzkum hraní deskových her, možnosti rozvoje v souvislosti s rozvojem služeb knihoven  Autor hry „Tulipmania 1637“

9 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 8 Nový termín??????  Termín Knihovna je v IT používán pro sbírku procedur, funkcí a datových typů (např. standardní knihovna jazyka C)  Dolováním dat v knihovnách není dolováním dat o knihovně

10 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 9 Bibliomining v češtině 1. SOŠKOVÁ, Michala, Analýza a vyhodnocení činností uživatelů souborného on- line katalogu Masarykovy univerzity. Brno, s. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet knihovnictví. Informační studia a knihovnictví. Vedoucí bakalářské práce Zdeněk Kadlec. Dostupný z WWW:.

11 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 10 Bibliomining v češtině 2. VOJNAR, Martin, Zpětná vazba ze statistik OPAC – bibliomining. Knihovny současnosti 2007 : prezentace z konference [online] [cit ]. Dostupný z WWW:.

12 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 11 Nástroje pro bibliomining a software v knihovnách  Nízká podpora dolování dat bez znalostí programování či vstupu do vnitřních tabulek = knihovník musí spolupracovat s IT specialistou (nebo dodavatelem systému)  Systém Aleph - speciální modul ARC – Aleph reporting center Místo pro realizaci studentů ÚISK FF UK  Možnost použití software (např. LISp- Miner, VŠE Praha)

13 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 12 Bibliomining proces 1. Porozumění problematice Co chceme zjistit, cíl projektu…  Prediktivní metoda - předvídá budoucí hodnoty na základě zjištěných vlastností stávajících  Popisná metoda - přesné informace o současném stavu

14 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 13 Bibliomining proces 2. Analýza dostupné datové základny  Vyhledání vhodných množiny pro dat pro bibliomining

15 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 14 Bibliomining proces 2. Analýza dostupné datové základny Příklad Cíl – služby z historických fondů Státní technické knihovny – možnosti: a) Dolovat budeme v záznamech, které mají atribut „Historický fond STK“ Přínos – zjistíme přesně vlastnosti platící pro tuto sbírku a) Dolovat budeme v celém katalogu Přínos – zjistíme více, ale množství dat může zkreslit výsledek, nebo se projekt zastaví nad tím, že se zdá, že něco by ještě navíc do kolekce patřit mělo a není tam… Výběr správného přístupu → zpřesnění cíle

16 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 15 Bibliomining proces 3. Čištění a příprava dat  Mají data, která chceme analyzovat atributy na kterých chceme stavět naši analýzu?  Za jaké situace data vznikala (roční doba, akademický rok, kvalita připojení k síti internet…)

17 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 16 Bibliomining proces 4. Průzkum dat a modelování  Vytvoření algoritmů pro proces  Počet etap průzkumu dat nelze předem přesně stanovit  Nutné počítat s časovou rezervou

18 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 17 Bibliomining proces 4. Zhodnocení vzorku výsledků  Předložení výsledků odborníkům (knihovníkům) k posouzení  Příliš překvapivé výsledky → nedošlo k chybě?  Příliš překvapivé výsledky → zpět o několik kroků procesu  Kontrole pomůže tzv. „typický představitel“ (např. časopis Nature)

19 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 18 Bibliomining proces 5. Zpráva a implementace 1.  Dokumentace procesu ve všech etapách  Před prezentací veřejnosti, konzultovat s knihovníky,  Bibliomining musí být vnímán pozitivně – všichni chtějí být lepšími, ale nikdo nechce být kárán  Selhání bibliominingu – knihovníci přestávají spolupracovat při tvorbě dat nebo se je snaží upravit

20 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 19 Bibliomining proces 5. Zpráva a implementace 2.  Podpora sociálních vztahů s uživateli – srozumitelné zveřejnění výsledků  Neadresná etická prezentace – maximálně do úrovně kategorie uživatelů

21 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 20 A pak zase znovu…  Statistické výstupy získané z bibliominingu je vhodné opakovat v pravidelných cyklech – v ideálním případě pravdivě odhalí zlepšení….stagnaci….zhoršení…  Softwarové nástroje vyvinuté pro bibliomining proces využít vícekrát….postupné snižování nákladů

22 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 21 Bibliomining v praxi aneb co nám poví KIS  Uvedené příklady slouží jako ilustrace využití bibliominingu, nikoli prezentace výsledků jednotlivých výzkumů!  Termín bibliomining nebyl použit v žádné citované práci

23 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 22 Vzdálený přístup do databází elektronických časopisů ŘÍMANOVÁ, Radka, Ultra Access : vstupy do elektronických verzí periodik aneb které služb NLK jsou přístupné po otevírací době II. In Knihovny současnosti 2002 : sborník z 10. konference, konané ve dnech září 2002 v Seči u Chrudimi. Brno : Sdružení knihoven, s ISBN

24 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 23 Vzdálený přístup do databází elektronických časopisů 1.  2000 – MŠMT podpořilo nákup online databází elektronických časopisů – několik tisíc titulů  Licence – autentifikace na IPA knihovny nebo školy  Statistiky – dnes COUNTER (Counting Online Usage of Networked Electronic Resources)

25 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 24 Vzdálený přístup do databází elektronických časopisů 2.  2000 – pro koho tyto databáze nakupujeme?  Informační bariéra – geografická a časová  Software pro realizaci vzdáleného přístupu Ultra Access (Národní lékařská knihovna 2002)

26 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 25 Vzdálený přístup do databází elektronických časopisů 3.  Ultra Access – hlavní cíl – přístup mimo NLK  Vzdálený přístup – nutné povolení v licenci  Vzdálená registrace – nutnost smlouvy, účetní opatření (očekávaná platba)  Zhodnocení výsledků pořízení – statistiky využívání – potřeba filtru od „in-house“ přístupů

27 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 26 Vzdálený přístup do databází elektronických časopisů 4.  Spolupráce s softwarovým specialistou  Grafická nadstavba  Analýza dat,které systém eviduje (omezení - přístup do databáze ano, chování v konkrétní databázi nikoli)  Definice položek pro dolování dat

28 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 27 Vzdálený přístup do databází elektronických časopisů 5.  Autorizace uživatele – podmínka licence – z hlediska dolování dat – velmi lákavá informace  Vytvoření trvalého nástroje pro sledování služby na intranetu Národní lékařské knihovny

29 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 28 Bibliomining a OPAC význam názvu nakladatele ŘÍMANOVÁ, Radka. Kvalitní katalog - nezbytný zdroj pro poskytování služeb knihovny. In Knihovny současnosti 2005 : Sborník z 13. konference, konané ve dnech září 2005 v Seči u Chrudimi. Brno : Sdružení knihoven ČR, s ISBN

30 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 29 Bibliomining a OPAC význam názvu nakladatele 1.  Konkrétní problém katalogizační  AACR2 – název nakladatele do pole 260, tak jak je uvedeno v knize  Katalogizátoři – snaha o unifikaci názvu nakladatele – konkrétní odraz vznik pole 928

31 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 30 Bibliomining a OPAC význam názvu nakladatele 2.  Problém – náklady na údržbu rejstříku autoritních podob názvu nakladatele x podle čeho uživatelé vyhledávají

32 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 31 Bibliomining a OPAC význam názvu nakladatele 3.  Výsledek - Název nakladatele není pro hledání v OPAC významný  Vytvoření tabulky na intranetu Státní technické knihovny  Další „překvapivá“ zjištění

33 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 32 Bibliomining a OPAC význam názvu nakladatele 4. (STK OPAC knihy – ) IndexWWW% (zaokrouhleno) Z39.50% Název %00 Autor %00 Předměto vé heslo %00 Název produktu 3022 %00 Heslo PSH1881 % 00

34 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 33 Bibliomining a OPAC význam názvu nakladatele 5. (STK OPAC knihy – ) IndexWWW% (zaokrouhleno) Z39.50% MDT75000 Nakladatel Edice77000 ISBN4303 % % ISSN Signatura %00

35 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 34 Bibliomining a OPAC význam názvu nakladatele 6. Režim „vyhledávání“ (STK OPAC knihy – ) PoložkaWWW% zaokrouhleno Z39.50% Všechny %00 Autor % Název % Předměto vá hesla 28844%1072 Nakladatel7301%00

36 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 35 Bibliomining a OPAC význam názvu nakladatele 7. Překvapivé výsledky: 1. Kde uživatelé hledají častěji (režim, položka) 2. Pojmenování položek v OPAC, rozumíme si? 3. Rozdíl mezi hledáním ve www a Z Důležitost selekčních prvků, na co je nám MDT? 5. Jak pomoci přesnosti nejčastějšího typu dotazu do OPAC? Pozor na zobecnění – nepřenositelné vůči jiné uživatelské skupině či OPAC!!!!!

37 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 36 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph DOLEŽALOVÁ, Pavlína, 2007; ŠRAJBOVÁ, Magda; TRNKA, Jiří. Katalogizátor pro(ti) uživateli katalogu aneb jak uvažuje knihovník o čtenáři. Knihovny současnosti 2007 : Sborník z 15. konference, konané ve dnech 11.–13. září 2007 v Seči u Chrudimi [online] [cit ], s Dostupný z WWW:.

38 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 37 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 1.  Provnání tradiční formy průzkumu v knihovnách a bibliominingu  Hledání bariér mezi OPAC a uživatelem  V roce 1967 – lístkové katalogy SVK Plzeň  Chyběl názvový katalog, málo užívaný systematický (MDT

39 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 38 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 2.  Zkoumané skupiny – katalogizátoři, pracovníci ve službách, uživatelé – dotaz na knihovníky – podle čeho hledáte vy a podle čeho si myslíte, že hledají uživatelé…

40 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 39 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 3.  Předpoklad při bibliominingu OPAC – laici KIS staff rozhraní – knihovníci  Dotazník – uživatelé uváděli rozšířenou škálu typů rešerši – nutno zkoumat skupinu respondentů – spíše lidé s hlubším vztahem ke knihovně (snaha „potěšit“ dotazujícího knihovníka)  Bibliomining – srovnatelné výsledky s STK

41 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 40 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 4. Ze závěrů průzkumu např. - Podle titulů nebo typů hledané literatury lze usuzovat i na úroveň práce uživatelské kategorie = studenti používají při hledání studijní literatury častěji než běžný uživatel kombinaci více termínů (název x rok) - Uživatelé nevnímají struktury bibliografického záznamu - Pracovníci ve službách lépe znají uživatele a jejich požadavky – nutné najít mechanismus jak tyto znalosti předávat do zpracovatelských sfér

42 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 41 Prezenční výpůjčky ŘÍMANOVÁ, Radka, 2006; SKOLKOVÁ, Linda. Jak sledovat využití knihovního fondu. In CASLIN 2006 : Zpětná vazba aneb děláme to dobře? Český ráj, Praha : Knihovna AV ČR, s ISBN Prezentace dostupná z WWW:

43 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 42 Prezenční výpůjčky 1.  „Kde nejsou data nemůže být ani bibliomining…“  Elektronické časopisy – dobrá statistická podpora  Tištěné časopisy - prezenční výpůjčky – obtížné vytváření dat

44 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 43 Prezenční výpůjčky 2.  Proč sledovat? Např. – efektivita nákladů na pořízení a zpřístupnění – uspořádání a organizace studoven – opravdu nutné jen prezenčně? –porovnání počtu služeb document delivery services a přímého využívání –poměr mezi využíváním tištěné a elektronické verze …..

45 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 44 Prezenční výpůjčky 3. Z výsledků  57% knihoven nemělo prokazatelné výsledky o poměru využívání papírových a elektronických verzí  Poměr mezi stabilitou financování a investicemi do sledování prezenčních výpůjček  Nejčastější metoda – ruční snímání čárových kódů a porovnáváním s evidencí v KIS RFID technologie – sledování prezenčních výpůjček na bází čipu – laboratoř 3M

46 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 45 Turniket a bibliomining LOŠŤÁKOVÁ, Danuše, 2006; SLEZÁKOVÁ, Ludmila. Víme, co naši uživatelé potřebují?. In CASLIN 2006 : Zpětná vazba aneb děláme to dobře? Český ráj, Praha : Knihovna AV ČR, s ISBN Prezentace dostupná z WWW:

47 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 46 Turniket a bibliomining  Identifikace uživatele na vstupu do knihovny  Přínos – adresné vyhodnocení vůči studované fakultě, prokazatelné požadavky při sdíleném financování a argument pro spojení knihoven  Negativní dopad – bariéra při vstupu do knihovny, v roce 2007 odstraněn

48 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 47 Zkušenost z Tchaj-wanu WU, Chin-Hsing, 2003; LEE, Tzai-Zang; KAO, Shu-Chen. Knowledge discovery applied to materiál aquisitions for libraries. Information Processing and Management. 2004, vol. 40 [cit ], p Doi: /j.ipm Abstrakt dostupný z WWW:. ISSN

49 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 48 Zkušenost z Tchaj-wanu 1.  Bibliomining pro akviziční politiku univerzity  Další záludnost bibliominingu – poměr odborníků a služeb - jak vyhovět i těm, kterých je méně  Nutná kombinace tradičních prvků – zkušenost, studijní plán, fakultní doporučení a bibliominingu

50 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 49 Zkušenost z Tchaj-wanu 2. „…Knihovníci, kteří přijmou technologie jako partnera při rozhodování, jsou i nadále více přístupni tomu, aby se změny v jejich práci děly na základě analytických počítačových metod. Z tohoto důvodu doporučujeme nezapomenout v projektech na náklady a prostor pro vysvětlení všem, kteří pracují s výpůjční databází, že při své práci vytváří i data pro budoucí akvizici…“

51 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 50 Závěr Knihovník musí vědet o existenci a možnostech bibliominingu. Pokud jej nezná, pak alespoň o existenci a možnostech dolování dat. 2. Před knihovníky leží úkol přejít od intuitivních metod dolování dat k standardizovaným procesům a zařadit je do své práce.

52 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 51 Závěr Při práci v knihovně minimalizovat neevidované procesy a zároveň výsledky bibliominingu prezentovat i v souvislostech statisticky nepopsatelných skutečností. 4. Výsledky bibliominingu prezentovat a využívat v souladu s etickými principy knihovníka a pozitivním způsobem. 5. Požadovat na všech producentech SW pro knihovnicko-informační služby dynamické nástroje pro bibliominingové projekty.

53 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 52 Vzhůru do dolů!

54 S TÁTNÍ TECHNICKÁ KNIHOVNA Jinonické informační pondělky, Praha, Bibliomining, 53 Děkuji za pozornost Radka Římanová Kontakt


Stáhnout ppt "Jinonické informační pondělky, Praha, 3. 11. 2008 Bibliomining dobývání znalostí z knihovních databází a systémů Radka Římanová Státní technická knihovna."

Podobné prezentace


Reklamy Google