Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Radka Římanová Bibliomining, Dolování dat

Podobné prezentace


Prezentace na téma: "Radka Římanová Bibliomining, Dolování dat"— Transkript prezentace:

0 Bibliomining dobývání znalostí z knihovních databází a systémů
Radka Římanová Státní technická knihovna ÚISK FF UK

1 Radka Římanová Bibliomining, Dolování dat „Dobývání znalostí bývá definováno jako proces netriviální extrakce implicitních dříve neznámých a potenciálně užitečných informací z dat [Fayyad a kol., 1996]. O dobývání znalostí z databází se začíná intenzivněji mluvit v polovině 90. let, kdy si nárůst objemu dat uchovávaných v různých organizacích spolu s potřebou tato data analyzovat vynutil propjení poznatků ze tří oblastí: statistiky, databází a strojového učení.“ [BERKA, 2001] Jinonické informační pondělky, Praha, Kvalitní katalog - nezbytný zdroj pro poskytování služeb knihovny

2 Bibliomining, (r.rimanova@stk.cz)
Dolování dat BERKA , Petr, Aplikace systémů dobývání znalostí pro analýzu medicínských dat [online]. Praha : EuroMISE Centrum – Kardio, VŠE, 2001 , datum poslední aktualizace: [cit ]. Tato studie vznikla v dubnu 2001 v rámci projektu LN 00B 107 MŠMT ČR. Dostupný z WWW: <http://euromise.vse.cz/kdd/index.php>. BERKA, Petr, Dobývání znalostí z databází. Praha : Academia, s. + 1 CD. Jinonické informační pondělky, Praha,

3 Dolování dat Termín pochází z ekonomických věd (business inteligence)
Bibliomining, Dolování dat Termín pochází z ekonomických věd (business inteligence) Nyní rozšířeno i do dalších oborů – biologie, medicína, technika, pedagogika …knihovnictví Přínos – pravdivé, nové informace ve vztahu k jiným informacím, nová překvapivá zjištění Jinonické informační pondělky, Praha,

4 Dolování dat a informační věda
Bibliomining, Dolování dat a informační věda Rozvíjí statistické metody Umožňuje rychlé aplikování zjištěných poznatků do praxe, stejně rychlé jako prostředí ovlivněné IT v dnešní době Umožňuje použití laboratorní metod pro ověření vědeckých hypotéz Jinonické informační pondělky, Praha,

5 Bibliomining Nový termín – 2002
Bibliomining, Bibliomining Nový termín – 2002 Zavedl Scott Nicholson, profesor Syracuse University School of Information Studies NICHOLSON, Scott. Bibliomining : data minig for libraries [online]. Syracuse : Syracuse University - School for Information Studies, c , 05-Jan-2008 [cit ]. Dostupný z WWW: <http://www.bibliomining.com/>. Jinonické informační pondělky, Praha,

6 Nový termín? Jinonické informační pondělky, Praha, 3. 11. 2008
Bibliomining, Nový termín? Jinonické informační pondělky, Praha,

7 Scott Nicholson http://www.scottnicholson.com/ Nar. 1971
Bibliomining, Scott Nicholson Nar. 1971 Library Game Laboratory of Syracuse – 2008 – výzkum hraní deskových her, možnosti rozvoje v souvislosti s rozvojem služeb knihoven Autor hry „Tulipmania 1637“ Jinonické informační pondělky, Praha,

8 Bibliomining, (r.rimanova@stk.cz)
Nový termín?????? Termín Knihovna je v IT používán pro sbírku procedur, funkcí a datových typů (např. standardní knihovna jazyka C) Dolováním dat v knihovnách není dolováním dat o knihovně Jinonické informační pondělky, Praha,

9 Bibliomining v češtině 1.
Bibliomining, Bibliomining v češtině 1. SOŠKOVÁ, Michala, Analýza a vyhodnocení činností uživatelů souborného on-line katalogu Masarykovy univerzity. Brno, s. Masarykova univerzita. Filozofická fakulta. Ústav české literatury a knihovnictví. Kabinet knihovnictví. Informační studia a knihovnictví. Vedoucí bakalářské práce Zdeněk Kadlec. Dostupný z WWW: <http://is.muni.cz/th/108801/ff_b/Bakalarka_prace_Soskova.pdf>. Jinonické informační pondělky, Praha,

10 Bibliomining v češtině 2.
Bibliomining, Bibliomining v češtině 2. VOJNAR, Martin, Zpětná vazba ze statistik OPAC – bibliomining . Knihovny současnosti : prezentace z konference [online] [cit ]. Dostupný z WWW: <http://www.sdruk.cz/sec/2007/b3/12_vojnar_bibliomining.pdf>. Jinonické informační pondělky, Praha,

11 Nástroje pro bibliomining a software v knihovnách
Bibliomining, Nástroje pro bibliomining a software v knihovnách Nízká podpora dolování dat bez znalostí programování či vstupu do vnitřních tabulek = knihovník musí spolupracovat s IT specialistou (nebo dodavatelem systému) Systém Aleph - speciální modul ARC – Aleph reporting center Místo pro realizaci studentů ÚISK FF UK  Možnost použití software (např. LISp-Miner, VŠE Praha) Jinonické informační pondělky, Praha,

12 Bibliomining proces 1. Porozumění problematice
Bibliomining, Bibliomining proces 1. Porozumění problematice Co chceme zjistit, cíl projektu… Prediktivní metoda - předvídá budoucí hodnoty na základě zjištěných vlastností stávajících Popisná metoda - přesné informace o současném stavu Jinonické informační pondělky, Praha,

13 Bibliomining proces 2. Analýza dostupné datové základny
Bibliomining, Bibliomining proces 2. Analýza dostupné datové základny Vyhledání vhodných množiny pro dat pro bibliomining Jinonické informační pondělky, Praha,

14 Bibliomining proces 2. Analýza dostupné datové základny Příklad
Bibliomining, Bibliomining proces 2. Analýza dostupné datové základny Příklad Cíl – služby z historických fondů Státní technické knihovny – možnosti: Dolovat budeme v záznamech, které mají atribut „Historický fond STK“ Přínos – zjistíme přesně vlastnosti platící pro tuto sbírku Dolovat budeme v celém katalogu Přínos – zjistíme více, ale množství dat může zkreslit výsledek, nebo se projekt zastaví nad tím, že se zdá, že něco by ještě navíc do kolekce patřit mělo a není tam… Výběr správného přístupu → zpřesnění cíle Jinonické informační pondělky, Praha,

15 Bibliomining proces 3. Čištění a příprava dat
Bibliomining, Bibliomining proces 3. Čištění a příprava dat Mají data, která chceme analyzovat atributy na kterých chceme stavět naši analýzu? Za jaké situace data vznikala (roční doba, akademický rok, kvalita připojení k síti internet…) Jinonické informační pondělky, Praha,

16 Bibliomining proces 4. Průzkum dat a modelování
Bibliomining, Bibliomining proces 4. Průzkum dat a modelování Vytvoření algoritmů pro proces Počet etap průzkumu dat nelze předem přesně stanovit Nutné počítat s časovou rezervou Jinonické informační pondělky, Praha,

17 Bibliomining proces 4. Zhodnocení vzorku výsledků
Bibliomining, Bibliomining proces 4. Zhodnocení vzorku výsledků Předložení výsledků odborníkům (knihovníkům) k posouzení Příliš překvapivé výsledky → nedošlo k chybě? Příliš překvapivé výsledky → zpět o několik kroků procesu Kontrole pomůže tzv. „typický představitel“ (např. časopis Nature) Jinonické informační pondělky, Praha,

18 Bibliomining proces 5. Zpráva a implementace 1.
Bibliomining, Bibliomining proces 5. Zpráva a implementace 1. Dokumentace procesu ve všech etapách Před prezentací veřejnosti, konzultovat s knihovníky, Bibliomining musí být vnímán pozitivně – všichni chtějí být lepšími, ale nikdo nechce být kárán Selhání bibliominingu – knihovníci přestávají spolupracovat při tvorbě dat nebo se je snaží upravit Jinonické informační pondělky, Praha,

19 Bibliomining proces 5. Zpráva a implementace 2.
Bibliomining, Bibliomining proces 5. Zpráva a implementace 2. Podpora sociálních vztahů s uživateli – srozumitelné zveřejnění výsledků Neadresná etická prezentace – maximálně do úrovně kategorie uživatelů Jinonické informační pondělky, Praha,

20 Bibliomining, (r.rimanova@stk.cz)
A pak zase znovu… Statistické výstupy získané z bibliominingu je vhodné opakovat v pravidelných cyklech – v ideálním případě pravdivě odhalí zlepšení….stagnaci….zhoršení… Softwarové nástroje vyvinuté pro bibliomining proces využít vícekrát….postupné snižování nákladů Jinonické informační pondělky, Praha,

21 Bibliomining v praxi aneb co nám poví KIS
Bibliomining, Bibliomining v praxi aneb co nám poví KIS Uvedené příklady slouží jako ilustrace využití bibliominingu, nikoli prezentace výsledků jednotlivých výzkumů! Termín bibliomining nebyl použit v žádné citované práci Jinonické informační pondělky, Praha,

22 Vzdálený přístup do databází elektronických časopisů
Bibliomining, Vzdálený přístup do databází elektronických časopisů ŘÍMANOVÁ, Radka, Ultra Access : vstupy do elektronických verzí periodik aneb které služb NLK jsou přístupné po otevírací době II. In Knihovny současnosti 2002 : sborník z 10. konference, konané ve dnech září 2002 v Seči u Chrudimi. Brno : Sdružení knihoven, s ISBN Jinonické informační pondělky, Praha,

23 Vzdálený přístup do databází elektronických časopisů 1.
Bibliomining, Vzdálený přístup do databází elektronických časopisů 1. 2000 – MŠMT podpořilo nákup online databází elektronických časopisů – několik tisíc titulů Licence – autentifikace na IPA knihovny nebo školy Statistiky – dnes COUNTER (Counting Online Usage of Networked Electronic Resources) Jinonické informační pondělky, Praha,

24 Vzdálený přístup do databází elektronických časopisů 2.
Bibliomining, Vzdálený přístup do databází elektronických časopisů 2. 2000 – pro koho tyto databáze nakupujeme? Informační bariéra – geografická a časová Software pro realizaci vzdáleného přístupu Ultra Access (Národní lékařská knihovna 2002) Jinonické informační pondělky, Praha,

25 Vzdálený přístup do databází elektronických časopisů 3.
Bibliomining, Vzdálený přístup do databází elektronických časopisů 3. Ultra Access – hlavní cíl – přístup mimo NLK Vzdálený přístup – nutné povolení v licenci Vzdálená registrace – nutnost smlouvy, účetní opatření (očekávaná platba) Zhodnocení výsledků pořízení – statistiky využívání – potřeba filtru od „in-house“ přístupů Jinonické informační pondělky, Praha,

26 Vzdálený přístup do databází elektronických časopisů 4.
Bibliomining, Vzdálený přístup do databází elektronických časopisů 4. Spolupráce s softwarovým specialistou Grafická nadstavba Analýza dat,které systém eviduje (omezení - přístup do databáze ano, chování v konkrétní databázi nikoli) Definice položek pro dolování dat Jinonické informační pondělky, Praha,

27 Vzdálený přístup do databází elektronických časopisů 5.
Bibliomining, Vzdálený přístup do databází elektronických časopisů 5. Autorizace uživatele – podmínka licence – z hlediska dolování dat – velmi lákavá informace Vytvoření trvalého nástroje pro sledování služby na intranetu Národní lékařské knihovny Jinonické informační pondělky, Praha,

28 Bibliomining a OPAC význam názvu nakladatele
Bibliomining, Bibliomining a OPAC význam názvu nakladatele ŘÍMANOVÁ, Radka. Kvalitní katalog - nezbytný zdroj pro poskytování služeb knihovny. In Knihovny současnosti 2005 : Sborník z 13. konference, konané ve dnech září 2005 v Seči u Chrudimi. Brno : Sdružení knihoven ČR, s ISBN Jinonické informační pondělky, Praha,

29 Bibliomining a OPAC význam názvu nakladatele 1.
Bibliomining, Bibliomining a OPAC význam názvu nakladatele 1. Konkrétní problém katalogizační AACR2 – název nakladatele do pole 260, tak jak je uvedeno v knize Katalogizátoři – snaha o unifikaci názvu nakladatele – konkrétní odraz vznik pole 928 Jinonické informační pondělky, Praha,

30 Bibliomining a OPAC význam názvu nakladatele 2.
Bibliomining, Bibliomining a OPAC význam názvu nakladatele 2. Problém – náklady na údržbu rejstříku autoritních podob názvu nakladatele x podle čeho uživatelé vyhledávají Jinonické informační pondělky, Praha,

31 Bibliomining a OPAC význam názvu nakladatele 3.
Bibliomining, Bibliomining a OPAC význam názvu nakladatele 3. Výsledek - Název nakladatele není pro hledání v OPAC významný Vytvoření tabulky na intranetu Státní technické knihovny Další „překvapivá“ zjištění Jinonické informační pondělky, Praha,

32 Bibliomining, (r.rimanova@stk.cz)
Bibliomining a OPAC význam názvu nakladatele 4. (STK OPAC knihy – ) Index WWW % (zaokrouhleno) Z39.50 Název 6204 37 % Autor 3310 20 % Předmětové heslo 2536 15 % Název produktu 302 2 % Heslo PSH 188 1 % Jinonické informační pondělky, Praha,

33 Bibliomining, (r.rimanova@stk.cz)
Bibliomining a OPAC význam názvu nakladatele 5. (STK OPAC knihy – ) Index WWW % (zaokrouhleno) Z39.50 MDT 75 Nakladatel 204 Edice 77 ISBN 430 3 % 1212 95 % ISSN 79 56 Signatura 3350 20 % Jinonické informační pondělky, Praha,

34 Bibliomining, (r.rimanova@stk.cz)
Bibliomining a OPAC význam názvu nakladatele 6. Režim „vyhledávání“ (STK OPAC knihy – ) Položka WWW % zaokrouhleno Z39.50 Všechny 46393 70 % Autor 8377 13 % 3369 54 Název 7461 11 % 2716 44 Předmětová hesla 2884 4% 107 2 Nakladatel 730 1% Jinonické informační pondělky, Praha,

35 Bibliomining a OPAC význam názvu nakladatele 7.
Bibliomining, Bibliomining a OPAC význam názvu nakladatele 7. Překvapivé výsledky: Kde uživatelé hledají častěji (režim, položka) Pojmenování položek v OPAC, rozumíme si? Rozdíl mezi hledáním ve www a Z39.50 Důležitost selekčních prvků, na co je nám MDT? Jak pomoci přesnosti nejčastějšího typu dotazu do OPAC? Pozor na zobecnění – nepřenositelné vůči jiné uživatelské skupině či OPAC!!!!! Jinonické informační pondělky, Praha,

36 Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph
Bibliomining, Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph DOLEŽALOVÁ, Pavlína, 2007; ŠRAJBOVÁ, Magda; TRNKA, Jiří. Katalogizátor pro(ti) uživateli katalogu aneb jak uvažuje knihovník o čtenáři. Knihovny současnosti 2007 : Sborník z 15. konference, konané ve dnech 11.–13. září 2007 v Seči u Chrudimi [online] [cit ], s Dostupný z WWW: <http://www.sdruk.cz/sec/2007/sbornik/3-08.pdf>. Jinonické informační pondělky, Praha,

37 Provnání tradiční formy průzkumu v knihovnách a bibliominingu
Bibliomining, Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 1. Provnání tradiční formy průzkumu v knihovnách a bibliominingu Hledání bariér mezi OPAC a uživatelem V roce 1967 – lístkové katalogy SVK Plzeň Chyběl názvový katalog, málo užívaný systematický (MDT Jinonické informační pondělky, Praha,

38 Bibliomining, (r.rimanova@stk.cz)
Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 2. Zkoumané skupiny katalogizátoři, pracovníci ve službách, uživatelé dotaz na knihovníky – podle čeho hledáte vy a podle čeho si myslíte, že hledají uživatelé… Jinonické informační pondělky, Praha,

39 Předpoklad při bibliominingu OPAC – laici
Bibliomining, Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 3. Předpoklad při bibliominingu OPAC – laici KIS staff rozhraní – knihovníci Dotazník – uživatelé uváděli rozšířenou škálu typů rešerši – nutno zkoumat skupinu respondentů – spíše lidé s hlubším vztahem ke knihovně (snaha „potěšit“ dotazujícího knihovníka) Bibliomining – srovnatelné výsledky s STK Jinonické informační pondělky, Praha,

40 Bibliomining, (r.rimanova@stk.cz)
Bibliomining a OPAC : porovnání dotazníku a bibliominingu z KIS Aleph 4. Ze závěrů průzkumu např. Podle titulů nebo typů hledané literatury lze usuzovat i na úroveň práce uživatelské kategorie = studenti používají při hledání studijní literatury častěji než běžný uživatel kombinaci více termínů (název x rok) Uživatelé nevnímají struktury bibliografického záznamu Pracovníci ve službách lépe znají uživatele a jejich požadavky – nutné najít mechanismus jak tyto znalosti předávat do zpracovatelských sfér Jinonické informační pondělky, Praha,

41 Bibliomining, (r.rimanova@stk.cz)
Prezenční výpůjčky ŘÍMANOVÁ, Radka, 2006; SKOLKOVÁ, Linda. Jak sledovat využití knihovního fondu. In CASLIN 2006 : Zpětná vazba aneb děláme to dobře? Český ráj, Praha : Knihovna AV ČR, s ISBN Prezentace dostupná z WWW: <http://www.lib.cas.cz/caslin-2006/download/Rimanova_Skolkova_prezentace.pdf> Jinonické informační pondělky, Praha,

42 Prezenční výpůjčky 1. „Kde nejsou data nemůže být ani bibliomining…“
Bibliomining, Prezenční výpůjčky 1. „Kde nejsou data nemůže být ani bibliomining…“ Elektronické časopisy – dobrá statistická podpora Tištěné časopisy - prezenční výpůjčky – obtížné vytváření dat Jinonické informační pondělky, Praha,

43 Prezenční výpůjčky 2. Proč sledovat? Např.
Bibliomining, Prezenční výpůjčky 2. Proč sledovat? Např. efektivita nákladů na pořízení a zpřístupnění uspořádání a organizace studoven opravdu nutné jen prezenčně? porovnání počtu služeb document delivery services a přímého využívání poměr mezi využíváním tištěné a elektronické verze ….. Jinonické informační pondělky, Praha,

44 Prezenční výpůjčky 3. Z výsledků
Bibliomining, Prezenční výpůjčky 3. Z výsledků 57% knihoven nemělo prokazatelné výsledky o poměru využívání papírových a elektronických verzí Poměr mezi stabilitou financování a investicemi do sledování prezenčních výpůjček Nejčastější metoda – ruční snímání čárových kódů a porovnáváním s evidencí v KIS RFID technologie – sledování prezenčních výpůjček na bází čipu – laboratoř 3M Jinonické informační pondělky, Praha,

45 Turniket a bibliomining
Bibliomining, Turniket a bibliomining LOŠŤÁKOVÁ, Danuše, 2006; SLEZÁKOVÁ, Ludmila. Víme, co naši uživatelé potřebují?. In CASLIN 2006 : Zpětná vazba aneb děláme to dobře? Český ráj, Praha : Knihovna AV ČR, s ISBN Prezentace dostupná z WWW: <http://www.lib.cas.cz/caslin-2006/program.php> Jinonické informační pondělky, Praha,

46 Turniket a bibliomining
Bibliomining, Turniket a bibliomining Identifikace uživatele na vstupu do knihovny Přínos – adresné vyhodnocení vůči studované fakultě, prokazatelné požadavky při sdíleném financování a argument pro spojení knihoven Negativní dopad – bariéra při vstupu do knihovny, v roce 2007 odstraněn Jinonické informační pondělky, Praha,

47 Zkušenost z Tchaj-wanu
Bibliomining, Zkušenost z Tchaj-wanu WU, Chin-Hsing, 2003; LEE, Tzai-Zang; KAO, Shu-Chen. Knowledge discovery applied to materiál aquisitions for libraries. Information Processing and Management. 2004, vol. 40 [cit ], p Doi: /j.ipm Abstrakt dostupný z WWW: <http://portal.acm.org/citation.cfm?id= http://portal.acm.org/citation.cfm?id= >. ISSN  Jinonické informační pondělky, Praha,

48 Zkušenost z Tchaj-wanu 1.
Bibliomining, Zkušenost z Tchaj-wanu 1. Bibliomining pro akviziční politiku univerzity Další záludnost bibliominingu – poměr odborníků a služeb - jak vyhovět i těm, kterých je méně Nutná kombinace tradičních prvků – zkušenost, studijní plán, fakultní doporučení a bibliominingu Jinonické informační pondělky, Praha,

49 Zkušenost z Tchaj-wanu 2.
Bibliomining, Zkušenost z Tchaj-wanu 2. „…Knihovníci, kteří přijmou technologie jako partnera při rozhodování, jsou i nadále více přístupni tomu, aby se změny v jejich práci děly na základě analytických počítačových metod. Z tohoto důvodu doporučujeme nezapomenout v projektech na náklady a prostor pro vysvětlení všem, kteří pracují s výpůjční databází, že při své práci vytváří i data pro budoucí akvizici…“ Jinonické informační pondělky, Praha,

50 Bibliomining, (r.rimanova@stk.cz)
Závěr 1. Knihovník musí vědet o existenci a možnostech bibliominingu. Pokud jej nezná, pak alespoň o existenci a možnostech dolování dat . Před knihovníky leží úkol přejít od intuitivních metod dolování dat k standardizovaným procesům a zařadit je do své práce. Jinonické informační pondělky, Praha,

51 Bibliomining, (r.rimanova@stk.cz)
Závěr 2. 3. Při práci v knihovně minimalizovat neevidované procesy a zároveň výsledky bibliominingu prezentovat i v souvislostech statisticky nepopsatelných skutečností. 4. Výsledky bibliominingu prezentovat a využívat v souladu s etickými principy knihovníka a pozitivním způsobem. 5. Požadovat na všech producentech SW pro knihovnicko-informační služby dynamické nástroje pro bibliominingové projekty. Jinonické informační pondělky, Praha,

52 Vzhůru do dolů! Jinonické informační pondělky, Praha, 3. 11. 2008
Bibliomining, Vzhůru do dolů! Jinonické informační pondělky, Praha,

53 Děkuji za pozornost Radka Římanová Kontakt r.rimanova@stk.cz
Bibliomining, Děkuji za pozornost Radka Římanová Kontakt Jinonické informační pondělky, Praha,


Stáhnout ppt "Radka Římanová Bibliomining, Dolování dat"

Podobné prezentace


Reklamy Google