Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilMichaela Navrátilová
1
Digitální knihovny Aktuální oblasti výzkumu Miroslav Bartošek MU Brno, Ústav výpočetní techniky
2
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 2 Krátce z historie 1945Vannevar Bush („As We May Think“, Memex) 1965J.C.R. Licklieder („Libraries of the Future“) 60. létaMARC, OPAC (LoC, OCLC) 80. létafulltexty poč. 90 C omputing + C ommunications + C ontents (nízká cena, vysoký výkon, široká dostupnost) 1994 Digital Library Initiative, www nyní od experimentování k budování infrastruktury
3
Digitální knihovny = ?
4
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 4 Definice DL (1) počítačnický pohled: Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. W.Y.Arms, 2000 - udržovaná, spravovaná dig. sbírka (maintained) - služby - vzdálený přístup
5
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 5 Definice DL (2) knihovnický pohled: Digitální knihovny jsou organizace, které poskytují zdroje (včetně specializovaného personálu) umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat – a to vše s ohledem na snadné a ekonomické využití určitou komunitou nebo množinou komunit uživatelů. US Digital Library Federation, 1997 - DL jako „instituce“ (např. knihovna) - důraz na systematickou organizaci a služby - cílenost DL (využívání určitou komunitou)
6
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 6 Obecné znaky DLs organizace digitální sbírky – klíčový problém DL není jedna uzavřená entita (DLs) heterogenní, dynamické a multimediální inf. zdroje propojení autonomních inf. celků transparentní propojení koherentní přístup bez ohledu na formu, formát, způsob a místo uložení informací
7
Oblasti výzkumu DLs
8
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 8 obecná architektura DL intelektuální vlastnictví & ekonomika vícejazyčný přístup k informacím metadata interoperabilita globální vyhledávání zdrojů zobecněný model dokumenu dlouhodobé uchovávání digitální informace budování sbírek digitalizaceborn digitalharvesting
9
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 9 Oblasti výzkumu DLs 1.Budování sbírek 2.Obecná architektura 3.Identifikace DO 4.Metadata 5.Interoperabilita, škálovatelnost 6.Vyhledávání zdrojů 7.IPR a ekonomika 8.Dlouhodobé uchovávání
10
1. Budování digitálních sbírek
11
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 11 1. Budování sbírek Digitalizace – rutinní záležitost Born digital pre-print archivy (ArXiv.org) Sklízené DLs ResearchIndex WebBase OAI Archivace webu (Internet Archive, WebArchive)
12
2. Obecná architektura DLs
13
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 13 2. Obecná architektura - význam Referenční model důležitý pro: ustanovení jednotného slovníku formalizaci představ o funkcích a fungování DL komponent služeb vztahů identifikaci potřebného middleware (underlying global infrastructure)
14
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 14 2. Obecná architektura - přístupy Kahn-Willensky Framework for distrib. DO Services DO, repozitář, RAP, identifikační systém, komponenty DL FEDORA Flexible Extensible DO Repository Architecture 5S-model Societies, Scenarios, Spaces, Structures, Streams Open Digital Libraries Extended PMH
15
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 15 2.1.3 KWF: komponenty DL => obraz DOUser interface4. display => digital object=> Repository - RAPUser interface => repository ID=> Handle systemUser interface3. retrieve => handle=> ItemUser interface2. select => list of items=> Search systemUser interface1. search
16
3. Identifikátory
17
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 17 3. Jména a identifikátory Hierarchie intelekt. děl (IFLA model) Klasické knihovnické identifikátory ISBN, ISSN, SICI, BICI, ISTC, … URN PURL - persistentní URL Systém „handles“ DOI - Digital Object Identifier
18
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 18 3.1 Klasické knihovnické identif. ISBN, ISSN, ISMN, … používány již cca 30 let většinou jen pro „projev díla“ (viz IFLA model) potřeba vícevrstvé identifikace : autor ISADNIntl. Standard Authority Data Number dílo ISTCIntl. Standard Textual Work Code ISANIntl. Standard Audiovisual Number ISWCIntl. Standard Musical Work Code (2001/11) projev ISBNIntl. Standard Book Number ISSNIntl. Standard Serial Number komponenta SICISeriál Item and Contribution Identifier BICIBook Item and Component Identifier již existuje návrh standardu v diskusi
19
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 19 3.2 Koncept URN nevhodnost URL (identifikuje lokaci, nikoliv obsah) URN - Uniform Resource Name globálnost a nezávislost na lokaci jednoznačnost (1 URN – 1 zdroj, ale 1 zdroj – x URN) persistence („na věky“ – i po zániku zdroje) škálovatelnost (granularita pro jakoukoliv „velikost“ zdroje) legacy support (začlenění již existujících systémů) rozšiřitelnost (na jakékoliv budoucí systémy) resolvovatelnost (jak nalézt aktuální URL, metadata, …) identifikace obsahu bez ohledu na lokaci: resoluční mechanismus ( URN –resoluce URL/metadata/…)
20
4. Metadata
21
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 21 4. Metadata Klasická (knihovnická) metadata vznik jednotný, centralizovaný velký podíl ruční práce komplexní popis „síťová“ metadata specializovaná, různé komunity/určení propojování do složitějších struktur (XML, RDF, METS) nová metadatová schémata Dublin Core, INDECS, ONIX, … „teorie“ metadat požadavky na „dobře utvořená“ md-schémata
22
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 22 4.1 Metadata - typologie a) z hlediska určení: popisná (vyhledání, identifikace, selekce) strukturální (uložení a zobrazování) administrativní (řízení přístupu, archivace, …) b) dle oblasti nasazení: popis/vyhledávání zdrojů (Dublin Core, MARC, RFC 1807, TEI) identifikace (DOI metadata, BibTeX) dlouhodobá archivace (OAIS model, OCLC-RLG) IPR, e-commerce (INDECS, ONIX, MPEG-21) hodnocení obsahu (PICS) interoperabilita (METS, RDF) formátově specializovaná (MPEG-7, TIFF) oborově specializovaná (fyzika, CSDGM – GIS, medicína…)
23
5. Interoperabilita
24
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 24 5. Interoperabilita ? DL <> monolitický produkt = dynamický systém spolupracujících komponent „ The common vision is one of tens of thousands of repositories of digital information that are autonomously managed yet integrated into what users view as a coherent digital library system “ C.Lynch, H.García-Molina, IITA DL Workshop, 1995 interoperabilita : schopnost spolupráce mezi technicky různorodými a organizačně nezávislými komponentami různé úrovně interoperability povrchní sjednocení syntaktická hluboká sémantická
25
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 25 5.1 Kritéria interoperability kritéria míry interoperability: vysoký stupeň autonomie komponent nízká cena infrastruktury snadnost přidání nové komponenty snadnost používání komponenty celková složitost škálovatelnost v počtu komponent optimalizace jednoho -> zhoršení jiného
26
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 26 5.2 Metody interoperability žádná (explicitní) spolupráce webovské vyhledávače, ResearchIndex silné standardy a federace Z39.50, NCSTRL, … lehkotonážní přístupy OAI, OpenDL, OpenURL, SFX, … nové nástroje/metodologie ontologie, web-services, …
27
6. Vyhledávání zdrojů
28
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 28 6. Vyhledávání - oblasti výzkumu organizace při distribuovaném vyhledávání má každé řešení svůj organizační aspekt; vždy musí existovat určitá forma koordinace – má-li být vyhledávání efektivní systémy systémová infrastruktura podporující vyhledávání (routing dotazů, mezirepozitářové protokoly, bezpečnost, soukromí, autentifikace, placení) digitální obsah logický výběr inf.bází, dotazování netextových zdrojů, ratings, filtrace, přechod od vyhledávání explicitní informace k získávání implicitních poznatků (knowledge discovery, sémantický web) rozhraní HCI: konstrukce dotazů, prezentace/vizualizace výsledků, task understanding, proces exposure metriky taxonomie pro vyhodnocování různých řešení, testbeds
29
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 29 6.2 Současné pokroky nejlepší výsledky : hrubá síla ! vyhledávání infomací - webovské vyhledávače porozumění sémantice dokumentů - Deliver vyhodnocování výsledků - Google archivace digitálního dědictví - Internet Archive citační analýza - ReserchIndex reference linking - SFX extrakce m-dat z multimediálních zdrojů - Informedia budoucnost: Sémantický web ! (?)
30
7. IPR a ekonomika
31
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 31 7. Klíčové aspekty nasazení DL „Technický rámec DL působí vždy v určitém legislativním, ekonomickém a sociálním kontextu“ ekonomika a legislativa (IPR) – úzce spolu souvisí Základní otázky : 1. funkce copyrightu u digitálních knihoven (jak vybalancovat veřejné právo na přístup k informacím s ekonomickými zájmy tvůrců a vydavatelů) 2. jak pokrýt různé nákladové položky v procesu vzniku, organizace, zpřístupňování, údržby, archivace dig.informace a dalších value added služeb (closed x open access) 3. technologie pro ochranu digitální-info před zneužitím (částečné zpřístupnění, HW zámky, steganografie, kryptologie, …)
32
8. Dlouhodobá archivace
33
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 33 8. Archivace digitální info „Digital information is forever. It doesn’t deteriorate and requires little in the way of material media”. Andy Grove, Intel Corp. „Digital information lasts forever – or five years, whichever comes first.“ Jeff Rothenberg, RAND, 1995
34
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 34 8.1 Hrozby pro dig. informaci Informace: obsah a formátování Technologické provedení (nosič) Změna obsahu Smazání obsahu Neplatný formát Nefungující software Destrukce fyzického nosiče Nedostupné čtecí zařízení hw/sw Degradace fyzického nosiče
35
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 35 3. Digitální arch. strategie replikace a refreshing technické museum migrace emulace POP – persistent object preservation konverze do permanentní analogové formy Referenční model OAIS (Open Archival Inf. Systém) Rosetta Disk: 2“ niklová deska, litograf. nano-technologií vyrytý analogový text a obrázky (350.000 stran, 2K-10K let) Digitální archeologie
36
Zdroje informací
37
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 37 5.2 Další zdroje info (1) časopisy D-Lib http://www.dlib.org http://www.dlib.org spec.čísla CACM 95/4, 98/4, 01/5 RLG DigiNews http://www.rlg.org/preserv/diginews/ ICSTI forum http://www.icsti.org/forum/index.html projekty na Inetu obrovské množství info (musím ale vědět, co hledám)
38
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 38 5.2 Další zdroje info (2) Konference (sborníky – viz LNCS-online) Advances in DLs (IEEE) 1996-2000 ACM Conference on DLs 1996-2000 Joint Conference on DLs od 2001 European Conference on Research and Advanced Technologies for DLs od 1997
39
M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS 2003 39 Děkuji za pozornost
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.