Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Digitální knihovny Miroslav Bartošek Ústav výpočetní techniky MU, Brno

Podobné prezentace


Prezentace na téma: "Digitální knihovny Miroslav Bartošek Ústav výpočetní techniky MU, Brno"— Transkript prezentace:

1 Digitální knihovny Miroslav Bartošek Ústav výpočetní techniky MU, Brno bartosek@ics.muni.cz

2

3 M.Bartošek, Digitální knihovny EurOpen 2009 3 Obsah přednášky 1. DL – co to je? 2. Oblasti a technologie DL 2.1 Metadata 2.2 Identifikátory 2.3 Interoperabilita 3. SW pro tvorbu DL 4. DML-CZ: příklad DL

4 DL – co to je?

5 M.Bartošek, Digitální knihovny EurOpen 2009 5 1.1 DL – obecné vymezení  Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. W.Y.Arms, 2000 - systematicky budovaná digitální sbírka - výběr materiálu, důraz na kvalitu - zaměření na určitou komunitu uživatelů - služby - efektivní přístup - komplexní infrastruktura - garantovaná dlouhodobá dostupnost

6 M.Bartošek, Digitální knihovny EurOpen 2009 6 1.2 DL - landscape Digitalizace  knihovny - American Memory (LoC), Kramerius (NK)  historické fondy - Manuscriptorium (NK ČR)  nakladatelé - Elsevier ScienceDirect, SpringerLink, DL IEEE, DL ACM, …  agregátoři - ProQuest, EBSCO  služby - JSTOR, Google Books

7 M.Bartošek, Digitální knihovny EurOpen 2009 7 1.2 DL - landscape Harvesting  Sklízení dokumentů z webu (archivace)  Internet Archive  WebArchiv (NK ČR)  Sklízení metadat (služby)  OAIster  Agregace (integrace DL)  NSDL (National Science Digital Library, STEM)

8 M.Bartošek, Digitální knihovny EurOpen 2009 8 1.2 DL - landscape Born-digital  preprintové repozitáře (komunikace)  arXiv.org  institucionální repozitáře (open access)  šedá literatura (kvalifikační práce)  vědecký výstup instituce  oborové repozitáře (oborové pokrytí)  specializované repozitáře (data z experimentů, …)

9 Oblasti a technologie DL

10 M.Bartošek, Digitální knihovny EurOpen 2009 10 obecný rámec a architektura DL intelektuální vlastnictví & ekonomika vícejazyčný přístup k informacím metadata interoperabilita (globální) vyhledávání zobecněný model dokumenu dlouhodobé uchovávání digitální informace budování sbírek digitalizaceborn digitalharvesting

11 M.Bartošek, Digitální knihovny EurOpen 2009 11 Oblasti 1.Metadata 2.Identifikátory 3.Interoperabilita & vyhledávání - základní standardy/technologie

12 M.Bartošek, Digitální knihovny EurOpen 2009 12 2.1 Metadata  Džungle aplikačních/oborových/… metadat  Metadata popisná, strukturální, administrativní, …  Poptávka po formátu, který by byl  jednoduchý  univerzální  flexibilní  široce rozšířený  …

13 M.Bartošek, Digitální knihovny EurOpen 2009 13 2.1 Metadata  MARC  klasická knihovnická metadata  velmi podrobná, příliš složitá, tištěné dokumenty  Dublin Core  minimalistický přístup (core), popisná metadata  15 prvků, jednoduchý x kvalifikovaný DC  MODS  kompromis mezi DC a MARC  modernizovaný MARC v XML kabátě

14 M.Bartošek, Digitální knihovny EurOpen 2009 14 2.1 Příklad: řádkový UNIMARC 001 CASLIN0000001 005 19960312 010 $a80-7050-237-1 100 $a19960305d1996####k##y0czey0103####ba 101 0# $acze 102 $aCZ 200 1# $aZáznam pro souborný katalog$eUNIMARC$iTištěné monografie $fPracovní skupina CASLIN pro standardizaci a jmenné... 205 $a1. vyd. 210 $aPraha$cNárodní knihovna České republiky$d1996 215 $a31 s. 225 1# $aStandardizace$vč. 4 675 $a025.3$9v 711 02 $aCASLIN$bPracovní skupina pro standardizaci a... 801 #0 $aCZ$bABA001$c19960312$gAACR2$91 801 #3 $aCZ$bABA001$c19960515 910 $aABA001

15 M.Bartošek, Digitální knihovny EurOpen 2009 15 2.1 Příklad: DC v hlavičce HTML Guidance on expressing the Dublin Core within the RDF …

16 M.Bartošek, Digitální knihovny EurOpen 2009 16 2.1 Metadata  METS  Metadata Encoding and Transmission Standard (LoC)  kontejner (XML schéma) pro složité digitální objekty  struktura  všechny typy metadat (popisná, administrat, technická, …)  zdrojové soubory  TEI  Text Encoding Initiative  značkovací schéma pro zápis embedded metadat  nejrůznější typy e-textů (knihy, slovníky, bibliografie, …)  vědecké práce v oblasti humanitních a sociálních věd  teixlite

17 M.Bartošek, Digitální knihovny EurOpen 2009 17 2.2 Identifikátory  globálně jednoznačné  decentralizované  univerzální (granularita)  persistentní  akční  „If there is one thing that distinquishes a digital library from a mere web site, it is that libraries do their best to provide reliable, persistent access through durable links.“ (J.A.Kunze, California Digital Library)

18 M.Bartošek, Digitální knihovny EurOpen 2009 18 2.2 „Klasické“ knihovnické id Potřeba vícevrstvé propojené identifikace  organizace (knihovna) ISIL Intl Standard Identifier for Libraries and Related Organizations  sbírka, služba ISCI Intl Standard Collection Identifier  autor/korporace ISPI Intl Standard Party Identifier  dílo ISTC Intl Standard Textual Code ISWC Intl Standard Musical Work Code  projev ISBN Intl Standard Book Number ISSN Intl Standard Seriál Number ISMN Intl Standard Music Number  komponenta SICI Seriál Item and Contribution Identifier  již existuje  návrh standardu  v diskusi

19 M.Bartošek, Digitální knihovny EurOpen 2009 19 2.2 „Digitální“ id PURL – persistentní URL purl.oclc.org  URL s nepřímou adresací Handle www.handle.net  CNRI – Corporation for National Research Initiatives  non-TCP/IP, vlastní resoluční systém nezávislý na DNS – i násobná resoluce  přímá resoluce přes handle protokol (plug-in pro web-prohlížeč)  URL-resoluce přes proxy DOI – Digital Object Identifier www.doi.org  aplikace nad handle (Asociace amerických nakladatelů)  samofinancující systém (IDF + registrační agentury)  velmi úspěšný, CrossRef

20 M.Bartošek, Digitální knihovny EurOpen 2009 20 2.3 Interoperabilita  The common vision is one of tens of thousands of repositories of digital information that are autonomously managed yet integrated into what users view as a coherent digital library system. C.Lynch, H.García-Molina, IITA DL Workshop, 1995  Různé úrovně (syntaktická, sémantická, …)  Oblasti interoperability  data  komunikace/vyhledávání  prezentace  řízení/přístup

21 M.Bartošek, Digitální knihovny EurOpen 2009 21 2.3 Interoperabilita Z39.50  Klasická knihovnická interoperabilita – search/retrieval  Spolupráce mezi heterogenními knihovními systémy  Meta-vyhledávání  Těžkotonážní „dinosaurus“ (před webem)  Mimo oblast klasických knihoven se nevyužívá (složitý) SRU/SRW  silně zjednodušená Z39.50 na webových technologiích  SRW – protokol nad SOAP (HTTP post + XML)  SRU – protokol nad URL (HTTP get)  CQL – Common Query Language

22 M.Bartošek, Digitální knihovny EurOpen 2009 22 2.3 Interoperabilita OAI  Open Archive Initiative – nízkoprahová interoperabilita  Cross-repository search sklízení MD + federativní vyhledávání  Metadatový standard (nekvalifikovaný DC)  globální identifikační schéma  OAI-PMH – Protocol for Metadata Harvesting  Agregace webových zdrojů  Komunikace a využití složených objektů v e-science  OAI-ORE – Object Reuse and Exchange  ORE Primer http://www.openarchives.org/ore/1.0/primer

23 M.Bartošek, Digitální knihovny EurOpen 2009 23 2.3 Interoperabilita Linkovací služby  dynamické kontextově citlivé vazby na webu  appropriate copy problem OpenURL  Standard pro kódování metadat zdroje do jeho URL  Příklad: citace článku v databázi Medline nakladatele Ebsco Publishing: Moll, JR. Attractive electrostatic interactions. J Biol Chem. 2000 Nov 3, 275(44):34826-32. doi:10.1074/jbc.M004545200 http://link.server.cz/demo?sid=ebsco:medline&aulast=Moll &auinit=JR&date=20001103&stitle=J%20Biol%20Chem&volume= 275&issue=44&spage=34826

24 M.Bartošek, Digitální knihovny EurOpen 2009 24 Kontextově citlivé vazby  Linkovací služby - aplikační rámec nad OpenURL  princip: oddělení popisu zdroje od poskytování vazeb  klasická vazba: kontextově citlivá vazba:  kooperační rámec:  linkovací služby (link resolvers) poskytují (dynamicky) vazby (Knowledge Base o zdrojích každého zákazníka)  producenti inf.zdrojů poskytující OpenURL-enabled zdroje  uživatelé se registrují u svých linkovacích služeb výchozí zdroj (např. citace článku) cílový zdroj (např. plný text) výchozí zdroj cílový zdroj (kontextový !) Link server cílový zdroj (kontextový !) cílový zdroj (kontextový !)

25 SW pro tvorbu DL

26 M.Bartošek, Digitální knihovny EurOpen 2009 26 3. Open Source SW Greenstone  University of Waikato, Nový Zéland  jednoduchý, snadná instalace EPrints  University of Southampton  pre-/post-print repozitář DSpace  MIT + HP Labs  Institucionální repozitář FEDORA  Cornel University + University of Virginia  Flexibilní univerzální robustní repozitář

27 M.Bartošek, Digitální knihovny EurOpen 2009 27 3. Open Source SW CDS Invenio - CERN

28 DML-CZ: příklad DL

29 M.Bartošek, Digitální knihovny EurOpen 2009 29 4.1 Co je DML-CZ 1. Projekt  pokročilá digitalizace  grant - Informační společnost, AV ČR  2005-2009 2. Digitální knihovna http://dml.cz  prestižní česká matematická literatura  fulltexty + metadata - volně dostupné  listopad 2009 – finální verze

30 M.Bartošek, Digitální knihovny EurOpen 2009 30 11 časopisů sborníkové řady, monografie 270.000 stran 25.000 článků 10.000 autorů

31 M.Bartošek, Digitální knihovny EurOpen 2009 31 4.2 Projekt: cíle 1. zkoumání/vývoj technologií  OCR matematiky  nástroje pro tvorbu metadat – metadatový editor, DL 2. digitalizace  časopisy, monografie, sborníky  článkově orientovaná národní DML 3. začlenění do světové WDML  mezinárodní standardy  interoperabilita

32 M.Bartošek, Digitální knihovny EurOpen 2009 32 4.3 Projekt: partneři AV – Matematický ústav  vedení, autorsko-právní aspekty, uživatelské požadavky MFF UK  matematika, metadata AV – Knihovna  digitalizace (Sirius, Kramerius) MU – FI  OCR + vyhledávání matematiky MU – ÚVT  integrace, implementace digitální knihovny (DSpace)

33 M.Bartošek, Digitální knihovny EurOpen 2009 33 4.4 Knihovna: obsah tištěné dokumenty  19.století – 1990  předlohy pouze v tištěné podobě  klasická digitalizace retro-born-digital  1991 – 2007  předlohy v (částečně) digitální formě  různé formáty - konverze digital-online  2008 –  automatizované přebírání nových čísel do DML-CZ

34 M.Bartošek, Digitální knihovny EurOpen 2009 34 1.Příprava materiálů 2.Digitalizace 3.OCR 4.Referenční metadata (MR, ZBL) 5.Integrace -> články 6.Digitální knihovna 4.5 DML-CZ Workflow MR – Mathematical Reviews ZBL – Zentralblatt MATH

35 M.Bartošek, Digitální knihovny EurOpen 2009 35


Stáhnout ppt "Digitální knihovny Miroslav Bartošek Ústav výpočetní techniky MU, Brno"

Podobné prezentace


Reklamy Google