Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky

Podobné prezentace


Prezentace na téma: "Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky"— Transkript prezentace:

1 Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky adolf.knoll@nkp.cz

2

3 Digitalizační aktivity ► 1992/1993 – První pilotní projekt programu UNESCO Paměť světa ► 1995 – další pilotní projekty ► 1996 – počátek rutinní digitalizace ► 2000 – národní programy ► 2003/2004 – spuštění digitálních knihoven ► -> 2010 – vytvoření virtuálního badatelského prostředí pro historické dokumenty a sbírky

4 Standardizace ► Složený digitální dokument:  Datová část  Metadatová část ► Jak strukturovat? ► Komplexní dokumentový formát

5 Značkovací jazyky ► Platforma SGML je pro takový formát ideální ► Naše programy:  Vlastní SGML implementace (DOBM) – 1996 – v r. 1999 jako doporučení UNESCO  XML platforma od r. 2003/2004 ► Namapování standardů pro popis obsahu, doporučených postupů a dalších řešení

6 Metadata

7 Metadata – co popsat ► Identifikace ► Obsah ► Struktura ► Technické parametry ► Komunikace ► Jak: naše konkrétní řešení jsou promítnuta do těchto strukturálních součástí ZPŘÍSTUPNĚNÍ PROSTŘEDNICTVÍM DEFINOVANÉ KOMPATIBILITY

8 Identifikační metadata ► Katalogizační a další identifikační pravidla ► MARC, Dublin Core, MASTER, …, v knihovnách ► EAD v archivech ► AMICO, CIDOC, REACH Element Set, …, v muzeích ► … in … ► ROLE: identifikovat virtuální reprezentaci originálu (ve vztahu k originálu)

9 Metadata pro popis obsahu ► Žádná pevná pravidla nejsou k dispozici – nebo jen částečně – většinou ověřené praktické postupy ► Musíme je vzít a formálně zabudovat do struktury dokumentu ► Většinou základní povinná úroveň je velmi jednoduchá, ale musí vyhovět nejčastějším uživatelským potřebám

10 Strukturální metadata ► Musí být namapována struktura celého dokumentu (se všemi nejčastějšími zvláštnostmi):  Fyzické části  Logické části, které chceme specifickým způsobem pojednat (články, kapitoly, vztažené objekty, …) ► Zde je často nesnadné stanovit povinné elementy

11

12 Technická metadata Existence vysoce profesionálních standardů vs. Naše pragmatické a skutečné potřeby ► Rigorózní standardy je třeba aplikovat tam, kde mohou dobře sloužit cílům projektu, ale tam, kde by byly jen cílem pro sebe sama, bychom měli mít odvahu se rozhodnout jinak ► ROLE: vyřešit současné a budoucí zobrazení, přehrání nebo tisk správně a na nezbytné kvalitativní úrovni

13 Komunikační metadata ► Zajišťují integraci do širšího virtuálního prostředí ► Komunikace mezi aplikacemi digitální knihovny a vyhledávacími portály ► Standardizované protokoly: Z39.50, OAI- PMH, … ► Je třeba si odsouhlasit profily, tj. minimální identifikační záznamy

14 Digital Library Applications Manuscriptorium Kramerius KATALOGY (Souborný katalog ČR bude mít funkci souborného katalogu digitálního obsahu) PORTÁLY http://theeuropeanlibrary.org http://theeuropeanlibrary.org TEL (http://theeuropeanlibrary.org)http://theeuropeanlibrary.org http://www.jib.cz http://www.jib.cz JIB (http://www.jib.cz)http://www.jib.cz https://diva.ub.uu.se/test/cerl/index.xml https://diva.ub.uu.se/test/cerl/index.xml CERL-MSS (https://diva.ub.uu.se/test/cerl/index.xml)https://diva.ub.uu.se/test/cerl/index.xml

15 Metadata: jak popsat ► Cílem je strukturovaný formát definovaný formálně jako DTD nebo W3C Schéma ► Mnoho z výše uvedených skutečností závisí na našem výběru/rozhodnutí ► Naše formáty pro digitalizované dokumenty: rukopisy, periodika, monografie, zvukové dokumenty, sbírkové předměty, komunikační profily, historický fultext

16 Budoucí vývoj ► XML platforma se zdá zatím dostatečně robustní ► Nové přístupy a dílčí platformy se budou objevovat – například METS (strukturovaná kontejnerizace) ► Jestliže jsou naše analýzy správné, budou starší a novější základně mezi sebou kompatibilní ► Změny stojí peníze: nástroje na výrobu digitálních dokumentů, na jejich zpřístupnění, na…

17 Data

18 Data: co ukázat ► Datové soubory jsou cílem uživatelského zájmu (obrazy, fulltext, audio nebo video soubory) ► Originál je jimi přímo reprezentován ► Kvalita dat:  Archivní soubory  Uživatelské soubory ► Obě úrovně jsou primárně definovány cíli našich projektů

19 Archivní soubory ► Funkce ochrany a záchrany originálů ► Většinou ISO nebo velmi rozšířené standardy:  TIFF, JPEG  WAV  MPEG  Nekomprimované  Komprimované ► bezeztrátově ► ztrátově

20 Uživatelské soubory ► Redukce objemu dat:  Snížení rozlišení nebo toku dat (bit rate)  Komprese  Pouze obrazy (+ je třeba zvážit i snížení počtu barev): ► Mixed Raster Content ► Multiresolutional image ► Obrazové servery

21 Snížení rozlišení/toku dat ► Použití pouze známých formátů ► Definovat cíle a smysl dodávání dat ► Dodávat jen takové rozlišení, které je mírně vyšší než požadovaný limit (náhled, základní kvality, normální kvalita, …) ► Většinou oblast JPEG nebo TIFF/GIF (černobílý obraz); MP3 nebo WMA; WMV nebo MPEG4 na Internetu

22 Ztrátová komprese ► Tradiční schémata:  DCT JPEG  MPEG1, MPEG2 ► Nová schémata:  JBIG pro černobílý obraz (zatím nerozšířeno)  Wavelet schémata (JPEG 2000 a další formáty)  MPEG4

23 Mixed Raster Content

24 Multiresolutional image ALL in ONE FILE

25 Obrazové servery Dynamické generování požadovaných částí obrazu resp. kvalitových hladin

26 Manuscriptorium Skutečnost Manuscriptorium ► souborný katalog vč. některých zahraničních institucí ► ca. 1700 dokumentů, tj. cca 800 000 stran vč. několika zahraničních ► obrazový Express Server na mapy ► Komunikace Z39.50 (MARC21), OAI-PMH (DC, MARC21, OpenM, MODS)

27 Manuscriptorium Záměry ► TEI strukturované texty (pilot nyní) ► CERL-MSS https://diva.ub.uu.se/test/cerl/index.xml https://diva.ub.uu.se/test/cerl/index.xml ► TEL ► Audio data ► Mezinárodní rozšíření – nástroje pro jeho podporu, výzva dalším institucím, mezinárodní workshop před Inforem ► Účast v mezinárodních projektech

28 Kramerius Současnost ► 1,5 milionu stran (dalších 0,5 milionu připraveno) ► 2 velké aplikace (NK, Akademie věd) ► Zabudováno v komerčních nástrojích firmy Elsys Engineering ► Wavelet a Mixed Raster Content technologie

29 Kramerius Současnost ► Zlepšení komunikace OAI-PMH (DC qualified) ► Dokončení provázanosti na Souborný katalog ČR (vzájemná propojenost) ► Další dokumenty: t.č. implementace DTD pro sbírkové předměty, návrh pro zvukové dokumenty

30 Digitální knihovny a zdroje ► http://www.manuscriptorium.com http://www.manuscriptorium.com ► http://kramerius.nkp.cz http://kramerius.nkp.cz ► Zdroje:  http://digit.nkp.cz (naše DTD) http://digit.nkp.cz

31

32

33


Stáhnout ppt "Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky"

Podobné prezentace


Reklamy Google