Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilMilena Benešová
1
Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky adolf.knoll@nkp.cz
3
Digitalizační aktivity ► 1992/1993 – První pilotní projekt programu UNESCO Paměť světa ► 1995 – další pilotní projekty ► 1996 – počátek rutinní digitalizace ► 2000 – národní programy ► 2003/2004 – spuštění digitálních knihoven ► -> 2010 – vytvoření virtuálního badatelského prostředí pro historické dokumenty a sbírky
4
Standardizace ► Složený digitální dokument: Datová část Metadatová část ► Jak strukturovat? ► Komplexní dokumentový formát
5
Značkovací jazyky ► Platforma SGML je pro takový formát ideální ► Naše programy: Vlastní SGML implementace (DOBM) – 1996 – v r. 1999 jako doporučení UNESCO XML platforma od r. 2003/2004 ► Namapování standardů pro popis obsahu, doporučených postupů a dalších řešení
6
Metadata
7
Metadata – co popsat ► Identifikace ► Obsah ► Struktura ► Technické parametry ► Komunikace ► Jak: naše konkrétní řešení jsou promítnuta do těchto strukturálních součástí ZPŘÍSTUPNĚNÍ PROSTŘEDNICTVÍM DEFINOVANÉ KOMPATIBILITY
8
Identifikační metadata ► Katalogizační a další identifikační pravidla ► MARC, Dublin Core, MASTER, …, v knihovnách ► EAD v archivech ► AMICO, CIDOC, REACH Element Set, …, v muzeích ► … in … ► ROLE: identifikovat virtuální reprezentaci originálu (ve vztahu k originálu)
9
Metadata pro popis obsahu ► Žádná pevná pravidla nejsou k dispozici – nebo jen částečně – většinou ověřené praktické postupy ► Musíme je vzít a formálně zabudovat do struktury dokumentu ► Většinou základní povinná úroveň je velmi jednoduchá, ale musí vyhovět nejčastějším uživatelským potřebám
10
Strukturální metadata ► Musí být namapována struktura celého dokumentu (se všemi nejčastějšími zvláštnostmi): Fyzické části Logické části, které chceme specifickým způsobem pojednat (články, kapitoly, vztažené objekty, …) ► Zde je často nesnadné stanovit povinné elementy
12
Technická metadata Existence vysoce profesionálních standardů vs. Naše pragmatické a skutečné potřeby ► Rigorózní standardy je třeba aplikovat tam, kde mohou dobře sloužit cílům projektu, ale tam, kde by byly jen cílem pro sebe sama, bychom měli mít odvahu se rozhodnout jinak ► ROLE: vyřešit současné a budoucí zobrazení, přehrání nebo tisk správně a na nezbytné kvalitativní úrovni
13
Komunikační metadata ► Zajišťují integraci do širšího virtuálního prostředí ► Komunikace mezi aplikacemi digitální knihovny a vyhledávacími portály ► Standardizované protokoly: Z39.50, OAI- PMH, … ► Je třeba si odsouhlasit profily, tj. minimální identifikační záznamy
14
Digital Library Applications Manuscriptorium Kramerius KATALOGY (Souborný katalog ČR bude mít funkci souborného katalogu digitálního obsahu) PORTÁLY http://theeuropeanlibrary.org http://theeuropeanlibrary.org TEL (http://theeuropeanlibrary.org)http://theeuropeanlibrary.org http://www.jib.cz http://www.jib.cz JIB (http://www.jib.cz)http://www.jib.cz https://diva.ub.uu.se/test/cerl/index.xml https://diva.ub.uu.se/test/cerl/index.xml CERL-MSS (https://diva.ub.uu.se/test/cerl/index.xml)https://diva.ub.uu.se/test/cerl/index.xml
15
Metadata: jak popsat ► Cílem je strukturovaný formát definovaný formálně jako DTD nebo W3C Schéma ► Mnoho z výše uvedených skutečností závisí na našem výběru/rozhodnutí ► Naše formáty pro digitalizované dokumenty: rukopisy, periodika, monografie, zvukové dokumenty, sbírkové předměty, komunikační profily, historický fultext
16
Budoucí vývoj ► XML platforma se zdá zatím dostatečně robustní ► Nové přístupy a dílčí platformy se budou objevovat – například METS (strukturovaná kontejnerizace) ► Jestliže jsou naše analýzy správné, budou starší a novější základně mezi sebou kompatibilní ► Změny stojí peníze: nástroje na výrobu digitálních dokumentů, na jejich zpřístupnění, na…
17
Data
18
Data: co ukázat ► Datové soubory jsou cílem uživatelského zájmu (obrazy, fulltext, audio nebo video soubory) ► Originál je jimi přímo reprezentován ► Kvalita dat: Archivní soubory Uživatelské soubory ► Obě úrovně jsou primárně definovány cíli našich projektů
19
Archivní soubory ► Funkce ochrany a záchrany originálů ► Většinou ISO nebo velmi rozšířené standardy: TIFF, JPEG WAV MPEG Nekomprimované Komprimované ► bezeztrátově ► ztrátově
20
Uživatelské soubory ► Redukce objemu dat: Snížení rozlišení nebo toku dat (bit rate) Komprese Pouze obrazy (+ je třeba zvážit i snížení počtu barev): ► Mixed Raster Content ► Multiresolutional image ► Obrazové servery
21
Snížení rozlišení/toku dat ► Použití pouze známých formátů ► Definovat cíle a smysl dodávání dat ► Dodávat jen takové rozlišení, které je mírně vyšší než požadovaný limit (náhled, základní kvality, normální kvalita, …) ► Většinou oblast JPEG nebo TIFF/GIF (černobílý obraz); MP3 nebo WMA; WMV nebo MPEG4 na Internetu
22
Ztrátová komprese ► Tradiční schémata: DCT JPEG MPEG1, MPEG2 ► Nová schémata: JBIG pro černobílý obraz (zatím nerozšířeno) Wavelet schémata (JPEG 2000 a další formáty) MPEG4
23
Mixed Raster Content
24
Multiresolutional image ALL in ONE FILE
25
Obrazové servery Dynamické generování požadovaných částí obrazu resp. kvalitových hladin
26
Manuscriptorium Skutečnost Manuscriptorium ► souborný katalog vč. některých zahraničních institucí ► ca. 1700 dokumentů, tj. cca 800 000 stran vč. několika zahraničních ► obrazový Express Server na mapy ► Komunikace Z39.50 (MARC21), OAI-PMH (DC, MARC21, OpenM, MODS)
27
Manuscriptorium Záměry ► TEI strukturované texty (pilot nyní) ► CERL-MSS https://diva.ub.uu.se/test/cerl/index.xml https://diva.ub.uu.se/test/cerl/index.xml ► TEL ► Audio data ► Mezinárodní rozšíření – nástroje pro jeho podporu, výzva dalším institucím, mezinárodní workshop před Inforem ► Účast v mezinárodních projektech
28
Kramerius Současnost ► 1,5 milionu stran (dalších 0,5 milionu připraveno) ► 2 velké aplikace (NK, Akademie věd) ► Zabudováno v komerčních nástrojích firmy Elsys Engineering ► Wavelet a Mixed Raster Content technologie
29
Kramerius Současnost ► Zlepšení komunikace OAI-PMH (DC qualified) ► Dokončení provázanosti na Souborný katalog ČR (vzájemná propojenost) ► Další dokumenty: t.č. implementace DTD pro sbírkové předměty, návrh pro zvukové dokumenty
30
Digitální knihovny a zdroje ► http://www.manuscriptorium.com http://www.manuscriptorium.com ► http://kramerius.nkp.cz http://kramerius.nkp.cz ► Zdroje: http://digit.nkp.cz (naše DTD) http://digit.nkp.cz
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.