Standardy digitálních knihoven – nové zkratky Martin Vojnar Vědecká knihovna v Olomouci
Standardy digitálních knihoven – nové zkratky 2... zkratky
Standardy digitálních knihoven – nové zkratky 3 Digitální knihovny výzkum a vývoj (a také rozmach a rozvoj) týká se všech paměťových institucí a druhů sbírek (různé role – budovatel, přispěvatel, správce, aj. – často spolupráce institucí) daleko překračuje rámec tradičních dokumentů, předmětů a listin objekty vznikají digitálně i digitalizovaně objekty jednoduché a souborné
Standardy digitálních knihoven – nové zkratky 4 Souborné objekty odpovídají okolní realitě a vnímání v digitálních knihovnách se často podle potřeby rozkládají na jednoduché objekty, např.: –digitalizovaná strana (obrázek) knihy –digitální článek (html stránka) časopisu –reklamní klip (video) jako část pořadu musí být ale uchovávány a prezentovány pohromadě
Standardy digitálních knihoven – nové zkratky 5 Co potřebujeme nástroj pro uchopení a popis objektů nástroj pro přenos objektů nástroj pro „užívání“ objektů jinak řečeno: metadata, protokoly a formáty (a identifikátory ?)
Standardy digitálních knihoven – nové zkratky 6 Standardy návrh, implementace a realizace digitální knihovny vyžaduje zdroje (čas, peníze, lidé), kterých není nikdy dost digitální knihovny více než jiné služby mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně... standardní metadata, protokoly, formáty (a identifikátory?)
Standardy digitálních knihoven – nové zkratky 7 Metadata –popisná metadata (abychom mohli objekt nalézt) –technická metadata (abychom mohli vyjádřit vlastnosti objektu – obrázek, text, audio,...) –strukturální metadata (abychom mohli propojit objekty a metadata mezi sebou) –administrativní metadata (abychom mohli objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv,... migrace)
Standardy digitálních knihoven – nové zkratky 8 Příklad metadat PŘÍKLAD – periodikum 19./20. století: –vícenásobná struktura (roky, ročníky, svazky, čísla, strany, články) metadata titulu vs. metadata čísla vs. metadata článku metadata pro vyhledávání (např. získaná OCR) metadata o umístění objektů pro zobrazování a o službách pro dodávání (např. konverze do djvu/pdf formátu)
Standardy digitálních knihoven – nové zkratky 9
10 Popisná metadata –MARC XML (MAchine-Readable Cataloging) –DC (Dublin Core) –TEI P4 / P5 (Text Encoding Initiative) –EAD (Encoded Archival Description)
Standardy digitálních knihoven – nové zkratky 11 Další metadata –NISO Z39.87 (Technical Metadata for Digital Still Images) –JHOVE (JSTOR/Harvard Object Validation Environment) –PREMIS (PREservation Metadata Implementation Strategies) –proces standardizace není zdaleka hotov!
Standardy digitálních knihoven – nové zkratky 12 Tolik metadat?
Standardy digitálních knihoven – nové zkratky 13 Do kontejneru s nimi!
Standardy digitálních knihoven – nové zkratky 14 METS – příklad kontejneru METS = standard pro zachycení a výměnu metadat v prostředí digitálních a digitalizovaných objektů METS = schéma založené na XML z iniciativy Digital Library Federation (DLF, správcem je Kongresová knihovna (viz www elektronická konference na od r (předchůdcem projekt Making of America II: , vlastní SGML DTD)
Standardy digitálních knihoven – nové zkratky 15 METS – příklad
Standardy digitálních knihoven – nové zkratky 16 METS – základní části METS obsahuje (ale nedefinuje) následujích 6 sekcí metadat: –hlavičku –popisná metadata –administrativní metadata –skupiny objektů –strukturální mapa –chování podle obsahu
Standardy digitálních knihoven – nové zkratky 17 METS – základní části METSHeader Administrative metadata File Inventory Structure map Descriptive metadata Behavioral metadata optional required optional převzato z prezentace Smith MacKenzie (MIT, 2003)
Standardy digitálních knihoven – nové zkratky 18 lze je zpracovat dvojím způsobem: –odkazem –druh odkazu: URN, URL, PURL, DOI... –druh metadat: MARC, EAD, DC, TEI,... –popisek METS – odkazem
Standardy digitálních knihoven – nové zkratky 19 METS – přímo –přímo v METS dokumentu :
Standardy digitálních knihoven – nové zkratky 20 METS – vyjadřuje každý fyzický soubor, lze seskupit do vyjadřuje umístění souboru nabízí použití kontrolních součtů např. MD5 umožňuje vyjádřit manifestace
Standardy digitálních knihoven – nové zkratky 21 METS – vyjadřuje každý fyzický soubor, lze seskupit do vyjadřuje umístění souboru nabízí použití kontrolních součtů např. MD5 umožňuje vyjádřit manifestace převzato z prezentace Smith MacKenzie (MIT, 2003)
Standardy digitálních knihoven – nové zkratky 22 METS – jádro METS dokumentu, které spojuje jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů vazba je realizována prostřednictvím: –... ukazatel na fyzický soubor v rámci aktuálního METS dokumentu –... ukazatel na jiný METS dokument, který obsahuje požadovanou informaci
Standardy digitálních knihoven – nové zkratky 23 METS – praktické dopady poměrně náročná datová struktura, kterou nelze pohodlně vytvářet s běžným editorem vyžaduje koordinaci při implementaci: –existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat –existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
Standardy digitálních knihoven – nové zkratky 24 METS – přehled implementací –UC, Berkeley (EAD<>METS) –National Library of Portugal (eContent editor) –California Digital Library (TEI, EAD<>METS) –Culturnet Cymru (TEI<>METS) –FCLA (conversion ETD<>METS) –Harvard, Göttingen, Library of Congress, Oxford, MIT, OCLC, RLG, Stanford, Graz aj. implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
Standardy digitálních knihoven – nové zkratky 25 METS – současný stav z amerického standardu se stává světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005) rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí) předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
Standardy digitálních knihoven – nové zkratky 26 METS pro uživatele
Standardy digitálních knihoven – nové zkratky 27 METS záznamu strany
Standardy digitálních knihoven – nové zkratky 28 METS záznamu svazku
Standardy digitálních knihoven – nové zkratky jhove, textMD
Standardy digitálních knihoven – nové zkratky 30 Standardy návrh, implementace a realizace digitální knihovny vyžaduje zdroje (čas, peníze, lidé), kterých není nikdy dost digitální knihovny více než jiné služby mohou snadno spolupracovat a samonavigovat své uživatele (stroje, lidé), pokud budou fungovat srozumitelně... standardní metadata, protokoly, formáty (a identifikátory?)
Standardy digitálních knihoven – nové zkratky 31 Protokoly OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) OpenURL Z39.88 (OpenURL Framework for Context-Sensitive Services) jejich implementace by měla být samozřejmým požadavkem dnešních digitálních knihoven!
Standardy digitálních knihoven – nové zkratky 32 Formáty volba podle potřeby (pluginy) čitelnost a velikost (různé techniky, pluginy) možnost dodání podle přání (pluginy) s vědomím, že konverze/migrace na horizontu MIME (Multipurpose Internet Mail Extensions) projekt JHOVE (validace a popis)
Standardy digitálních knihoven – nové zkratky 33 Identifikátory na úrovni popisných metadat –sbírky národního významu; pro digitalizované/digitální varianty nelze využít identifikátor tištěné podoby (viz např. ISSN vs. e-ISSN) –lokální sbírky, ideálně jednoznačné identifikátory (instituce – sbírka – záznam) obvykle lze přidělování kontrolovat (např. sigla pouze pro knihovny)
Standardy digitálních knihoven – nové zkratky 34 Identifikátory na úrovni ostatních metadat a objektů –jednoznačnost identifikátoru v rámci repozitáře –jednoznačnost identifikátoru v národním rámci –délka identifikátoru (CRC32 vs. MD5) –identifikátor coby validace objektu (použití kontrolních součtů, nikoliv číslic!) –identifikátor objektu musí být součástí metadat –zajištění linkování (i při změně identifikátoru) –identifikátor by měl být uložen mimo objekt obvykle nelze přidělování kontrolovat
Standardy digitálních knihoven – nové zkratky 35 Shrnutí standardní metadata, protokoly, formáty (a identifikátory?): –existují metadata + kontejner –existují protokoly –existují formáty –neexistují identifikátory (instituce, sbírky,...) vyžadujme je v aktuálním/plánovaném software je třeba národní koordinace zvláště mezi paměťovými institucemi je třeba koordinace s vazbou na světové standardy jedná se o dlouhodobý úkol a vybudování rámce, který musí mít patřičné zdroje
Standardy digitálních knihoven – nové zkratky 36 Využití identifikace digitální knihovna musí zajistit mechanismus linkování (tj. na základě poskytnutých metadat být schopna přímého linkování k objektu) identifikátory mohou být používány opakovaně různými způsoby: –plošný sběr metadat –cílené ověření metadat (např. rightsMD) –získání kopie objektu z repozitáře
Standardy digitálních knihoven – nové zkratky 37 Využití identifikace lze doporučit kompatibilitu s OpenURL, které umožňuje přenášet jak specifické identifikátory tak metadata, ze kterých lze identifikátor odvodit a kontextové informace potřebné např. pro vyhodnocení IPRM/DRM
Standardy digitálních knihoven – nové zkratky 38 Aktuální stav příkladem může být úzká spolupráce německy mluvících zemí (D-A-CH): – –každá národní knihovna přiděluje jedinečná čísla ve svém jmenném prostoru v rámci NBN –existuje vazba na národní bibiliografii –pro prohlížeče jsou k dispozici pluginy –použití kódů institucí a kontrolních číslic převzít mechanismus přidělování identifikátorů z projektu WebArchiv (?)
Děkuji za pozornost. Martin Vojnar Vědecká knihovna v Olomouci