Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz> Stručný úvod do METS Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>
Místo úvodu REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: popisná metadata (abychom mohli objekt nalézt) technická metadata (abychom mohli vyjádřit vlastnosti objektu – obrázek, text, audio, ...) strukturální metadata (abychom mohli propojit objekty a metadata mezi sebou) administrativní metadata (abychom mohli objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)
Místo úvodu – příklad PŘÍKLAD – periodikum 19./20. století: vícenásobná struktura (roky, ročníky, svazky, čísla, strany, články) metadata titulu vs. metadata čísla vs. metadata článku metadata pro vyhledávání (např. získaná OCR) objekty pro zobrazování a služby pro dodávání (např. konverze do djvu/pdf formátu)
METS – základní informace METS = standard pro zachycení a výměnu metadat v prostředí digitálních a digitalizovaných objektů METS = schéma založené na XML z iniciativy Digital Library Federation (DLF, http://www.diglib.org/) správcem je Kongresová knihovna (viz www http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na mets@loc.gov od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)
METS – proč ? analogická situace s automatizací knihovního prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC) cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.) digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D) standardizace tyto úkoly řeší efektivněji
METS – příklad
METS – základní části METS obsahuje (ale primárně nedefinuje) následujích 5 sekcí metadat: hlavičku <metsHdr> popisná metadata <dmdSec> administrativní metadata <amdSec> skupiny objektů <fileSec> strukturální mapa <structMap> chování podle obsahu <behaviourSec>
METS – základní části METS Header Descriptive metadata Administrative optional Header optional optional optional Descriptive metadata Administrative metadata Behavioral metadata optional required File Inventory Structure map převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – <dmdSec> odkazem lze je zpracovat dvojím způsobem: odkazem <mdRef> druh odkazu: URN, URL, PURL, DOI ... druh metadat: MARC, EAD, DC, NISOIMG, TEI, ... popisek
METS – <dmdSec> přímo přímo v METS dokumentu <mdWrap>:
METS – popisná metadata přímé vkládání i volání odkazem lze kombinovat pro stejný objekt lze použít vícenásobný různý zápis (TEI, MARC i DC) důležité je zachování identifikátorů (jak uvidíme záhy) využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: hlavičku <metsHdr> popisná metadata <dmdSec> administrativní metadata <amdSec> skupiny objektů <fileSec> strukturální mapa <structMap> chování podle obsahu <behaviourSec>
METS – <amdSec> vyjadřuje různé aspekty objektů: technické údaje (formát, typ, velikost, ...) autorská práva informace o zdroji, ze kterého digitalizované verze vznikla (popisné, administrativní) informace o cestě, jakou objekt ze zdroje vznikl (konverze, kopie, verze, ...)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: hlavičku <metsHdr> popisná metadata <dmdSec> administrativní metadata <amdSec> skupiny objektů <fileSec> strukturální mapa <structMap> chování podle obsahu <behaviourSec>
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace
METS – <fileSec> <file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp> <FLocat> vyjadřuje umístění souboru <FContent> nabízí použití kontrolních součtů např. MD5 <GroupID> umožňuje vyjádřit manifestace převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – základní části METS obsahuje (ale primárně nedefinuje) následují sekce metadat: hlavičku <metsHdr> popisná metadata <dmdSec> administrativní metadata <amdSec> skupiny objektů <fileSec> strukturální mapa <structMap> chování podle obsahu <behaviourSec>
METS – <structMap> jádro METS dokumentu, které spojuje jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů vazba je realizována prostřednictvím: <fptr> ... ukazatel na fyzický soubor v rámci aktuálního METS dokumentu <mptr> ... ukazatel na jiný METS dokument, který obsahuje požadovanou informaci
<div> vyjadřuje jednotlivé části dokumentu <fptr> odkazuje na identifikátory použité v sekci <fileSec> <mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika) <area> <par> <seq>
METS – <structMap> převzato z prezentace Smith MacKenzie (MIT, 2003)
METS – praktické dopady poměrně náročná datová struktura, kterou nelze pohodlně vytvářet s běžným editorem vyžaduje koordinaci při implementaci: existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
METS – přehled implementací http://sunsite.berkeley.edu/mets/registry/ UC, Berkeley (EAD<>METS) National Library of Portugal (eContent editor) California Digital Library (TEI, EAD<>METS) Culturnet Cymru (TEI<>METS) FCLA (conversion ETD<>METS) Harvard, Göttingen, Library of Congress, Oxford, MIT, OCLC, RLG, Stanford, Graz aj. implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
METS – současný stav z amerického standardu se stává světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005) rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí) předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
METS pro uživatele
METS záznamu strany
METS záznamu svazku
... jhove, textMD
Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz> Otázky ? Martin Vojnar Vědecká knihovna v Olomouci <vojnar@vkol.cz>