Perspektivy trvalých identifikátorů v ČR Jan Hutař Libor Coufal
Souvislosti Koncepce Národní digitální knihovny - čeká na schválení vládou Centrální digitální repozitář CDR v NK >> potřeba jednoznačné identifikace jak v rámci CDR tak i navenek – Kramerius – Manuscriptorium – WebArchiv
Souvislosti Žádná instituce v ČR zatím PID pro digitální dokumenty plnohodnotně nevyužívá – KNAV používá DOI pro své článkové databáze – WebArchiv přiděluje NBN – nemá resolver – ÚVT UK – ID v DigiToolu
Pracovní skupina PID na základě zájmu NK zavést standardní PID, široce podporovaný a použitelný i v jiných institucích velký zájem o spolupráci z ostatních institucí – KNAV – STK – Městská knihovna Praha – MZK – AiP Beroun (Manuscriptorium) – UVT UK – UVT MU – Cosmotron Bohemia s.r.o
Co jsou identifikátory? objekt řetězce čísel, písmen a symbolů reprezentující určitý objekt
Identifikátor vyžaduje Standard, který jej definuje (sám o sobě nedává smysl, např. RČ) Správce, který přiřazuje ID objektům Identifikátor ~ společenská dohoda jejíž hodnota závisí na organizaci
K čemu slouží identifikátory? Identifikace r.č /5527
K čemu slouží identifikátory? Odkazování
K čemu slouží identifikátory? Odkazování
Požadavky na ID Jednoznačnost - každý objekt má pouze jeden ID - jeden ID odkazuje pouze na jeden objekt - často požadavek na globální jednoznačnost - důležitý je kontext Trvalost (Persistence) > PID - ID = vztah mezi řetězcem a věcí > vydrží tak dlouho, jak dlouho vydrží tento vztah - perzistentnost není vlastností technologie, ale organizace - jak dlouhá je „perzistentnost“?
PID v knihovnách tradiční – LCCN 1898 – ISBN 1970 – ISSN 1975 > ISMN, ISAN (vše garantováno ISO) „nové“ – DOI; URI; URL; URN; ARK; PURL; NBN; Handles aj.
Problémy PID v knihovnách Neexistuje univerzální ID, pokrývající všechny typy intelektuálních děl Lze využít tradiční ID v novém kontextu? ANO - např. urn:ISBN:
Co od PID očekáváme/-te? Obecné požadavky a očekávání jednotlivých institucí: jednoznačná identifikace DO na všech úrovních (titul > část > kapitola > strana) nebo (titul > ročník > číslo > strana > článek) nejen v rámci jednoho systému, ale i v systémech ostatních fungující propojení elektronických dokumentů s katalogem (SKC x knihovny)
Pracovní skupina - plán specifikace konkrétních požadavků na trvalý identifikátor od jednotlivých institucí převedení specifikace do formy hodnotících kritérií hodnocení kandidátů na základě kritérií analýza existujících PID, výběr užšího okruhu vhodných kandidátů výběr nejvhodnějšího trvalého identifikátoru vytvoření konkrétní podoby (syntaxe)
Analýza - otázky 1. Používáte nebo plánujete používat trvalé identifikátory? 2. Jakým způsobem, v rámci jakého projektu a pro jaké typy dokumentů? 3. Co konkrétně čekáte od jejich zavedení ve vaší instituci? 4. Jaké jsou vaše představy?
Výsledná tabulka
Analýza odpovědí Celkem jsme obdrželi 10 odpovědí. Nejčastějšími požadavky byly: jednoznačná a persistentní identifikace 10x umožnění linkování dokumentů 9x propojení dokumentů s SKC6x propojení dokumentů s lokálním katalogem5x zajištění resoluční služby (resolveru) 3x
Analýza odpovědí Využívají ID v současnosti (spíše pasivně) 4x Chtějí ID na úrovni titulu, i části dokumentů (kapitoly nebo články) 4x
Analýza odpovědí Přidělovat PID těmto typům dokumentů: digitalizované dokumenty 8x kvalifikační práce 2x články 2x webové dokumenty 1x
Typy a druhy PID Od 90tých let bylo představeno několik číselných schémat používajících name space name space – pro uložení jména a lokace dokumentu – ID jsou registrovány centrálně ID je resolvováno (tj. správný dokument je nalezen), aniž by uživatel věděl jeho skutečnou lokaci jde o handles, DOI, ARK, PURL, URN, NBN a OpenURL aj.
Uniform Resource Name URN obecná syntaxe: “urn:“ “:“ globálnost – různé zdroje nemohou mít stejné URN dovoluje integraci jiných schemat (ISBN, ISSN, NBN aj.) urn:isbn:
urn:nbn:cz:nkp urn:nbn:cz URN:NBN: - pro národní knihovny globální registr URN:NBN namespace v LoC NK rozhoduje komu dá sub-namespace National Bibliographic number NBN
Handles / Handle ~ konkrétní ID unikátnost, persistence (fce administrátorské péče), umí odkazovat na různé výskyty konkrétního zdroje, Unicode 2/UTF-8 –vyjádří „cokoliv“, distribuovaný model: globální služba může delegovat dotazy lokální sl. a naopak /jan2004-rk132648
Handles 2 nezávislé na DNS – má vlastní root server (Global Handle System na CNRI) tj. GHS ví o všech Naming authorities (NA) a přeposílá jim dotazy SW volně na webu CNRI registrační poplatek je 50 USD /jan2004-rk132648
Digital Object Identifier DOI DOI Foundation - poskytuje technickou i administrativní vrstvu obojí postavené na možnostech Handle systému + sada dalších schémat a standardů služby jdou dále než jen technická úroveň DOI deleguje vše tzv. RA (Registračním Agenturám) využíváno komerčně – vydavatelé – články, části textů, ale i pro výrobky, vědecká měření apod. za registraci a použití se platí! tisíce dolarů doi: /8105
Archival Resource Keys ARK ARK schéma opatruje California Digital Library nejen koncept pro PID, ale i kompletní protokol a SW suite k okamžitému startu identifikace a resolvování ! otevřený rámec pro perz. identifikaci sestávající z: – administrativního modelu – jmenné konvence – síťového protokolu persistence je čistě otázkou služeb než syntaxe ark:/ /1234-xth-12/oiis
ARK 2 [“ “/“] “ark:/“ “/“ [ ] ARK dokáže vyjádřit hierarchii ark:/ /1234-xth-12/oiis
PURL vyvinuto OCLC – jako „naming and resolution service“ URL, které nemíří přímo na zdroj, ale na resolution službu, která odkazuje na zdroj, kt. mohl být mezitím přemístěn http, DNS – resolver purl.oclc.org PURL nelze smazat – lze změnit/smazat cíl kam odkazuje persistence tak dlouho, dokud se udržuje resolution server
Co používají jinde... NBN – Švédsko – projekt DIVA – urn:nbn:se dostali z NK + sami vlastní subnamespace – resolvováno v NK – Německo – DDB - projekt EPICUR (NK) – urn:nbn:de pro online disertace – – resolver v DDB dokáže resolvovat NBN (URN), URL a DOI ARK – USA – NLM, LoC, California Digital Library, Internet Archive, DCC aj. – Francie – BNdF, ve všech jejích sbírkách DK Gallica PURL – Německo - Goettingen – všechny digitální sbírky na webu Handles – USA - American Memory – LoC
Řešení? může být (a bude) pro instituce různé 1 instituce i více druhů ID všespásné řešení pro všechny není cesta nejmenšího odporu cesta nejlepší služby
další informace a materiály naleznete na děkujeme za pozornost