Open source systémy pro digitální knihovnu Martin Lhoták, Knihovna AV ČR, v.v.i. AKP, 16. května 2007, Liberec
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 2 Obsah Úvod: open source - výhody x nevýhody Zahraniční volně dostupné systémy (DSpace, Fedora, EPrints, CDS Invenio, Greenstone,...) České řešení – systém Kramerius Závěr
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 3 Open source: výhody x nevýhody Výhody - nulové náklady na pořízení - možnost zapojení do vývoje - znalost zdrojového kódu - zajištění kontinuity Potencionální nevýhody - ne vždy dostupná podpora - ne vždy jisté dlouhodobé financování - v některých případech je potřeba disponovat vlastním silným technickým zázemím
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 4 Zahraniční projekty Většinou univerzitní prostředí, často finanční podpora nadací a komerčních firem DSpace Fedora EPrints CDS Invenio Greenstone ...
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 5 DSpace - MIT a HP Labs 1. verze v roce 2002 > 100 instalací v institucích po celém světě, aktivní komunita, pravidelná setkání velmi rychlá možnost nasazení, omezenější flexibilita OAI-PMH 2.0, URN, OpenURL, Dublin Core, export do METS v ČR VŠB-TU v Ostravě a MUNI v Brně
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 8
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 11 Fedora - Cornell University a University of Virginia vývoj od roku 1997 od roku 2002 podpora od A.W.Mellon Found. vysoký důraz na flexibilitu a rozšiřitelnost - Flexible Extensible Digital Object and Repository Architecture výkonné jádro pro digitální knihovnu nasazení vyžaduje programátorské práce širšího rozsahu (není např. webové rozhraní pro uživatele) základem objekt, který obsahuje systémová metadata a perzistentní identifikátor METS, DC, OAI-PMH, FOXML v ČR zkušební instalace na MUNI v Brně reálný provoz např. v knihovně University of Virginia
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 15 EPrints - University of Southampton institucionální repozitář pro open access publikování, sdílení a archivace vědecké literatury po instalaci okamžitě provozovatelný jeho primární určení může být omezující pro některé typy dokumentů propracovaný postup pro publikování uživateli/autory OAI-PMH, Dublin Core, METS, MODS propojení s externími službami - PubMed, CrossRef, Google Maps k v provozu 227 instalací, zázn. možnost placené podpory od Uni of Southampton
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 18 CDS Invenio - vývoj od roku 1995 v CERNu pod názvem CDSware vyvíjen pro potřeby velké instituce velká flexibilita a rozšiřitelnost – větší nároky na programování a administraci k dispozici okamžitě provozovatelná demoverze se základním nastavením propracovaný systém pro správu uživatelů, jejich práv a rolí poměrně složitá instalace, používá se řada externích aplikací OAI-PMH, MARC 21 možnost placené podpory při instalaci a provozu
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 20 Greenstone - New Zealand Digital Library Project na University of Waikato od roku 1995 podpora od UNESCO instalace vyžaduje větší úsilí než u DSpace, systém ovšem nabízí větší flexibilitu možnost vytváření vlastních aplikací, které obsluhují systém nemá detailně propracovanou správu uživatelů, ktrerá by umožnila např. přispívání do repozitáře OAI-PMH, Dublin Core, Z39.50 česká lokalizace na MUNI v roce 2004
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 22 Český open source - Kramerius Národní knihovna ČR, Knihovna AV ČR, Qbizm technologies vývoj od roku 2003 primárně určeno pro časopisy a monografie, možnost rozšíření o další typy dokumentů V ČR > 10 instalací, > 3 milióny stran (NK, KNAV, MZK, Krajské knihovny - Havlíčkův Brod, Hradec Králové, Ostrava, Zlín, některé muzejní knihovny) NK ČR periodika – 387 titulů / stran - monografie – 25 titulů / stran KNAV periodika – 56 titulů / stran
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 23 Kramerius - struktura Metadata - XML soubor DTD pro periodika DTD pro monografie vychází ze stejného základu jako v GDZ v Göettingenu Grafický soubor DjVu, JPEG, PNG, PDF,... OCR/text soubor TXT, může být i PDF, příp. jako 2. vrstva
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 24 Kramerius - interoperabilita OAI - PMH Kvalifikovaný Dublin Core Kompletní DTD METS Propojení do portálů - The European Library - JIB Propojení do SK ČR – link na základě ISSN
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 25 Kramerius - funčnost Stromové procházení – zobrazení strany Plnotextové vyhledávání – všichni uživatelé NKP – Convera Retrievalware (pattern search) KNAV - Convera Retrievalware (pattern s. + synonyma) Open source – Lucene 2006/2007 (pattern search) Generování vícestránkových PDF (2006)
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 28 Kramerius – vývoj 2007 Hrazena podpora vývoje Implementace perzistentních identifikátorů – (PURL, URN, DOI/CROSSREF) Rozšíření metadat o technická a administrativní Zaměření na popis jednotlivých částí dokumentů (článků, kapitol) Příjem born-digital dokumentů – (spolupráce s redakcemi časopisů AV ČR) Rozšíření možností správy uživatelů a nastavení práv k jednotlivým dokumentům Podpora OpenURL?
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 29 Kramerius – podpora Qbizm – uživatelský portál Instalace a údržba Knihovna AV ČR – digitalizační centrum – mail list Kramerius Národní knihovna ČR
16. května 2007 Open source systémy pro digitální knihovnu, Martin Lhoták, KNAV 30 Závěr Nutno vybrat řešení dle velikosti a potřeb instituce a s ohledem na personální (technicky orientované) zázemí DSpace, Greenstone a EPprints jsou s přiměřeným IT zázemím poměrně snadno využitelné pokud nejsou extrémní nároky na flexibilitu systému. EPrints vhodný zejména pro open access. Systémy Fedora a CDS Invenio lze doporučit v případě velkých nároků na flexibilitu a rozšiřitelnost systému, je nutno počítat se silným imlementačním týmem Systém Kramerius je řešení, které kromě všeobecně používaných standardů pro popis a komunikaci respektuje také národní standardy pro popis digitalizovaných periodik a monografií. Okamžitě použitelný, s případnou možností zajištění podpory při instalaci a provozu. Vhodný i pro instituce bez IT zázemí.
Děkuji za pozornost! Martin Lhoták, Knihovna AV ČR, v.v.i. Tato prezentace byla vytvořena v souvislosti řešením projektu 1ET programu GA AV ČR Informační společnost (2005–2009)