Digitální knihovna AV ČR Martina Nezbedová Knihovna AV ČR, v. v. i. Seminář Zpřístupňování dokumentů v digitálních knihovnách ČR 8. 3. 2012
Obsah Digitalizační centrum Knihovny AV ČR Zpracování Systém pro zpřístupnění Kramerius Projekt „Registr digitalizace CZ“ Digitální knihovna AV ČR
Akademie věd ČR 54 vědeckých ústavů 7 000 zaměstnanců, (2 700 VaV) > 11 000 článků, věd. zpráv, atd. ročně vydává 103 časopisů (cca 3000 článků) 3
Knihovna Akademie věd ČR
Digitalizační centrum KNAV ČR zřízeno a provozováno KNAV od roku 2004 digitalizace, popis a zpřístupnění - často žádaných časopisů a monografií vydávaných AV ČR - vzácných materiálů z fondů knihoven AV ČR archivace digitalizovaných materiálů 5
HW vybavení - skenery DigiBook 10000 RGB – barevný max. formát A1 při rozlišení 400 dpi max. rozlišení 1000 dpi při formátu 2 x A5 rychlost 100 stran/hod. 2 x A4 / 400 dpi CCD line 3 x 10000 pixelů RGB max. tloušťka knihy 50 cm max. váha 40 kg 6
HW vybavení - skenery ProServ ScannTech – 600i barevný max. formát A0 při rozlišení 600 dpi rozlišení: 600 dpi CCD kamery: 3 x 7 300 pixelů přítlačné sklo po celé ploše 7
HW vybavení - skenery Zeutchel OS 7000 – 256 grey-scale max. formát A2 při rozlišení 400 dpi max. rozlišení 800 dpi při formátu A4 rychlost 180 stran/hod. A4 / 400 dpi CCD line 7500 pixelů max. tloušťka knihy 50 cm 8
HW vybavení - skenery ScanRobot SR301 max. rozlišení 300 dpi max. rozměry předlohy 32x30x12 cm Color / Grayscale / BW 9
SW vybavení Book Restorer, i2S IrfanView, Irfan Skiljan Sirius, Elsyst Engineering Kramerius, Qbizm (opensource) Registr digitalizace 10
Skenování 11
Zpracování – Book Restorer 12
Zpracování – Book Restorer 13
Upravený obrázek 14
15
Sirius DMS Sirius Národní knihovnou definovaná struktura popisu 1 XML soubor popisuje kompletně celé periodikum (monografii, ...) automatizované vytváření metadat možnost grafických úprav obrázků export do XML + obrazové soubory ve formátu TIFF, JPG, DJVU 16
Kramerius – vývojová skupina a technologie Open source – vývoj od roku 2003 Účel vývoje – zpřístupnění digitalizovaných dokumentů (periodik a monografií) Národní knihovna ČR, Knihovna AV ČR, Qbizm technologies, Moravská zemská knihovna v Brně Vývoj financován zejména z projektů financovaných MK ČR a MŠMT ČR Použité technologie: JAVA, Linux, Apache, Tomcat, Postgres SQL, Lucene
Kramerius – aktuální stav DTD pro periodika a monografie Import XML, TXT a obrazových souborů Grafický formát DjVu, JPG, PNG, PDF Fulltextové vyhledávání (Convera, Lucene) Replikace dat mezi jednotlivými instalacemi OAI-PMH – možnost sklízení metadat METS, PREMIS, MIX – standardy pro metadata
Kramerius – aktuální stav automatizované zviditelňování a nastavení přístupnosti titulů vyhledávání podle data export monografií do statické HTML podoby perzistentní identifikátor na všech úrovních dokumentu (UUID) vylepšené interní fulltextové vyhledávání zjednodušení uživatelského rozhraní pro vyhledávání Proof of Concept: využití systému Fedora
Kramerius – aktuální stav Propojení do portálů: - The European Library http://www.theeuropeanlibrary.org - Jednotná informační brána JIB http://www.jib.cz/ Propojení do katalogu NK ČR a do Souborného katalogu ČR – link z Krameria na základě ISSN a link z katalogů na digit. dokument Podpora perzistentních URL umožňuje stabilní prolinkování do knihovního OPACu
Kramerius – plán vývoje Zásadní změna – využití digitálního repozitáře FEDORA jako jádra (open source USA) Důvody – FEDORA je robustní stroj s podporou složených objektů, vhodný i z hlediska dlouhodobé archivace Rozšíření administrace – zejména správa uživatelských a přístupových práv Dávkové operace s digitálními dokumenty Nové typy dokumentů (mapy, audio, video,…)
Kramerius – uživatelé Národní knihovna ČR Moravská zemská knihovna v Brně Moravskoslezská vědecká knihovna v Ostravě Státní technická knihovna Vědecká knihovna v Olomouci Mendelova zemědělská a lesnická knihovna v Brně Jihočeská vědecká knihovna v Českých Budějovicích
Kramerius – uživatelé Krajská knihovna Františka Bartoše Zlín Severočeská vědecká knihovna v Ústí n. L. Městská knihovna v Praze Národní lékařská knihovna v Praze Knihovna Akademie věd ČR Muzejní knihovny: UPM Praha, ŽM Praha, DU Praha, MVČ Hradec Králové Celkem cca 6.600.000 stran (cca 500 titulů časopisů, 8500 titulů monografií a 840 map)
Kramerius – podpora Knihovna AV ČR – digitalizační centrum – Mail list Kramerius http://digit.knav.cz/ Instalace a údržba http://www.unidata.cz/
Projekt „Registr digitalizace CZ“ Národní knihovna a Knihovna AV ČR – projekt v rámci programu MK ČR centrální evidence – registr digitalizovaných dokumentů v ČR sledování digitalizačního workflow, stažení bibliografického popisu z knihovního systému přenesení informace o zahájení digitalizace do SK ČR (příp. do OPACu) a prolinkování na digitální dokument po dokončení
Československá parazitologie
Digitální knihovna AV ČR Projekt z programu AV ČR (2004-2009) Digitalizace dříve vydaných ročníků časopisů AV ČR (> 100 let), Digitalizováno téměř 2 000 000 stran Vývoj open source systému Kramerius pro zpřístupnění Zpřístupněno 850 000 stran, bez dělení na články Plnotextové vyhledávání
Digitální knihovna AV ČR Nové články – jiný přístup Open source E-prints (Uni of Southampton) Smlouvy s ústavy – definice podmínek zpřístupnění Finální stav - sloučení obou knihoven a kompletní dělení na články
Spolupráce s Googlem Digitalizované časopisy v systému Kramerius - indexace plných textů, rozdělení na články, link z Google na 1.stranu článku Nové články v E-prints - indexace plných textů, link na 1.str článku Publikační činnost – ASEP - využití pro extrakci dat z Krameria, případně provázání s plnými texty v Google Scholar
Centrální úložiště dat AV ČR Velký objem dat z digitalizace Nyní cca 4 TB Velký růst také vzhledem k velkoformátové barevné digitalizaci a k robotickému skenování 2009 - řešení pro dlouhodobou archivaci od fy Sun Microsystems – disk. pole > 30 TB Trvalé uložení výsledků VaV celé AV ČR
Děkuji za pozornost! Martina Nezbedová nezbedova@knav.cz www.knav.cz