Projekt Národní digitální knihovny Archivy, knihovny, muzea v digitálním světě 2009, Praha, Mgr. Tomáš Foltýn Digitalizace novodobých dokumentů
Současný stav x ideální budoucnost
Detailní popis současného pracoviště - průběh digitalizace ● 85% dodavatelsky x 15% ve vlastní režii ● 3 společnosti - digitalizace – Microna, Ampaco - zpracování dat – Elsyst Engineering ● vytváří se mikrofilm i digitální kopie - financování ● zdrojem jsou různé projekty – např. tzv. Norské fondy, VISK 7, Tel+, další menší projekty - co digitalizujeme ● periodika ● monografie - převážně v českém a německém jazyce - psány latinkou a švabachem - k dispozici pomocí protokolu OAI-PMH
- formáty ● uložení:.jpeg,.txt,.xml, amd ● zpřístupnění:.DjVu (PDF) ● metadata: METS - bibliografická metadata Dublin Core, Marc 21 - využívaný software ● zpracování dat– Sirius ● OCR – Abby FineReader ● zpřístupnění – Kramerius ● monitorování workflow – RD.cz Využívané formáty
- software ● tvorba metadat a zpracování obrazových souborů – Sirius ● validace xml – Corel XMetal ● drobné úpravy obrazových dat – Photoshop ● konverzní nástroj mezi JPEG a DjVu – Document Express s DjVu Enterprise Edition ● OCR – Abby FineReader ● prezentace – Kramerius ● monitorování workflow – RD.cz Softwarové a hardwarové vybavení pracoviště Omezená funkčnost Nutné úpravy Nízká kapacita
Softwarové a hardwarové vybavení pracoviště
- hardware ● mikrofilmové kamery: - Elke - Zeutschel Omnia OK 102 ● hybridní kamera - Proserv DualProfi + ● mikrofilmový skener: - Wicks and Wilson 4100 Series ● „běžné vybavení“ - tiskárny - počítačové stanice - kopírky Softwarové a hardwarové vybavení pracoviště Zastaralost Nedostatečná kapacita Náhradní díly
Personální zabezpečení pracoviště - Oddělení digitalizace ● 13 zaměstnanců - 1 vedoucí - 3 projektoví manažeři - 2 příprava dokumentů - 1 administrátor systému Kramerius - 3 zpracování metadat a obsluha mikrofilmového skeneru - 1 administrativní pracovník - 2 brigádníci - Oddělení mikrografie ● 5 zaměstnanců - 1 vedoucí - 4 fotografky
Uvažované digitalizační pracoviště - hlavní důvody: ● urychlení procesu digitalizace - při současném postupu by digitalizace knihovních dokumentů trvala asi 300 let ● zpřístupnění dat ● modernizace pracoviště ● vylepšení IT struktury ● zlepšení personálního zabezpečení ● záchrana národního kulturního dědictví - dokumenty ohroženy degradací papíru
Uvažované digitalizační pracoviště Inspirace - návštěvy evropských digitalizačních center ● Norská národní knihovna ● Finská národní knihovna ● Bavorská státní knihovna Mnichov ● a další Ideový koncept - důkladná analýza ● nové digitalizační pracoviště ovlivní chod mnoha dalších oddělení NK ČR ● vytvoření pracoviště spojeno i s výstavbou nového depozitáře - pro pracoviště samostatné patro - idea „výrobní linky“ – propojení jednotlivých operací - přímá návaznost na skladové prostory
Uvažované digitalizační pracoviště 670 m m 2 skenery - 360m 2 administrativní provoz
Uvažované digitalizační pracoviště
Uvažované digitalizační pracoviště – příprava dokumentů Pracoviště přípravy dokumentů - odpovědnost: ● výběr dokumentů ● příprava denního počtu dokumentů pro digitalizaci – „skenovací dávka“ ● směřování dokumentů na skenování či další zpracování ● kontrola fyzické konzistence ● kontrola korektnosti dat (NKC, SKC) ● rozhodnutí o způsobu digitalizace - typ dokumentu - šedá škála/barva - typ skeneru ● kontrola a vyřazování duplicit - personální zabezpečení ● vedoucí ● 6 pracovníků
Uvažované digitalizační pracoviště – příprava dokumentů
Uvažované digitalizační pracoviště - skenování Pracoviště skenování - odpovědnost: ● vlastní skenování - max. efektivita práce ● případně ořez a narovnání dat - personální zabezpečení ● vedoucí ● 8 pracovníků
Uvažované digitalizační pracoviště - skenování Základní požadavky pro skenery - maximální automatizace - šetrný mechanismus obracení stránek - minimální rozlišení 300 DPI, možnost zvolit škálu - využití čteček čárových kódů - pohyblivé „kolébky“ - manuální skenery ● poškozená vazby, degradovaný papír, zvláštní formáty - více typů robotických skenerů ● pro velké formáty ● pro menší formáty (monografie) - „kolébkový“ systém, specifikace způsobů otáčení, způsob snímání
Uvažované digitalizační pracoviště - skenování - 4Digitalbooks- Quidenus- Kirtas- Treventus
Uvažované digitalizační pracoviště – zpracování dat Pracoviště zpracování dat - odpovědnost: ● úprava obrazových souborů - ořez a narovnání, vylepšení kvality ● strukturování dokumentu ● tvorba OCR ● tvorba metadat ● příprava SIPu pro LTP systém - personální zabezpečení ● vedoucí ● 18 pracovníků ZÁSADNÍ a ČASOVĚ NEJNÁROČNĚJŠÍ AKTIVITA Workflow management system
Uvažované digitalizační pracoviště – zpracování dat Standardy a formáty ● metadata - deskriptivní metadata – MODS/MARCxml - administrativní metadata – PREMIS/MIX - strukturální metadata - xml ● formáty - „modify master“ pro archivaci– JPEG „user copy“ – komprimovaný JPEG textový formát – ALTO xml - „kontejnerový balíček“ – METS, ZIP/TAR
Uvažované digitalizační pracoviště
Uvažované digitalizační pracoviště - FAQ 1)Bude pokračovat systém Kramerius? ● ANO ● vývoj Kramerius 4 – FEDORA ● zachovaná funkcionalita - menší knihovny si budou moci ponechat verzi 3 2) Program VISK 7 Kramerius – budou nadále probíhat replikace dat? ● ANO ● k dispozici i data vzniklá IOPem???
Uvažované digitalizační pracovištěUvažované digitalizační pracoviště - FAQ 3) Koordinace digitalizace v rámci IOP – jak se vyvarovat duplicitám? ● sledovat RD.cz ● možno NK ČR zaslat seznam periodik (regionálního charakteru), které nebude digitalizovat NK ČR či MZK Brno ● do budoucna možnost využití ČNB či URN:NBN 4) Doporučení, metodiky, standardy ● Ano ● standardy budou vystaveny, doporučení a metodické rady na vyžádání ● ve spolupráci s MZK Brno
Děkuji za pozornost!!! Otázky???