Digitalizace knihovních dokumentů Jiří Polišenský.

Slides:



Advertisements
Podobné prezentace
III/2 XVII AB
Advertisements

Open source systémy pro digitální knihovnu Martin Lhoták, Knihovna AV ČR, v.v.i. AKP, 16. května 2007, Liberec.
Praha, Brno Nové komunikační možnosti systému Kramerius © Qbizm technologies, a.s. René Michálek
Digitální knihovna AV ČR
Souborný katalog ČR pod systémem ALEPH 500 Knihovny současnosti 2003 Národní knihovna ČR PhDr. Eva Svobodová – Mgr.Danuše Vyorálková Souborný katalog ČR.
CODEG 4 nástroj pro podporu OCR a tvorbu rozšířených metadat
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Knihovny současnosti 2011, České Budějovice 13. – 15. září 2011
Digitalizace knižního a časopiseckého fondu v muzejních knihovnách.
Web: Komunikujte efektivně Inzerce Originál Čistý formát: 203x275 Zrcadlo sazby: 170x237 K datům je nutné dodat jako závazný vzor barevnosti.
Moravská zemská knihovna a zpřístupňování starých map.
Digitální zemědělská knihovna on-line. ÚVOD ČZU SIC a KBFR – dlouhodobá koncepce rozvoje „snadného“ přístupu k informacím podpora FRVŠ –616/ Digitalizace,
Bohdana Stoklasová Národní knihovna ČR
Nové trendy a možnosti v oblasti digitalizace Jiří Polišenský.
Jiří Herman Elsyst Engineering Digitalizace a nástroje pro podporu digitalizace v knihovnách Jiří Herman Brněnská 10, 682.
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
13. února 2007Systém Kramerius, Martin Lhoták, KNAV1 Systém Kramerius aktuální stav a vývoj v roce 2007 Martin Lhoták, Knihovna AV ČR, v.v.i. SDRUK – IT,
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitální knihovna AV ČR a vývoj nové verze systému Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě
Krajská digitalizační jednotka Kraje Vysočina
Historické fondy VKOL - ukázky
Nové nástroje pro digitalizaci knihovních dokumentů
Petr Žabička Moravská zemská knihovna v Brně Návrh HW a SW vybavení krajského digitalizačního centra.
Mgr. Rostislav Krušinský VĚDECKÁ KNIHOVNA V OLOMOUCI Služba EOD - Elektronické knihy na objednávku.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Dagmar Vítková Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Představení projektu digitalizace: Ochranné reformátování periodika Sdělení zaměstnanců fy T. & A. Baťa Ing. Jan Kaňka Krajská knihovna Františka Bartoše.
Užití skeneru.
Projekt FRVŠ 1547/2007/E/b Budování digitální knihovny starých a vzácných dokumentů Řešitel: Ing. Věra Svobodová Ústav vědecko-pedagogických informací.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
Budoucnost současných internetových zdrojů Mgr. Ludmila Celbová
Digitalizace a archivace dokumentů státní sociální podpory
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Digitalizace knihovních fondů – praktické postupy
Digitalizace a ukládání Zpracoval: Jiří Hošek Datum:
Projekt Digitální knihovna AV ČR a vývoj systému Kramerius Martin Lhoták, Knihovna AV ČR AMK v digitálním světě 2005, Praha.
Barevná hloubka: Ukázky obrázků ještě jednou:
Datovýsklad Datový sklad V budoucích službách státního archivu.
TŘI ROKY DIGITÁLNÍHO UNIVERZITNÍHO REPOZITÁŘE UNIVERZITY KARLOVY Eliška Pavlásková, Andrea Fojtu Archivy, knihovny a muzea v digitálním světě.
Možnosti spolupráce při vytváření digitálních sbírek Ing. Martin Lhoták Knihovna AV ČR.
Kramerius 4 – nová generace systému pro digitální knihovnu Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě ,
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
Novinky v registru digitalizace a možnosti další spolupráce RD SK ČR Helena Dvořáková, NK ČR.
OBÁLKY KNIH.cz Jiří Nechvátal Jihočeská vědecká knihovna v Českých Budějovicích
Národní digitální knihovna
Projekt Národní digitální knihovny Archivy, knihovny, muzea v digitálním světě 2009, Praha, Mgr. Tomáš Foltýn Digitalizace novodobých dokumentů.
Digitální autoarchiv Národní lékařské knihovny Mgr. Lenka Maixnerová Národní lékařská knihovna.
EBooks on Demand – projekt evropské kooperace Věra Pospíšilíková – MZK, Kateřina Kamrádková – NTK AKM 2010.
Digitalizace úvod do problematiky Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 14. dubna 2011.
Počítačová grafika Maturitní otázka č. 19 Martin Ťažký.
Petr Žabička Moravská zemská knihovna v Brně Možnosti technického řešení.
Digitální zpřístupnění knihovních sbírek Adolf Knoll Národní knihovna České republiky
Digitální knihovna, systém pro tvorbu, archivaci a zpřístupňování digitálních dokumentů Jiří Polišenský.
Muzejní knihovny a Souborný katalog ČR 36. SEMINÁŘ KNIHOVNÍKŮ AMG ČR Slovácké muzeum v Uherském Hradišti PhDr. Eva Svobodová - Jana Militká,
Memoriae mundi series Bohemica digitalizace rukopisů a starých tisků Národní knihovna ČR AiP Beroun s.r.o. dceřinná společnost Albertina icome Praha s.r.o.
SK ČR a digitalizace (se zvláštním přihlédnutím k seriálovým dokumentům) Helena Dvořáková, NK ČR Seminář účastníků Souborného.
Odbor doplňování a zpracování fondů
Skenování obálek a obsahů v praxi NK ČR Seminář účastníků SK ČR,
Metadatová popisná schémata a rozvoj nových formátů Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti Tvorba tohoto kurzu byla financována.
Co nového na "obálkách ...“ Seminář SK ČR Jiří Nechvátal
Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4)
Rastrová grafika Základní termíny – Formáty rastrové grafiky.
Výstupní zařízení počítače - skener
Digitalizace v krajské knihovně (SVK HK)
Sbírka evangelických časopisů z 19. a přelomu 20
Muzejní knihovny a Souborný katalog ČR
Průběh importu dat z programu VISK 7 do systému Kramerius NKP
Informační den ÚVIS MZLU, Brno
Registr digitalizace Registr digitalizace Helena Dvořáková
Historické fondy VKOL - ukázky
Digitalizace knihovních dokumentů
Transkript prezentace:

Digitalizace knihovních dokumentů Jiří Polišenský

Obsah prezentace Základní prvky digitalizace Formáty a standardy Skenery Digitalizační work flow Systémy pro prezentaci a evidenci digitalizovaných dokumentů Projekt Národní digitální knihovna

Základní prvky digitalizace Digitální objekty + metadata Digitální objekty Obrazové soubory Zvuk Video atd.

Funkce digitálních objektů Archival master – archivní soubor Modified master – modifikovaný soubor User copy – uživatelská kopie

Obrazové soubory Základní bitmapa získaná skenováním Různé způsoby komprese podle použitých obrazových formátů Ztrátová a bezztrátová komprese Vlastnosti obrazových souborů –Obrazový formát –Rozlišovací schopnost v dpi –Černobílé zobrazení, šedá škála, barva –Velikost v bytech

Formáty obrazových souborů TIFF neztrátový JPEG ztrátový JP2 neztrátový PNG neztrátový DjVu ztrátový PDF

Metadata Popisná metadata Strukturální metadata Administrativní a technická metadata

Standardy Popisná metadata –V současné době NK používá národní standard založený na UNIMARCu a DTD pro periodika a monografie, XML –Další používané standardy: Dublin Core MARC XML MODS Administrativní a technická metadata –PREMIS, MIX

Příprava dokumentů pro digitalizaci Selekce dokumentů – stanovit selekční kriteria Kontrola stavu zpracování v elektronickém katalogu Čárový kód Fyzický stav Přílohy – volné, rozkládací apod. Jazyk a písmo (OCR)

Skenery Skenery pro různé typy dokumentů: Knižní skenery –Manuální –Robotické –Kombinované –Hybridní kamery Skenery pro jiné typy dokumentů –Průběžné –Bubnové –Mikrofilmové –Atd.

Vlastnosti skenovacích zařízení Maximální velikost předlohy Způsob uložení knihy (bookcradle) Maximální dpi v celé ploše Rychlost skenování Přenos souborů

Zpracování obrazových souborů Separace jednotlivých stránek dokumentu Narovnání –Manuální –Poloautomatické Ořez –Uvnitř stránky dokumentu –Vně stránky dokumentu Zlepšení kvality –Potlačení pozadí (průtisků) –Odstranění šumu

OCR Optical Character Recognition –Antikva –Fraktura německá –Fraktura česká Formáty –TXT, PDF, PDF HT, METS ALTO, ALTO XML, PAGE XML Příčiny nízké úspěšnosti rozpoznávání –Nízká kvalita předlohy –Chyby v nastavení skenovacích parametrů (např. nízké dpi) –Zastaralý typ písma –Starší podoba jazyka

Struktura dokumentu Jednostránkové soubory / dvoustránkové / vícestránkové Jendosvazkové /vícesvazkové dokumenty Seriály a nepravá periodika Pravá periodika Noviny

Struktura dokumentu Složité struktury, např. noviny –Titul –Ročník metadata –Výtisk –Strana –Reprezentace stranydigitální objekt

Struktura dokumentu Struktura pro zpřístupnění archivaci: PSP, SIP –Popisná metadata – xml –Složka JP2 – Modified master (neztrátová komprese) –Složka JP2 – User copy (ztrátová komprese) –Složka METS ALTO

Kontrola kvality Kontrola kvality obrazových souborů –DPI, stupně šedé barvy, věrnost barevného podání podle obrazce, atd. Kontrola úspěšnosti OCR –Na písmena (vícenásobné selhání u stejného písmene) –Na slova Validace XML Konsistence struktury dokumentu

Nástroje pro digitalizaci Skenery Programové nástroje pro zpracování obrazu OCR Nástroje pro vytvoření struktury dokumentu Nástroje pro tvorbu metadat (XML editor) Kompletní work flow (DocWorks, Sirius, Goobi, atd.)

Automatizace procesu digitalizace Tvorba popisných metadat konverzí záznamu z elektronického katalogu Generování administrativních a technických metadat v průběhu digitalizace nebo archivace Automatizované operace s daty umožňuje využívání identifikátorů (čárový kód, číslo ČNB, ISSN, ISBN, atd.)

Prezentace digitalizovaných dokumentů Aplikace pro digitální knihovnu - Kramerius 3, Kramerius 4(open source): Vyhledávání dokumentů podle metadat a fulltextu Jednotná informační brána Federované katalogy Europeana, TEL

Evidence digitalizovaných dokumentů Evidence digitalizovaných dokumentů, nebo vybraných pro digitalizaci, je důležitá pro: –Eliminaci duplicitních neekonomických činností –Zjišťování informací o digitalizovaných dokumentech –

Národní program Kramerius VISK 7 program zaměřený na mikrofilmování a digitalizaci dokumentů ohroženýchz degradací kyselého papíru Podporuje MK ČR – hradí 70% nákladů Otevřený všem veřejným knihovnám registrovaným MK ČR Výzva k podávání projektů listopad 2010, uzávěrka leden 2011 Informace na webu NK ČR

Projekt Národní digitální knihovna Integrovaný operační program, Smart administration Trvání 2010 – 2014 Udržitelnost 2015 – 2019 Celkem digitalizace 26 mil. stran V rámci projektu budou vybudována dvě pracoviště digitalizace NK ČR a MZK Využití robotických skenerů Nové standardy a formáty (konverze a migrace dat)

Děkuji za pozornost