Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Projekt hromadné digitalizace Ad fontes v Archivu hlavního města Prahy

Podobné prezentace


Prezentace na téma: "Projekt hromadné digitalizace Ad fontes v Archivu hlavního města Prahy"— Transkript prezentace:

1 Projekt hromadné digitalizace Ad fontes v Archivu hlavního města Prahy
Projekt komplexní digitální ochrany, záchrany a obecného zpřístupnění nejvzácnějších historických dokumentů hlavního města Prahy Název: Záchranná digitalizace a zpřístupnění nejvzácnějších historických archiválií hlavního města Prahy Podpořeno grantem z Norska Prostřednictvím Norského finančního mechanismu

2 Motivace: Cíle projektu:
Záchrana a trvalé uchování historicky nejvýznamnějších, památkově nejcennějších a fyzicky nejvíce ohrožených archiválií ze sbírek a fondů Archivu hlavního města Prahy, významných pro národní i evropské dějiny, cestou vytvoření všestranně využitelných digitálních kopií z originálů těchto archiválií Zpřístupnění archiválií v digitální podobě pro badatele a širokou veřejnost Zaměření / koncepce: Uchování evropského kulturního dědictví Zlepšení péče a ochrana movitého kulturního dědictví Ochrana vzácných písemných dokumentů Prahy ePraha Motivace: riziko zničení nebo ztráty archiválie archivace její digitální kopie na jiném bezpečném místě riziko poškození archiválie jejím častým půjčováním do badatelny zpřístupnění její digitální kopie v Informačním systému v badatelně nutnost prezenčního studia archiválie v badatelně archivu zpřístupnění na Internetu

3 Časový harmonogram projektu a financování projektu
Doba trvání projektu: – Celkové náklady projektu: EUR Celková výše grantu: EUR

4 Technické vybavení – zařízení pro digitalizaci
2 portálové skenery A1 600 DPI ProServ ScannTech 601i výhody: vysoká kvalita výstupů, vysoké rozlišení rovnoměrné osvětlení a geometrie (portál) univerzální použití – knižní předlohy s vazbou (kolébka), plošné materiály nastavení přítlaku spolehlivost, rychlost a konektivita – 1 Gbps LAN nevýhody: sklo (riziko poškrábání) skládání obrazu (3 CCD) kalibrace CCD 1 portálový skener A2 600 DPI ProServ ScannTech 602i 1 plošný skener s nástavcem pro skenování transparentních předloh A DPI Epson Expression 10000 XL

5 Technické vybavení - datové úložiště a zařízení pro archivaci
Datový a aplikační server Hewlett Packard DL380 G5 Zálohovací zařízení Hewlett Packard StorageWorks MSL4048 Ultrium 960 Diskové pole RAID 6 Hewlett Packard 15TB Zařízení pro archivaci Plasmon Archive Appliance AA80-W2NDN2E

6 Výběr archiválií a jeho kritéria
historická dokumentární hodnota archiválie míra reálného nebo možného fyzického poškození frekvence jejího využívání badatelskou veřejností Celkem bude během během 3 let pořízeno scanů.

7 Proces digitalizace a s tím související činnosti
Příprava archiválií (vyčištění, narovnání, konzervace) Naskenování (provoz: 4 osoby plný úvazek + supervizor, 1 směna) Úprava skenu (oříznutí, korekce) Popis metadat, identifikace dat Kontrola záznamů (obrázek+metadata) Transformace záznamů pro publikaci Založení pracovních kopií do Informačního systému Archivace záznamů na archivační média

8 Identifikace Sady: soubor archivního materiálu, který lze identifikovat a popisovat knihy (např. rukopisy, matriky), soubor jednotlivin (např. stavební plány) vlastní tzv. profilová karta v grafické databázi, zakládá se před skenováním 1 sada = 1 adresář s názvem sady název sady: 5 ciferné přírustkové číslo strojově generované IS grafické databáze Sada obsahuje n skenů, n technických metadat, 1 soubor s popisnými metadaty Skeny (objekty): Název souboru: 5 ciferné přírustkové číslo tif – nnnnn.tif Názvy souborů neobsahují odkazy na signatury či inventární čísla Obsah objektů v popisných metadatech Identifikace objektů (ID): jedinečný identifikátor 32 znaků generovaný algoritmicky není nutné centrální přidělení vazba metadata – data – záznamy v databázi možnost off-line zpracování dat

9 Výstupy Záchranné kopie nejvzácnějších archiválií ve formátu TIFF RAW group 6 bez komprese 600 DPI (24 bitů/pixel, RGB) Celkem bude během 3 let pořízeno scanů. Skeny v náhlížecí kvalitě JPEG 300 DPI Technická metadata ve formátu XML odpovídající specifikaci MIX v.2.0 Specifikace se odkazuje na standard popisu technických metadat digitálních statických obrazů Z39.87. Popisná metadata pro identifikaci ve formátu XML podle vlastního schématu IDA AMP v.2.0 (Identifikace archiválie AMP) Všechny soubory ve formátu XML se ukládají ve znakové sadě (kódování) UTF-8.

10 Metadata Technická metadata
NISO MIX v.2.0 – dle standardu popisu dig. statických obrazů Z39.87 XML, UTF-8 Obsahují kontrolní řetězec – zajišťuje autentičnost dat Popisná metadata pro identifikaci IDA AMP v.2.0 – vlastní schéma Popis sady: označení sady (strojově generované přírustkové 5 ciferné číslo), datace, jméno operátora digitalizace, zařízení pro digitalizaci Popis archiválie: povinné: číslo NAD, název fondu/sbírky, forma (1=kniha, 2=jednotlivina, 3=hybridní) část fondu, manipulace, úložná jednotka, inv. Č., signatura, č. jednací, obsah, typ, autor, poznámka Popis záznamů (skenů): povinné: pořadí, název souboru číslování, typ číslování, část celku, inv. Č., signatura, poř. č./č. jedn., obsah, autor, poznámka

11 Zpracování metadat Technická metadata
Hromadná kontrola DPI a syntaxe názvů souborů Hromadné generování hashovacích řetězců a ID objektů (záznamy/skeny) Dávkové generování technických metadat na základě výběru XML šablony, profilu skeneru, hash řetězce a ID, údajů z hlavičky TIFF Popisná metadata pro identifikaci Dávkové generování ida.xml pro zvolenou sadu na základě údajů v dokumentu info.ods Automatická volba transformace dle parametru forma archiválie Automatické doplnění ID, kontrola vazby na objekty Dávková validace všech metadat Všechny operace jsou logovány. Zpřístupnění – výhled Zprovoznění archivního datového repozitáře – data i metadata Vazba popisná metadata pro identifikaci (grafická databáze) – popisná metadata (textová databáze ProArchiv) - EAD Standardizace, zpřístupnění, vyhledávání, sklízení – OAI-PMH

12 Archivace Archivace dat: dlouhodobé uložení dat se zajištěním:
Udržitelnosti Formátu – TIFF RAW group 6 (ISO standard, bez komprese) Datového archivačního média – životnost UDO média let Neměnnosti (autentičnosti) dokumentu – média typu WORM, hashovací řetězec Důvěryhodnosti – historická sbírka, garant instituce Technologie: Archivace na optická média UDO II typu WORM ve 2 kopiích (primární a sekundární řada). Kapacita UDO II média je 60 GB a výrobcem deklarovaná životnost 50-70 let. Archivace souborů ve formátu TIFF RAW spolu s technickými a popisnými metadaty pro identifikaci Použití kontrolního řetězce (64 znaků) generovaného na základě hashovací funkce sha-256 používající pro výpočet hashovacího řetězce 256 bitový klíč – součást technických metadat Oddělení dat (obrázků) a metadat (popisu) – obsah některých elementů se mění

13 Partnerské projekty: Společný projekt Národního archivu a Archivu hlavního města Prahy: Možnosti a formy zpřístupnění archivních fondů nebo jejich součástí veřejnosti v elektronické podobě. Koordinační komise pro projekty schválené v první výzvě FM EHM/Norsko. členové komise: Archiv hlavního města Prahy Městská knihovna v Praze Národní knihovna ČR koordinátor: odbor umění a knihoven Ministerstva kultury ČR. účel: výměna zkušeností společná propagace

14 Email: tomas.hanousek@cityofprague.cz Tomáš Dvořák
Tomáš Hanousek Tomáš Dvořák Archiv hlavního města Prahy


Stáhnout ppt "Projekt hromadné digitalizace Ad fontes v Archivu hlavního města Prahy"

Podobné prezentace


Reklamy Google