Projekt masové digitalizace NK ČR kalukalce objemů Jiří Polišenský
Definice cílů Digitalizace historických bohemikálních dokumentů v úplnosti Digitalizace historických bohemikálních dokumentů v úplnosti Digitalizace bohemikálních dokumentůdokumentů 19. stol. v úplnosti Digitalizace bohemikálních dokumentůdokumentů 19. stol. v úplnosti Digitalizace soudobých přírůstků bohemikální literatury Digitalizace soudobých přírůstků bohemikální literatury Digitalizace bohemikálních dokumentů 20. stol. výběrově Digitalizace bohemikálních dokumentů 20. stol. výběrově
Základní rozhodnutí Pro digitalizaci historických fondů byl zvolen NK ČR a MZK Pro digitalizaci historických fondů byl zvolen NK ČR a MZK Pro digitalizaci 19. a počátku 20. stol. byl zvolen UKF a MZK Pro digitalizaci 19. a počátku 20. stol. byl zvolen UKF a MZK Pro digitalizaci 20. a 21. stol. byl zvolen NKF a MZK Pro digitalizaci 20. a 21. stol. byl zvolen NKF a MZK Nižší míra duplicit než v UKF Nižší míra duplicit než v UKF Nižší využívání čtenáři Nižší využívání čtenáři
Kalkulace objemů výpočet stran Definice časových období a rozhodnutí o kompletnosti nebo výběru Definice časových období a rozhodnutí o kompletnosti nebo výběru Zjištění počtu svazků Zjištění počtu svazků Odhad průměrného počtu stran na svazek pro jednotlivé signatury a typy dokumentů Odhad průměrného počtu stran na svazek pro jednotlivé signatury a typy dokumentů Propočet celkového počtu stran podle vybraných částí fondů Propočet celkového počtu stran podle vybraných částí fondů Globální kalkulace za celý projekt, příp. po jeho skončení Globální kalkulace za celý projekt, příp. po jeho skončení
Průměr stran na sv. Počet sv. Celkem stran NKF I NKF II NKF III NKF IV NKF PI NKF PII NKF PIII NKF PIV Celkem NKF A - J Sign A-C D-M Monografie 19. stol Periodika 19. stol Celkem
Kalkulace objemů Tabulka xls Tabulka xls Celkový počet zahrnuje několik sbírek, které se vzájemně dublují Celkový počet zahrnuje několik sbírek, které se vzájemně dublují Je velmi obtížné odhadnout kolik dokumentů je třeba doplnit z jiné sbírky (např. NKF x UKF) Je velmi obtížné odhadnout kolik dokumentů je třeba doplnit z jiné sbírky (např. NKF x UKF) V rámci projektu se bude digitalizovat pouze malá část, je třeba dobře zargumentovat výběr V rámci projektu se bude digitalizovat pouze malá část, je třeba dobře zargumentovat výběr Ostatní části se budou digitalizovat v rámci rutinního provozu, je však třeba mít rámcový přehled jak dlouho to potrvá Ostatní části se budou digitalizovat v rámci rutinního provozu, je však třeba mít rámcový přehled jak dlouho to potrvá
Kalkulace objemů výkon pracoviště NK ČR Počet plánovaných digitalizovaných stran slouží pro výpočet kapacity digitalizačního pracoviště a současně pro dimenzování úložiště pro dlouhodobou archivaci Počet plánovaných digitalizovaných stran slouží pro výpočet kapacity digitalizačního pracoviště a současně pro dimenzování úložiště pro dlouhodobou archivaci Kapacita pracoviště by měla být zpracována ve variantách (např. reálná, optimální, ideální) Kapacita pracoviště by měla být zpracována ve variantách (např. reálná, optimální, ideální)
skenů/1 hod.x hodskenů/1 denskenů/1 týden1 rok3,5 roku6 let DL 3000Barva A3-A Barva A5-A GS A3-A GS A5-A DL 3000Barva A3-A Barva A5-A GS A3-A GS A5-A DL 3000Barva A3-A Barva A5-A GS A3-A GS A5-A DL 3000Barva A3-A Barva A5-A GS A3-A GS A5-A Scan2PageGS/Barva TreventusGS/Barva TreventusGS/Barva TreventusGS/Barva TreventusGS/Barva Celkem
Kalkulace objemů paměťové kapacity pro archivaci Při digitalizaci se pro jednu stranu dokumentu vytváří několik souborů: Při digitalizaci se pro jednu stranu dokumentu vytváří několik souborů: Archivní soubor Archivní soubor Modifikovaný soubor Modifikovaný soubor Uživatelská kopie Uživatelská kopie Textový soubor Textový soubor Popisná metadata Popisná metadata Administrativní metadata Administrativní metadata
FileTypeFileFormatMB/F No of F TB PMPreservationMasterJP MMModifiedMasterJP UCUserCopy PDF HT OCRTextFormat ALTO XML DMD XML DescriptiveMetadataXML0, ,65 AMD XML AdministrativeMetadataXML0, ,33 Celkem 1869,98
FileTypeFileFormatMB/F No of F TB PMPreservationMasterJP2 MMModifiedMasterJP UCUserCopy PDF HT OCRTextFormat ALTO XML DMD XML DescriptiveMetadataXML0, ,65 AMD XML AdministrativeMetadataXML0, ,33 Celkem 1071,98
Kalkulace objemů paměťové kapacity pro zpřístupnění Pro zpřístupnění se mohou využít jen některé vytvořené soubory v závislosti na způsobu zpřístupňování Pro zpřístupnění se mohou využít jen některé vytvořené soubory v závislosti na způsobu zpřístupňování Generování uživatelských kopií „on the fly“ Generování uživatelských kopií „on the fly“ Autonomní systém (aplikace) obsahující soubory pro zpřístupnění Autonomní systém (aplikace) obsahující soubory pro zpřístupnění
FileTypeFileFormatMB/FNo of FTB UCUserCopyPDF HT DMD XMLDescriptiveMetadataXML0, ,65 AMD XMLAdministrativeMetadataXML0, ,33 Celkem 273,98
Kontakt