Průběh importu dat z programu VISK 7 do systému Kramerius NKP Václav Jiroušek, Šárka Forgáčová Odbor digitálních fondů Národní knihovna České republiky 25.5.2017
Kdy budou data z programu VISK 7 dostupná v systému Kramerius NKP? Jaké typy chyb je třeba opravovat před importem dat do Krameria NKP?
Průběh importů dat do Krameria importy dat do Krameria byl zahájeny v říjnu 2016 (v období listopad 2016 – únor 2017 došlo k přerušení importů) v předchozím období byla odevzdaná data ukládána pouze do LTP úložiště NK ČR – úpravy linky NDK potřebné pro export VISKových dat do Krameria byly dokončeny v říjnu 2016 od dubna 2017 jsou již všechna nově odevzdaná data při ukládání do LTP úložiště automaticky paralelně exportována též do Krameria
Data z programu VISK za roky 2013-2015 v průběhu dubna 2017 byla provedena inventura dat dodaných ve formátech NDK, tedy dodávky z let 2013 – 2015 celkem bylo odevzdáno cca 1 150 000 digitalizovaných stran k dnešnímu dni je zpřístupněno cca 635 000 stran (55%) tempo zpřístupňování činí cca 150 000 stran / měsíc prioritně jsou zpracovány dodávky dat bez chyb v metadatech a data institucí neprovozujících vlastního Krameria kompletní zpřístupnění dat odevzdaných za roky 2013-2015 lze očekávat během podzimu 2017 průběžně probíhá oslovování institucí, které v uplynulých letech čerpaly dotaci na digitalizaci, jejich data však nebyla zpracovateli v pořádku odevzdána do NK ČR
Data z programu VISK za roky 2011-2012 v květnu 2017 byla zahájena inventura úplnosti dat odevzdaných do NK ČR za období 2011 – 2012, jedná se o data ještě ve starších formátech určených pro Krameria 3 většina dat byla zpřístupněna ještě v Krameriovi 3 a nyní tedy probíhají jejich konverze do Krameria 5 (cca do roku 2019) část dat byla odevzdána až po „zakonzervování“ Krameria 3 – tato data byla prioritně v loňském roce konvertována do formátů NDK a z větší části již byla zpřístupněna v Krameriovi 5, zbylá část bude dokončena v roce 2017
Přehled zpracování dat odevzdaných za rok 2013
Přehled zpracování dat odevzdaných za rok 2014
Přehled zpracování dat odevzdaných za rok 2015
Chyby a nepřesnosti v metadatech dodávaných dat:
Různá titulová uuid při zpracování periodik rozfázované zpracování titulu na několik etap zpracování titulu různými zpracovateli vyskytly se také roztříštěné ročníky, každé čtvrtletí jiné uuid (více svazků v ročníku) při zpřístupnění vznikají pahýly
Kontrolní součty samotný md5 soubor bývá v pořádku kontrolní součet je uveden v balíčku na více místech (md5 soubor, hlavní mets, vedlejší mets) samotný md5 soubor bývá v pořádku kontrolní součty v metadatech! velikosti souborů v metadatech často u dodatečných úprav vedlejších mets validátor to hlídá
Vlastník digitalizovaného dokumentu zobrazení vlastníka v Krameriovi mods:physicalLocation obsahem je sigla, Kramerius ji převádí na název instituce element neopakovat
Vícečetný element physicalLocation - bere se první
Problém s mezerou mezera je také znak přebytečná mezera znemožňuje strojové rozeznání hodnoty, kvůli předdefinovanému pevnému formátu u některých elementů sigla (ABA 000 X ABA000) rozmezí dat pro datum vydání (1900 – 1901 X 1900-1901)
Číslo ročníku periodika číslování ročníku periodika je potřeba vyplňovat element <mods:partNumber> v úrovni VOLUME v DMF je MA, ale Pravidla pro popis periodik požadují vyplnit vždy arabskou číslicí pokud nelze dopočítat, uvést rok vydání ročníku
Case-sensitivita velké a malé písmeno nemusí být pro stroj ten samý znak u typů identifikátorů ve vazbách event-object ve vedlejších mets <premis:eventIdentifierType>EventId</ <premis:relatedEventIdentifierType>EventID</ názvy typů stran v <mets:div> <mets:div ID="DIV_P_PAGE_0020" ORDER="25" ORDERLABEL="23" TYPE="normalPage"> normalPage ≠ NormalPage označení typu dokumentu v hlavičce záznamu
http://www.ndk.cz/standardy-digitalizace/metadata Specifikace pro periodika http://www.ndk.cz/standardy- digitalizace/DMFperiodika_16.pdf Specifikace pro monografie http://www.ndk.cz/standardy- digitalizace/DMFmonografDok_12.pdf Pravidla pro popis periodik https://goo.gl/kzvKrV Pravidla pro popis monografií https://goo.gl/KL0axr
Děkujeme za pozornost vaclav.jirousek@nkp.cz sarka.forgacova@nkp.cz