Dlouhodobá ochrana digitálních dat a systém Archivematica

Slides:



Advertisements
Podobné prezentace
OPEN REPOSITORIES 2010 MADRID, 6. – MGR. LENKA NĚMEČKOVÁ ÚSTŘEDNÍ KNIHOVNA ČVUT.
Advertisements

Informační systém krizového řízení kraje
Integrovaný systém kvality v dalším profesním vzdělávání KVALITA V DALŠÍM VZDĚLÁVÁNÍ Liberec,
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Systém dlouhodobé archivace z dílny Ex Libris - Rosetta Univerzitní knihovna v Bratislavě | Mgr. Eliška Pavlásková.
Knihovny současnosti 2011, České Budějovice 13. – 15. září 2011
Open source vs. Komerční řešení pro digitální repozitáře
Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
Iva Horová: Zpřístupňování eVŠKP Olomouc, SDRUK, IT Zpřístupňování eVŠKP současný stav a záměry.
IISPP ■ pojem definován v letech v rámci přípravy výzkumných záměrů NPÚ na roky ■ dlouhodobý projekt na vybudování nového komplexního.
Global network of innovation e-government – Užití IT v sociálním pojištění E-government Užití informačních technologií v sociálním pojištění.
Audit IT procesů ve FNOL
Praha Jan Mach Vysoká škola ekonomická v Praze Příprava Národního registru VŠKP a Národního úložiště šedé literatury Ing. Jan Mach
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Implementace elektronické důvěryhodné spisovny
Spolupráce lokálních institucí Seminář Komunitní role veřejných knihoven ZLÍN
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
Metainformační systém - Metaportál MŽP ČR
Inovace výuky ve vazbě na požadavky Mezinárodních výukových standardů doc. Ing. Marie Pospíšilová,CSc. SVŠES.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Další vývoj přiřazování kvalifikací k EQF v České republice Miroslav Kadlec, Praha,
Vaše jistota na trhu IT Archivace elektronického spisu Karel Škrle, ICZ a.s. 27/03/2008, Praha.
Evropská digitální úložiště a perspektivy důvěryhodného digitálního úložiště v rámci Národní digitální knihovny Bohdana Stoklasová Anna Nerglová Národní.
Podpora a rozvoj komunikační infrastruktury ISVS Ing. Lubomír Moravčík
Národní digitální archiv Představení projektu Jiří Bernas, Miroslav Kunt, Národní archiv.
CIS Cizinecký informační systém
Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes? Mgr. Jan Hutař Odbor digitální ochrany NK ČR AKM
Projekt realizace referenčního rozhraní Ing. Jan Pokorný Ministerstvo informatiky ČR ISSS, 5. dubna 2005.
Informace o přípravě Integrovaného operačního programu  Ministerstvo kultury  Ministerstvo informatiky Vít Richter Národní knihovna ČR
Portál - kultura a historie Prahy Ivan Seyček Miroslav Váňa Lada Králová Magistrát hl. m. Prahy ePraha ISSS/LORIS/V4DIS Portál – kultura.
Co po nás zbyde… ISSS 2005 WebArchiv digitální archiv českého webu Markéta Škodová, Národní knihovna ČR.
Realizační tým ICZ duben 2005
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
NÁRODNÍ DIGITÁLNÍ ARCHIV
Usability Workshop Zpráva ze semináře Vilnius, 1.– Ing. Jan Kaňka Krajská knihovna Františka Bartoše
Informační kulturní portál
Vaše jistota na trhu IT Vybudování a provozování e-spisovny Josef Sedláček ICZ a.s.
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě (digitální archiv)‏
PLÁN DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DOKUMENTŮ V PRAXI Mgr. Andrea Fojtu, Mgr. Eliška Pavlásková ÚVT UK, ÚISK UK
Vaše jistota na trhu IT Architektura informačních systémů paměťových institucí ► Ing. Petr Vršek ►ICZ a.s. ► , Praha
Zkušenosti ze zavedení systému řízení bezpečnosti informací ve shodě s ISO a ISO na Ministerstvu zdravotnictví ČR Ing. Fares Shima Ing. Fares.
MoReq2 Ing. Miroslav ŠIRL Hradec Králové.
Využití NUŠL pro ukládání a zveřejňování výsledků výzkumu a vývoje V ČR Open Access: otevřený přístup k vědeckým informacím v EU a ČR Technologické centrum.
INTERNET VE STÁTNÍ SPRÁVĚ A SAMOSPRÁVĚ 2008 © Copyright IBM Corporation 2008 Správa obsahu v podání IBM 7. – 8. dubna 2008 ibm.com/cz/public Daniel Beneš.
Rody Unifikované názvy Personální jména Konference Edice Akce Rodiny Korporace Geografická jména National Authority Files/ Names Soubory národních autorit.
Vaše jistota na trhu IT Správa elektronických dokumentů v organizaci a jejich dlouhodobé uchovávání ►Ing. Pavel Pačes, CSc ► , ISSS Hradec.
Systém DESA DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA A ARCHIV
Datovýsklad Datový sklad V budoucích službách státního archivu.
TŘI ROKY DIGITÁLNÍHO UNIVERZITNÍHO REPOZITÁŘE UNIVERZITY KARLOVY Eliška Pavlásková, Andrea Fojtu Archivy, knihovny a muzea v digitálním světě.
© Ing. V. Šebek, CSc. Řízení projektů a podnikových procesů 1/9 9. Tvorba modelů v procesně řízeném podniku  Způsoby modelování  Základní postupy a role.
Informační systém UNIV 2 Kraje Ing. Marek Kocan , UNIV 2 KRAJE, Ostrava, PragoData Consulting, s.r.o.
Kramerius 4 – nová generace systému pro digitální knihovnu Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě ,
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
Národní digitální knihovna
YOUR SYSTEM, spol. s r. o. Ing
Petr Žabička Moravská zemská knihovna v Brně Možnosti technického řešení.
Digitální knihovna, systém pro tvorbu, archivaci a zpřístupňování digitálních dokumentů Jiří Polišenský.
Odbor digitálních fondů Zuzana Kvašová,
Zahájení úvodní slova představení projektu etapy projektu představení projektového týmu Národní digitální archiv.
SIKP – Státní informační a komunikační politika Prezentace – aplikace vybraných zákonů ve společnosti NeXA, s.r.o. Eva Štíbrová Zdeňka Strousková Radka.
Mezinárodní konference ICT Fórum PERSONALIS 2006 Procesní řízení informační bezpečnosti ve státní správě Ing. Jindřich KODL, CSc. Praha
Práce s datovými úložiště Jan Málek. Cíl studia Získat přehled o základních životních fázích dokumentu, povinnostech původce při jeho uchování a typech.
V Českých Budějovicích, únor 2017
Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4)
OpenAIRE Plán managementu dat
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Jak jsme na Slovensku prováděli “audit” Centrálneho dátového archívu podle ISO Zdeněk Hruška Moravská zemská knihovna v Brně.
Transkript prezentace:

Dlouhodobá ochrana digitálních dat a systém Archivematica Miroslav Bartošek ÚVT MU

Úvod

„Digital information is forever „Digital information is forever. It doesn’t deteriorate and requires little in the way of material media”. Andy Grove, Intel Corp. „Digital information lasts forever – or five years, whichever comes first.“ Jeff Rothenberg, RAND, 1995

Uchování informací Důležitý úkol (podmínka rozvoje) civilizace Knihovny (GLAM): dlouhodobě = mnoho staletí digitální technologie: inovační cyklus = cca 5 let (v průměru po 5 letech je daná technologie zastaralá  ) The trouble with technological progress is that it seems to come at the expense of preservation (Ian H.Witten) Computer technology is made for information processing, not for long term storage (M. Wettengel)

Problém s digitální informací bity – OK nosič, formát, SW, HW – problém! Životnost Dostupnost Použitelnost

Nosiče informací - trendy Médium Kapacita (bits/cm2) Životnost (roky) kámen 10 10.000 papír 104 1.000 film 107 100 disk 1010 Zdroj: Richard Wright (http://dx.doi.org/10.7207/twr12-01) Analogové záznamy – postupná degradace Digitální záznamy – zmizí najednou

Domesday Book/Project 1086 Vilém Dobyvatel pozemková kniha (kniha posledního soudu) – výběr daní 1984-86 BBC projekt záznam života UK na dalších 1000 let, špičkové technologie LV-ROM 2002 data nedostupná technologická zastaralost 2000-4 záchranná mise projekty – emulace, konverze, … 2011 BBC Domesday Reloaded aktualizovaná webová verze

Digital preservation

Digital Preservation Digital preservation combines policies, strategies and actions that ensure access to digital content over time. (ALA – Short definition) Digital preservation combines policies, strategies and actions to ensure access to content that is born digital or converted to digital form regardless of the challenges of file corruption, media failure and technological change. The goal of digital preservation is the most accurate rendering possible of authenticated content over time. (ALA – Medium definition) http://www.ala.org/alcts/resources/preserv/2009def DP – Digital Preservation LTP – Long-Term (digital) Preservation

DP trojnožka Technologie HW, SW, sítě, technické dovednosti Organizace Mandát, strategie, plány ochrany, sbírkové plány, bezpečnost Zdroje Lidé a jejich kvalifikace, prostory, financování http://www.dpworkshop.org/dpm-eng/conclusion.html

Úrovně digitální ochrany Fyzická (bitová) ochrana – ochrana bitů Bitová replikace Vícenásobné kopie Různá média Rozdílné lokality Fixity – neměnnost, problém bit-rot Logická ochrana – ochrana informačního obsahu Ochrana před zastaráváním technologií a formátů Identifikace formátů, plánování, migrace formátů, emulace prostředí, … Použitelnost a srozumitelnost obsahu v budoucnosti Metadata, kontext, porozumění – OAIS Zachování integrity a autenticity

Standardy ISO 14721:2012 OAIS – Open Archival Information Systém referenční model pro dlouhodobý archiv Model prostředí (tvůrci, archiv, uživatelé, určená komunita, správa) Informační model (SIP, AIP, DIP, …) Funkční model (Ingest, Archival storage, Data Management, Preservation Planning, Administration, Access) 2014 český překlad ČSN ISO 14721 Skvělý přehled od Lavoie v rámci DPC Technology Watch Reports ISO 16363:2012 Audit a certifikace důvěryhodných digitálních repozitářů

Aktivity Obrovské množství projektů ve světě Velká komerční řešení Řada open-source nástrojů Systémy a best-practices V ČR Národní digitální knihovna (NK) – vlastní řešení Centralizovaný projekt MŠMT (spisová služba?) LTP-pilot (FR Cesnet 2014/09-2015/10) NAKI-LTP (návrh projektu 2016-2020) Ale pořád jsme teprve na začátku, systémové řešení není

Přístupy Velké projekty/systémy Nízkonákladové projekty Národní knihovny/archivy ve vyspělých zemích Velké drahá řešení (komerční nebo vývoj na zakázku) KB e-Depot (NK Holandska + IBM, DIAS) Archives New Zealand (ExLibris – Rosetta,Honza Hutař) Nízkonákladové projekty Nečekat, až s čím přijdou velcí hráči Začít se dá i v malém, postupné kroky Využít komunitní nástroje, řešení, zkušenosti POWRR – Preserving Digital Objects With Restricted Resources LTP-pilot NAKI-LTP

LTP-pilot Projekt FR CESNET (MU, MZK 2014/09-2015/10) Pilotní implementace a ověření nízkobariérového přístupu k LTP prostřednictvím systému Archivematica Prozkoumat možnosti, nároky a omezení systému Archivematika Propojení Archivematiky s úložnou infrastrukturou Cesnet Ověřit použitelnost systému Archivematica pro ukládání, správu a logickou dlouhodobou ochranu vybraných typů dokumentů a sbírek Vytvořit základní dokumentaci pro správce systému a kurátory digitálních dat

LTP-pilot 6 pracovních skupin Závěrečný LTP-workshop (spolu s NA ČR) Systém a vývoj Úložiště Uživatelské scénáře Kurátoři dat Standardy Publicita Závěrečný LTP-workshop (spolu s NA ČR) Satelitní akce konference Archivy, knihovny a muzea v digitálním světě 2015 (počátkem prosince)

Archivematica

Archivematica - vznik Open-source SW na podporu DP Artefactual Systems Inc., vývoj od 2008, v1.3.1 www.archivematica.org Spolupráce s UNESCO, archiv Vancouveru, MMF, univ, … ZIB Berlín, Finská NDL, NA ČR Impuls vzniku: Poptávka po nízkonákladovém řešení Dostupnost velké škály volných open-source nástrojů Propojit dostupná nástroje do „pragmatického“ řešení dle OAIS

Archivematica - rysy Propojená sada dostupných nástrojů pro realizací základních funkcí DP Neřeší vše – integrace s externími systémy používanými institucí a doplnění těchto systémů o DP funkcionalitu Příjem a zpracování dat (normalizace), vytvoření kvalitních AIP balíčků Best practices – formátově orientované ochranné postupy FPR – Format Policy Registr Kontrola a normalizace na vstupu, migrace a emulace později Technologie mikroslužeb Open-source nástroje Řetězení mikroslužeb do pracovních postupů – funkční entity OAIS Řídicí webová aplikace Dashboard Programovací jazyk Python, open-source produkt po licencí AGPL 3.0 Průběžný vývoj + uživateli sponzorované nové funkcionality + wish-list

OAIS a Archivematica Transfer příprava dat -> SIP Ingest zpracování -> AIP, DIP Archival Storage uložení AIP, DIP Data Mngmt AtoM, externí systém Preservation Planning FPR Administration Access AtoM, externí systém

Archivematica - architektura access DAM storage

Archivematica - standardy UUID identifikace všech interních objektů (soubory, procesy, paměťové lokace, aj.) BagIt zabalení informačních balíčků AIP, SIP (kontrolní součty – fixity) METS integrace všech metadatových popisů v rámci AIP Premis zachycení všech událostí a historie změn během vzniku a života AIP DC popisná metadata pro vyhledávání informačních balíčků

Archivematica - dashboard

NAKI-LTP ARCLib - komplexní řešení pro dlouhodobou archivaci digitálních (knihovních) sbírek Návrh projektu do NAKI II – KNAV, MU, MZK, NK + externisté Podáno 4.5.2015, rozhodnutí 2015/12, doba řešení 2016/3-2020 Hlavní řešitel: M.Lhoták Výstupy Komplexní SW řešení pro LTP (open-source) Certifikovaná metodika pro LTP Certifikovaná metodika pro fyzické ukládání dat a bit-level ochranu Cílem projektu je vytvoření komplexního LTP (Long Term Preservation) řešení ARCLib na bázi open source, které využije volně dostupné nástroje a systémy. Součástí projektu a jeho dalším významným výstupem je vytvoření metodiky na dlouhodobou logickou ochranu digitálních dat zohledňující mezinárodní standardy v této oblasti (referenční model OAIS – ČSN ISO 14721 a ČSN ISO 16363) a systémy využívané pro vytváření a zpřístupňování digitálních dat v českých knihovnách. Současně bude připravena metodika a řešení pro fyzické ukládání dat a zajištění bit-level ochrany. Funkčnost celého řešení bude ověřena v praxi formou poloprovozu minimálně v jedné ze zapojených institucí.

Děkuji za pozornost. Dotazy?