Problematika digitálních archivů

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Spisová služba – páteřní systém eGovernmentu v úřadu
Podpora personálních procesů v HR Vema Jaroslav Šmarda
Internet ve službách archivu a archivace webu
Spisová služba pro organizace zřízené Olomouckým krajem
Praha, Brno Nové komunikační možnosti systému Kramerius © Qbizm technologies, a.s. René Michálek
Stránka 1, © Vema, a. s.. Stránka 2, © Vema, a. s. Podnikové aplikace  Integrovaný podnikový systém (Integrated Business System):  komplex aplikací.
Nadpis Portál pro komunikaci s občany 1 Portál pro komunikaci s veřejností Portál pro komunikaci s veřejností DATRON, a.s. ing. Jaromír Látal projektový.
Systém dlouhodobé archivace z dílny Ex Libris - Rosetta Univerzitní knihovna v Bratislavě | Mgr. Eliška Pavlásková.
Open source vs. Komerční řešení pro digitální repozitáře
UŽIVATELSKÉ STATISTIKY IEEE/IET ELECTRONIC LIBRARY A ACM DL Lenka Němečková Ústřední knihovna ČVUT v Praze.
Přednáška č. 5 Proces návrhu databáze
Návrh architektury moderních informačních systémů
IISPP ■ pojem definován v letech v rámci přípravy výzkumných záměrů NPÚ na roky ■ dlouhodobý projekt na vybudování nového komplexního.
XML, RDF a Dublin Core Petr Žabička
Střednědobé a dlouhodobé ukládání dokumentů
Krajská digitální spisovna (KDS)
Rozvoj eGovernmentu ve Středočeském kraji, reg. č. projektu CZ.1.06/2.1.00/ Krajské digitální úložiště Vladimír Dinuš, ICZ a. s
Úvod do databází Databáze.
Lenka Fialová Martina Procházková Ondřej Soukup Martin Valenta Cyril Vojáček 1.
Systémy pro zpřístupňování VŠKP: zkušenosti, možnosti, nabídky, potřeby … Seminář Brno,
Informační technologie pro IZS a krizové řízení
Implementace elektronické důvěryhodné spisovny
Geo-informační systémy
Střednědobé uložení digitálních dokumentů a jejich autenticita (Miroslav Čejka, GORDIC spol. s r.o.)
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
Inovace výuky ve vazbě na požadavky Mezinárodních výukových standardů doc. Ing. Marie Pospíšilová,CSc. SVŠES.
Projekt ELIŠKA Centrální registr řidičů
D IPLOMOVÁ P RÁCE Databázová reprezentace medicínských informací a lékařských doporučení 2002Josef Špidlen.
Projekt MEMORIA MEMORIAE MUNDI SERIES BOHEMICA databáze MANUSCRIPTORIUM Národní knihovna ČR AiP Beroun s.r.o.
Návrh a tvorba WWW Přednáška 1
Cloud Computing - efektivní a transparentní provoz organizace pro každého (Jakub Fiala, Miroslav Čejka GORDIC ® )
Konference SI Praha Ladislav Přívozník is:energy czech a.s.
Vaše jistota na trhu IT Archivace elektronického spisu Karel Škrle, ICZ a.s. 27/03/2008, Praha.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Podpora a rozvoj komunikační infrastruktury ISVS Ing. Lubomír Moravčík
Zkušenosti ze zavedení systému řízení kvality informačních služeb
MoodleMoot.cz 2011, Ostrava, PragoData Consulting, s.r.o. 1 Moodle a okolní svět Ing. Marek Kocan.
LiveContent Univerzální Formulářové Řešení Michal Petrtýl, Marek Beneš.
Dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě
Národní digitální archiv Představení projektu Jiří Bernas, Miroslav Kunt, Národní archiv.
CIS Cizinecký informační systém
Některé digitální knihovny Martina Machátová Moravská zemská knihovna v Brně Tel.: Poslední aktualizace:
Microsoft Office InfoPath 2003 Tomáš Kutěj Account Technology Specialist
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.1 Lucián Piller Intranet HR.
Multiplatformní, řídící systém elektronického vzdělávání pro školy eDoceo Multiplatformní, řídící systém elektronického vzdělávání pro školy Tomáš Hrdonka.
Základní principy řešení a využití ERP aplikací
Architektura ukládání digitálních dokumentů spravovaných v systémech spisové služby vedených v elektronické podobě technická specifikace negarantovaného.
Co po nás zbyde… ISSS 2005 WebArchiv digitální archiv českého webu Markéta Škodová, Národní knihovna ČR.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
Budoucnost současných internetových zdrojů Mgr. Ludmila Celbová
NÁRODNÍ DIGITÁLNÍ ARCHIV
Digitalizace a archivace dokumentů státní sociální podpory
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Pracoviště pro dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě (digitální archiv)‏
PLÁN DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DOKUMENTŮ V PRAXI Mgr. Andrea Fojtu, Mgr. Eliška Pavlásková ÚVT UK, ÚISK UK
Nebezpečí webových aplikací Tomáš Strýček Invex Forum Brno
2005 Adobe Systems Incorporated. All Rights Reserved. 1 Inteligentní PDF formuláře Vladimír Střálka Territory Account Manager Adobe Řešení pro.
INTERNET VE STÁTNÍ SPRÁVĚ A SAMOSPRÁVĚ 2008 © Copyright IBM Corporation 2008 Správa obsahu v podání IBM 7. – 8. dubna 2008 ibm.com/cz/public Daniel Beneš.
Vaše jistota na trhu IT Správa elektronických dokumentů v organizaci a jejich dlouhodobé uchovávání ►Ing. Pavel Pačes, CSc ► , ISSS Hradec.
Systém DESA DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA A ARCHIV
Miroslav Skokan IT Security Consultant
Sales & Consulting IGS, Czech Republic © 2005 IBM Corporation Optimalizace a sdílení informací ve státní správě Pavel Hrdlička.
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
1 E - S V Ě T S E T O Č Í S T Á L E R Y C H L E J I. S T A Č Í T E M U ? Fenix II –IS na platformě.NET Michal Varga.
Národní digitální knihovna
Práce s datovými úložiště Jan Málek. Cíl studia Získat přehled o základních životních fázích dokumentu, povinnostech původce při jeho uchování a typech.
Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4)
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Tradiční metody vývoje softwaru
Transkript prezentace:

Problematika digitálních archivů Miroslav Cink 26/02/2007

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Potřeby řešení dlouhodobé archivace Dlouhodobá archivace – dlouhodobé uchování intelektuálního kapitálu a kulturního dědictví (100 let) Podpora formátů – informace uložená ve starém formátu často není dostupná či podporovaná v novém formátu Uchování různých typů dat – statických textových, obrazových, dynamických, elektronických Objemy dat – stovky tisíc elektronických publikací, desítky milionů textových Legislativa – normy a standardy zatím spíše komplikuje, daná Zákonem 499/2004 Sb. a Vyhláškou 646/2004 Sb.

Základní principy elektronické archivace Elektronická archivace není ani zálohování ani digitalizace Hlavní důraz = autenticita a dlouhodobé uchování V podstatě procesně odpovídá tradičnímu uchovávání, liší se jen způsob uložení V systému jsou odděleny technická a archivní metadata (archivní metadata uložena v databázi u dokumentu) Není třeba online přístup, zpřístupňují se elektronické kopie

Role IBM v oblasti archivace dokumentů IBM se oblasti dlouhodobé archivace věnuje systematicky od pol.90.let IBM je dlouhodobě nejvýznamnějším inovátorem v oblasti IT  nové postupy a řešení pro oblast uchovávání dokumentů Spolupodíleli jsme se na vytvoření referenčního modelu pro dlouhodobou archivaci OAIS IBM přijala společně s Evropskou komisí standard pro fungování systémů el. spisové služby a modelových požadavků pro správu el. dokumentů - MoReq vyvinuli jsme a uvolnili k volnému použití koncept UVC (Universal Virtual Computer) Vyvinuli jsme unikátní nástroj na dlouhodobou archivaci dokumentů – DIAS Vlastní SW pro oblast archivace dokumentů – IBM Content manager; FileNet Máme za sebou zkušenosti z reálných projektů – knihovny a archivy

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Struktura digitálního archivu Formátování & Poskytnutí Vydavatel Původce dokumentu Digitální spisovna Fyzické úložiště dokumentů Systémová manipulace (emulace, migrace, kontrola integrity atd.) Zpřístupnění Archivní zpracování Zákazník Katalogizační pracovník

Referenční Model OAIS „Open Archival Information System" – ISO 14721

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Způsob uchovávání elektronických dokumentů Migrace mění se objekt, přizpůsobuje se novému prostředí výhoda - relativní jednoduchost nevýhody – možnost ztráty informace, šíření chyb Emulace zachovává se původní objekt, prostředí se emuluje výhoda – zachování funkčnosti, vhodné pro komplexní dokumenty nevýhoda – komplexnost emulovaného prostředí UVC (Universal Virtual Computer) tato metoda spojuje výhody migrace a emulace a eliminuje jejich nevýhody Navrženo IBM v roce 2000, ověřeno v projektu DIAS

Metoda UVC – ukládání Typ dokumentu (obrázek, bitmapa, text…) Dokument Formát dokumentu (např. tiff, png, jpeg, gif) LDS (Logical Document scheme) Obecný popis, schéma Dokumentu jednoho typu Vytvoří se 1x při ukládání Popis formátu Definice UVC Dekodér formátu (program pro UVC, převádí dokument na jeho logickou podobu LDV) -vytvoří se 1x při ukládání

Metoda UVC – zpřístupnění Definice UVC Dokument Zákazník Dekodér formátu (program pro UVC, převádí dokument na jeho logickou podobu LDV) -vytvoří se 1x při ukládání Prohlížeč formátu LDV formát (např. XML) prohlíženo pomocí LDS

Životní cyklus ED a procesy v digitálním archivu Vstup dokumentu do digitálního archivu Přijetí k archivaci, validace dokumentu, přiřazení identifikace Způsob uchování, migrace na archivní formát Generování technických metadat, získání a úprava popisných metadat Publikace v katalogu, vložení do archivního systému, notifikace o vložení Zpřístupnění dokumentu z digitálního archivu Vyhledání dokumentu v katalogu Žádost o dokument Ověření přístupu a autorizace Získání dokumentu z archivního systému Migrace na zobrazovací formát, či zobrazení dokumentu přímo Údržba dat Zajištění uchovávání a případně manipulace s ED Zánik dokumentu, skartace Proces uchovávání nezměněné podoby, záloha dat

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Vytvoření DIAS řešení v roce 2004 Rostoucí zájem na řešení pro dlouhodobé uchování informací DIAS je vytvořen na základě řešení pro Národní knihovnu v Holandsku (KB) a sestává z : - jádro řešení DIAS-Core - specifické komponenty navržené pro Národní knihovnu (mohou být použity i ostatními klienty  customizace dle potřeb klienta) DIAS byl vytvořen IBM na základě modifikace OAIS vytvořené v Networked European Deposit Library (EU-Projekt 2000 – 2002) Vytvoření skupiny uživatelů DIAS  společné rozhodování na vývoji a prioritizaci budoucích požadavků, tvorba jediného standardu DIAS řešení

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

DIAS pro Národní knihovnu Holandsko (Koninklijke Bibliothek) Pilotní systém na archivaci - Návrh a dodávka DNEP – Pilot archivačního systému (Deposit systém of Netherlands Electronic publications) Archivační systém - Návrh a dodávka Implementace DIAS v1 Provoz a rozvoj systému na 10 let Studie & Výzkum ohledně strategie dlouhodobé archivace

kopal projekt Co to je kopal projekt? Projekt zastřešený Spolkovým ministrstvem pro vzdělání a výzkum (BMBF) Trvání : 01/07/2004 – 30/06/2007 Cíl : vývoj řešení a potřebné infrastruktury pro dlouhodobé uchovávání elektronických publikací Produkt : DIAS-Core Partneři projektu: Die Deutsche Bibliothek (DDB) - Frankfurt - project management Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB) Gesellchaft für wissenschafliche Datenverarbeitung (GWDG) IBM Deutschland GmbH

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Formátování & Poskytnutí Bibliografický katalog DIAS : Architektura DIAS-Core (OAIS model) Získání & Uložení Poskytnutí & Získání Formátování & Poskytnutí ISIP IDIP Ingest Data Management Přístup Archivní Storage Plánování uchování Administrace Preservation Processor Toolbox Bibliografický katalog Sběr Sklizeň Poskytnutí Hledání Vyvolání Vydavatel Zákazník Bibliografický popis Security Autentizační služby Uživatelské skupiny Uživatelská práva Autorizační služby ICIP ICSR Katalogizační pracovník Pre-process Post-process

Komponenty řešení DIAS ISIP IDIP Ingest Access Archival Storage Preservation Planning Administration CM Resource Manager TSM Storage Server Loader Retriever Data Management AccessManager CM Library Server Logging Reporting Preservation Manager Monitoring and Control

DIAS-Core: Aplikační architektura Client Layer Midtier Layer Server Layer Physical Storage Layer Admin Client Admin Access Manager Server Retriever Client Retriever DB2 CM LS CM RM1..n Tape Magnetic Disk SAN Loader TSM Optical Access Manager Logger Persistent Identifier Generator Monitoring & Control

DIAS-Core: Uložení a struktura metadat Administrativní metadata amdSec File Section fileSec techMD Popisná metadata mdWrap dmdSec fileGrp LmerObject mdWrap techMD file mdWrap FLocat dmdSec LmerFile mdWrap digiprovMD structMap mdWrap Fyzicky uložené soubory LmerProcess div digiprovMD fptr mdWrap Structurální mapa LmerProcess

Používané standardy a HW / SW DIAS řešení je vytvořeno na základě IBM Content manager for Mutiplatforms Využívá open standardy – J2EE, HTTP, HTML, FTP a XML Možné HW platformy – IBM AIX, Sun Solaris, Win2000, Linux SW požadavky – IBM Content Manager for Multiplatforms, IBM Information Integrator, Business Objects, WebIntelligence

Agenda Základní principy archivace, role IBM Struktura digitálního archivu Uchovávací metody pro dlouhodobou archivaci Vývoj DIAS na základě dlouhodobých potřeb klientů Implementované projekty Popis řešení DIAS Typický scénář při implementaci

Klíčové problémy při řešení systému dlouhodobé archivace Typy vstupních souborů které budou zpracovávány Jak systém rozčlenit na jednotlivé samostatné moduly? Jak rozdělit objekty s digitálním obsahem na archivní soubory (AIP)? Požadavky na přijímaná a získávaná data (SIP) Požadavky na vlastní popis formátů SIP, AIP and DIP Management obsahu bibliografických metadat Management uchování technických metadat

Komplexnost a datové typy Webové stránky: Dynamicky generované stránky Proměnlivé externí odkazy Komplikace – bezpečnost webu Potřebuje prostředí web serveru Aplikace / CDROM: závislé na operačním systému a na perifériích Potřebuje interakci s uživatelem Potentciální závislost na sw – ovladače, knihovny atd. Statická data Závislá pouze na aplikaci prohlížeče Migrace formátu uchová digitální obkekt Samostatný digitální objekt Datové typy

Strategie při odlišných prioritách řešení Pohled dodavatele Quality assurance Automatické získání dat Bezpečnost (identifikace, autentizace, autorizace) Pohled zákazníka Cesta k získání dat (složitost) Obsah a kvalita metadat Bezpečnost (identifikace, autentizace, autorizace) Rozpad na moduly Rozčlenění AIP SIP požadavky Vlastní popis formátů Obsah bibliografických metadat Uchování technických metadat Pohled archivátora Uchování médií Technická metadata Nástroje na migraci dat Nástroje na emulaci dat

Typický postup při implementaci DIAS Analýza požadavků Projekt začíná analýzou požadavků, fit-gap analýzou a projekcí pokrytí požadavků řešením DIAS Případný aplikační vývoj Nové kompomenty které mají být navrženy, vytvořeny a otestovány Návrh a implementace infrastruktury Definice a implementace prostředí DIAS u klienta, dle požadovaného návrhu infrastruktury Dodávka řešení Akceptační testy Odsouhlasení klientem že systém běží dle požadavků a přání

Důležité odkazy k IBM řešení dlouhodobé archivace : DIAS řešení: http://www.ibm.com/nl/dias/ IBM POC (demo) archivace: http://www.alphaworks.ibm.com/tech/uvc REFERENCE: Královská knihovna Holandsko - DIAS: http://www.kb.nl/site/sitemap-en.html Německá knihovna – projekt Kopal: http://kopal.langzeitarchivierung.de/

Reference ohledně dlouhdodobé archivace Raymond Lorie and Raymond J. van Diessen: Long-Term Preservation of Complex Processes in IS&T Archiving Conference, Washington, DC, April 26-29, 2005. Hoeven, J.R. van der, Diessen, R.J. van en Meer, K. van der, Development of a Universal Virtual Computer (UVC) for long-term preservation of digital objects, Journal of Information Science, vol. 31(3), p. 196-208, 2005. Raymond van Diessen and Raymond Lorie, UVC: A Universal Computer for Long-Term Preservation of Digital Information, RJ 10338, IBM Almaden Research Center, San Jose, CA, 2005 Eric Oltmans, Raymond J. van Diessen, Hilde van Wijngaarden: Preservation Functionality in a Digital Archive in ACM/IEEE Joint Conference on Digital Libraries,Tucson, AZ, June 7-11, 2004 Raymond J. van Diessen and Titia van der Werf - Davelaar: Authenticity in a Digital Environment, in: IBM / KB Long-term Preservation Study Report Series, IBM Global Services Netherlands, 2002, ISBN/ISSN: 90-6259-155-8 Raymond J. van Diessen: Preservation Requirements in a Deposit System, in: IBM / KB Long-term Preservation Study Report Series, IBM Global Services Netherlands, 2002, ISBN/ISSN: 90-6259-156-6 Raymond J. van Diessen and Ben J. van Rijnsoever: Managing Media Migration in a Deposit System, in: IBM / KB Long-term Preservation Study Report Series, IBM Global Services Netherlands, 2002, ISBN/ISSN: 90-6259-158-2 Raymond J. van Diessen and Johan F. Steenbakkers: The Long-Term Preservation Study of the DNEP Project - an Overview of the Results, in: IBM / KB Long-term Preservation Study Report Series, IBM Global Services Netherlands, 2002, ISBN/ISSN: 90-6259-154-X

Děkuji za pozornost Miroslav Cink miroslav_cink@cz.ibm.com