Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes? Mgr. Jan Hutař Odbor digitální ochrany NK ČR AKM 2.12.2010.

Slides:



Advertisements
Podobné prezentace
Praha, Brno Nové komunikační možnosti systému Kramerius © Qbizm technologies, a.s. René Michálek
Advertisements

OPEN REPOSITORIES 2010 MADRID, 6. – MGR. LENKA NĚMEČKOVÁ ÚSTŘEDNÍ KNIHOVNA ČVUT.
Výběr vozidla do firmy – máme k dispozici všechny informace? Michal Krátký, Přemysl Žižka – DEN S FLEETEM DEN S FLEETEM – JARO 2010.
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Podpora dostupnosti a kvality sociálních služeb v Pardubickém kraji Úvodní seminář k projektu Pardubice
Martin Vojnar Vědecká knihovna v Olomouci
Systém dlouhodobé archivace z dílny Ex Libris - Rosetta Univerzitní knihovna v Bratislavě | Mgr. Eliška Pavlásková.
Knihovny současnosti 2011, České Budějovice 13. – 15. září 2011
Projektové řízení Modul č.1.
Open source vs. Komerční řešení pro digitální repozitáře
1 Repozitář MU Mgr. Michal Petr Odbor pro akademické kvalifikace a kvalitu
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
13. Koordinace projektů Realizace změn Koordinace projektů
Moravská zemská knihovna a zpřístupňování starých map.
Politika výběru elektronických zdrojů publikovaných v prostředí Internetu Mgr. Ludmila Celbová
Bohdana Stoklasová Národní knihovna ČR
Aktivita číslo 5 Návrh a zavedení systému centrální administrace a řízení projektů Zvýšení kvality řízení na Krajském úřadě Plzeňského kraje.
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Jiří Herman Elsyst Engineering Digitalizace a nástroje pro podporu digitalizace v knihovnách Jiří Herman Brněnská 10, 682.
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
13. února 2007Systém Kramerius, Martin Lhoták, KNAV1 Systém Kramerius aktuální stav a vývoj v roce 2007 Martin Lhoták, Knihovna AV ČR, v.v.i. SDRUK – IT,
Střednědobé uložení digitálních dokumentů a jejich autenticita (Miroslav Čejka, GORDIC spol. s r.o.)
Open source nástroje pro dlouhodobou ochranu digitálních dat
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitální knihovna AV ČR a vývoj nové verze systému Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Koncepce trvalého uchování knihovních sbírek tradičních i elektronických dokumentů v knihovnách ČR do roku 2010 Bohdana Stoklasová & kol. Národní knihovna.
Relační databáze.
Uchování a trvalé zpřístupnění webových dokumentů zkušenosti z WebArchivu.
Digitalizace knihovních dokumentů Jiří Polišenský.
Vaše jistota na trhu IT Archivace elektronického spisu Karel Škrle, ICZ a.s. 27/03/2008, Praha.
Dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě
Národní digitální archiv Představení projektu Jiří Bernas, Miroslav Kunt, Národní archiv.
Jméno firmy Podnikatelský plán. Shrnutí Jasně popište, co je smyslem činnosti vaší společnosti a jaké si kladete cíle –Stručně popište, jak si představujete.
Informace o přípravě Integrovaného operačního programu  Ministerstvo kultury  Ministerstvo informatiky Vít Richter Národní knihovna ČR
Co po nás zbyde… ISSS 2005 WebArchiv digitální archiv českého webu Markéta Škodová, Národní knihovna ČR.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
NÁRODNÍ DIGITÁLNÍ ARCHIV
Vaše jistota na trhu IT Vybudování a provozování e-spisovny Josef Sedláček ICZ a.s.
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
PLÁN DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DOKUMENTŮ V PRAXI Mgr. Andrea Fojtu, Mgr. Eliška Pavlásková ÚVT UK, ÚISK UK
Vaše jistota na trhu IT Architektura informačních systémů paměťových institucí ► Ing. Petr Vršek ►ICZ a.s. ► , Praha
Digitalizace a ukládání Zpracoval: Jiří Hošek Datum:
 P1 - Strategické plánování  P2 - Systém managementu jakosti a legislativy  P3 - Řízení informací  P4 – Audity.
Projekt Digitální knihovna AV ČR a vývoj systému Kramerius Martin Lhoták, Knihovna AV ČR AMK v digitálním světě 2005, Praha.
MoReq2 Ing. Miroslav ŠIRL Hradec Králové.
Za okamžik začínáme. Co nás dnes čeká Kdo jsme Jak a s čím jsme začínali Co obnáší digitalizace a archivace doc. Analýza Formáty Souvislosti Struktura.
Systém DESA DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA A ARCHIV
Datovýsklad Datový sklad V budoucích službách státního archivu.
TŘI ROKY DIGITÁLNÍHO UNIVERZITNÍHO REPOZITÁŘE UNIVERZITY KARLOVY Eliška Pavlásková, Andrea Fojtu Archivy, knihovny a muzea v digitálním světě.
Přístup k řešení bezpečnosti IT Nemochovský František ISSS Hradec Králové, dubna 2005.
Záměrem Moravskoslezského kraje je provést systémovou změnu v poskytování sociálních služeb Závěrečná konference k projektu „Podpora transformace pobytových.
Možnosti spolupráce při vytváření digitálních sbírek Ing. Martin Lhoták Knihovna AV ČR.
Kramerius 4 – nová generace systému pro digitální knihovnu Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě ,
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
Open Access v AV ČR Martin Lhoták Knihovna AV ČR, v. v. i. 3. setkání českých uživatelů systému DSpace , Ostrava.
Národní digitální knihovna
Petr Žabička Moravská zemská knihovna v Brně Možnosti technického řešení.
Odbor digitálních fondů Zuzana Kvašová,
ODBOR SLUŽEB Seminář pro vedoucí pracovníky infrastrukturních útvarů NK ČR 13. ledna 2016.
IS jako nástroj moderního personálního managementu Vít Červinka
Digitalizace v krajské knihovně (SVK HK)
OpenAIRE Plán managementu dat
Průběh importu dat z programu VISK 7 do systému Kramerius NKP
Úvodní hodina do předmětu Knihovnické procesy a služby
Jak jsme na Slovensku prováděli “audit” Centrálneho dátového archívu podle ISO Zdeněk Hruška Moravská zemská knihovna v Brně.
Digitalizace knihovních dokumentů
Otevřená data v České republice
Transkript prezentace:

Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes? Mgr. Jan Hutař Odbor digitální ochrany NK ČR AKM

Témata co řeší dlouhodobá ochrana digitálních dat a nač ji potřebujeme? v čem dlouhodobá ochrana digitálních dat spočívá? na co se soustředit? volně dostupné nástroje pro dlouhodobou ochranu dlouhodobá ochrana digitálních dat a projekt NDK VISK7 a nové postupy tvorby metadat a dat přehled dostupných nástrojů AKM

UNESCO o digitálních datech Listina o ochraně digitálního dědictví, 15. říjen 2003 článek 1: “Digitální dědictví sestává z unikátních zdrojů lidského vědění. Mnohé z těchto zdrojů mají trvalou hodnotu a podstatu, čímž tvoří odkaz, který musí být opatrován a ochráněn pro současné i budoucí generace.” AKM

Co řeší dlouhodobá ochrana digitálních dat? ochranu dat? ochranu vložených financí? ochranu vědění? ochranu děl lidského umu? – dostupnost, použitelnost, srozumitelnost v budoucnu jak „dlouhá“ je budoucnost? – dokud budou mít uchovávané digitální objekty význam pro uživatele – 5 let nebo déle x časový úsek, ve kterém dojde k podstatné změně technologií (podpora medií a formátů) “Pokud mluvíme o ochraně digitálních zdrojů, termín „dlouhodobá“ neznamená garantované uchování na 5 nebo 50 let, jako spíše odpovědný vývoj strategií, které se dokáží vyrovnat s neustálými změnami, které přináší informační trh.” Ute Schwens / Hans Liegmann (DNB/nestor) AKM

Co má dlouhodobá ochrana dat zajistit? základní ochrana dat nyní i v budoucnu (ochrana bit streamu) ochrana použitelnosti dat v budoucnu (ochrana logická) logická ochrana = procesy zajišťující, aby digitální objekty zůstaly v budoucnosti: – vyhledatelné, – přístupné (zobrazitelné), – využitelné znovu a znovu a – pochopitelné (obsah a smysl) – autentické OAIS (ISO 14721:2003 – Open Archival Information System) – s jednotlivými digitálními objekty musí být uchován nejen informační obsah uchovávaných objektů, ale také další informace o původu a historii změn dokumentu, o jeho kontextu a zdrojích potřebných k porozumění AKM

V čem ochrana spočívá? digitalizace – vytváříme to co chceme? jsou formáty standardní máme kompletní dokument? máme kompletní metadata? máme kontrolní součty? přesuny dat – kontrolní součty, kompletnost, plán uložení – kontrola HW, kontrola integrity, přehled co kde je (data a metadata), přehled o změnách, práva přístupu, opatření dlouhodobé ochrany opravy dat a metadat – kdo, co, kdy, proč a s jakým výsledkem; úpravy metadat zpřístupnění – autenticita, použitelnost, vyhledávání AKM

Digitalizace – co promyslet? strategická příprava – standardy + jasná strategie projektu/instituce víme opravdu co a proč budeme skenovat? kvalita předlohy, existence metadat víme jak to budeme uchovávat a zpřístupňovat? kolik to bude stát? máme kapacity na uložení dat? zkušenosti a lidi pro manipulaci s daty? NEZAČÍNAT bez plánu - MÁME NA TO (TEĎ) PENÍZE… raději naopak dělat kontroly integrity (kontrolní součty) validace metadat – formáty, kompletnost co hrozí? zdržení, hromadění nehotových dat, ztráty dat, vícepráce/náklady AKM

Jak pomohou metadata? většina metadat vzniká během digitalizace x bezprostředně po ní – mohou uchovat vše důležité pro budoucnost – pokud to podstatné do nich dáme metadata popisná (MARC, MODS, DC, EAD) – popis intelektuální entity – ideálně použít bibl. záznam z katalogu (konzistence katalog a dig. knihovna) – obohacení – popis vnitřních částí – nejsou v katalogu apod. administrativní metadata (PREMIS, MIX, METS) – technická m. – údaje o formátech, validacích, skeneru, SW, identifikátory … – metadata práv – údaje o copyrightu, licencích aj. – metadata o provenienci – vztahy mezi objekty, události, agenti strukturální metadata (METS) – logická a fyzická struktura dokumentu volné nástroje PRONOM, JHOVE aj. AKM

Přesuny dat a metadat do repozitáře; do aplikace zpřístupnění; na nový HW jakýkoliv přesun je riskantní rizika přesunů ztráty existujících vazeb, narušení zaběhaných procesů, časově náročný proces, ztráta integrity nutno provádět kontroly integrity a kompletnosti dat antivirová kontrola validace struktury balíku dat a metadat identifikace/ validace formátů před a po AKM

Metadata a data v repozitáři monitorování základních vlastností a metadat vkládaného materiálu > hodnocení risků obohacení metadat doplnění metadat dokumentujících životní cyklus v archivu (použití, exporty, ochranné operace, atd.) neustálá kontrola integrity dat preservation planning jednoduché vyhledávání, filtrování – víme co kde je konzistence metadat mezi archivem, zpřístupněním a katalogem? ano x ne AKM

S čím můžete začít již dnes? za všech okolností následovat aktuální standardy mít strategii ochrany digitálních dokumentů pro vaši instituci dokumentace procesů mít spolehlivý systém na správu repozitáře a dat provádět kontroly při jakémkoliv přenosu dat i metadat využívat volně dostupné nástroje – lze využívat okamžitě – zvláště pokud máte velké objemy dat, často s nimi manipulujete – výrazně zlepší vyhlídky do budoucna – není třeba čekat na nějaké řešení „shůry“ připravit se již během digitalizace (metadata) AKM

Strategie ochrany aneb víme co děláme obecná strategie institucionální > strategie ochrany dlouhodobá > střednědobá > projektová co chceme ochraňovat? a proč? všechno stejně? máme kapacity? personál? znalosti? víme kolik bude stát uložení? dlouhodobé uložení? spolupráce/koordinace = sdílení financí > sdílení technologií > sdílení znalostí sdílení NENÍ využívání a spoléhání se na druhého AKM

Volně dostupné nástroje identifikace, validace a charakterizace formátů - PRONOM, UDFR metadata extraktory - JHOVE, NZME aj. nástroje na vytváření metadat, migrace, validace metadat open source SW na repozitáře – správa dat a metadat, událostí, práv (přístup i copyright) aj. – vyhledávání + hromadné operace s daty/metadaty – zajištění integrity – preservation planning ano x ne preservation planning – PLATO nebo PLANETS testbed AKM

Externí služby využití externích služeb je klíčovou vlastností SW repozitáře – z nich čerpají podstatné informace např. o formátech dokumentů (identifikace, charakterizace) – validují je oproti těmto službám – získávají z nich informace o doporučovaných možnostech migrací i stavu zastarání formátů registry formátů - PRONOM (DROID), UDFR extraktory/validároty Jhove2, New Zealand Metadata Extractor a open source i komerční SW repozitáře s nimi musí pracovat AKM

Registry formátů – use case Identifikace mám digitální objekt, co je to za formát? Validace mám objekt, který říká, že je to formát F – je to opravdu ono? Transformace mám objekt ve formátu F, ale potřebuji formát G - jak ho mohu vytvořit? Charakterizace mám objekt ve formátu F, jaké má vlastnosti? Odhad risků mám objekt ve formátu F, je s ním spojen risk? např. zastarávání? Zobrazení mám objekt ve formátu F, jak a čím ho mohu zobrazit? (Abrams, Seaman: Towards a global digital format registry. IFLA 2003) AKM

Dlouhodobá ochrana digitálních dat a projekt NDK jeden ze tří hlavních cílů projektu ochrana pro stávající data, nová zdigitalizovaná i digital born návrh nových procesů a standardů digitalizace – východisko pro VISK7, krajské digitalizace – pořízení SW na kompletní workflow digitalizace pořízení komerčního LTP systému (Rosetta x SDB) – strategie ochrany – velké objemy dat z digitalizace nelze uchovávat ve file systému – trend ve světě (NZ, Austrálie, Německo, Holandsko, Finsko, Norsko, Polsko, Maďarsko) – důvod – ochrana dat, investic AKM

VISK7 a plánované změny nové standardy dat i metadat – návaznost na NDK – využití standardů běžných v okolních zemích VISK7 v roce 2011 = 2 možnosti tvorby dat 1.stávající formáty dat i metadat (DTD monografie a periodika) 2.nové formáty dat (JPEG2000 a ALTO XML) VISK7 v roce 2012 – stávající postup? – nové metadatové formáty dle NDK (METS, PREMIS, MIX, MODS) – nové formáty dat – JPEG2000, ALTO XML – nová struktura balíků co je smyslem změn? interoperabilita, flexibilita, komunitní podpora namísto vlastního vývoje … AKM

Dlouhodobá ochrana digitálních dat ve světě řešena převážně v knihovnách a archivech Nový Zéland (NK a NA) Německo (NK) Velká Británie (NK, NA a další knihovny a nadace) Nizozemí (NK a NA) USA (NK, NA, univerzitní knihovny, nadace aj.) přidávají se ostatní evropské a světové knihovny (Finsko, Norsko, Singapur, Austrálie, Francie, Estonsko, Polsko, SK, Maďarsko atd. atd) – probíhající tendry projektová podpora EU – DigitalPreservationEurope – CASPAR – PLANETS – SHAMAN – KEEP aj. AKM

Dostupné produkty komerční – Safety Deposit Box (fa Tessella UK) – Rosetta (fa ExLibris, Izrael) – DIAS (fa IBM) – systém nemá další vývoj v oblasti knihoven open source – Fedora a její nadstavby – XENA (NA Austrálie) – RODA (Portugalsko, Uni of Minho) – CRIB (Portugalsko, předchůdce RODA) – ARCHIVEMATICA (Unesco + Kanada); tool packhttp://archivematica.org/ – MOPSEUS – založeno na Fedoře, Řecko – HOPPLA – vývoj TUW Vídeň, pro malé instituce nebo domácnosti – ePRINTS – Univerzita Southampton nástroje na preservation planning – PLANETS testbed, PLATO aj. AKM

Děkuji za pozornost Otázky? AKM