Stáhnout prezentaci
Prezentace se nahrává, počkejte prosím
ZveřejnilNicol Jandová
1
Systém dlouhodobé archivace z dílny Ex Libris - Rosetta Univerzitní knihovna v Bratislavě | 12.4.2011 Mgr. Eliška Pavlásková
2
2 Obsah prezentace • Dlouhodobá ochrana obecně • Dlouhodobá ochrana dle Ex Libris • Intelektuální entita v systému Rosetta • Moduly systému Rosetta • Aktivní podpora ochrany digitálních objektů
3
3 Co je to dlouhodobá ochrana? • Ochrana digitálních objektů po dlouhou dobu • Ochrana bit-streamu • Logická ochrana – ochrana obsahu • Digitální objekt • Data = soubor • Reprezentační informace = jeho smysl
4
4 Co je cílem dlouhodobé ochrany? Problémy Výzvy • Vyrovnání se se změnou • uživatelské komunity • užívaných nástrojů • Nárůst množství dat Řešení (dle Ex Libris) • Ochranné akce • Škálovatelnost • Flexibilita • Rozšiřitelnost • Komplexní systém
5
5 Ochranné akce
6
6 Škálovatelnost - architektura • Správa milionů objektů • Vkládání i dodávání desítek tisíc objektů denně • Redundance
7
7 Škálovatelnost - důkaz • White paper – Scaling Proof of Concept • http://www.Ex Librisgroup.com/files/Products/Preservation/Ros ettaScalingProofofConcept.pdf http://www.Ex Librisgroup.com/files/Products/Preservation/Ros ettaScalingProofofConcept.pdf • Vložení 200 000 souborů o velikosti 10KB za méně než 24 hodin. • Jedna instance Rosetty je schopna pojmout 50 milionů intelektuálních entit.
8
8 Flexibilita a rozšiřitelnost • Nástroje třetích stran • Transformátory • SDK - vstupní aplikace • Indigo • API • Nástroj pro správu plug-in • Integrace s existujícími systémy (CMS)
9
9 Flexibilita a rozšiřitelnost – integrační body Zpracování intelektuálních entit API pro vkládání SRU/SRW Autentikace Customizace uživatelského rozhraní Validační plug-in Plug-in pro obohacování Migrační plug-in OAI Prohlížeče Deep links Rosetta
10
10 Teoretické základy • PREMIS - PREservation Metadata: Implementation Strategies • Intelektuální entita • OAIS – Open Archival Information System
11
11 Intelektuální entita “Smysluplnná jednotka z pohledu uživatele a správy úložiště” 11/12
12
12 IE - interní
13
13 IE - zobrazení
14
14 OAIS Model
15
15 Vstup (Ingest) Ochrana (Preservation) Management Pracovní oblast Operační repozitář Permanentní repozitář/úložiště Manuální / Automatický Publikace SIP AIP DIP Dodávání DIP Vyhledávací nástroje ( ) Moduly
16
16 Deposit - vstup do systému • webové rozhraní • správa producentů • správa typů dat a procesů jejich zpracování • vstupní aplikace - SDK • vytvářeno na míru Výstupem balíček SIP
17
17
18
18 Pracovní oblast – Working Area • Zpracování přijatých objektů • Provádění ochranných akcí • Správa a provádění procesů • Kontrola • Obohacování
19
19
20
20 Permanentní repozitář • Trvalé uložení digitálních objektů • Minimální závislost na databázi a na SW aplikacích • Uchovávána je kompletní informace • Strukturální metadata • Popisná metadata • Administrativní metadata • Historie změn • Technická metadata • Verze objektů
21
21 Administrace systému • Konfigurace - webové rozhraní • Reporting - integrován BIRT • Správa uživatelů - integrace externích systémů - LDAP... • Auditing - uchování veškerých informacích o akcích prováděných v rámci systému • Monitorování
22
22
23
23 Výstup ze systému • Publikační část – zpřístupnění pro externí systémy (Primo) • OAI-PMH • SRU/SRW • Část pro dodání objektu • Prohlížeče • Rosetta může fungovat i jako light archive • Vše na jednom místě • Jednotná struktura dat • Bez ohrožení archivovaných objektů
24
24 Preservation (Ochrana) Zásadní přínos ve srovnání s digital asset managementem Management rizik • ochranné akce • plánování i provedení • znalostní báze • lokální i globální knihovny • Uchování i sdílení informací o formátech
25
25 Knihovna formátů • metadatový popis formátů • založeno na a propojeno se systémem PRONOM • možnost dodatečného doplnění formátů • informace o formátech je doplněna informací o aplikacích a rizicích • integrace s globální knihovnou • klíčové pro plánování ochrany i pro systém jako celek
26
26
27
27
28
28 Podpůrné knihovny • knihovna aplikací • knihovna klasifikačních skupin - skupiny formátů sdílející stejné vlastnosti (např. textové formáty • knihovna metadatových extraktorů - správa extrakčních nástrojů a jejich mapování vůči internímu formátu DNX
29
29 Ochranné akce Plánování ochrany (formát + risk = plán ochrany) Hodnocení alternativ (technická i obchodní kritéria) Permanent Storage Operational Storage Migration Action Provedení plánu (vytvoření a uložení nové verze) Komplexní systém pro aktivní ochranu
30
30 Plán ochrany Vytvoření plánu Testování plánu Výběr plánu Provedení plánu Analýza rizik
31
31 Správa rizik Identifikace rizik • průběžně na vstupu do systému • časovatelný proces • průběžná analýza – generování reportů Druhy rizik • Zastaralý formát • Chybějící aplikace pro zobrazení (v rámci instituce) • Rizikové vlastnosti (v rámci konkrétního formátu) • Rizika plynoucí z použitých nástrojů - rizikové vlastnosti formátů, které nejsou současné extraktory schopny zpracovat
32
32 Testování plánu Report o rizicích Výběr rizika Vytvoření množiny objektů na základě rizika Vytvoření ochranného plánu alternativ Spuštění testu
33
33 Hodnocení plánu Na základě kvantifikovatelných kritérií: • Technická kritéria • Finanční náročnost • Dostupnost nástrojů • Personální náročnost • …
34
34 Provedení plánu • Tvoří se verze objektů • Hodnocení výsledků • Řešení technických problémů
35
35 eliska.pavlaskova@multidata.cz
Podobné prezentace
© 2024 SlidePlayer.cz Inc.
All rights reserved.