LOCKSS Lots Of Copies Keep Stuff Safe Miroslav Bartošek Masarykova univerzita ÚVT MU.

Slides:



Advertisements
Podobné prezentace
IBM Global Technology Services © 2006 IBM Corporation Zabezpečení přístupu k informacím na základě elektronického podpisu Konference eČesko 2006.
Advertisements

Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Kateřina Raichová. Materiál je publikován pod licencí Creative Commons. ze sady:3tematický.
7. setkání zástupců krajů Mgr. Marcela Stratilová pracovník pro EV, oddělení mládeže a sportu, KÚOK.
Uvedení autoři, není-li uvedeno jinak, jsou autory tohoto výukového materiálu a všech jeho částí. Tento projekt je spolufinancován ESF a státním rozpočtem.
VY_32_inovace_01_infpojmynet1_01 Vypracovala: Mgr. Lucie Bernátová Datum: leden 2013 Předmět:Informační technologie Ročník:7. ročník Škola - adresa:Základní.
Číslo projektu: CZ.1.07/1.4.00/ Název DUM: Prostředí internetu Číslo DUM: III/2/VT/2/2/27 Vzdělávací předmět: Výpočetní technika Tematická oblast:
2OP484 Manažerská informatika 4Office doplňkySnímek 1 2OP484 Manažerská informatika 4 Office 365 Co nebylo ve skriptech
„Výzkumné infrastruktury“ a socioekonomické a humanitní vědy Informační seminář k připravovaným výzvám 7. rámcového programu v prioritách: „Socioekonomické.
Co je Open Access (OA) Bc. Miroslava Pourová. Open Access = Otevřený přístup mezinárodní iniciativa k zajištění: – trvalého – okamžité – bezplatného přístupu.
Systém správy dokumentace akreditované zkušební laboratoře Bc. Jan Randl, 4912.
OCHRANA PROTI PIRÁTSTVÍ Lenka Zatloukalová, Lucie Pavlíková, Jitka Zapletalová, Kateřina Wlachová, 1.a.
OPAC – jak dál? Nové technologie v knihovnictví Seminář KISK, VIKMB15.
Licence - povolení, oprávnění, svolení k užití programu - hranice mezi legálním užíváním, krádeží, přestupky z nedbalosti - za jejich použití (případně.
Síťové operační systémy OB21-OP-EL-KON-DOL-M Orbis pictus 21. století.
ŠKOLA: Gymnázium, Chomutov, Mostecká 3000, příspěvková organizace AUTOR:Mgr. Jiří Kolář NÁZEV:VY_32_INOVACE_08B_14_Internet1 TEMA:HARDWARE A SOFTWARE ČÍSLO.
ŠKOLA: Gymnázium, Chomutov, Mostecká 3000, příspěvková organizace AUTOR:Mgr. Jiří Kolář NÁZEV:VY_32_INOVACE_08B_15_Sítě_internet2 TEMA:HARDWARE A SOFTWARE.
Získávání dokumentů z externích zdrojů Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 4. dubna 2012.
Zpřístupňování informačních zdrojů včetně šedé literatury v Zeměměřičské knihovně Jiří Drozda, Veronika Synková Výzkumný ústav geodetický, topografický.
CESTA PRO CHYTROU BUDOUCNOST. SMART CITIES Teorie?Koncepce? Realita? Neohraničený urbanistický koncept Informační technologie pro efektivní správu měst.
Elektronická knihovna časopisů EZB Karolína Košťálová Národní knihovna ČR.
Jsou venkovské školy horší než městské?
PŘIHLÁŠENÍ K ELEKTRONICKÉ EVIDENCI TRŽEB
3. Odborná literatura, její zdroje na internetu a PřFUK
Tutoriál ~ eKnihy Stahování
Internet.
Informace a informační zdroje
Finanční zajištění EIZ na VŠB-TUO Kolik nás stojí a jak se využívají
Irena Baranayová Knihovna společenských věd T.G. Masaryka
Nina Suškevičová, Suweco CZ Olomouc,
METODIKA ZAVÁDĚNÍ UIS NA JINÝCH UNIVERZITÁCH
COM – Práce s objektovým modelem jiné aplikace
Informace a informační zdroje
Evaluace předmětů studenty (Anketky)
Hlavní město praha a integrace cizinců
EIZ - bilance Profesionální informační zdroje
STANDARDY KVALITY V SOCIÁLNÍCH SLUŽBÁCH „SKSS“
Architektura UIS Bc. Tomáš Procházka Sekce jádra systému Vývojový tým Univerzitního informačního systému Mendelova zemědělská a lesnická univerzita v.
Organizace a správa EIZ na MU
Metody knihovnické práce (VIKBA04)
Přístupový systém aneb kontrola vstupů
Minulost a současnost financování e-zdrojů na FSV UK
UNIVERZITA PALACKÉHO V OLOMOUCI
Software počítače 1 - opakování
Elektronické informační zdroje (VIKBA25)
SYSTÉM FINANČNÍHO PRÁVA
Informační zdroje v zoologii Zoological resources of information
Elektronické informační zdroje pro obor pedagogika
Název projektu: Od rozvoje znalostí k inovacím
EQF a Národní soustava kvalifikací v České republice
Digitální učební materiál
3. Odborná literatura, její zdroje na Internetu a PřFUK
Jak přispívat do Souborného katalogu ČR
Základní informace o programu
Jednotná informační brána jako studnice informací pro lékaře
Základy práce s informačními zdroji ZUR163
Akvizice e-knih Národní technickou knihovnou pro konsorcium CzechELib
Technická Evidence Zdravotnických Prostředků 1
ŠKOLA: Gymnázium, Chomutov, Mostecká 3000, příspěvková organizace
Remote login.
Výukový materiál zpracovaný v rámci projektu
Máte zájem o více informací?
Platforma pro personalizaci standardizovaných výukových materiálů
Identifikátor ORCID na ČVUT
3. Odborná literatura, její zdroje na internetu a PřFUK
KNIHOVNA UNIVERZITY PALACKÉHO V OLOMOUCI
Financování dopravní infrastruktury v letech 2018 – 2021
Analýza informačního systému
Martin VLASTNÍK, vedoucí oddělení politiky nerostných surovin
BIM – datový standard pro dopravní stavby
3. Odborná literatura, její zdroje na internetu a PřFUK
Transkript prezentace:

LOCKSS Lots Of Copies Keep Stuff Safe Miroslav Bartošek Masarykova univerzita ÚVT MU

LOCKSS – primární motivace Knihovny – uchovávat získaný obsah pro budoucnost Vědecké časopisy jen v e-podobě (na webu vydavatele) knihovny nekupují kopii obsahu, ale časově omezenou licenci na přístup Jak zajistit uchování při zániku předplatného/vydavatele? Inspirace v tištěném světě (purchase-and-own) každá knihovna archivuje svůj materiál knihoven je hodně – hodně kopií – lepší šance na přežití Uchování nezávislé na vydavatelích Jak na to? Implementovat systém sdílený mezi knihovnami. Požadavky: snadné finančně nenáročné dlouhodobě udržitelné spolehlivé (kontrola správnosti archivovaného obsahu) M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20162

LOCKSS – historie Stanford University Libraries Victoria Reich (Stanford HighWire Press) David Rosenthal (Sun Microsystems) 2014 LITA/Library Hi Tech Award for Outstanding Communication in Library and IT Legislativa – Digital Millenium Copyright Act Vydavatelé musí umožnit knihovně archivovat zakoupený obsah Vývoj a provoz 1998 – první idea, implementace 2000 – zkušební provoz LOCKSS (50 knihoven po světě) 2004 – ostrá produkční verze 2005 – demonstrace principů logické ochrany 2007 – samofinancující systém (free SW, paid support) 2015 – 500 knihoven, 500 vydavatelů, různé modely nasazení M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20163

LOCKSS – 3 modely Global LOCKSS Network síť knihoven uchovávajících svůj obsah (e-časopisy, e-books) LOCKSS Alliance – poplatky podle velikosti knihoven Stanford – centrální podpora CLOCKSS (Controlled LOCKSS) Dark archive pro vědecké časopisy vydavatelů – od 2006 Nevýdělečná organizace sdružující knihovny (275) a vydavatele (200) 12 archivačních uzlů po světě (strážci obsahu), Stanford TRAC audit (2014) – důvěryhodný repozitář Private LOCKSS Networks (PLNs) Speciální sítě lokálních komunit Libovolný obsah (nejen e-časopisy) Provoz v režii komunity (15 PLNs) M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20164

LOCKSS – charakteristiky Bezplatný open-source software LOCKSS deamon ( >200K řádků kódu v Javě) Peer-to-peer distribuovaná decentralizovaná síť LOCKSS uzly, každý komunikuje s každým každá knihovna uchovává svůj obsah (přirozené duplicity; min 7 kopií) Dlouhodobá archivace původně e-časopisy, dnes už cokoliv Udržitelný finanční model systém si vydělá na svůj provoz i rozvoj, tým na Stanfordu Rozsáhlá mezinárodní komunita knihovny a vydavatelé vědecké literatury (přes 1000 partnerů) Nejen bit-level, ale komplexní LTP-system (?) alespoň podle letákových tvrzení… M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20165

LOCKSS – technologie LOCKSS deamon (Java) Instaluje se na běžné linuxové PC Přetvoří linuxový systém na archivační aplikaci – LOCKSS box Ingest dat (web harvesting a FTP) – archivační jednotky (AU, ročník časopisu) Kontrola integrity AU (LOCKSS: Polling and Repair Protocol) Zpřístupnění obsahu (proxy na vydavatele x lokální kopie z LOCKSS boxu) Stav a statistiky Administrace přes webové rozhraní Plugins adaptují obecné chování LOCKSS deamona pro konkrétní chráněný obsah (např. časopisy vydavatele Taylor & Francis) Instance java-programu parametrizovatelná přes XML-soubor LOCKSS box – provádí kontinuálně: 1. Ingest : shromažďuje nový obsah (nová čísla časopisů apod.) 2. Preserve : porovnává obsah se stejným obsahem v jiných LOCKSS boxích – oprava poškození 3. Disseminate : monitoruje přístup uživatelů k obsahu, při výpadku vydavatele ho sám poskytuje M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20166

1. Global LOCKSS Network Celosvětová peer-to-peer síť (aktuálně 150 uzlů) Každá knihovna – lokální LOCKSS box s vlastním obsahem sklízení obsahu z webu vydavatelů – archivační jednotky AU (ročník časopisu) lokalizace uzlů uchovávající stejné AU (25 – medián počtu kopií AU) ověřování shody obsahu AU detekce poškození obsahu a opravy AU nahrazením chybné za správnou poskytnutí obsahu z LOCKSS boxu, pokud je nedostupný od vydavatele Přes časopisů od 530 vydavatelů (long-tail 70 %, 1000 titulů) Lokální provoz uzlů (knihovny) + centrální správa sítě (Stanford) LOCKSS Alliance – financování; členské poplatky knihoven dle velikosti, 2 – 12K USD/rok (vydavatelé zdarma) technická podpora při nastavení a provozu lokálního LOCKSS uzlu začleňování nových vydavatelů/časopisů rozvoj systému LOCKSS M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20167

2. CLOCKSS – jak pracuje 1. Nastavení přístupu k e ‐ časopisu Vydavatel zřídí přístup (web, FTP) 2. Ingest: sklízení webu Tři spec CLOCKSS uzly provedou sklizeň 3. Verifikace obsahu Jsou všechny 3 verze identické? 4. Archivace Nakopírování obsahu na 12 arch uzlů 5. Ochrana Průběžná kontrola integrity + opravy 6. Trigger event Migrace + přenos na 2 veřejné servery 7. Přístup OA přístup k uvolněnému obsahu M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE Dark-archive vědeckých časopisů 200 vydavatelů, 275 supporting libraries (Nature, Elsevier, Springer, Wiley, …) Trigger event – časopis se stává OA

2. CLOCKSS Přes 200 vydavatelů Velcí hráči (Nature, Elsevier, Springer, Wiley, …) Snaha přilákat i malé vydavatele, jejichž uchování je nejvíce ohroženo Motivace: ochrana obsahu bez nutnosti vlastního LTP řešení Roční poplatek podle obratu vydavatelství (225 USD – USD) Archivace e-časopisů, e-knih a dalšího obsahu Aktuálně 29 triggered časopisů Přes 275 supporting libraries Motivace: přispět k ochraně světového e-obsahu Roční poplatek podle výše akvizičního rozpočtu (450 USD pro rozpočet pod 1 milión USD – USD pro rozpočet nad 25 mil USD) CLOCKSS Advisory Council CLOCKSS Boards of Directors M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE 20169

3. Private LOCKSS Networks MetaArchive Cooperative (největší, 50 institucí ze 3 zemí, noviny, ETD, fotky, hudba, …) Alabama Digital Preservation Network (historické archiválie, obrazové kolekce, databáze) Canadian Government Information (11 CA institucí, vládní informace) CARINIANA Instituto Brasileiro de Informaçãoem Ciência e Tecnologia (1000 e-časopisů, ETDs) CLOCKSS Archive Council of Prairie and Pacific University Libraries (COPPUL) Consortium (9 CA universit) Data Preservation Alliance for the Social Sciences (social science data, vedoucí Harvard) Digital Commons (materials published on BePress platform) Digital Federal Depository Library Program (preserving born-digital government documents) LOCKSS und KOPAL Infrastrucktur und Interoperabilitat (Germany) PKP Public Knowledge Project (archivace pro časopisy pod OJS) PNAS Proceedings of the National Academy of Sciences (e-journals of US Academy of Science) Persistent Digital Archives and Library System – PeDALS (knihovny a archivy v Arizoně) SAFE Archiving Federation (5 institucí z BE, CA, DE – localy published OA sci publication & data) Synergies (Canadian humanities & socsci research results) M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE

LOCKSS a logická ochrana „The LOCKSS system is sometimes criticized as providing only bit-level preservation, but this is a misunderstanding“ Systém využívá i běžné postupy/nástroje logické ochrany Identifikace a ověřování formátů (FITS) Migrace formátů Extrakce a tvorba metadat Rozdíl je v tom, kdy se tyto postupy uplatní Vše s výjimkou kontroly integrity se odkládá tak dlouho, jak jen to jde Neprovádí se preemptivní hromadné migrace/normalizace Migrace jen individuálních uživatelem vyžádaných souborů (je-li nutná) Uchovávají se vždy jen a pouze původní bity (ne nové verze z migrací) Demonstrace koncepce 2005, v praxi se ale nevyužívá (formáty v LOCKSS nepodléhají zastarávání) Zastarávání aktuálně nehrozí -> neplýtvejme na to naše omezené zdroje Čím pozdější migrace/emulace, tím kvalitnější nástroje budou k dispozici M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE

LOCKSS – pilotní projekt v ČR? Konference PASIG 2016 v NTK (březen) Schůzka Rosenthal/Taylor se zástupci českých knihoven „Neměli byste zájem LOCKSS v ČR vyzkoušet/nasadit?“ Pilotní projekt na PLN How to set up a Private LOCKSS Network PLN – minimálně 6 uzlů CZ-pilot – najdou se vážní zájemci k odzkoušení technologie? Archivace OA časopisů Bit-level technologie pro ARCLib Archivace zakoupeného obsahu konsorciálních EIZ atd. M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE

M. BARTOŠEK: LOCKSS -- OTEVŘENÉ REPOZITÁŘE Děkuji za pozornost. Dotazy?