Uchování a trvalé zpřístupnění webových dokumentů zkušenosti z WebArchivu
eBorn dokumenty
Množství obsahu roste Registrované domény v zóně.cz
Internet Archive (IA) americká nezisková organizace vznik průkopnický projekt podporováno: Library of Congress Smithsonian (muzejní organizace) archiv mezinárodního rozsahu tvorba open source software nástrojů: Heritrix (sklízení webu) Wayback Machine (zpřístupnění)
Záloha dat IA data Internet Archive mají od roku 2002 zrcadlo v rámci Bibliotheca Alexandrina
International Internet Preservation Consortium vznik 2003 – 12 zakládajících členů: Národní knihovny - Austrálie, Kanady, Dánska, Finska, Francie, Islandu, Itálie, Norska, Švédska, Britská knihovna, americká Kongresová knihovna a Internet Archive koordinace tvorby nových software nástrojů sjednocení pojetí - tvorba standardů pracovní skupiny - přístup, sklízení, ochrana, standardy
International Internet Preservation Consortium v roce rozšíření o nové členy celkový počet členů vzrůstá na 27 přijata i Národní knihovna ČR se svým projektem WebArchiv probíhá další kolo přijímacího procesu
Český projekt řešený od roku 2000 Národní knihovnou ČR spolupráce s: Moravskou zemskou knihovnou Ústavem výpočetní techniky Masarykovy univerzity
Typy sklizní celoplošné sklizně (tzv. harvesting) – delší interval např. v oblasti národní domény výběrové sklizně – kratší interval výběr hodnotných webových stránek s častými aktualizacemi spolupráce se střediskem ISSN tematické sklizně výběry materiálů k významným údálostem nebo specifickému tématu WebArchiv: Praha olympijská (2007); Nová budova Národní knihovny (2007); Volby (2006); Vysočina (2005); Dalimilova kronika (2005); Povodně (2002)
Průběh sklizní NEDLIB harvesterHeritrix Number of files
Kritéria pro sklízení profil každé sklizně je dán definicí kriterií
Kritéria pro sklízení - celoplošné sklizně technické aspekty – nastavení software snaha zachytit národní tvorbu na internetu v kompletu hlavním kritériem je národní doména dalšími kritérii jsou: formát, přístup, protokol, velikost souboru, počet souborů z 1 domény (2. úrovně – např. nkp.cz) řada národních dokumentů na webu je i na jiných doménách pracuje se na software pro rozpoznání jazyka sklizeň by se potom nemusela omezovat jen národní doménou
Kritéria pro sklízení - výběrové sklizně hodnocení člověka – kritéria výběru snaha zachytit hodnotné často aktualizované národní weby kritérii jsou: doména, národní aspekty, obsah, přístup, formáty, původní forma, typ
Technické řešení získání trvalé uložení zpřístupnění
Zpřístupnění - legislativa zpřístupnění – legislativní omezení – autorský zákon WebArchiv je dostupný pouze na terminálech v Národní knihovně a v Moravské zemské knihovně nutnost zamezit kopírování zdroje ve výběrových sklizních snaha zajistit neomezenou online dostupnost přes internet smlouva o poskytování elektronických online zdrojů nutnost změnit legislativu tvorba návrhu zákona týkajícího se uložení elektronických publikací zakotvení licence Creative Commons do české legislativy
Creative Commons (CC) licence je novým pojetím autorských práv – nová formulace: „všechna práva vyhrazena“ nahrazuje „některá práva vyhrazena“ CC znamená: volné užití díla bez nároku na finanční náhradu stanoveny podmínky (např. pouze pro nekomerční účely) při užití platí povinnost citovat původního autora CC umožňuje archivovat a online zpřístupňovat web namísto uzavírání smluv autor aplikuje licenci
Creative Commons (CC) možná cesta pro řešení problematiky archivace webu více zainteresovaných stran – řešení pro publikování na webu Pracujeme a chystáme: právní analýzu – vztah české legislativy k CC překlad licence do češtiny propagaci
Knihovnicko-administrační činnosti výběr výběrové sklizně tematické sklizně uzavírání smluv katalogizace (katalog NK ČR, ČNB) metadata – ve formátu Dublin Core
Management financování – zdroje: z vlastní instituce grantové spolupráce mezi institucemi: domácí mezinárodní propagace: letáky, brožury webová stránka, bannery příspěvky na konferencích
Národní digitální knihovna archiv webu má své místo ve sbírkách národních knihoven budování digitálních sbírek digitalizační projekty snaha zpřístupnit digitální sbírky z jednoho rozhraní Manuscriptorium (rukopisy a staré tisky) Kramerius (novodobé tisky – hlavně periodika, ale i monografie) WebArchiv
Děkuji za pozornost Tomáš Síbek Národní knihovna ČR – WebArchiv