Projekt WebArchiv „Získávání, archivace a zpřístupnění domácích webových zdrojů“

Slides:



Advertisements
Podobné prezentace
Internet ve službách archivu a archivace webu
Advertisements

Souborný katalog ČR pod systémem ALEPH 500 Knihovny současnosti 2003 Národní knihovna ČR PhDr. Eva Svobodová – Mgr.Danuše Vyorálková Souborný katalog ČR.
Mgr. Ludmila Celbová Národní knihovna ČR
Zpřístupnění digitálního archivu
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Zkušenosti se zpracováním elektronicky dodaných záznamů seriálů do Souborného katalogu ČR Danuše Vyorálková
INFOS 2009 Věra Jurmanová Volemanová FF MU Brno
Elektronické informační zdroje a české právo Plzeň Elektronické informační zdroje II Česko-saská síť knihoven Vít Richter
1 Repozitář MU Mgr. Michal Petr Odbor pro akademické kvalifikace a kvalitu
2005 Elektronické vysokoškolské kvalifikační práce.
Iva Horová: Zpřístupňování eVŠKP Olomouc, SDRUK, IT Zpřístupňování eVŠKP současný stav a záměry.
Iva Horová: Zpráva Komise eVŠKP za rok , Olomouc CPVŠK Zpráva o činnosti za rok 2006 Odborná komise pro otázky elektronického zpřístupňování.
Aktuality. Novela knihovního zákona  Staré:  d) umožnění přístupu k vnějším informačním zdrojům, ke kterým má knihovna bezplatný přístup, pomocí telekomunikačního.
AUTORSKÝ ZÁKON A ZPŘÍSTUPŇOVÁNÍ DIGITÁLNÍCH DOKUMENTŮ
Vyhledávání v archivu českých webových zdrojů Mgr. Jan HUTAŘ Bc. Lukáš MATĚJKA Mgr. Ludmila CELBOVÁ.
Moravská zemská knihovna a zpřístupňování starých map.
Politika výběru elektronických zdrojů publikovaných v prostředí Internetu Mgr. Ludmila Celbová
Praha Jan Mach Vysoká škola ekonomická v Praze Příprava Národního registru VŠKP a Národního úložiště šedé literatury Ing. Jan Mach
8. prosinec 2009, PrahaSeminář ASEP Spolupráce Národního úložiště šedé literatury (NUŠL) a ústavů AV ČR Iveta Fürstová
E-PK aktuální stav služeb DDS Markéta Hlasivcová Zuzana Švastová ÚIV - NPKK.
, Elektronické služby knihoven prakticky, Praha Portál STM Lucie Hejná Státní technická knihovna
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Systémy pro zpřístupňování VŠKP: zkušenosti, možnosti, nabídky, potřeby … Seminář Brno,
1 Martin Vojnar Indexy a uživatelé paměťových institucí IKI, 17. ledna
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
Přístup k národnímu webovému archivu Tomáš Síbek a Lukáš Gruber.
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
Zpřístupnění plných textů vědeckých publikací v prostředí systému Medvik Helena Bouzková, Filip Kříž, Lenka Maixnerová, Eva Lesenková, Ondřej Horsák, Adéla.
Studijní IS a publikační činnost Jitka Brandejsová 8. října 2014 Fakulta informatiky Masarykovy univerzity.
Školení pro nové zaměstnance NK ČR Praha – Souborný katalog ČR jako informační zdroj.
Záměry Knihovny Antonína Švehly v oblasti poskytovaných služeb pro knihovníky Knihovna Antonína Švehly 2014.
1 Vít Richter ISSS 2005 – Hradec Králové Národní knihovna ČR Mobil: Archivy, knihovny, muzea a jejich úloha při.
SDRUK-IT Možnosti využití programového vybavení WebArchivu dalšími subjekty Ing. Petr Žabička, MZK.
Uchování a trvalé zpřístupnění webových dokumentů zkušenosti z WebArchivu.
Oborová informační brána KIV Jak ji využívat. Bránu KIV vytvořili Hlavní garant: Knihovnický institut NK ČR Technologie: Ústav výpočetní techniky UK v.
UŽITÍ DÍLA § 12. (4) Právem dílo užít je a) právo na rozmnožování díla (§ 13), b) právo na rozšiřování originálu nebo rozmnoženiny díla (§ 14), c) právo.
Elektronické knihy v knihovnách Antonín Pokorný
WebArchiv – digitální knihovna českého webu Petr Žabička Moravská zemská knihovna v Brně Rufis 2002.
Dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě
Legislativní otázky týkající se problematiky online elektronických zdrojů Mgr. Iva Celbová
, Konference muzejních knihoven, Brno Paměťové instituce a duševní vlastnictví Martin Svoboda Státní technická knihovna, Praha
Archiv českého webu (Webarchiv) a CC Lukáš Gruber.
Příprava novely autorského zákona Celostátní porada vysokoškolských knihoven Hradec Králové Vít Richter Národní knihovna ČR
110 let služby české historické obci Projekt Bibliografie dějin Českých zemí Věra Hanelová INFORUM ročník mezinárodní konference o profesionálních.
Zpřístupnění elektronických zdrojů z digitálního archivu - jak a pro koho - Mgr. Ludmila Celbová Markéta Simonová Martina Tatranská.
Co po nás zbyde… ISSS 2005 WebArchiv digitální archiv českého webu Markéta Škodová, Národní knihovna ČR.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A5 Nástroje informatiky pro získávání informací a jejich zpracování.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
Praktické zkušenosti s naplňováním směrnice rektora o závěrečných pracích na Ostravské univerzitě v Ostravě Mgr. Jarmila Krkošková Bc. Šárka Kostecká Univerzitní.
Budoucnost současných internetových zdrojů Mgr. Ludmila Celbová
Příprava novely knihovního zákona, novela autorského zákona Regionální funkce knihoven listopadu 2005 Národní knihovna ČR Tel.
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Šedá literatura (Gray literature) Martina Machátová Tel.: Aktualizace:
Přístup k národnímu webovému archivu Tomáš Síbek a Lukáš Gruber.
2006 Úpravy směrnice a prováděcího předpisu pro eVŠKP na UTB ve Zlíně.
Archiválie a archivní pomůcky na portálu Badatelna.cz
Datovýsklad Datový sklad V budoucích službách státního archivu.
TŘI ROKY DIGITÁLNÍHO UNIVERZITNÍHO REPOZITÁŘE UNIVERZITY KARLOVY Eliška Pavlásková, Andrea Fojtu Archivy, knihovny a muzea v digitálním světě.
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
Databáze Bibliografie dějin českých zemí jako cesta k plným textům v domácích i zahraničních knihovnách Václava Horčáková Elektronické služby knihoven.
Digitální autoarchiv Národní lékařské knihovny Mgr. Lenka Maixnerová Národní lékařská knihovna.
Petr Žabička Moravská zemská knihovna v Brně Možnosti technického řešení.
Odbor digitálních fondů Zuzana Kvašová,
Pilotní projekt NK ČR Dobrovolné uložení elektronických publikací Mgr. Martin Žížala Oddělení doplňování domácích dokumentů.
Odbor doplňování a zpracování fondů
e-PK aktuální stav služeb DDS
Copy on demand Martin Krčál (ÚK FSS MU) Zdeněk Kadlec (ÚK FF MU)
Elektronické prezenční zpřístupňování dokumentů a jejich tisk Věra Jurmanová Volemanová Dr. Ing. Zdeněk Kadlec Martin Krčál E-prezenční výpůjčka / M.Krčál.
MOŽNOSTI PORTÁLU KNIHOVNY.CZ NEJEN PRO KNIHOVNÍKY
Transkript prezentace:

Projekt WebArchiv „Získávání, archivace a zpřístupnění domácích webových zdrojů“

Projekt WebArchiv (*2000) „Získávání, archivace a zpřístupnění domácích webových zdrojů“ Nositelé:  Národní knihovna ČR  Moravská zemská knihovna v Brně Hlavní řešitelé: Mgr. Ludmila Celbová  Mgr. Ludmila Celbová  Ing. Petr Žabička Spoluřešitelé: Markéta Simonová  Markéta Simonová  Petra Kačírková Externí spolupráce:  Ústav výpočetní techniky Masarykovy univerzity v Brně

Strategie vytváření digitálního archivu Kompletní archiv Kompletní archiv  harvesting Výběrový archiv Výběrový archiv  selektivní výběr Kombinace obojího Kombinace obojího  harvesting + selektivní výběr Implementace  Implementace  např. Dánsko (projekt Netarchive.dk)  Česká republika (projekt WebArchiv)

WebArchiv český národní projekt Problém je v legislativě  zákony o povinném výtisku  autorský zákon Smlouvy o poskytování elektronických online zdrojů  2 verze Stanovení kritérií výběru dokumentů Zpřístupnění archivu + vyhledávání Báze Web 01  tvorba +vyhledávání Spolupráce  na národní úrovni  na mezinárodní úrovni

Problém je v legislativě Zákony o povinném výtisku  Zákon č. 37/1995 Sb.  o neperiodických publikacích  „zahrnuje rozmnoženiny literárních, vědeckých a uměleckých děl určené k veřejnému šíření“  nosič zmíněn není  vztahuje se pouze na monografické publikace  Zákon č. 46/2000 Sb.  tzv. tiskový zákon  vztahuje se pouze na tištěné publikace  celkem 19 paragrafů, povinnému výtisku věnován pouze §9 Nevyhovují – nutná novelizace!

Problém je v legislativě Zákony o povinném výtisku Důvody novely  zachování národního kulturního dědictví  online zdroje přibývají a zároveň nenávratně mizí  právní zastřešení činností WebArchivu  udržení kontaktu s „vyspělými“ zeměmi Návrh řešení  definice základních pojmů  poskytování a zpracování zdrojů  přístup k archivovaným zdrojům Očekávané výsledky  zachování národního kulturního dědictví  NK ČR - naplnění funkce depozitní knihovny  registrace a archivace většího počtu zdrojů  spolupráce s digitálními archivy v mezinárodním měřítku

Problém je v legislativě Autorský zákon zákon 121/2000 Sb. vytváření digitálního archivu: ANO  § 37(1) AZ: „Do práva autorského nezasahuje knihovna, archiv a jiné nevýdělečné školské, vzdělávací a kulturní zařízení, zhotoví-li rozmnoženinu díla pro své archivní a konzervační účely.“  za předpokladu: nic nezpřístupňovat  problém: databáze zpřístupnění digitálního archivu: NE  zpřístupnění pouze „vydaných děl“  § 38(1) AZ: „Do práva autorského nezasahuje osoba uvedená v § 37 odst. 1, půjčuje-li originály či rozmnoženiny vydaných děl  vydané dílo = dílo v hmotné podobě  online zdroj (viz §4 a §14)

Problém je v legislativě Autorský zákon řešení?  novelizace AZ  udělení výjimek knihovně z AutZ.  směrnice 2001/29/ES (O informační společnosti)  dovoluje knihovnám zhotovování rozmnoženin nad rámec pouhé interní archivace či konzervace (čl.5/2(c))  umožňuje sdělování nebo zpřístupňování autorských děl, která má knihovna ve svých sbírkách, na vyčleněných terminálech ve svých prostorách jednotlivým členům veřejnosti za účelem výzkumu nebo soukromého studia (čl.5/3(n))  kolektivní správce – Dilia  nutno znát majitele autorských práv  Vydavatel? Autoři článků? Majitel domény?....?  uzavírání smluv s vydavateli

Smlouva o poskytování elektronických online zdrojů 2 verze Smlouvy  Koncový uživatel má přístup k archivovaným dokumentům přes Internet  koncový uživatel = kdokoli s přístupem na Internet  Koncový uživatel má přístup k archivovaným dokumentům pouze z vyhrazených terminálů v budovách vybraných knihoven  koncový uživatel = registrovaný uživatel knihovny

Smlouva o poskytování elektronických online zdrojů Práva a povinnosti Národní knihovny:  vybrané elektronické online zdroje:  vyhledávat, stahovat, ukládat, tvořit kopie, trvale uchovávat  nést veškeré náklady spojené s vytvářením digitálního archivu  katalogizovat vybrané zdroje (UNIMARC, MARC 21)  zahrnout vybrané zdroje do ČNB Práva a povinnosti vydavatele:  souhlasí s činnostmi vykonávanými NK  souhlasí, aby se jeho zdroje staly součástí ČNB  poskytuje své zdroje Národní knihovně zdarma  zavazuje se vytvářet metadata dle standardu Dublin Core a vkládat je do hlavičky svého zdroje (dle verze Smlouvy)metadata dle standardu Dublin Core

Současný WebArchiv uzavřeno  16 smluv pro online přístup 16 smluv  4 smlouvy pro lokální přístup

 není možné archivovat veškerý online obsah  technické důvody  ekonomické důvody (vč. ceny dlouhodobého uchovávání a zpřístupňování)  zaměření archivující instituce  legislativní rámec  hledání optimálního řešení  omezení rozsahu podle účelu archivu (rozdělení rolí)  dlouhodobá ekonomická udržitelnost Kritéria výběru zdrojů do archivu

Prozatímní kritéria výběru zdrojů do archivu Dle místa uložení zdroje  je obtížné správně vymezit tzv. národní web  podobnost s tradičním vymezením bohemikálních dokumentů  doména prvního stupně.cz  dnes i.com,.net,.org a další Dle obsahu zdroje  zdroje s vysokou informační hodnotou (subjektivní)  vyjmuty zejména zdroje: reklamní povahy, firemní prezentace, …. Dle typu zdroje  zejména seriály, konferenční sborníky, výzkumné a jiné zprávy, studie apod.

Prozatímní kritéria výběru zdrojů do archivu Dle formy zdroje  pouze zdroje, které existují jen v online podobě Dle přístupu  pouze volně přístupné zdroje Dle formátu  všeobecně podporované formáty jako html, xml, jpg, gif, txt, pdf Dle protokolu  především http, částečně i ftp

Doména.cz Současné kolo sklízení probíhá od Sklízení bylo zahájeno s počáteční množinou cca serverů doposud staženo přibližně 15 milionů unikátních dokumentů z cca 17 milionů adres v současné době registrováno v doméně.cz cca domén 2. úrovně zatím sklizeno 400 GB (komprimovaných) dat

Doména.cz - relativní četnost souborů v archivu podle typů

Doména.cz - zastoupení hlavních typů souborů v archivu podle objemu dat

Zpřístupnění archivu data uložena na diskovém poli, kde zabírají celkem 815 GB v komprimovaném tvaru volné zpřístupnění jen tam, kde je uzavřena smlouva s vydavatelem závislost na kapacitě a výkonu hardwaru testování dvou nástrojů  NWA toolset – nepodporuje češtinu, problémy při indexaci plynoucí z malého praktického testování  český indexer – vyvinutý studenty MFF UK pro projekt webarchiv

Nordic Web Archive – časová osa

WebArchiv indexer – výsledky hledání

Národní bibliografie báze WEB 01 samostatná zkušební báze v rámci elektronického katalogu Národní knihovnybáze zkatalogizované zdroje vybrány na základě selekčních kritérií WebArchivu primární funkce bibliografická (ČNB) prozatím uloženo cca 100 záznamů

Záznamy v bázi WEB 01 UNIMARC  doplnění několika polí dle metadatového standardu Dublin Core přechod na MARC 21 – podzim 2004 použitelnost v různých systémech  konverze do Dublin Core  konverze do Metalibu apod. prostřednictvím pole 856 přístup do digitálního archivu

Spolupráce na národní úrovni  archivace dokumentů veřejné správy s ukončenou platností  metadata dle standardu Dublin Core pro všechny dokumenty veřejné správy  využití SW nástrojů WebArchivu  Portál veřejné správy Portál veřejné správy  UK Central Government Web Archive (*2003) UK Central Government Web Archive  možnost archivace online zdrojů je součástí elektronického formuláře žádosti o ISSN  oslovování potenciálních vydavatelů  propagace projektu

Spolupráce na mezinárodní úrovni využívání volně dostupných nástrojů vyvinutých konsorcii  NEDLIB  Nordic Web Archive  netpreserve.org spolupráce při odhalování chyb standardizace Web Archiving workshop při konferenci ECDL

Spolupráce s knihovnami Pokud znáte elektronický zdroj, který vychází pouze v online podobě a splňuje nastíněná kritéria NAPIŠTE NÁM! Pokud znáte vydavatele takového zdroje (regionální zdroj) POVĚZTE MU O NÁS!

Děkujeme za pozornost! Workshop, , INFORUM 2004