Digitální knihovny Aktuální oblasti výzkumu Miroslav Bartošek MU Brno, Ústav výpočetní techniky.

Slides:



Advertisements
Podobné prezentace
DOI Digital Object Identifier
Advertisements

Open source systémy pro digitální knihovnu Martin Lhoták, Knihovna AV ČR, v.v.i. AKP, 16. května 2007, Liberec.
Internet ve službách archivu a archivace webu
Praha, Brno Nové komunikační možnosti systému Kramerius © Qbizm technologies, a.s. René Michálek
OPEN REPOSITORIES 2010 MADRID, 6. – MGR. LENKA NĚMEČKOVÁ ÚSTŘEDNÍ KNIHOVNA ČVUT.
Systémy na podporu DLs DSpace a Fedora Vlastimil Krejčíř & Petr Kovář ÚVT MU Brno.
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Systém dlouhodobé archivace z dílny Ex Libris - Rosetta Univerzitní knihovna v Bratislavě | Mgr. Eliška Pavlásková.
Open source vs. Komerční řešení pro digitální repozitáře
Český Internet po (uši v?) krizi Marek Antoš. snímek |datum |dokument | 1. Internetové prostředí 2.
1/11 VŠB-TUO Ostrava AMU = DAMU + FAMU + HAMU Dspace na AMU (budování repozitáře pro VŠKP) 1.Výchozí situace na AMU 2.Úpravy Dspace 3.Vazby.
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Dana Sigmundová E-books jako zdroj odborných informací ÚK FSS MU, Ústřední knihovna FSS MU.
Návrh architektury moderních informačních systémů
Projekt „Příprava národního registru vysokoškolských kvalifikačních prací“ Persistentní identifikátory v databázích eVŠKP Stručné shrnutí Petr Novák, Státní.
, Porada IT-SDRUK, Olomouc Portál STM: stav a výhled Martin Svoboda Státní technická knihovna, Praha
ZNALOSTI 2004 Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. Richard Papík – Martin Souček.
Eva Filípková Informační zdroje = zdroje, který přináší uživatelům informace, = zdroje, který přináší uživatelům informace, poznatky.
Audit IT procesů ve FNOL
Systémy pro zpřístupňování eVŠKP 2008, Brno Ing. Jan Mach, CIKS Vysoká škola ekonomická v Praze Přenos VŠKP pomocí protokolu OAI-PMH.
Praha Jan Mach Vysoká škola ekonomická v Praze Příprava Národního registru VŠKP a Národního úložiště šedé literatury Ing. Jan Mach
OR 2014 Helsinky : zpráva z konference Helena Kováříková Ústřední knihovna ČVUT.
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
1 Martin Vojnar Indexy a uživatelé paměťových institucí IKI, 17. ledna
Spolupráce lokálních institucí Seminář Komunitní role veřejných knihoven ZLÍN
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
13. února 2007Systém Kramerius, Martin Lhoták, KNAV1 Systém Kramerius aktuální stav a vývoj v roce 2007 Martin Lhoták, Knihovna AV ČR, v.v.i. SDRUK – IT,
Střednědobé uložení digitálních dokumentů a jejich autenticita (Miroslav Čejka, GORDIC spol. s r.o.)
Outsourcing jako strategický nástroj řízení nejen v komerční sféře
METADATA „Tvoří velice důležitou složkou geodat (prostorově lokalizovatelných dat) “ Renata Hrabinová.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Informační strategie. řešíte otázku kde získat konkurenční výhodu hledáte jistotu při realizaci projektů ICT Nejste si jisti ekonomickou efektivností.
Cisco Confidential © 2010 Cisco and/or its affiliates. All rights reserved. 1 Cisco Services Zbynek Pakandl / / comm
1 Vít Richter ISSS 2005 – Hradec Králové Národní knihovna ČR Mobil: Archivy, knihovny, muzea a jejich úloha při.
Digitální knihovny Miroslav Bartošek Ústav výpočetní techniky MU, Brno
Konference SI Praha Ladislav Přívozník is:energy czech a.s.
Relační databáze.
Uchování a trvalé zpřístupnění webových dokumentů zkušenosti z WebArchivu.
E-knihovna pro knihovníky Seminář E-knihy III, NTK,
Mgr. Pavla Rygelová Ústřední knihovna VŠB-TUO Novinky v projektu OpenAIRE plus.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Studijní informační zdroje (a jak se k nim dostat) Pro předmět Jazykový projev (2014/15) připravila Eva Cerniňáková Jabok - Vyšší odborná škola sociálně.
Dlouhodobé uchovávání a zpřístupňování dokumentů v digitální podobě
Identifikátory v digitálních knihovnách Martin Vojnar Vědecká knihovna v Olomouci.
Projekt realizace referenčního rozhraní Ing. Jan Pokorný Ministerstvo informatiky ČR ISSS, 5. dubna 2005.
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.1 Lucián Piller Intranet HR.
GIS??? Ve státní správě Karel Charvát. GIS?????? Je správné používat v souvislosti s využíváním prostorových informací ve státní správě, ale i v komerčním.
Co po nás zbyde… ISSS 2005 WebArchiv digitální archiv českého webu Markéta Škodová, Národní knihovna ČR.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
Web 2.0, folksonomie a uživatelská rozhraní Lenka Němečková Eliška Pavlásková Založeno mimo jiné na prezentacích prof. B. Whitea „The Promise of Rich User.
Budoucnost současných internetových zdrojů Mgr. Ludmila Celbová
NÁRODNÍ DIGITÁLNÍ ARCHIV
Informační kulturní portál
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
PLÁN DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DOKUMENTŮ V PRAXI Mgr. Andrea Fojtu, Mgr. Eliška Pavlásková ÚVT UK, ÚISK UK
Projekt Digitální knihovna AV ČR a vývoj systému Kramerius Martin Lhoták, Knihovna AV ČR AMK v digitálním světě 2005, Praha.
Využití NUŠL pro ukládání a zveřejňování výsledků výzkumu a vývoje V ČR Open Access: otevřený přístup k vědeckým informacím v EU a ČR Technologické centrum.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Datovýsklad Datový sklad V budoucích službách státního archivu.
TŘI ROKY DIGITÁLNÍHO UNIVERZITNÍHO REPOZITÁŘE UNIVERZITY KARLOVY Eliška Pavlásková, Andrea Fojtu Archivy, knihovny a muzea v digitálním světě.
Možnosti spolupráce při vytváření digitálních sbírek Ing. Martin Lhoták Knihovna AV ČR.
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
Základní problémy realizace eLearningového systému Roman Malo Ústav informatiky PEF MZLU v Brně.
1 Martin Vojnar Bibliografie jako nezbytná součást jednotného vyhledávaní SNK v Martine, 7. listopadu 2011.
Odbor digitálních fondů Zuzana Kvašová,
Digitální knihovny.
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Digitalizace úložiště, digitální knihovny, legislativa
Transkript prezentace:

Digitální knihovny Aktuální oblasti výzkumu Miroslav Bartošek MU Brno, Ústav výpočetní techniky

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Krátce z historie  1945Vannevar Bush („As We May Think“, Memex)  1965J.C.R. Licklieder („Libraries of the Future“)  60. létaMARC, OPAC (LoC, OCLC)  80. létafulltexty  poč. 90 C omputing + C ommunications + C ontents (nízká cena, vysoký výkon, široká dostupnost)  1994 Digital Library Initiative, www  nyní od experimentování k budování infrastruktury

Digitální knihovny = ?

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Definice DL (1) počítačnický pohled:  Digitální knihovna je spravovaná sbírka informací spolu s odpovídajícími službami, přičemž informace jsou uloženy v digitální podobě a jsou dostupné prostřednictvím sítě. W.Y.Arms, udržovaná, spravovaná dig. sbírka (maintained) - služby - vzdálený přístup

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Definice DL (2) knihovnický pohled:  Digitální knihovny jsou organizace, které poskytují zdroje (včetně specializovaného personálu) umožňující provádět výběr, strukturování a zpřístupnění sbírek digitálních prací, tyto práce dále distribuovat, udržovat jejich integritu a dlouhodobě uchovávat – a to vše s ohledem na snadné a ekonomické využití určitou komunitou nebo množinou komunit uživatelů. US Digital Library Federation, DL jako „instituce“ (např. knihovna) - důraz na systematickou organizaci a služby - cílenost DL (využívání určitou komunitou)

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Obecné znaky DLs  organizace digitální sbírky – klíčový problém  DL není jedna uzavřená entita (DLs)  heterogenní, dynamické a multimediální inf. zdroje  propojení autonomních inf. celků  transparentní propojení  koherentní přístup bez ohledu na formu, formát, způsob a místo uložení informací

Oblasti výzkumu DLs

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS obecná architektura DL intelektuální vlastnictví & ekonomika vícejazyčný přístup k informacím metadata interoperabilita globální vyhledávání zdrojů zobecněný model dokumenu dlouhodobé uchovávání digitální informace budování sbírek digitalizaceborn digitalharvesting

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Oblasti výzkumu DLs 1.Budování sbírek 2.Obecná architektura 3.Identifikace DO 4.Metadata 5.Interoperabilita, škálovatelnost 6.Vyhledávání zdrojů 7.IPR a ekonomika 8.Dlouhodobé uchovávání

1. Budování digitálních sbírek

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Budování sbírek  Digitalizace – rutinní záležitost  Born digital  pre-print archivy (ArXiv.org)  Sklízené DLs  ResearchIndex  WebBase  OAI  Archivace webu (Internet Archive, WebArchive)

2. Obecná architektura DLs

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Obecná architektura - význam Referenční model důležitý pro:  ustanovení jednotného slovníku  formalizaci představ o funkcích a fungování DL  komponent  služeb  vztahů  identifikaci potřebného middleware (underlying global infrastructure)

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Obecná architektura - přístupy  Kahn-Willensky Framework for distrib. DO Services DO, repozitář, RAP, identifikační systém, komponenty DL  FEDORA Flexible Extensible DO Repository Architecture  5S-model Societies, Scenarios, Spaces, Structures, Streams  Open Digital Libraries Extended PMH

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS KWF: komponenty DL => obraz DOUser interface4. display => digital object=> Repository - RAPUser interface => repository ID=> Handle systemUser interface3. retrieve => handle=> ItemUser interface2. select => list of items=> Search systemUser interface1. search

3. Identifikátory

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Jména a identifikátory  Hierarchie intelekt. děl (IFLA model)  Klasické knihovnické identifikátory ISBN, ISSN, SICI, BICI, ISTC, …  URN  PURL - persistentní URL  Systém „handles“  DOI - Digital Object Identifier

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Klasické knihovnické identif.  ISBN, ISSN, ISMN, … používány již cca 30 let  většinou jen pro „projev díla“ (viz IFLA model)  potřeba vícevrstvé identifikace :  autor ISADNIntl. Standard Authority Data Number  dílo ISTCIntl. Standard Textual Work Code ISANIntl. Standard Audiovisual Number ISWCIntl. Standard Musical Work Code (2001/11)  projev ISBNIntl. Standard Book Number ISSNIntl. Standard Serial Number  komponenta SICISeriál Item and Contribution Identifier BICIBook Item and Component Identifier  již existuje  návrh standardu  v diskusi

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Koncept URN  nevhodnost URL (identifikuje lokaci, nikoliv obsah)  URN - Uniform Resource Name  globálnost a nezávislost na lokaci  jednoznačnost (1 URN – 1 zdroj, ale 1 zdroj – x URN)  persistence („na věky“ – i po zániku zdroje)  škálovatelnost (granularita pro jakoukoliv „velikost“ zdroje)  legacy support (začlenění již existujících systémů)  rozšiřitelnost (na jakékoliv budoucí systémy)  resolvovatelnost (jak nalézt aktuální URL, metadata, …)  identifikace obsahu bez ohledu na lokaci: resoluční mechanismus ( URN –resoluce  URL/metadata/…)

4. Metadata

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Metadata  Klasická (knihovnická) metadata  vznik jednotný, centralizovaný  velký podíl ruční práce  komplexní popis  „síťová“ metadata  specializovaná, různé komunity/určení  propojování do složitějších struktur (XML, RDF, METS)  nová metadatová schémata  Dublin Core, INDECS, ONIX, …  „teorie“ metadat  požadavky na „dobře utvořená“ md-schémata

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Metadata - typologie a) z hlediska určení:  popisná (vyhledání, identifikace, selekce)  strukturální (uložení a zobrazování)  administrativní (řízení přístupu, archivace, …) b) dle oblasti nasazení:  popis/vyhledávání zdrojů (Dublin Core, MARC, RFC 1807, TEI)  identifikace (DOI metadata, BibTeX)  dlouhodobá archivace (OAIS model, OCLC-RLG)  IPR, e-commerce (INDECS, ONIX, MPEG-21)  hodnocení obsahu (PICS)  interoperabilita (METS, RDF)  formátově specializovaná (MPEG-7, TIFF)  oborově specializovaná (fyzika, CSDGM – GIS, medicína…)

5. Interoperabilita

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Interoperabilita ?  DL <> monolitický produkt = dynamický systém spolupracujících komponent „ The common vision is one of tens of thousands of repositories of digital information that are autonomously managed yet integrated into what users view as a coherent digital library system “ C.Lynch, H.García-Molina, IITA DL Workshop, 1995  interoperabilita : schopnost spolupráce mezi technicky různorodými a organizačně nezávislými komponentami  různé úrovně interoperability  povrchní sjednocení  syntaktická  hluboká sémantická

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Kritéria interoperability  kritéria míry interoperability:  vysoký stupeň autonomie komponent  nízká cena infrastruktury  snadnost přidání nové komponenty  snadnost používání komponenty  celková složitost  škálovatelnost v počtu komponent  optimalizace jednoho -> zhoršení jiného

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Metody interoperability  žádná (explicitní) spolupráce  webovské vyhledávače, ResearchIndex  silné standardy a federace  Z39.50, NCSTRL, …  lehkotonážní přístupy  OAI, OpenDL, OpenURL, SFX, …  nové nástroje/metodologie  ontologie, web-services, …

6. Vyhledávání zdrojů

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Vyhledávání - oblasti výzkumu  organizace při distribuovaném vyhledávání má každé řešení svůj organizační aspekt; vždy musí existovat určitá forma koordinace – má-li být vyhledávání efektivní  systémy systémová infrastruktura podporující vyhledávání (routing dotazů, mezirepozitářové protokoly, bezpečnost, soukromí, autentifikace, placení)  digitální obsah logický výběr inf.bází, dotazování netextových zdrojů, ratings, filtrace, přechod od vyhledávání explicitní informace k získávání implicitních poznatků (knowledge discovery, sémantický web)  rozhraní HCI: konstrukce dotazů, prezentace/vizualizace výsledků, task understanding, proces exposure  metriky taxonomie pro vyhodnocování různých řešení, testbeds

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Současné pokroky nejlepší výsledky : hrubá síla !  vyhledávání infomací - webovské vyhledávače  porozumění sémantice dokumentů - Deliver  vyhodnocování výsledků - Google  archivace digitálního dědictví - Internet Archive  citační analýza - ReserchIndex  reference linking - SFX  extrakce m-dat z multimediálních zdrojů - Informedia budoucnost: Sémantický web ! (?)

7. IPR a ekonomika

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Klíčové aspekty nasazení DL  „Technický rámec DL působí vždy v určitém legislativním, ekonomickém a sociálním kontextu“  ekonomika a legislativa (IPR) – úzce spolu souvisí Základní otázky : 1. funkce copyrightu u digitálních knihoven (jak vybalancovat veřejné právo na přístup k informacím s ekonomickými zájmy tvůrců a vydavatelů) 2. jak pokrýt různé nákladové položky v procesu vzniku, organizace, zpřístupňování, údržby, archivace dig.informace a dalších value added služeb (closed x open access) 3. technologie pro ochranu digitální-info před zneužitím (částečné zpřístupnění, HW zámky, steganografie, kryptologie, …)

8. Dlouhodobá archivace

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Archivace digitální info „Digital information is forever. It doesn’t deteriorate and requires little in the way of material media”. Andy Grove, Intel Corp. „Digital information lasts forever – or five years, whichever comes first.“ Jeff Rothenberg, RAND, 1995

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Hrozby pro dig. informaci Informace: obsah a formátování Technologické provedení (nosič) Změna obsahu Smazání obsahu Neplatný formát Nefungující software Destrukce fyzického nosiče Nedostupné čtecí zařízení hw/sw Degradace fyzického nosiče

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Digitální arch. strategie  replikace a refreshing  technické museum  migrace  emulace  POP – persistent object preservation  konverze do permanentní analogové formy  Referenční model OAIS (Open Archival Inf. Systém)  Rosetta Disk: 2“ niklová deska, litograf. nano-technologií vyrytý analogový text a obrázky ( stran, 2K-10K let)  Digitální archeologie

Zdroje informací

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Další zdroje info (1) časopisy  D-Lib  spec.čísla CACM 95/4, 98/4, 01/5  RLG DigiNews  ICSTI forum projekty na Inetu  obrovské množství info (musím ale vědět, co hledám)

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Další zdroje info (2) Konference (sborníky – viz LNCS-online)  Advances in DLs (IEEE)  ACM Conference on DLs  Joint Conference on DLs od 2001  European Conference on Research and Advanced Technologies for DLs od 1997

M.Bartošek: Digitální knihovny – oblasti výzkumu INFOS Děkuji za pozornost