MANUSCRIPTORIUM: vize virtuálního badatelského prostředí Zdeněk Uhlíř Národní knihovna České republiky Praha – ÚISK
Vznik Manuscriptoria integrace a zpřístupnění originálních historických dokumentů zdigitalizovaných v programu MEMORIAE MUNDI SERIES BOHEMICA integrace a zpřístupnění originálních historických dokumentů zdigitalizovaných v programu MEMORIAE MUNDI SERIES BOHEMICA vytvoření otevřeného/souborného katalogu historických fondů vytvoření otevřeného/souborného katalogu historických fondů
Co je MANUSCRIPTORIUM nyní digitální knihovna sdružující: digitální knihovna sdružující: katalogové záznamy katalogové záznamy digitální obrazy digitální obrazy plné texty plné texty největší digitální knihovna zpřístupňující starší historické dokumenty na světě největší digitální knihovna zpřístupňující starší historické dokumenty na světě cena UNESCO Džikdži 2005 cena UNESCO Džikdži 2005
MANUSCRIPTORIUM do škol mutace pro pomoc výuce na základních a středních školách mutace pro pomoc výuce na základních a středních školách výběr dokumentů podle témat výběr dokumentů podle témat doplnění dokumentů o plné texty doplnění dokumentů o plné texty edice primárních dokumentů edice primárních dokumentů sekundární dokumenty sekundární dokumenty instruktivní návody pro využití při výuce instruktivní návody pro využití při výuce
Vyhledávání dokumentů jednoduché jednoduché kombinované kombinované způsoby – možnosti: způsoby – možnosti: defaultně operátor OR defaultně operátor OR tolerance tolerance grafické varianty grafické varianty řetězec/fráze řetězec/fráze ve fulltextu ve fulltextu strukturovaně strukturovaně
Prohlížení obrazů stupně komprese – stupně kvality: stupně komprese – stupně kvality: galerie galerie náhled/preview náhled/preview nižší/low nižší/low vyšší/normal vyšší/normal černobílá/black and white optimisation černobílá/black and white optimisation nejvyšší/excelentní kvalita v MANUSCRIPTORIU zpřístupňována není nejvyšší/excelentní kvalita v MANUSCRIPTORIU zpřístupňována není zooming zooming
Partneři MANUSCRIPTORIA účastníci programu MEMORIAE MUNDI SERIES BOHEMICA – cca 40 institucí v Česku účastníci programu MEMORIAE MUNDI SERIES BOHEMICA – cca 40 institucí v Česku slovenští partneři užívající téže technologie – UK Bratislava, KAV Bratislava slovenští partneři užívající téže technologie – UK Bratislava, KAV Bratislava partneři evropského projektu ECH:TOPICC – KAV Vilno, UK Budapešť, NUK Lublaň partneři evropského projektu ECH:TOPICC – KAV Vilno, UK Budapešť, NUK Lublaň individuální partneři – BU Vratislav, BN Varšava, NUK Záhřeb, VK Oděssa, NK Ankara individuální partneři – BU Vratislav, BN Varšava, NUK Záhřeb, VK Oděssa, NK Ankara partneři evropského projektu ENRICH – 19 plných, cca 10 přidružených partneři evropského projektu ENRICH – 19 plných, cca 10 přidružených partneři rakouského projektu MONASTERIUM partneři rakouského projektu MONASTERIUM
Evropská digitální knihovna dlouhodobá snaha MANUSCRIPTORIA o integraci dalších partnerů v mezinárodním a nadnárodním rámci dlouhodobá snaha MANUSCRIPTORIA o integraci dalších partnerů v mezinárodním a nadnárodním rámci soustavné úsilí o vůdčí postavení v Evropě soustavné úsilí o vůdčí postavení v Evropě projekt ENRICH: projekt ENRICH: síťová integrace síťová integrace znalostní web – ontologie (evropský projekt VICODI) znalostní web – ontologie (evropský projekt VICODI) multilingvalismus multilingvalismus heterogenita heterogenita
Integrace MANUSCRIPTORIA JIB – Jednotná informační brána JIB – Jednotná informační brána TEL – The European Library TEL – The European Library CERL Manuscripts Portal CERL Manuscripts Portal
Virtuální prostředí dnes síťová integrace – fyzická agregace do jediné databáze síťová integrace – fyzická agregace do jediné databáze jednotný vnitřní standard – heterogenita standardů v integrovaném síťovém prostředí jednotný vnitřní standard – heterogenita standardů v integrovaném síťovém prostředí konceptuální rámec/datový model – ideologie markupu/katalogizační pravidlo konceptuální rámec/datový model – ideologie markupu/katalogizační pravidlo flexibilita funkčních struktur – zneužití tagu flexibilita funkčních struktur – zneužití tagu
Virtuální prostředí - představa katalogové záznamy – evidenční záznam + vážené doplňující záznamy katalogové záznamy – evidenční záznam + vážené doplňující záznamy digitální obrazové kopie digitální obrazové kopie plné texty primárních dokumentů plné texty primárních dokumentů plné texty sekundárních dokumentů plné texty sekundárních dokumentů audio primárních dokumentů audio primárních dokumentů video sekundárních dokumentů video sekundárních dokumentů multimodální dokumenty multimodální dokumenty
Virtuální prostředí v budoucnu – to jednodušší virtuální realita – faktoid -> jedno-jednoznačná korelace fyzických originálních dokumentů a digitálních kopií i elektronických katalogových záznamů virtuální realita – faktoid -> jedno-jednoznačná korelace fyzických originálních dokumentů a digitálních kopií i elektronických katalogových záznamů využití OCR pro vyhledávání využití OCR pro vyhledávání exemplářový (item) – bibliografický záznam (manifestation) exemplářový (item) – bibliografický záznam (manifestation) sdružování/clustering: sdružování/clustering: exemplářové -> bibliografické záznamy exemplářové -> bibliografické záznamy exemplářové záznamy -> institucionální sdružení exemplářové záznamy -> institucionální sdružení
Virtuální prostředí v budoucnu – to složitější vyhledávání podle ontologií/sémantických sítí vyhledávání podle ontologií/sémantických sítí vyhledávání podle komplexů/syntagmat vyhledávání podle komplexů/syntagmat využití komplexů pro citační analýzu/bibliometrii využití komplexů pro citační analýzu/bibliometrii sdružování/clustering plných textů primárních dokumentů na základě míry podobnosti sdružování/clustering plných textů primárních dokumentů na základě míry podobnosti vytváření virtuálních dokumentů vytváření virtuálních dokumentů
Virtuální prostředí v budoucnu – to nejobtížnější sémantické vyhledávání nad celou databází (primární, sekundární, terciární dokumenty) sémantické vyhledávání nad celou databází (primární, sekundární, terciární dokumenty) sémantický multilingvalismus sémantický multilingvalismus využití komputační lingvistiky pro rozpoznání fluidního textu a práci s ním využití komputační lingvistiky pro rozpoznání fluidního textu a práci s ním obousměrné/protisměrné větvení (FRBR předpokládá pouze jednodměrné shora): obousměrné/protisměrné větvení (FRBR předpokládá pouze jednodměrné shora): nejenom: work -> expression -> manifestation -> item, nejenom: work -> expression -> manifestation -> item, ale i: item -> manifestation -> expression -> work, ale i: item -> manifestation -> expression -> work, tudíž také: problém worxpression tudíž také: problém worxpression multilingvalismus textové tradice multilingvalismus textové tradice
ukázky (1) Manuscriptorium do škol Manuscriptorium do škol preview plných textů preview plných textů
ukázky (2) JIB TEL CERL Manuscripts Portal CERL Manuscripts Portal
DĚKUJI ZA POZORNOST