Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. Richard Papík – Martin Souček Ústav informačních.

Podobné prezentace


Prezentace na téma: "Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. Richard Papík – Martin Souček Ústav informačních."— Transkript prezentace:

1 Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. Richard Papík – Martin Souček Ústav informačních studií a knihovnictví, Filozofická fakulta,Univerzita Karlova, Praha ZNALOSTI 2004

2 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Současná paradigmata

3 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Digitální svět

4 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

5 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Vytěžování informačních zdrojů

6 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Současné přístupy k problematice vyhledávání informací Na problematiku vyhledávání lze pohlížet mnohostranně a jako na mezioborovou disciplínu. Informační a knihovní věda se velmi intenzívně zabývá problematikou vyhledávání informací. T. SARACEVIC (1997) interakce s informačními systémy (BELKIN, VICKERY) informační potřeby a užití informací (DERVIN, NILES) psychologický výzkum v oboru human-computer interaction (BORGMAN) projektování systémů, např. založených na řízených menu (SHNEIDERMAN) online vyhledávání v databázích (FENICHEL, BELLARDO)

7 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

8 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

9 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

10 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

11 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

12 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

13 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha „Viditelný“ versus „neviditelný“ web, volný internet versus profesionální zdroje

14 Přístup k dialogovým systémům všeobecně Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

15 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Druhy dokumentů, druhy bází dat, „moment zpoždění“

16 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Informační zóny

17 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Databáze NTIS jako příklad textové databáze

18 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Rešeršní strategie

19 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

20 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

21 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Pojem digitální knihovna Pojem digitální knihovna (DL – digital library) používá se frekventovaně, ale není vždy úplně jasné, co je tímto pojmem přesně myšleno pojem pokrývající celou řadu činností, které směřují k moderním způsobům práce s digitálními fondy dva základní přístupy: spravované sbírce informací organizace poskytující informace v digitální formě.

22 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Společné vlastnosti DL v rámci různých přístupů klíčovou úlohu hraje organizace datové sbírky, nikoliv vlastní digitalizace klade se důraz na interoperabilitu a spolupráci s dalšími subjekty obsah DL je přirozeně různorodý, heterogenní, multimediální jednotné uživatelské rozhraní pro všechny druhy a libovolné umístění dokumentů

23 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Kahn-Wilenského architektura DL bylo třeba vytvořit infrastrukturu DL, která by umožňovala: kooperaci digitálních knihoven formalizaci představ o funkcích jednotlivých prvků DL vznikl model, který podali Kahn a Wilensky prosadil se dnes jako standard jedna z prvních implementací tohoto modelu byla např. v projektu National Digital Library

24 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Schéma digitálního objektu Elementárním stavebním kamenem modelu je digitální objekt, kterým se rozumí datová struktura pro samostatně použitelnou elementární informační jednotku. identifikátor (handle) transakční log signatura obsah metadata

25 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Uložení digitálních objektů DO jsou uloženy v úložištích - repozitářích, které mají přiřazeno jednoznačné globální jméno. každý repozitář komunikuje s okolím prostřednictvím jednoduchého repozitářového přístupového protokolu RAP (Repository Access Protocol), umožňujícího ukládání a pozdější zpřístupnění digitálních objektů. dalším prvkem architektury je tzv. handle-systém, sloužící jako globální resoluční mechanismus (pro digitální objekt určený svým identifikátorem vrátí seznam repozitářů, které tento objekt udržují)

26 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Globální identifikace digitálních objektů V rámci DL je třeba mít identifikační systém, který musí být: jednoznačný (celosvětově), trvalý, škálovatelný, resolvovatelný klasické knihovnické: ISBN, ISSN, ISADN, ISTC... URN.. identifikuje objekt v rámci registrovaného identifikačního systému PURL.. využít url ale odstranit závislost na lokaci (OCLC) systém „Handels“.. distribuovaný glob. systém s centrální administrací DOI.. systém pro identifikaci prací chráněných copyrightem

27 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Metainformace, metadata DC – Dublin Core Metadadata Kongresové knihovny MARC RDF

28 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Interoperabilita, kooperace DL Schopnost spolupráce mezi technicky různorodými a organizačně nezávislými celky. používané standardy: Z39.50 OAI - Open Archive Initiative: sklízecí protokol OpenURL - propojování zdrojů od různých producentů

29 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Právní a ekonomické prostředí Hlavní problémy a úkoly lze shrnout do několika bodů:  vyvážení ekonomických a autorskoprávních hledisek DL  optimalizace zájmů : autor, nakladatel, prodejce, zákazník  problém s národní legislativou – internet je bez hranic  pro tiskové dokumenty komplikovaná situace s copyrightem

30 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Case study: ArXiv.org unikátní repozitář digitálních plných textů články, vědecko-výzkumných a technických zpráv, disertací založen jako automatizovaný systém pro ukládání a distribuci dokumentů v roce 1991 v rámci Národní laboratoře v Los Alamos v současné době je vlastněn, provozován a financován v rámci Cornell University, (částečná finanční podpora jde také z National Science Foundation) zahrnuje 5 vědních oblastí fyziku matematiku nelineární vědy počítačovou vědu kvantitativní biologii

31 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Case study: ArXiv.org otevřený archiv splňuje požadavek svobodného publikování a volného přístupu k vědeckým informacím nabízí možnost jak rychle publikovat a efektivně sdílet čerstvé vědecké poznatky umožňuje publikovat rozsáhlé práce jako disertační práce, výzkumné zprávy řeší autorskoprávní problémy tím že poskytuje nástroj, který využívají sami autoři

32 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Case study: ArXiv.org dokumenty přijímány ve formátech TeX/LaTeX, případně HTML+PNG/GIF, PDF a PS, vkládání přes WWW, FTP i ; zhruba elektronických dokumentů a registrovaných uživatelů přímé vyhledávání přes WWW rozhraní podle předmětové oblasti, názvu, autora a slov z referátu; zobrazování a download dokumentu ve zvoleném formátu jednoduchý citační index v testovacím provozu SDI servis pro zájemce k dispozici pres vyhledávání probíhá v názvech a anotacích (využívá booleovské operátory); je iniciátorem a hlavním účastníkem Iniciativy pro propojování elektronických archívu OAI - "The Open Archives Initiative"

33 Digitální knihovnyZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Case study: ArXiv.org

34 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Etapy vyhledávacího procesu Rešeršní (vyhledávací) proces může být složen z následujících kroků (GOLDMANN, 1992, s.75): připojení (spolu s „logon“ procedurou) výběr báze dat provedení rešerše tisk (resp. download) výsledků odpojení se od systému („logoff“ procedura)

35 Průběh relace s dialogovým systémem (Budil – Kastl, 1989) Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

36 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

37 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha So: Arnold, S.A., Online Information 1999, London Simpler and Easier Are Better than More Powerful and Complex Systems

38 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha So: Arnold, S.A., Online Information 1999, London

39 Operátory Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha proto. Operátory a další elementy je obecně možno rozdělit: AND OR NOT (w), (n), (l), (a), (s), near, with, adj - proximitní ( ) - závorky

40 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Marchionini 1995 / klíčové procesy

41 Hodnocení systémů Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha Problematikou vyhledávání se prolíná „čtveřice“ pojmů: relevance pertinence úplnost přesnost

42 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha

43 Databázová centra a databáze ZNALOSTI 2004 Ústav informačních studií a knihovnictví, FF UK, Praha


Stáhnout ppt "Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. Richard Papík – Martin Souček Ústav informačních."

Podobné prezentace


Reklamy Google