Problematika velkého indexu Martin Vojnar
2 Problematika velkého indexu, Obsah předehra: jednotné prostředí velký index vs. metavyhledávání vytváření velkého indexu a jeho vlastnosti velký index a český obsah malá úskalí velkého indexu praktické ukázky otázky / diskuse
3 Problematika velkého indexu, a: jednotné prostředí
4 Problematika velkého indexu, Jednotné prostředí pro vyhledávání informací a dokumentů pro dodávání informací a dokumentů pro objevení nového používáte ho každý den ukázka
5 Problematika velkého indexu, Proč ? v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje byly původně označovány jako katalogy nové generace (next-gen OPACs) postupně se vyvinuly v tzv. „discovery“ systémy jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost užitečný nástroj v kontextu informační gramotnosti
6 Problematika velkého indexu, Cíle jednotného prostředí každý dotaz musí být prováděn ve všech zdrojích knihovny (tištěné, elektronické, digitalizované, …) výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací zobrazení plného textu na jedno kliknutí podpora SSO, integrace objednávání a čtenářského konta
7 Problematika velkého indexu, Co není jednotné prostředí pokud uživatel musí přecházet do jiných systémů pokud se musí uživatel opakovaně přihlašovat pokud uživatel ztrácí kontinuitu svého vyhledávání pokud uživatel musí začínat v „discovery“ systému (příklad)příklad pokud rozhraní nenabízí jednotné výsledky pokud rozhraní neumožňuje začlenění libovolného zdroje
8 Problematika velkého indexu, b: „discovery“ systémy
9 Problematika velkého indexu, Očekávání ze strany uživatelů* rychlé, jednoduché, intuitivní používání jediné rozhraní navigace pomocí faset DYM, návrhy/našeptávání RSS pokrytí relevantního obsahu základní přehled „discovery“ systémů *Marshall Breeding
10 Problematika velkého indexu, Přidaná hodnota „discovery“ jedno společné rozhraní = méně práce s lepším výsledkem konec informačního přehlcení díky: konfigurovatelné relevanci (zlato vs. šum) personalizaci výpočtu relevance seskupování výsledků (FRBR) doporučení zapojení uživatelů integrace s jejich prostředím komentáře / hodnocení čtenářské konto sledování novinek virtuální knihovnička
11 Problematika velkého indexu, Typické zdroje pro „discovery“ knihovní fond licencované databáze volně dostupné dokumenty a data (open access) digitální knihovny institucionální repozitáře … a další dle potřeb uživatelů různé formáty, různé oprávnění, různé instituce, různý význam discovery také může být zdrojem pro vyšší třídu vyhledávačů
12 Problematika velkého indexu, UI discovery discovery index
13 Problematika velkého indexu, UI discovery discovery index obsahuje různé zdroje
14 Problematika velkého indexu, UI discovery včetně elektronických zdrojů
15 Problematika velkého indexu,
16 Problematika velkého indexu, Anatomie vyhledávání index lokálních zdrojů index elektronických zdrojů (tzv. velký index) paralelní vyhledávání (tzv. metavyhledávání) – více v kapitole 2 externí vyhledávání (sám sebe, Solr, API, …) zadávání dotazů a jejich typy
17 Problematika velkého indexu, c: ukázka ~ Primo od Ex Libris
18 Problematika velkého indexu, Ukázka systému Primo (naživo později) elektronické zdroje: získání plného textu (přímé linkování, více zdrojů) doporučení, citovanost dostupnost seskupení (FRBR) čtenářské konto a objednávání z knihovního fondu otevřenost (aktuální články) lokální obsah (wikipedie, www stránky, české zdroje) metavyhledávání vs. velký index filozofie velkého indexu webové rozhraní pro administrátora
19 Problematika velkého indexu, d: konec úvodu
20 Problematika velkého indexu, Výzva pro knihovny sjednocení vyhledávacího prostředí sjednocení služeb na něj navázaných výsledek: efektivnější využívání zdrojů knihovny častější využívání zdrojů knihovny získání nových uživatelů opakované využívání zdrojů knihovny
21 Problematika velkého indexu, UI discovery včetně elektronických zdrojů ukázka: videovideo
22 Problematika velkého indexu, : velký index vs. metavyhledávání
23 Problematika velkého indexu, Změna filozofie velkého indexu paralelní vyhledávání = ve sbírkách velký index = v obsahu oddělení fáze vyhledávání a dodávání nepřihlášeným uživatelům: povoleno obojí povoleno jen vyhledávání není povoleno ani vyhledávání dodávání na základě elektronických holdingů (dostupnost)
24 Problematika velkého indexu, Příklad dostupnosti např. ve formátu pro Google Scholar JOURNAL Abacus ABACUS A JOURNAL OF ACCOUNTING FINANCE AND BUSINESS STUDIES ABACUS OXFORD
25 Problematika velkého indexu, Pro uživatele Metalibu význam paralelního vyhledávání velký index jako cíl v paralelním vyhledávání (obrat 180°) paralelní vyhledávání jako doplňková metoda přístupu v UI rozhraní velkého indexu příklad
26 Problematika velkého indexu, : jak vzniká velký index
27 Problematika velkého indexu, Plnění velkého indexu Ex Libris vs. tradiční agregátoři open aktivity v rámci JISC (RDTF, KBART, lis-oss aj.) smlouvy s poskytovateli různého typu (typicky na 3 roky) rozsah získávaných metadat: základní metadata + věcný popis + abstrakt + plný text
28 Problematika velkého indexu, Váš obsah ve velkém indexu (dnes) sbírky vs. tituly profil velkého indexu dostupnost na úrovni instituce analýza procentuálního zastoupení titulů počet elektronických titulů (ISSN/ISBN/název) počet předplácených titulů počet recenzovaných titulů
29 Problematika velkého indexu, Váš obsah ve velkém indexu (zítra) plnění je nekonečný proces řídí se podle cestovní mapy (ukázka) nikdy nebude 100%-ně úplný nikdy nebude 100%-ně aktuální petice IGELU
30 Problematika velkého indexu, Důraz na otevřenost velkého indexu během plnění (open discovery) jeho obsahu (open access, open data) jeho dostupnosti (open platform) zařazení do jiných rozhraní (open source) v budoucnu lze očekávat i kombinování více velkých indexů (např. lokální/globální, více globálních apod.), bude-li úspěšně vyřešena normalizace relevance
31 Problematika velkého indexu, Co je nejdůležitější na velkém indexu ? pokrytí relevance dostupnost rychlost odezvy neutralita možnosti konfigurace (jaké?) jak moc je důležité pokrytí lokálního obsahu ?
32 Problematika velkého indexu, : český obsah ve velkém indexu
33 Problematika velkého indexu, Dvě dimenze obsahu velkého indexu (nějaký) obsah je k dispozici online dostupnost obsahu pro daného uživatele (tj. instituci) jaký český obsah je k dispozici ?
34 Problematika velkého indexu, Potenciál českého obsahu SK ČR, ANL, registr digitalizace oborové bibliografie národní digitální knihovny (M+K+W) oborové digitální knihovny (DML-CZ) NUŠL placené zdroje (Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …) nová média: wiki, archivy vysílání, e-knihy publikační činnost / výstupy VaV nástroje pro podporu vzdělávání, doporučená literatura institucionální repozitáře (DSpaceCZ, digitalizace KNAV ČR, …) a další (?)
35 Problematika velkého indexu, Potenciál českého obsahu – pár čísel experiment v testovacím prostředí UK: katalog + kvalifikační práce ca 1 mil. záznamů ostatní ca 800 tis. záznamů, v tom: cswiki ca 200 tis. záznamů manuscriptorium ca 200 tis. záznamů ANL (online) ca 200 tis. záznamů BMČ (online), BDÚ (online), ZPB (online), GEOBIBLINE ca 60 tis. záznamů DML-CZ a NUŠL ca 100 tis. záznamů různé ca 50 tis. záznamů (Forum, Anopress IT, Kramerius NKP, …)
36 Problematika velkého indexu, Oborové bibliografie hlavní zdroj: oborové bibliografie týká se ANL týká se národních digitálních knihoven (K) týká se institucionálních repozitářů (digitalizace KNAV ČR) ukončení plnění ANL v NK ČR, udržování pro další knihovny průzkum stavu oborových bibliografiíoborových bibliografií
37 Problematika velkého indexu, Oborové bibliografie - výběr
38 Problematika velkého indexu, Spojení českého obsahu opravdu na jednom místě praktické zkušenosti: jednání, vysvětlování, … licencovaný obsah limitován předchozími smlouvami jak a kdo [bude chtít | by měl | může] tuto službu nabízet (knihovny vs. dodavatelé, licence, smlouvy, …) bylo by velmi vhodné zahrnout do strategie knihoven pár ukázek
39 Problematika velkého indexu, : ukázka ~ Primo od Ex Libris
40 Problematika velkého indexu, Ukázka systému Primo elektronické zdroje: získání plného textu (přímé linkování, více zdrojů) doporučení, citovanost dostupnost seskupení (FRBR) čtenářské konto a objednávání z knihovního fondu otevřenost (aktuální články) lokální obsah (wikipedie, www stránky, české zdroje) metavyhledávání vs. velký index filozofie velkého indexu webové rozhraní pro administrátora
41 Problematika velkého indexu, : shrnutí
42 Problematika velkého indexu, Pár zajímavých odkazů přehled nejlepších v analýze „Web Scale Discovery Services“ (Jason Vaughan, obsah není volně dostupný) Federated Search blog (Sol Lederman) services/ services/ Informační gramotnost uživatelů vs. vyhledávací nástroje nové generace (Vilém Sklenák, ProInflow) nove-generace nove-generace
43 Problematika velkého indexu, Jedno prostředí pro uživatele vyhledávací nástroje nové generace se na Vás tlačí velký index je toho součástí (jak moc je důležitý?) každý velký index jde svou cestou důraz na otevřenost jak velká míra kontrola ze strany knihovny je třeba?
44 Problematika velkého indexu, Otázky / diskuze.
45 Problematika velkého indexu, Některé z otázek je velký index luxus ? záleží na velikosti indexu ? jak otestovat rozsah indexu ? má smysl podpořit Open Discovery ? co to stojí a kdo to platí ? proč si to knihovny neudělají samy a lépe ? jakou míru kontroly chci mít nad velkým indexem ? jaké z mých sbírek jsou ve velkém indexu ? jaké zdroje / jaký obsah by tam mí uživatelé rádi viděli ?