Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Avi.lib.cas.cz Company LOGO E-Prints a Digitální knihovna AV ČR Roman Chýla

Podobné prezentace


Prezentace na téma: "Avi.lib.cas.cz Company LOGO E-Prints a Digitální knihovna AV ČR Roman Chýla"— Transkript prezentace:

1 avi.lib.cas.cz Company LOGO E-Prints a Digitální knihovna AV ČR Roman Chýla

2 avi.lib.cas.cz Company LOGO Obsah Základní informace o Dig.Knihovně AV ČR „politická situace“ vize a cíle Podrobnější info o E-Prints Výhody Problémy Existující řešení Na čem pracujeme (či chceme)

3 avi.lib.cas.cz Company LOGO D-KNAV Kramerius Digitální knihovna 57 časopisů, digitalizováno 2 mil. stran, zpřístupněno 760 tis. (GScholar nám má pomoci indexovat další) Digitalizace pokračuje Eprints Rozšíření D-KNAV Flexibilní – schopná pojmout prakticky jakýkoliv typ dokumentů Na rozdíl od Krameria obsahuje logické jednotky obsahu Chceme oba systémy spojit a vytvořit jednotnou digitální Knihovnu AV ČR

4 avi.lib.cas.cz Company LOGO

5 avi.lib.cas.cz Company LOGO Politická situace AV ČR cca 65 vědeckých časopisů Přesné číslo stále není známo D-Knav je v „polo-oficiálním“ provozu asi rok Zkušební provoz únor-březen 2008 Takže existuje asi 13 měsíců D-Knav dnes obsahuje 13 časopisů S různým časovým pokrytím plných textů Většinu tvoří časopisy AV ČR Ale jsou přítomny i dva externí časopisy A hlásí(ly) se další externí

6 avi.lib.cas.cz Company LOGO Politická situace II S časopisy uzavíráme smlouvy Zejména kvůli zpřístupňování mimo AV ČR Autorsko-právní posudek Politika KNAV je velmi vstřícná potřebám časopisů Snažíme se jim pomáhat (nikoho nenutíme) Knihovna spravuje systém (technicky) a časopisy spravují svou vlastní produkci

7 avi.lib.cas.cz Company LOGO Cíle a vize Cíl(e): Archivovat kompletní časopiseckou produkci AV ČR v el. podobě Získat pro spolupráci všechny časopisy AV ČR Zpřístupnit pokud možno co nejvíce článků koncovým uživatelům Jak jsme na tom s plněním? Oblast humanitních věd se podařilo oslovit (máme teď asi 50%) V ostatních oblastech zaostáváme, avšak: Publikační systém (8-9 časopisů) Měli jsme jiné priority (tedy doufám, že se polepšíme…)

8 avi.lib.cas.cz Company LOGO Další dopady Existuje mnoho dalších důvodů, proč ukládat plné texty do DKNAV Knihovnu lze využít jako doplněk tradiční tištěné podoby časopisu Ekonomické důvody Žádný z časopisů si nemůže dlouhodobě dovolit podobné investice –Správa software a jeho vývoj –Údržba hardware –Zabezpečení dat –Podpora uživatelů Nové možnosti publikování

9 avi.lib.cas.cz Company LOGO Časopisy v DKNAV DKNAV CEJSH OAI GScholar

10 avi.lib.cas.cz Company LOGO Proč E-Prints? Zvažovali jsme jak obecné CMS tak i DSpace, Fedoru, E-Prints, Invenio Vybrali jsme si Fedoru Ale Fez (frontend napsaný v PHP) se ukázal při testování jako příliš nezralý A protože potřebujeme, aby dig. Knihovna fungovala, E-Prints bylo nejmenší zlo Proti DSpace (v době rozhodování) hovořilo: Neexistence API pro správu objektů Naše neznalost (Java) Z čehož plynou pro nás závažné problémy: Rozšiřitelnost, správa uživatelských práv…

11 avi.lib.cas.cz Company LOGO Výhody E-Prints Můžeme se spolehnout, že základní věci budou fungovat Vkládání dokumentů (GUI) OAI Indexace apod. E-Prints dokážeme rozšiřovat (i když to bolí…) E-Prints umí uložit prakticky cokoliv (konfigurovatelné typy dokumentů, jejich struktura) Základní workflow vyhovuje potřebám D-Knav Schvalování obsahu Exportní formáty (MODS, METS, DC….)

12 avi.lib.cas.cz Company LOGO Některé ze zásadních kladů Skriptování jako jedna ze zásadních předností E-Prints nemá web API (resp. má, ale není dobře otestované) Avšak má API pro správu objektů Prakticky 90% veškerého obsahu se do knihovny dostává pomocí strojových importů Existuje dobrá dokumentace a tutoriály Systém je rozšiřitelný („napojitelný“ na externí) Poměrně dost instalací a uživatelů (základní věci fungují dobře – jsou odzkoušeny) Diskusní list a komunita kolem E-Prints

13 avi.lib.cas.cz Company LOGO Problémy Problémy s UTF-8 Řetězce jsou ukládány (a zpracovávány) jako byty Šokující zjištění V základní instalaci nemůže fungovat pro většinu jazyků (mimo iso ) „Nikomu“ to zvlášť nevadí (2008!) V naší instalaci jsme opravili Zůstávají problémy s architekturou S budoucími upgrade –Vývojáři plánují plnou podporu UTF-8 pro verzi >3.1.2 (naše 3.05)

14 avi.lib.cas.cz Company LOGO Diakritika

15 avi.lib.cas.cz Company LOGO Na úrovni kódu… Perl, modperl & Apache Obtížné debugovat Nezdá se, že vývojáři mají úplně jasno v OO Objekty jsou definovány a mají strukturu Ale metody k jejich manipulaci nejsou jasné –Modul, který vytvoří objekt $->{feature}=x –O několik úrovní dál jiný modul $->{feature}=y Některé zásadní nejasnosti ve zpracování unicode a utf-8 Celý program je zbytečně složitý Už 2x jsem viděl hl.vývojaře komentovat slovy: „víme o té chybě, ale nevíme, kde vzniká“ Počet testunits: 0

16 avi.lib.cas.cz Company LOGO Plnotextové indexování Index = tabulka v databázi (MySQL) Obstojně v současné situaci, ale pro budoucí potřeby nevhodné zvláště po zapojení dat z Krameria Náš buoucí přístup: Externí indexovací nástroj E-Prints jako přístupové rozhraní GUI Přístupová práva

17 avi.lib.cas.cz Company LOGO Vlastní plnotextové vyhledávání DKNAV obsahuje vlastní podrobné vyhledávání Specificky podle polí Včetně plného textu Lze prohledávat celou knihovnu, nebo vybrané kolekce DKNAV má obsahovat (v budoucnu) všechny ročníky, tj. produkci časopisu ve své úplnosti To bude jedinečný zdroj Časopisy mohou integrovat vyhledávání do svých vlastních stránek Výsledky vyhledávání povedou do DKNAV

18 avi.lib.cas.cz Company LOGO Formulář pro podrobné vyhledávání

19 avi.lib.cas.cz Company LOGO Statický obsah Velká část toho, co vidí anonymní uživatelé, je staticky generovaný obsah Zobrazení článku Rejstříky Šablony (includes) Některé změny v (databázi, v šablonách) se tedy promítnou do zobrazení až se zpožděním Motivací je zřejmě úspora CPU Filesystém však „bobtná“ Dle mého názoru zbytečné (a dává to vývojářům falešnou představu, že E-Prints je rychlý)

20 avi.lib.cas.cz Company LOGO

21 avi.lib.cas.cz Company LOGO Vzhled Lokalizace bez problémů (každý jazyk má své xml s překlady: ID text) Pro změnu generovaného obsahu je ve většině případů nutný zásah do kódu Naštěstí většina z něj je v konfiguraci E-Prints používá XML-DOM Velmi „low-level“ Není snadné měnit vzhled Velká většina instalací má standardní design

22 avi.lib.cas.cz Company LOGO Statistiky Existuje modul pro sledování statistik Zastaralý, bez dokumentace Ukládá informace o přístupu do databáze Access log Apache Nutno zpracovávat zvlášť V současnosti (bohužel) nevyřešeno Awstats? Google analytics?

23 avi.lib.cas.cz Company LOGO Přístupová práva Kdo má právo zobrazit plný text Lze nastavit embarg o V budoucnu podrobnější nastavení

24 avi.lib.cas.cz Company LOGO Přístupová práva Pro každý jednotlivý článek, ale i skupiny článků lze nastavit Individuální uživatele Přístup díky heslu Rozsah IP adres odkud je možné Přístup podle lokace (fyzického umístění)‏ Kombinace obou Vyšší bezpečnost i kontrola: např. přístup pouze z počítačů Archeologického ústavu, pouze pro uživatele XY V DKNAV bude rozhraní pro nastavení přístupu Pověřená osoba (z řad redakce) má právo kdykoliv práva změnit

25 avi.lib.cas.cz Company LOGO Co chceme řešit Fulltextové vyhledávání Napojení Krameria a E-Prints Statistiky Grafické rozhraní pro správu přístupových práv Registrace DOI Platební brána Dlouhodobá archivace E-Prints sice tyto problémy neřeší, ale zároveň nám nestojí v cestě.


Stáhnout ppt "Avi.lib.cas.cz Company LOGO E-Prints a Digitální knihovna AV ČR Roman Chýla"

Podobné prezentace


Reklamy Google