Sbírka pdf dokumentů obrázkově Stránky dokumentu pdf jako grafický soubor (image)
Stránky jako posloupnost obrázků Princip: GSDL pomocí ImageMagic převede stránku .pdf dokumentu na obrázek Dokument se zobrazuje jako posloupnost obrazů Důsledek: žádná z nových stránek neobsahuje text Standardní formátování v GLI předpokládá text. Není-li, dostaneme zprávu „notext“ Musíme ručně testovat, zda je stránka typu .text nebo .img opink 8/11/2016
Založení cvičné sbírky pdfimg Nová sbírka: pdfimg Vstupní dokumenty: g: …podklady\vstupni_dokumenty\pdf\1314a_seznam_1.5studentu.pdf Ukázka: sb. oppd15im http://nb371h07.znet.vse.cz/greenstone/cgi- bin/library.cgi?site=localhost&a=p&p=about&c=oppd15im&l=en&w=utf-8 Sbírka založena na „New Collection“ opink 8/11/2016
Založení sbírky pdfimg - pokračování Přiřazení metadat dc – raději podrobnější Převod: pdfconversion Výběr a nastavení zásuvných modulů Vyloučení některých zbytečných – opatrně plugin PDFPlugin -process_exp (?i)\.pdf$ -OIDtype hash -convert_to pagedimg_jpeg opink 8/11/2016
Test sb. pdfimg bez úprav formátování Zobraz sbírku Očekávaný výsledek – dokument neobsahuje žádný text opink 8/11/2016
GLI a záložka format GLI – záložka format Nabídka vlevo: Format Features – otevřít Volba: Document Text Podmínka If Obsah podmínky: {if} {[NoText],[srcicon],[Text]} Význam podmínky: první operand: existence textu, když ano: druhý op., když ne, pak zobraz text opink 8/11/2016
O příkazu „format“ Elektronická kniha: How to Build a Digital Library, Scnd Ed. 2009 G:\PROJEKTY\4IZ250\PODKLADY\dokumenty\zakladni Kap. 10 Building collections, str. 463 Enhanced PDF documents handling opink 8/11/2016