Digitalizace úvod do problematiky Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 14. dubna 2011.

Slides:



Advertisements
Podobné prezentace
Základní škola národního umělce Petra Bezruče, Frýdek-Místek, tř. T. G. Masaryka 454 Projekt SIPVZ 2005.
Advertisements

Počítačová grafika.
Grafické formáty výukový text.
III/2 XVII AB
Téma č.2 Datové formáty grafiky, jejich specifika a možnost využití
ZÁKLADY GRAFIKY Ing. Tomáš Kostka UNIV 2 – KRAJE; TWS_02.
Ing. Jaroslav Parma.  Instalace programu ABBYY Fine Reader 10 Trial  Co to je PDF soubor  Práce s PDF dokumenty  Programy pro práci s PDF dokumenty.
Pavel Dvořák Gymnázium Velké Meziříčí Počítačová sestava – skener
PERIFERNÍ ZAŘÍZENÍ Skener
Výukový modul projektu: Nové formy výuky ve školách kraje Vysočina Projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky.
DIGITÁLNÍ UČEBNÍ MATERIÁL
Základy focení – Zlatý řez a formáty souborů ve fotografii
Webové formáty Bohumil Bareš. -1- Rozdělení grafických formátů  firemní (PSD, AI, FLA……)  univerzální (GIF, JPEG, TIFF, PNG…)  bitmapové (rastrové,
Základní škola národního umělce Petra Bezruče, Frýdek-Místek, tř. T. G. Masaryka 454 Projekt SIPVZ 2005.
Počítačová grafika Nagla Al Samsamová 4.B.
RASTROVÁ A VEKTOROVÁ GRAFIKA
Textový editor (další nástroje textového procesoru, export a import dat, PDF formát – čtení a tvorba)
Referát č. 18 Počítačová grafika, prezentace (základní pojmy a principy z oblasti počítačové grafiky, grafické a multimediální formáty, jejich vlastnosti.
Skener.
Počítačová grafika, prezentace
Číslo šablony: III/2 VY_32_INOVACE_P4_1.6 Tematická oblast: Hardware, software a informační sítě Práce se skenerem, skener Typ: DUM - kombinovaný Předmět:
Počítačová grafika 18. Marcel Svrčina.
Digitalizace knihovních dokumentů Jiří Polišenský.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Dagmar Vítková Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
DIGITALIZACE Datové formáty. Nekomprimované formáty původní algoritmy záznamu datových souborů umožnily pouze jejich převod do digitální podoby:  formát.
Lotus NotesJiří Beran Počítačová grafika. Lotus NotesJiří Beran Základní dělení počítačové grafiky: 1) Vektorová grafika – obrázek bereme jako množinu.
Základy počítačové grafiky
Užití skeneru.
Počítačová grafika a prezentace
Tomáš Veselý, Lukáš Ratkovský, Luboš Rauer.
Gymnázium, Žamberk, Nádražní 48 Projekt: CZ.1.07/1.5.00/ Inovace ve vzdělávání na naší škole Název: Grafické formáty Autor: Mgr. Petr Vanický.
Gymnázium, Žamberk, Nádražní 48 Projekt: CZ.1.07/1.5.00/ Inovace ve vzdělávání na naší škole Název: Základní pojmy počítačové grafiky Autor: Mgr.
Počítačová grafika.
Digitalizace knihovních fondů – praktické postupy
Barevná hloubka: Ukázky obrázků ještě jednou:
Informační a komunikační technologie PDF Implementace ICT do výuky č. CZ.1.07/1.1.02/ GG OP VK Studijní obor: Sociální péče Ročník: 4.
Počítačová grafika a CAD 1. Způsoby uložení grafické informace Rastr (grid, bitmapa …) Vektor.
Základní pojmy a principy
Poznámky k testu Z uvedených otázek je vždy jedna odpověď správná.
Univerzita třetího věku kurz Pokročilý Multimedia – Obrázky, Video a Hudba.
BMP – bitová mapa bez komprese Dnes se už nepoužívá TIFF – bezztrátový formát Používá se, když je potřeba uložit celý obrázek v maximální velikosti (publikace)
Název školyStřední odborná škola a Gymnázium Staré Město Číslo projektuCZ.1.07/1.5.00/ AutorMgr. Soňa Patočková Název šablonyIII/2.
Vytvoření dokumentu bylo financováno ze zdrojů Evropského sociálního fondu a státního rozpočtu ČR. Registrační číslo projektu: CZ.1.07/1.1.32/ Rastrová.
Vytvoření dokumentu bylo financováno ze zdrojů Evropského sociálního fondu a státního rozpočtu ČR. Registrační číslo projektu: CZ.1.07/1.1.32/ Počítačová.
EBooks on Demand – projekt evropské kooperace Věra Pospíšilíková – MZK, Kateřina Kamrádková – NTK AKM 2010.
Textový editor (další nástroje textového procesoru, export a import dat, PDF formát – čtení a tvorba)
Počítačová grafika Maturitní otázka č. 19 Martin Ťažký.
VYTVÁŘENÍ e-LEARNINGOVÝCH MATERIÁLŮ Přednáší Mgr. Jaromír Kozel
Grafika Kateřina Šebestová Grafika Druh výtvarného umění Více exponátů stále originály Vznik 6. století v Číně 868 první kniha 13. století tisk na plátno.
Grafické formáty Mgr. Petra Toboříková. Barevná hloubka barevné odstíny jsou dány kombinací barev barevná hloubka = určuje kolik bitů je potřeba k popisu.
Jakub Strnka. Legislativní rámec  zákon 300/2008 Sb.  o elektronických úkonech a autorizované konverzi dokumentů  novela zákona č. 499/2004 Sb.  zákon.
Inf Ztrátová a bezztrátová komprese zvuku. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
NÁZEV ŠKOLY:Základní škola a mateřská škola Bohdalov ČÍSLO PROJEKTU: CZ.1.07/1.4.00/ ŠABLONA:III/2 TÉMATICKÁ OBLAST:Informační a komunikační technologie.
TEXTOVÝ EDITOR Karin Tylšerová. Textový editor je software, kterým je možné editovat prostý text. Neobsahuje žádné informace o formátování, jako je použití.
3.3 scanery.  zařízení, které slouží ke snímání grafických dat a k jejich ukládání do počítače v digitální podobě.  data ukládá ve formě obrázku i text.
Počítačová grafika Rastrová a vektorová grafika Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Růžena Hynková. Dostupné z Metodického.
Periferní zařízení počítače - opakování
Rastrová grafika Základní termíny – Formáty rastrové grafiky.
Grafické programy - opakování
Výstupní zařízení počítače - skener
Grafika – opakování Číslo projektu CZ.1.07/1.5.00/
Textový Editor.
Sbírka evangelických časopisů z 19. a přelomu 20
Textový editor Lada Juráňová.
Výstupní zařízení - skener
Počítačová grafika základní pojmy. Počítačová grafika základní pojmy.
Základní pojmy z počítačové grafiky
Inf Formáty grafických souborů
Digitalizace knihovních dokumentů
Barvy v počítačové grafice
Transkript prezentace:

Digitalizace úvod do problematiky Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 14. dubna 2011

Otázka na úvod Jak získáme elektronický dokument?

Digitalizace převod info z analogové do digitální (elektronické) podoby formy informace  textové  obrazové  zvukové  jejich kombinacích

Proč digitalizujeme dostupnost informací úspora místa ochrana a archivace vyhledávání

Základní pojmy

Rozlišení rozdělení obrazu na síť pixelů pixel = jedna barva větší hustota (rozlišení) = větší kvalita = větší velikost souboru základní jednotka dpi (dots per inch) tisková kvalita od 300 dpi na web od 75 dpi

Barevná hloubka počet barev použitých při skenu černobílé skeny: čb nebo stupně šedi barevné skeny: 24-bitů+ zdravé oko vnímá okolo 4 mld. odstínů barev

Barevná hloubka - počty barev Druh obrazuPočet bitůPočet barev černobílý (bitonální, monochromatické) 12 1 = 2 stupně šedi (grayscale)82 8 = 256 odstínů šedi 8-bitový barevný (color)82 8 = bitový (high color) = bitový (true color) = bitový (super true color) = bitový (deep color) =

Komprese zmenšení velikosti souboru druhy komprese  ztrátová – vypuštění některých pixelů (např. podprahové), větší komprese zmenšuje soubor, ale snižuje kvalitu, trvalá a nevratná (JPG, MP3, MPEG, AAC)  bezztrátová – převod na matematický algoritmus, okolní barvy se dopočítávají, není tak účinná jako ztrátová, ale je vratná (GIF, PNG, TIFF, WMA Lossless, RealAudio Lossless, některé video kodeky – HuffyUV, Lagarith)

OCR Optical Character Recognition automatické rozpoznávání textu  obrazová předloha  analýza znaků  porovnání s DB (znaky, slova) kvalita OCR  přesnost rozpoznání  kvalita předlohy OCR pro národní jazyky

Nástroje - funkce profi i free nástroje, home verze ručně psané písmo – problémy podpora národních jazyků zachování layoutu a formátování  písmo, velikost, odstavce, obrázky označení bloků k rozpoznání ukládání jako PDF s txt vrstvou dávkové zpracování serverové verze

OmniPage

Omnipage nyní verze 18 různé licence  Standard, Professional, Enterprise 123 jazyků  vč. češtiny, nemá český interface přesnost 99% propojení se zařízeními a SW  Kindle, MS Office propojení na cloud úložiště  Evernote a Dropbox

Readiris

nyní verze jazyků (vč. češtiny) spolupracuje s MS Office konverze do PDF více info na Grafika.czGrafika.cz

Abby Fine Reader

verze jazyků (včetně češtiny) stejné funkce jako konkurence serverová verze více info na Grafika.czGrafika.cz PDF Transformer 3.0  převod PDF do editovatelné podoby

Free OCR

OCR zdarma pro Windows verze 3.0 vychází z Tesseract OCR EngineTesseract OCR Engine nemá české podklady horší kvalita výstupu solidní výsledky na podporované jazyky  ENG, GER, SPA, POR, NDL, ITA

Online služby OnlineOCR  32 jazyků včetně češtiny  dobrá kvalita, zachování v layoutu, výstupy do DOC, XLS, TXT  omezení (odpadnou po registraci) NewOCR  29 jazyků včetně češtiny  posloupnost odkazů, ale nezachová layout, dobrá kvalita  limity: obrázky 5MB, PDF (20MB)  bez registrace

Online služby Free OCR  29 jazyků včetně češtiny  dobrá kvalita, asi nejlepší  obrázky 5MB, jednostránkové PDF  capcha

ScanTaylor opensource komplexní nástroj pro úpravu dokumentů otáčení, spojování, odstraňování částí stránek, OCR nepodporuje PDF – PDF-TO-TIFFPDF-TO-TIFF

Články k nástrojům ed-softwaru-rozpoznavani-textu-ocr- jak-na ed-softwaru-rozpoznavani-textu-ocr- jak-na?page=0,1

Výstupní formáty

grafické  JPG, TIFF, PNG, GIF, BMP textové  TXT, RTF, PDF, DjVu

JPG (JPEG) Joint Photographic (Expert) Group nejrozšířenější formát ztrátová komprese (0-100%) malé soubory vhodné na web

BMP bitová mapa (bit map) složen z bodů neumožňuje kompresi

TIFF Tagged Interchange File Format podobný BMP ztrátová komprese

GIF Graphics Interchange Format v minulosti velmi populární využití u animovaných obrázků uchová max. 256 barev bezztrátová komprese

TXT Plain Text text bez formátování  pouze odstavce zpracuje jakýkoliv program pracující s textem

RTF Rich Text Format prostý text se základním formátováním Microsoft

PDF Portable Document Format Adobe komerční Adobe Acrobat prohlížení Reader volně dostupné programy  PDFCreator, PDFill PDF Tools a další PDFCreatorPDFill PDF Toolsdalší  kancelářské balíky: Open Office, MS Office 2010,…Open Office

DjVu konkurence PDF otevřený formát vhodný pro text, obrázky, kresby rozdělení do vrstev  výběr vhodné komprese = efektivnější komprese = malé soubory více info:

Hardware pro digitalizaci

Skenery kvalita skenování zvolit vhodný skener pro konkrétní druh dokumentu!!!

Ruční a tužkové skenery

problémy s kvalitou a přesností chyby při OCR (nejen) českých textů výhoda - přenosnost zařízení novější integrovaný disk

Plochý skener

stolní skener relativně kvalitní nízká cena  v multifunkcích již okolo 1000Kč formát A4 velkoformátové skenery odrážení světla na CCD snímač  čím tmavší, tím menší odraz světla = určení barvy

Rotační skener

bubnový skener profesionální využití kvalitní výstup nelze použít na knihy  upínání na válec extrémně drahé  stovky tisíc až mil. Kč

3D skener tvorba 3D modelů

Knižní skener oOXXpxzETA

Knižní skener fotografické skenery komplexní systémy  vč. PC a SW robotické skenery  otáčení stránek  extrémně drahé

Více info o skenerech Skenery a skenování  prelouc.cz/stranky/polygrafie_grafika_dro bek/dokumenty/maturita10/graf_18_ske n.pdf prelouc.cz/stranky/polygrafie_grafika_dro bek/dokumenty/maturita10/graf_18_ske n.pdf

Postup digitalizace

Výběr a příprava dokumentů vytipování dokumentů k digitalizaci různá kritéria výběru prohlédnutí a volba zařízení pro digitalizaci  záleží na typu dokumentu  digitalizace VŠKP na MU – rozřezání  vyčištění, narovnání listů, svorky,…  kvalita předlohy

Stanovení pravidel workflow = jednotný postup při digitalizaci, pravidla digitalizace uplatnění zejména v projektech a při vícenásobném skenování kvalita, rozlišení, komprese, formát,… záleží na typu dokumentu

Digitalizace provedení převodu dle pravidel kontrola na výstupu

Uložení do repozitáře zvolit vhodný archiv metadata vhodný formát zálohování

Využití digitalizace Kde se digitalizace využívá???

Použité zdroje ce-dokumentu#postup-digitalizace /Skenovani_%28digitali zace%29_dokumentu.htm ace_dokument%C5%AF

Závěr Děkuji Vám za pozornost Martin Krčál