CODEG 4 nástroj pro podporu OCR a tvorbu rozšířených metadat

Slides:



Advertisements
Podobné prezentace
Dílčí báze Seriály Souborný katalog ČR České Budějovice, prosinec 2006 Danuše Vyorálková.
Advertisements

Specializovaná databáze pro výzkum astronomie a astrofyziky Mgr. Radka Svaškova, Astronomický ústav AVČR, v. v.i.
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Podpora dostupnosti a kvality sociálních služeb v Pardubickém kraji Úvodní seminář k projektu Pardubice
Knihovny současnosti 2011, České Budějovice 13. – 15. září 2011
Mgr. Iva Celbová konzultant SEFIRA spol. s r.o.
Strategie Jihovýchod – jsou kraje připraveny na budoucnost?
Ing. Petr Štefan Kp-sys s.r.o. CPVŠK Praha
Digitalizace knižního a časopiseckého fondu v muzejních knihovnách.
Koncepce rozvoje a řízení vědy a výzkumu
Digitální publikace a e-knihy v Ústavu pro českou literaturu AV ČR Pavel Janáček, Michal Kosák, Praha,
„Výzkum, vývoj a inovace ve statistikách a analýzách“ 20. dubna 2012 Aktuality z oblasti analýz pro politiku výzkumu, vývoje a inovací Michal Pazour.
Připraveno v rámci projektu „Projektové financování vysokých škol“ podpořeného FRVŠ pod číslem 72/2011
Odborný seminář „APLIKACE STRATEGICKÉHO HODNOTÍCÍHO RÁMCE PRO STRATEGIE MÍSTNÍHO ROZVOJE V ČR“ Odborný seminář Praha 20. září 2010.
Bohdana Stoklasová Národní knihovna ČR
Nabídka karty Soubor Soubor. Nabídka karty Domů Domů práce se schránkou formátování písma zarovnávání formát čísel práce se styly práce s buňkami vyhledávání.
8. prosinec 2009, PrahaSeminář ASEP Spolupráce Národního úložiště šedé literatury (NUŠL) a ústavů AV ČR Iveta Fürstová
Nové trendy a možnosti v oblasti digitalizace Jiří Polišenský.
5. setkání českých uživatelů systému DSpace 16. května setkání českých uživatelů systému DSpace 16. května 2012 Dspace na UTB aneb 3 ve 2 Ing.
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Fond Vysočiny Celkový objem finančních prostředků Fondu Vysočiny – 81,4 mil Kč Dílčí cíl Programu rozvoje kraje – 3.2 Podpora rozvoje telekomunikačních.
Jiří Herman Elsyst Engineering Digitalizace a nástroje pro podporu digitalizace v knihovnách Jiří Herman Brněnská 10, 682.
Jak používat systém Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. 32. seminář knihovníků muzeí a galerií při AMG Plzeň.
13. února 2007Systém Kramerius, Martin Lhoták, KNAV1 Systém Kramerius aktuální stav a vývoj v roce 2007 Martin Lhoták, Knihovna AV ČR, v.v.i. SDRUK – IT,
Otto Chmelík, Státní okresní archiv Děčín
Digitální knihovna AV ČR a vývoj nové verze systému Kramerius Martin Lhoták Knihovna AV ČR, v. v. i. Archivy, knihovny, muzea v digitálním světě
9. Národní konferenci kvality ve veřejné správě, 2013, Brno.
Výsledky projektu VaV "Optimalizace nástrojů pro digitalizaci tištěných dokumentů ohrožených degradací papíru" Jiří Polišenský Archivy, knihovny a muzea.
Projekt 3.3 „Partnerství pro budoucnost“. Úvodní informace o projektu Projekt byl úspěšně předložen Karlovarským krajem v rámci výzvy SROP, priority 3.
NS-LEV 21 pro český sport Jiří Šlégr http://
Elektronické VŠKP na FAST VUT
Nové nástroje pro digitalizaci knihovních dokumentů
Digitalizace knihovních dokumentů Jiří Polišenský.
Knihovědné oddělení KNAV a Bibliografie cizojazyčných bohemikálních tisků století on-line Lenka Veselá.
MoodleMoot.cz 2011, Ostrava, PragoData Consulting, s.r.o. 1 Moodle a okolní svět Ing. Marek Kocan.
ARL klient Stručný přehled funkcí Klient – jiný přístup k datům v systému  Umožňuje používat i další pole v záznamu - Je nezbytný v případě.
Seriály v Souborném katalogu ČR Ústí nad Orlicí, 6. října 2006 Danuše Vyorálková.
Seriály v Souborném katalogu ČR Opava, 21. června 2006 Danuše Vyorálková.
DMVS Zpracoval: Ing. Ivan Ivanov 1 Typové projekty DMVS -Účelová katastrální mapa realizace 2011, investice cca 9 mil. -Nástroje pro tvorbu a údržbu ÚAP.
Power Point– popis prostředí
Archivy, knihovny, muzea v digitálním světě 2010, Praha,
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
Souborný katalog ČR Seriály Seminář knihovníků muzeí a galerií Olomouc, Danuše Vyorálková.
Budoucnost současných internetových zdrojů Mgr. Ludmila Celbová
1 Dspace na AMU – Ostrava 2012 AMU = DAMU + FAMU + HAMU Dspace na AMU Jakub Ivanov PhDr. Iva Horová.
I sss I nternet, elektronické informační zdroje a s lužby pro o s oby se s pecifickými potřebami v knihovnách Zlata Houšková, Jana Vejsadová Internet ve.
Inspirační databanka pro podporu strategického řízení rozvoje lidských zdrojů v krajích Národní vzdělávací fond, o.p.s. M. Mandíková, Z. Palán, I. Sládková,
Informační kulturní portál
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Projekt MedGate – integrace informačních zdrojů pro výzkum a vývoj v medicíně Eva Lesenková, Helena Bouzková, Jarmila Potomková, Eva Chárová MEDSOFT 2004,
Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl.
Projekt Digitální knihovna AV ČR a vývoj systému Kramerius Martin Lhoták, Knihovna AV ČR AMK v digitálním světě 2005, Praha.
Školení, Náchod 18. dubna 2007 Seriály v Souborném katalogu ČR Danuše Vyorálková.
Možnosti spolupráce při vytváření digitálních sbírek Ing. Martin Lhoták Knihovna AV ČR.
Archiv českého webu Petr Žabička, Moravská zemská knihovna a Masarykova Univerzita v Brně Ludmila Celbová, Národní knihovna ČR.
MIDAS v kontextu veřejné správy a návaznost na standardy ISVS v oblasti metadat Bronislava Horáková vedoucí projektu MIDAS ISSS 2003 Sdružené pracoviště.
© Adolf Knoll National Library of the Czech Republic Zpřístupnění digitálních dat Přehled.
Popis systému DBMAN (KEVIS). Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním.
Národní digitální knihovna
Petr Žabička Moravská zemská knihovna v Brně Možnosti technického řešení.
Úvodní hodina do předmětu Knihovnické procesy a služby Martin Krčál VIKBB42 Knihovnické procesy a služby Brno, 19. února 2014.
Systémová podpora procesů transformace systému péče o ohrožené děti a rodiny Klíčové aktivity realizované v Pardubickém kraji Pardubice, dne
Projekt “VDK – Virtuální depozitní knihovna” Jiří Polišenský.
Zuzana Teplíková , Praha
Informační den ÚVIS MZLU, Brno
Budování Integrovaného informačního systému Národního památkového ústavu Petr Volfík, NPÚ ÚP
Elektronické prezenční zpřístupňování dokumentů a jejich tisk Věra Jurmanová Volemanová Dr. Ing. Zdeněk Kadlec Martin Krčál E-prezenční výpůjčka / M.Krčál.
Digitalizace knihovních dokumentů
METODOLOGIE PROJEKTOVÁNÍ
Digitalizace textů obsahujících matematickou symboliku
Transkript prezentace:

CODEG 4 nástroj pro podporu OCR a tvorbu rozšířených metadat Jiří Polišenský Ondřej Lehrl

Obsah Charakteristika nástroje CODEG 4 OCR starších textů Vývojové etapy Práce s nástrojem CODEG 4 Knihovny současnosti 2011

Charakteristika nástroje CODEG 4 Nástroj byl vyvíjen v rámci realizace projektu VaV „Optimalizace nástrojů pro digitalizaci tištěných dokumentů ohrožených degradací kyselého papíru“ Víceúčelová aplikace pro podporu rozpoznávání starších tištěných textů a tvorbu rozšířených metadat Umožňuje vytvářet specializované slovní báze pro podporu rozpoznávání Umožňuje editaci a opravy rozpoznaných textů a regionů Umožňuje vytvářet polo automatizovaným způsobem metadata dílčích částí dokumentů Knihovny současnosti 2011

Problematika rozpoznání starších textů Výsledky rozpoznávání starších tištěných textů bývají negativně ovlivněny následujícími faktory: degradací papíru způsobující barevné změny (zežloutnutí nebo zhnědnutí) horší kvalitou tisku starší podobou jazyka archaickou podobou písma (pravopisné reformy, gotika) Knihovny současnosti 2011

Fáze vývoje nástroje CODEG 4 Návrh jazykových vrstev češtiny 19. a 1. poloviny 20. stol., definování dvanácti tematických skupin Vývoj nástrojů pro opravy textů, plnění jazykových bází a tvorbu znalostní báze Implementace formátu ALTO XML Tvorba rozšířených metadat Integrace vyvinutých algoritmů do jediného nástroje CODEG 4 Knihovny současnosti 2011

Využití nástroje CODEG 4 Opravy OCR textů Tvorba externích slovníků Budování znalostních bází českého jazyka Tvorba rozšířených metadat (popisná metadata pro dílčí části dokumentů – články, kapitoly apod.) ve formátu ALTO XML Kooperativní systém pro opravy OCR textů dobrovolníky z řad veřejnosti Knihovny současnosti 2011

Navazující aktivity Opravy textů a zón pro evropský projekt IMPACT Další vývoj nástroje v projektu VaV „Nástroje pro zpřístupnění tištěných textů 19. století a první poloviny 20. století“ Vývoj funkcí pro správu systému Plnění znalostní báze slovními tvary Knihovny současnosti 2011

Knihovny současnosti 2011

Kontakty a informace Jiri.Polisensky@nkp.cz Ondrej.Lehrl@nkp.cz http://kramerius-info.nkp.cz/projekt-optimalizace/nastroj-codeg4 http://kramerius-info.nkp.cz/projekt-optimalizace/prednaska-dr-polisenskeho-z-akm-2010/view Knihovny současnosti 2011