Prameny pro poznání historické češtiny na internetu

Slides:



Advertisements
Podobné prezentace
Analýza staročeské morfologie v Excelu
Advertisements

JAZYKOVĚDA, JAZYKOVÁ KULTURA, ŘEČ A JAZYK
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
PŮVOD A ZÁKLADY VÝVOJE ČEŠTINY
Základy informatiky Ing. Roman Danel, Ph.D.
SEZNAMTE SE S ČESKÝM NÁRODNÍM KORPUSEM!
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
ASEP-ARL Pracovní seminář Seminář Knihovna AV ČR, Praha.
VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU
53. Šrámkova Sobotka Sobotka 9. července 2009
Velké infrastruktury pro výzkum, vývoj a inovace
Digitální publikace a e-knihy v Ústavu pro českou literaturu AV ČR Pavel Janáček, Michal Kosák, Praha,
Lexikografické zdroje na stránkách ÚJČ AV ČR SEMINÁŘ: CJA014/A SOUČASNÝ ČESKÝ JAZYK – LEXIKOLOGIE AUTOR: LUCIE JIRÁKOVÁ, UČO DATUM:
Jazykověda a její disciplíny
Profesní organizace, nadace a neziskové organizace.
Číslo projektuCZ.1.07/1.5.00/ Název projektuEU peníze středním školám Masarykova OA Jičín Název školyMASARYKOVA OBCHODNÍ AKADEMIE, 17. listopadu.
Staročeská Bible drážďanská a olomoucká: Knihy prorocké a knihy Makabejské (k vydání závěrečného dílu kritické edice) Hana Sobalíková, Markéta Pytlíková.
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A6 Rozpočet a plánování tvorby projektů a jejich následná realizace.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Anglické standardy při psaní projektu Osnova kurzu
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
0350 – Podpora nových vzdělávacích metod v systému vzdělávání ČMKOS Žadatel: ČMKOS Partner: AIVD Mgr. Dušan Martinek
Informační kulturní portál
JAZYKOVĚDA JAZYKOVÉ PŘÍRUČKY
Téma: Současná spisovná čeština v pravidlech Vypracoval: Mgr. Milan Pilař.
Příslib do budoucna Zprávy z Univerzity Karlovy Alena Matuszková, Knihovna společenských věd TGM v Jinonicích Otevřené repozitáře, Brno,
Šedá literatura (Gray literature) Martina Machátová Tel.: Aktualizace:
Zpracování rešerše Mgr. Anna Vitásková.
Environmentální výchova v zemědělských a zahradnických školách CZ.1.07/1.1.00/ Učebnice Ekologie a ochrana životního prostředí.
Národní referenční rámec excelence - NRRE Ladislav Cabada
Národní úložiště šedé literatury (NÚŠL) informace o projektu SKIP Klub vysokoškolských knihoven AMU, Iva Horová.
B ORIS L EHEČKA, ODDĚLENÍ VÝVOJE JAZYKA ÚJČ AV ČR, V. V. I. DALIBORIS. CZ P RAŽSKÉ JARO V O STRAVĚ, 24. BŘEZNA 2015 Nástroje pro badatele (nejen)
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Archiválie a archivní pomůcky na portálu Badatelna.cz
Střední odborné učiliště Liběchov Boží Voda Liběchov Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona: I/2 Inovace a zkvalitnění výuky.
Aktuální problémy vysokoškolských knihoven 21.předsednictvo RVŠ – Pracovní komise pro VŠ knihovny PhDr.Miloslava Faitová ZČU v Plzni.
Střední průmyslová škola, Mladá Boleslav, Havlíčkova 456
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5.
14. Informace vládnou sv ě tu Úloha ICT p ř i ř ízení podniku rb.
Vyhledávání na internetu, SEO
Databáze Bibliografie dějin českých zemí jako cesta k plným textům v domácích i zahraničních knihovnách Václava Horčáková Elektronické služby knihoven.
VÝVOJ SPISOVNÉ ČEŠTINY
Kontrola pravopisu Daniel Zeman Počítačové zpracování češtiny.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
CJBB75 Základy využití korpusu pro praxi st G13.
Zkvalitnění výuky německého jazyka na Vyšší odborné škole Zahradnické v Mělníku CZ.1.07/2.1.00/
KVINTA. = VĚDA ZABÝVAJÍCÍ SE ZKOUMÁNÍM JAZYKA. Dělení podle: 1) jazyků, jimiž se zabývá (např. bohemistika, anglistika, romanistika, hungaristika, sinologie,
KRAJSKÝ AKČNÍ PLÁN ROZVOJE VZDĚLÁVÁNÍ Martina Vojtěchová
VARIANTNÍ PROSTŘEDKY PŘI ÚPRAVĚ PUBLICISTICKÝCH TEXTŮ NA MATERIÁLU MF DNES Mgr. Barbora Albrechtová Ústav pro jazyk český AV ČR, v. v. i.
Integrační trendy při tvorbě multimediálních výukových portálů pro medicínu a zdravotnictví V. Mihál, J. Potomková Lékařská fakulta Univerzity Palackého.
KRAJSKÝ AKČNÍ PLÁN ROZVOJE VZDĚLÁVÁNÍ Jana Stará
Manuscriptorium Evropská digitální knihovna historických fondů.
Odpověď na tyto otázky nalezneš v jazykových příručkách.
Standardizace odborné zdravotní péče
VY_32_INOVACE_ČJ.9.A NÁZEV ŠKOLY: ZŠ ŠTĚTÍ, OSTROVNÍ 300 AUTOR: MGR. NIKOLA GRBAVČICOVÁ NÁZEV MATERIÁLU: VY_32_INOVACE_ČJ.9.A.01_VÝVOJ ČESKÉHO JAZYKA.
Daniel Zeman Počítačové zpracování češtiny Kontrola pravopisu Daniel Zeman
Možnosti spolupráce: e-VŠKP v rámci systému šedé literatury
Financováno z ESF a státního rozpočtu ČR.
Název projektu: Učíme obrazem Šablona: III/2
Jazykověda a její disciplíny
SEMINÁŘ Prameny k dějinám Židů v českých zemí
NÁZEV ŠKOLY: SOŠ Net Office Orlová, spol. s r. o.
JAZYKOVĚDA A JEJÍ DISCIPLÍNY
Polytechnické vzdělávání v praxi
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Pedagogická knihovna J. A. Komenského
Elektronický publikační systém
Jazykověda a její disciplíny
Název Jazykové příručky Název projektu: OP VK
Transkript prezentace:

Prameny pro poznání historické češtiny na internetu Boris Lehečka, boris@daliboris.cz Příspěvek byl podpořen projektem Ministerstva školství, mládeže a tělovýchovy č. LM2015081 „Výzkumná infrastruktura pro diachronní bohemistiku“ (akronym RIDICS, http://vokabular.ujc.cas.cz).

Osnova Historie Vokabuláře webového Slovníky Texty Mluvnice Počítačové nástroje Formální popis staré češtiny (hláskosloví, morfologie) FPE ZČU v Plzni, 8. 11. 2018

Boris Lehečka oddělení vývoje jazyka Ústavu pro jazyk český AV ČR počítačové zpracování a zpřístupňování jazykových materiálů (programování, databáze, značkovací jazyky) Vokabulář webový (http://vokabular.ujc.cas.cz) řešitel projektu Výzkumná infrastruktura pro diachronní bohemistiku (RIDICS); 2016–2019 zakládající člen České asociace pro digitální humanitní vědy (www.czadh.cz) kontakt: boris@daliboris.cz FPE ZČU v Plzni, 8. 11. 2018

Poděkování za pozvání – PhDr. Eva Pasáčková, CSc., Mgr. Martina Spěváčková, Ph.D. za náměty – Mgr. Jan Dušek, Vokabulář webový a škola. In JAZYK – LITERATURA – KOMUNIKACE II/2006, str. 27–35. Dostupné též z <http://jlk.upol.cz/index.php/cislo-2-2017>. za finanční podporu – MŠMT v rámci Projektu velkých infrastruktur pro VaVaI. za materiály poskytnuté k publikování – badatelé se zaměřením na diachronní bohemistiku FPE ZČU v Plzni, 8. 11. 2018

Historie Vokabuláře webového od 14. listopadu 2006 zpočátku pro slovníky staročeské slovní zásoby (Heslář lístkového materiálu ke StčS, ESSČ, MSS; později GbSlov, StčS) postupně další zdroje (viz záložka Zdroje) texty (textová banka, ediční modul) lístkové kartotéky (digitalizované, anotované) mluvnice (digitalizované, indexované, s odborným popisem) audioknihy dobové slovníky (textové, digitalizované) počítačové nástroje FPE ZČU v Plzni, 8. 11. 2018

Way back machine – zobrazení historické podoby webových stránek https://web.archive.org/web/20070206025951/http://vokabular.ujc.cas.cz:80/zdroj.aspx FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Slovníky není slovník jako slovník (moderní staročeské) stáří (GbSlov × ESSČ), kvalita (MSS × StčS), médium (ESSČ), období (GbSlov), doklady (StčS × ESSČ) abeceda (StčS: na – při; GbSlov: A – netbánlivý; MSS: A–Ž; ESSČ: při–Ž, A–M) není slovník (středněčeské období) Lexikální databáze humanistické a barokní češtiny (http://madla.ujc.cas.cz; nutná registrace) anotovaná lístková kartotéka dobové slovníky s vlastním prohledáváním, vzájemně neprovázané Gebauer, Slovník staročeský, 1 (A—J), 1903, 2 (K—N) 1916; dokladový Staročeský slovník 1968–2008; dokladový Malý staročeský slovník 1978 Elektronický slovník staré češtiny 2006– Madla = Manuální anotátor databáze lístkových archivů pokročilé prohledávání (význam) FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Zpracování slovní zásoby v moderních slovnících staré češtiny FPE ZČU v Plzni, 8. 11. 2018

Texty staročeská a středněčeská textová banka (pro korpusové vyhledávání) transkribované, nelemmatizované, nepropojené (Manuscriptorium; spolupráce ukončena) standard XML TEI P5 ediční modul (pro čtení in continuo) ne všechny texty (texty publikované, např. Klaretovy slovníky; nedávno vyšlé, např. Bible olomoucká (a drážďanská)) drážďanská je v závorce, protože jde o text transliterovaný FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Srovnání textové banky a Diakorpu Textová banka Diakorp 1300–1800 6 155 994 pozic (5 298 599 stč.) nereferenční (částečně lemmatizovány) všechny dostupné prameny 1300–1939 4 128 874 pozic (970 343 stč.) referenční nelemmatizovaný vyvážený, 1. opis památky FPE ZČU v Plzni, 8. 11. 2018

Mluvnice Ondřej Koupil historické mluvnice a podobné příručky z období 16. až 19. století (84×) digitální obrazy podrobná charakteristika tematické rejstříky hlavní témata: Hláskosloví, Pravopis, Slovní zásoba a slovotvorba, Tvarosloví, Skladba, Styl, Varia nejen česky psané, ale i latinské a německé Varia: jazyky (němčina, staroslověnština), výslovnost, titulní strana, předmluva, dodatky, věnování FPE ZČU v Plzni, 8. 11. 2018

Mluvnice poslední aktualizace (13. 10. 2018) Orthographia Bohemica Beneš Optát – Petr Gzel – Václav Philomathes. Grammatyka česká v dvojí stránce: orthographia předkem, kteráž učí českú řeč právě a vlastně psáti i čísti (ta se i lejkom hodí); etymologia potom, kteráž učí českú řeč právě a vlastně mluviti i z latíny vykládati (ta samým latiníkom přísluší). Náměšť nad Oslavou, 1533. (včetně knižní edice, editoři O. Koupil a K. Voleková) FPE ZČU v Plzni, 8. 11. 2018

Počítačové nástroje výsledky projektu NAKI výsledky projektu RIDICS Kolační pravítko Speciální znaky doplněk eEdice a Metodika přípravy a zpracování elektronických edic starších českých textů (Alena M. Černá – Boris Lehečka, 2015) výsledky projektu RIDICS Asistent pro kontrolu pravopisu Kontrola staročeského pravopisu FPE ZČU v Plzni, 8. 11. 2018

Plánovaná podoba Vokabuláře webového FPE ZČU v Plzni, 8. 11. 2018

Kolační pravítko FPE ZČU v Plzni, 8. 11. 2018

Speciální znaky FPE ZČU v Plzni, 8. 11. 2018

Asistent pro kontrolu pravopisu ve Wordu FPE ZČU v Plzni, 8. 11. 2018

Kontrola staročeského pravopisu kontrola pravopisu jako standardní nástroj nezajistí 100% správnost může upozornit na chyby používá se (pro moderní jazyky) princip kontroly pravopisu seznam pravopisně náležitých tvarů (obsažených v tzv. slovníku) FPE ZČU v Plzni, 8. 11. 2018

Co je pravopisně správné pravopisně náležité tvary staročeská textová banka – staročeské tokeny (nikoli emendovaný a doplněný text, cizí jazyk) slovníky staré češtiny (StčS, ESSČ) – lemmata ne všechny tvary musejí být pravopisně náležité systém skóre (jeho vylepšení a minimální hodnota pro zařazení tvaru do slovníku pro kontrolu stč. pravopisu) FPE ZČU v Plzni, 8. 11. 2018

Jak zvýšit naději na zařazení do slovníku tvar je totožný s podobou lemmatu z moderního staročeského slovníku tvar se vyskytuje v různých památkách (tj. s velkou pravděpodobností tvar použili různí staročeští autoři/písaři); tvary se vyskytují v různých pramenech téže památky; FPE ZČU v Plzni, 8. 11. 2018

Jak zvýšit naději na zařazení do slovníku tvary se vyskytují v edicích, které připravovali různí editoři (je méně pravděpodobné, že se různí editoři dopustí téže chyby) pokud se mezi doloženými tvary objevuje ještě další, hláskoslovně náležitá podoba (např. tvary kóň a kůň), jejich frekvence se sčítají (kóň 2×, kůň 3× → kóň 5×, kůň 5×) doložený tvar se vyskytuje v morfologické databázi staré češtiny (zatím jen apelativa, nesklonné slovní druhy) FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Formální popis staročeské morfologie účel lemmatizace staročeských textů prostředek seznam lemmat (ze slovníků; podoby k roku 1300) formální popis staročeského hláskosloví (z historických mluvnic) formální popis staročeské flexe (k roku 1300; P. Synková) formální popis hláskových změn (od roku 1300) FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Korpus / Texty II KonText korpusový manažer vyvíjený v Českém národním korpusu částečně lemmatizovaný (apelativa, nesklonné slovní druhy) Pavlína Synková (teoretická část) Ondřej Svoboda (programování) Karel Oliva (vedení práce) FPE ZČU v Plzni, 8. 11. 2018

FPE ZČU v Plzni, 8. 11. 2018

Děkuju za pozornost otázky a odpovědi http://vokabular.ujc.cas.cz boris@daliboris.cz FPE ZČU v Plzni, 8. 11. 2018