VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU Boris Lehečka boris@daliboris.cz, lehecka@ujc.cas.cz VOKABULÁŘ WEBOVÝ aneb HISTORICKÉ SLOVNÍKY NA INTERNETU
Vokabulář webový – VWobsah představení VW zdroje VW struktura slovníků v XML návod na použití VW nedostatky VW další slovníky (nejen historické) budoucí zdroje VW
Selfpromotion Boris Lehečka boris@daliboris.cz, lehecka@ujc.cas.cz oddělení vývoje jazyka ÚJČ AV ČR, v. v. i. programování zpracování textů a databází Visual Basic, C#, SQL XML, XSLT, HTML, CSS
Představení VW Vokabulář webový http://vokabular.ujc.cas.cz důvod vzniku webová aplikace současné možnosti VW plánované možnosti VW důvod vzniku: pozastavení prací na StčS, ESSČ pouze elektronicky a diferenčně vůči MSS webová aplikace: výhody – lepší prohledávání, 1 licence, aktualizace (nové zdroje, jednotlivá hesla); nevýhody – připojení k internetu, menší pohodlí při práci s aplikací současné možnosti: výběr zdrojů, vyhledávání heslových slov (se zástupnými znaky), fulltextové prohledávání, vymezení prohledávaných částí (význam, valnece...), retrográdní řazení, flexe při prohledávání plánované možnosti: našeptávač hesel, listování slovníky. nové zdroje, korpus stč. textů
Zdroje VW Heslář Staročeského slovníku (HesStčS) databáze Malý staročeský slovník (MSS) tištěná publikace Elektronický slovník staré češtiny (ESSČ) elektronický text ukázky jednotlivých zdrojů (papírově i elektronicky) MSS: Středisko Teiresiás (Středisko pro pomoc studentům se specifickými nároky), autorská práva
Fungování VW databáze (MS SQL Server) texty (soubory XML) obsahuje heslová slova hledání podle části hesel abecední a retrográdní řazení texty (soubory XML) fulltextové prohledávání (Indexing Service, IFilter) zobrazení (transformace pomocí XSLT) korpus (Manatee) prohledávání textů kolokace webová aplikace (zpřístupňuje zdroje) Manatee: Pavel Rychlý, Fakulta informatiky Masarykovy univerzity v Brně webová aplikace: IIS 6.0, ASP.NET 2.0, C# 2.0
Fungování VW Vokabulář webový http://vokabular.ujc.cas.cz MSS Indexing HesStčS Vokabulář webový http://vokabular.ujc.cas.cz Generální heslář MSS Indexing Service ESSČ korpus
Slovníky v XML tištěné slovníky elektronické slovníky zachování distinktivních rysů (vlastnosti písma: patkové, bezpatkové; tučné, kurzívní…) rozepisování zkrácených podob [blázniti (sě)] identifikace jednotlivých částí heslové stati (heslové slovo, morfologický, slovotvorný, etymologický údaj, odkaz, slovní spojení…) elektronické slovníky definování struktury podle vlastních potřeb není třeba se omezovat místem pomůcky pro hlídání autorů (formální správnosti) 1 heslová stať = 1 soubor uloženo na disku: 1 zdroj = 1 adresář (kvůli prohledávání), písmena = podadresáře (kvůli přehlednosti) XML kvůli transformaci (XSLT => HTML a nejen) a kvůli fulltextovému prohledávání (rozlišování jazyků)
Návod na použití VW seznam zdrojů jednoduché prohledávání pokročilé prohledávání fulltextové prohledávání řazení připomínky
Nedostatky VW chyby v HesStčS chyby v generálním hesláři chyby v textech slovníků nezvýrazňuje nalezený výraz novočeská flexe při fulltextovém hledání omezení Indexing Service (jednopísmenné výrazy) chyby v HesStčS: píjěťi
Další slovníky Jazykové slovníky Klaret (http://titus.uni- frankfurt.de/texte/etcs/slav/acech/klaret/klare.htm) K. Z. Vusín (http://kb-upol.bach.cz/slov/) F. Št. Kott (Česko-německý slovník zvláště grammaticko-fraseologický) Chorvatské historické slovníky (http://crodip.ffzg.hr/default_en.aspx) DEBDict (http://nlp.fi.muni.cz/projekty/deb2/index-cs.html) SSJČ ASCS, SSČ (Leda) Kašpar Zachariáš Vusín: Dictionarium latino-germanico-bohemicum DEBDict: Adam Rambousek z FI MU v Brně; SSČ, SSJČ, ASCS (?), Slovník české frazeologie a idiomatiky; encyklopedie; dvojí prohledávání Seznam: Ottova encyklopedie Coje.to
Další slovníky Encyklopedie Seznam (http://encyklopedie.seznam.cz) Co je to (http://coje.to)
Další zdroje VW o Vokabuláři webovém plánované slovníky Leonardo (http://www.rozhlas.cz/leonardo/audio/_audio/00507236.mp3) plánované slovníky J. Dobrovský (Deutsch-böhmisches Wörterbuch) V. J. Rosa (Thesaurus linguae bohemicae) J. Gebauer (Slovník staročeský) J. V. Pohl (Česko-německý slovnář oder Böhmisch- Deutsches Wörter-Buch, 1756) plánované další zdroje Gebauerova excerpce korpus staročeských textů