Dvoujazyčný slovník a korpus

Slides:



Advertisements
Podobné prezentace
Výběr vozidla do firmy – máme k dispozici všechny informace? Michal Krátký, Přemysl Žižka – DEN S FLEETEM DEN S FLEETEM – JARO 2010.
Advertisements

M A N A G E M E N T 3 Akad. rok 2009/2010, Letní semestr
Redukce textů, obsahová analýza, anotace
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
Modernizace studijních opor Představení LMS Moodle
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Tereza Podaná Lucie Řeřábková
Zpracování seminárních a kvalifikačních prací
Metodologie historického výzkumu volného času
Audit administrativních činností
ADT Strom.
Prostředí pro tvorbu strukturovaných učebních textů Ing. Jiří Přibil Fakulta managementu VŠE Rozvojový grant Ministerstva školství, mládeže a tělovýchovy.
Činnost veřejné správy
Mechanismy evaluace kulturních služeb
Řízené slovníky databází ISTA, LLIS/FTXT, LISA. Obecně: Řízený slovník – controlled vocabulary Slovník lexikálních jednotek selekčního jazyka uspořádaný.
Sociální konstruktivismus
STRUKTURA OSNOVY KURZU
KEG Použití vzorů při vyhledávání na webu Václav Snášel.
Kam se obrací „gramatická“ vlna?
Učte se anglicky 4krát rychleji Úvod Dr. Arkady Zilberman *US Patent 6,341,958.
Konference projektu APSYS Propojení vědy, výzkumu, vzdělávání a podnikové praxe Propojení vědy, výzkumu, vzdělávání a podnikové praxe ODBORNÁ JAZYKOVÁ.
KOMUNIKACE OLGA BÜRGEROVÁ. CÍLE:  VÝZNAM PRVNÍHO DOJMU  UMĚT NAVÁZAT KONTAKT.
PRIMÁRNÍ PREVENCE PRÁVNÍ VĚDOMÍ
Dokumentace informačního systému
Role vysokoškolského pedagoga ve WBL PaedDr.Vanda Hájková, Ph.D
Vítejte při prezentaci některých zajímavých vlastností slovníků Lingea Lexicon. Mezi stránkami můžete přecházet pomocí kláves, myší nebo počkat na automatické.
FÁZE NÁCVIKU SLOHOVÉHO PROJEVU
Personální procesy.
Osnova kurzu – modulu A3 PŘÍPRAVA PROJEKTU
Databázové modelování
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
Zpracování rešerše Mgr. Anna Vitásková.
EKO VY_32_INOVACE_EKO_12 MARKETINGOVÉ ŘÍZENÍ. Autor: Ing. Hana Motyčková „Autor je výhradní tvůrce materiálu.“ Datum vytvoření: Klíčová slova:
Aplikace teorie information commons v Ústřední knihovně Přírodovědecké fakulty MU Klub vysokoškolských knihovníků SKIP Zdeňka Dohnálková Prosinec 2006.
Rozhodovací procesy.
PLÁNOVÁNÍ CELOROČNÍ VÝUKOVÉ AKTIVITY UČITELE EKONOMICKÝCH PŘEDMĚTŮ
Olomouc: Univerzita Palackého 2010.
Reporting.
Aktuální problémy vysokoškolských knihoven 21.předsednictvo RVŠ – Pracovní komise pro VŠ knihovny PhDr.Miloslava Faitová ZČU v Plzni.
Úvod do studia Strategie vyhledávání zdrojů Robert Zbíral.
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Plánování auditu ISA 300 Plánování práce auditora
Fáze a modely tlumočení
Teorie ES a jejich aplikace Biskup Jiří, Fakulta stavební, ČVUT Praha, Květen 2004.
Mémy tlumočení podle Franze Pöchhackera
Technická univerzita v Liberci LIBEREC I Studentská 2 Inovace vzdělávání v oboru čeština jako druhý jazyk (CZ.1.07/2.2.00/ ) podpořeného z.
Výuka českého jazyka pro cizince na Vysoké škole hotelové v Praze 8
1 Inovace vzdělávacího procesu založeného na získávání kompetencí prostřednictvím výstupů z učení ve studijních oborech PODNIKÁNÍ
Přehledová studie soustřeďuje původně rozptýlené informace do jednoho zdroje zhušťuje a sumarizuje existující informace interpretuje (vysvětluje) existující.
Databázové systémy Normalizace dat.
Jak napsat zprávu z praxe
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Personální plán pro podnikatelský plán
Mgr. Naděžda Fasurová, Ph.D.
INFORMAČNÍ SYSTÉMY PRO KRIZOVÉ ŘÍZENÍ POUŽITÍ INFORMAČNÍCH SYSTÉMŮ PRO MODELOVÁNÍ A SIMULACE KRIZOVÝCH SITUACÍ - T3 ING. JIŘÍ BARTA Operační program Vzdělávání.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
Připraveno s podporou programu Erasmus+ Evropské unie. Výsledky učení v pedagogické činnosti vysokých škol Představení metodiky.
Základy marketingu část 4. Ing. Monika Dobešová Univerzita Pardubice FEI Letní semestr 2012/2013.
Ekonomika malých a středních podniků
VIKBA20_Elektronické informační zdroje Klára Zemanová, UČO
Projekt Impuls / Seminář
Projekt Impuls / Seminář
VIKMA06 Rešeršní a studijně rozborová činnost
JOINME (Journal of Interactive Media)
BEZBARIÉROVÉ KNIHOVNY
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace Autor: Mgr
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Tento projekt byl podpořen finančními prostředky z EU
Jak na jazyky.
Transkript prezentace:

Dvoujazyčný slovník a korpus Anna Fazekašová

Dvoujazyčné (překladové) slovníky Funkce - usnadnění komunikace mezi mluvčími různých jazyků Hledání prostředků substituce, ekvivalentů Slovník ≠ 2 seznamy slov, spíše 2 komplexní a strukturované soubory hesel Ekvivalentem jednoho slova není vždy jiné slovo

V jakých situacích potřebujeme slovník? Když někam cestujeme • Obchod a jiné kulturní styky, častými uživateli administrativní pracovníci, překladatelé, tlumočníci b) Při překladu odborných textů • Vázán na terminologii, uživateli odborní překladatelé c) Když se učíme cizí jazyk • Uživateli studenti, lingvisté

Rozdělení slovníků z hlediska obsahu Podle počtu jazyků Podle rozsahu lexikonu (zaměřuje se na spisovný jazyk, slang?) Podle jazykového a věcného oboru (obsahuje encyklopedické informace, termíny?) Podle doby, kdy vzniknul Podle jeho zaměření (komu je slovník určen)

Čím jsou tedy dány povaha a rozsah slovníku? CÍLEM TYPEM UŽIVATELE POTŘEBAMI UŽIVATELE

Funkce a uživatelské typy slovníku • Laická představa × vědecké poznání • Pro kódování a dekódování - tzn. pro mluvení/psaní, poslech/četbu - mezi dvěma jazyky (např. čeština a maďarština) potřebujeme 4 slovníky: 1. česko-maďarský kódovací – pro Čechy 2. česko-maďarský dekódovací – pro Maďary 3. maďarsko-český kódovací – pro Maďary 4. maďarsko-český dekódovací – pro Čechy

b) hrubou korespondenci c) pro plnou analýzu, nebo jen Další rozdělení – podle toho, zda jde o slovník pro aktivní, nebo pasivní uživatele daného jazyka: a) pro komunikativní kompetenci, nebo jen b) hrubou korespondenci c) pro plnou analýzu, nebo jen d) orientační porozumění

Materiálová báze slovníku Dříve jen kartotéky, dnes také paralelní korpusy s vyhledávacím softwarem (aligner) Pro překladový slovník jednoho směru ideálně obojí (kartotéky hlavně pro terminologii)

Projekt slovníku Co by měla hesla ve slovníku obsahovat, aby se nám s ním co nejlíp pracovalo? • Zařazení lexému do souvislostí • Základní kolokabilitu lexému, naznačení jeho valence

Co by tvůrci slovníku měli mít rozmyšleno, než začnou pracovat? • Rozsah slovníku • Časový odhad délky práce • Typ a náročnost práce • Druh kontroly a koordinace • Míru závislosti na spolupráci s externími odborníky • Zpětnou vazbu

Tak vznikají 2 plány: a) lineární plán (typy a rozsah úkolů) b) nelineární plán (koordinace, kontrola, zpětná vazba) Důležité je také stanovení vymezení kritérií výběru hesel a základního hesláře určení typů a struktury hesel (metajazyk)

Lingvistika a lexikografie Lingvistická analýza obou jazyků (zvláště kontrastivní a typologická) přínosná pro tvorbu slovníku

Typologie hesel Vedle standardních hesel většinou potřeba i tzv. zvláštní hesla: Hesla odkazová Gramaticky nepravidelné formy lemmat s odkazem Části slov/morfémy Zkratky Výběr proprií Hesla konstruovaná pro potřeby slovníku v důsledku analýzy obou jazyků (např. složky kompozit)

Ekvivalence a ekvivalent Vztah ekvivalence zpravidla asymetrický Ekvivalentem v druhém jazyce ne vždy nutně lexém Teoreticky lze odlišovat 4, resp. 3 druhy ekvivalence lexémů: 1 : 1 - Jednoznačná (izomorfismus) 1 : více - Částečná (anizomorfismus) Více : více - Částečná (anizomorfismus) 1 : 0 - Absence ekvivalence

Jiné rozdělení druhů ekvivalence: a) Jednoznačná ekvivalence b) Opis (ekvivalent chybí) c) Částečná ekvivalence c1) Vztah širší a užší a naopak c2) Obecné a specifické a naopak c3) Jen částečný průnik výchozího lexému s ekvivalentem d) Ekvivalent vázaný na frazém e) Ekvivalent funkčně neparalelní

Korpusová lexikografie + používání korpusů: 2x více ekvivalentů − používání korpusů: ekvivalenty ne vždy bez problémů - ukazatelem frekvence výskytu Zarovnávací programy (aligners) odhadují kandidáta na ekvivalent, uživatel provede kontrolu kontextu, zjišťuje frekvenci výskytu kritika

Další otázky a problémy Informace o definici a kolokabilitě i u vstupního jazyka Vnitřní propojení elektronického slovníku hypertextovým způsobem, propojení slovníku s korpusem Termíny Zdokonalení metajazyka Pragmatické a diskurzní problémy

Slovníkářovo desatero 1) Slovník do cílového jazyka má dělat kvalifikovaný rodilý mluvčí. 2) Žádný slovník není úplný, jde vždy o výběr. Ten však nesmí být ledajaký 3) Slovník má být v konečné podobě na jiných zdrojích informace nezávislý, i když se implicitně a jako předchozí znalost obvykle předpokládají. 4) Nepřeložitelnost neexistuje, existuje jen omezená znalost slovníkáře: problémy se neházejí pod stůl, ale řeší dobrým příkladem a kontextem, když je nelze zobecnit jako význam.

5) Žádný slovník není bez chyb. Slovník je umění možného 5) Žádný slovník není bez chyb. Slovník je umění možného. 6) Slovu neodpovídá slovo, ale heslu heslo s celým aparátem a vztahy. 7) Ekvivalent je především sémanticko‑funkční, založený na aproximativní identitě úzu i systémové příslušnosti toho, co se srovnává v obou jazycích. Skutečný úzus lze zjistit jen studiem typické kolokability. 8) Heslo a jeho informace má vyhovět potřebě uživatele a povaze sledovaného jazyka, a proto může být svou povahou jak nadslovní, tak podslovní. Je v průsečíku relevantních vztahů paradigmatických a syntagmatických.

9) Slovník je přítel, a ne učeně odpudivý povýšenec či podvodník: přes velkou sumu vloženého umu a znalostí musí vycházet vstříc, a ne mást či jen rozmarně napovídat, nakusovat. 10) Lepší jeden slovník než deset gramatik, je‑li dobře udělán.

Děkuji za pozornost!