Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005.

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Úvod do studia jazyka – 4. Gramatika Morfologie.
Gramatémy ve FGP a v PDT II Část 2
1 / 28 Všechno, co jste chtěli vědět o valenci, ale... Předběžná zpráva o přípravě komplexně anotovaného valenčního slovníku sloves Markéta Straňáková-Lopatková.
CJBB75 1 ZPK CJBB75 čtvrtek G
Rozkazovací způsob.
Studentská inovace praxí
Základové větné struktury, slovesná valence a její chápání
Lingvistika dvacátého století Magda Ševčíková Přednáška
89.1 SLOVESA – osoba, číslo, slovesný způsob, čas
Základní syntaktické pojmy
VY_32_INOVACE_Čj-Ml 6.,7.18 Anotace: Prezentace je zaměřena na druhy přísudku. Obsahuje základní pravidla pro tvoření přísudku slovesného a jmenného se.
Trpný rod Matěj Suchánek.
VY_32_INOVACE_Čj-Ml 6.,7.15 Anotace: Prezentace je zaměřena na slovesné kategorie rod a vid. Ke každé kategorii je uvedena stručná definice s příklady.
Pojem / koncept Homonymie Ondřej Diblík – Simona Kukučová | |
Vzorce se slovesy s obecným významem změny Jiří Řezáč VMS, 8. prosince 2009.
Valenční slovník: od sloves k substantivům
Modální slovesa a jejich opisné tvary
Jazyk a jazyková komunikace Cizí jazyk Nezbytná gramatika v angličtině MUST / HAVE TO VY_22_INOVACE_06 Sada 4 Základní škola T. G. Masaryka, Český Krumlov,
Morfologie savců a ptáků Karolína Rezková. T-exkurze jsou skvělou příležitostí pro středoškoláky, kteří si chtějí vyzkoušet něco nad rámec školní výuky.
Workshop 3 grantů – PDT 3.0 – představy, realita, budoucnost Jarmila Panevová.
Co má obsahovat prezentace
Definování prostředí pro provozování aplikace dosud jsme řešili projekt v obecné rovině aplikace bude ovšem provozována v konkrétním technickém a programovém.
Označení materiálu: VY_32_INOVACE_KASPE_ANGLICTINA1_06
Slovesný vid Dokonavý nedokonavý.
Příklad přejímací kontroly A Příklad uvádí, jak ovlivní střední hodnota a směrodatná odchylka pravděpodobnost chyby (vadného výrobku). Ptáme se, kolik.
DATOVÉ MODELY (c) Tralvex Yeap. All Rights Reserved.
Valence a Pražský závislostní korpus (PDT)
1 / 36 Komplexně anotovaný elektronický valenční slovník českých sloves Markéta Straňáková-Lopatková Zdeněk Žabokrtský říjen 2001.
Slovesný vid Slovesný vid VY_32_INOVACE_ČJ-M 8.,9.03.
Výroková logika.
Věta, výpověď, promluva Název materiálu: VY_32_INOVACE_CJ3r0101
LINGUA CECA I LM Udine 2013/2014. Přednáška P4 STAVBA ČESKÉ VĚTY Pravovalenční členy větné struktury - komplementy.
Vítejte při prezentaci některých zajímavých vlastností slovníků Lingea Lexicon. Mezi stránkami můžete přecházet pomocí kláves, myší nebo počkat na automatické.
http:// Metody morfologické analýzy Seznam slovních tvarů –books: book-1/NNS, book-2/VBZ Zadrátovat do programu –hlavní.
Název školy Základní škola Domažlice, Komenského 17 Číslo projektu CZ.1.07/1.4.00/ Název projektu „EU Peníze školám ZŠ Domažlice“ Číslo a název.
ŠKOLA:Gymnázium, Tanvald, Školní 305, příspěvková organizace ČÍSLO PROJEKTU:CZ.1.07/1.5.00/ NÁZEV PROJEKTU:Šablony – Gymnázium Tanvald ČÍSLO ŠABLONY:VI/2.
K sémantice základních číslovek Alena Poncarová 13-14/V 2011.
Predikátová logika1 Predikátová logika 1. řádu Teď „logika naostro“ !
Dagmar Strejčková Kapitoly z lexikologie současné češtiny Kapitoly z lexikologie českého jazyka Dagmar Strejčková
Automatická předanotace TFA v české části PCEDT GAP406/10/0875 (Komputační lingvistika: Explicitní popis jazyka a anotovaná data se zřetelem na češtinu)
Markéta Lopatková Karolína Skwarska Václava Kettnerová Eduard Bejček
Významy morfologických kategorií v PDT 2.0 Magda Razímová Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulta Univerzita Karlova v Praze.
Tento Digitální učební materiál vznikl díky finanční podpoře EU- OP Vzdělávání pro konkurenceschopnost. Není –li uvedeno jinak, je tento materiál zpracován.
Explicitní popis jazyka a anotovaná data se zřetelem na češtinu GA ČR P406/10/0875 Explicitní popis jazyka a anotovaná data se zřetelem na češtinu Workshop.
INVESTICE, INVESTIČNÍ PRÁVO, SMLOUVA O DODÁVCE INVESTIČNÍCH CELKŮ
UDINE Lingua ceca I LM ZS 2013/2014 Božena Bednaříková.
pokus o obecnou teorii sociálního jednání (T
Úvod do databází zkrácená verze.
Zásady tvorby dotazníků Radka Štěpánová, IBA MU. Stavba dotazníku Úvod Otázky Identifikace.
Tato práce je šířena pod licencí CC BY-SA 3
Logické principy QCA Karel Kouba.
OZNAČENÍ MATERIÁLU: VY_32_INOVACE_274_ČJ8
Mgr. Marie Havránková TVAROSLOVÍ 7 - slovesa Mluvnice pro 2. ročník
SLOVESA SE SLŮNĚTEM PRO DRUHÁČKY
Co umí český slovesný vid
Výukový materiál zpracovaný v rámci projektu EU peníze školám
Výukový materiál zpracovaný v rámci projektu EU peníze školám
Zdravotnický management
vnímání velikosti a prostoru zpracování zrakové informace v mozku
Základní skladební dvojice Název projektu: OP VK
Tvoření slov - slova značková, neutvořená x slova utvořená, motivovaná, popisná.
Šablona 32 VY_32_INOVACE_13_24_Slovesný vid
Otázky pro průběžnou práci
Busines Object Relation Modeling
Dělitelnost přirozených čísel
Otázka, přítomný průběhový
KMT/DIZ1 Věty, poučky a jejich důkazy ve školské matematice
ZÁKLADNÍ ŠKOLA, JIČÍN, HUSOVA 170
Analýza informačního systému
Transkript prezentace:

Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL,

Jak zmenšit VALLEX? Osnova: 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí

VALLEX Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“ –stát – někde, o někoho, za něco, za něčím, při někom… –odpovídat – někomu na něco, za někoho, něčemu –brát – něco někomu, za něco, roha, zasvé,… Teorie valence ve Funkčním generativním popisu –aktanty-volná doplnění, posouvání, obligatornost… VALLEX –valenční slovník českých sloves budovaný na základě FGP od jara 2001 –verze 1.0 zveřejněná na podzim 2003 (cca 1400 sloves) –

Volba termínů pro popis slovníku Filipec, 1994 – lexém trojí úrovně: 1. odpovídat, 2. odpovídat 2 (čemu), 3. „ Neodpovídá požadavkům“ Mel’čuk, Žolkovskij, 1984 vocabel (odpovídat) vs. lexeme (odpovídat 2 ) Filipec,Čermák, 1985 lexém vs. lexie Cruse, 1986 lexém vs. lexikální jednotka

Jak snížit počet hesel ve VALLEXu tradiční pohled: –1 slovníkové heslo ~ 1 lexém ~ 1 lemma řešení: –více slovesných lemmat v jednom lexému

Sloučení vidových „dvojic“ do jediného lexému + přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness) + snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky) – vidové protějšky nesdílí všechny významy/rámce – problematické vymezení vidové dvojice – ztráta stromové struktury slovníku – nestandardní makrostruktura slovníku – jak má vypadat tektogramatické lemma (t-lemma v PDT 2.0)? dát dávat dávávat

Vidové dvojice způsoby tvoření vidových dvojic: (a) – sufixace (vypsat-vypisovat) (b) – prefixace (psát-napsat) (c) – supletivní dvojice (vzít-brát) problematické (b) –nejednoznačný dok. protějšek (zblednout/vyblednout) –hypotéza čistě vidové předpony –kritérium sekundární imperfektivizace (napisovat?) závěr: –ve VALLEXu do jednoho lexému raději jen (a) a (c)

Změna datové struktury VALLEX 1.0VALLEX 2.0 lemma-pf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-pf

Kvantitativní důsledky sloučení vidových dvojic ve VALLEX 1.5 před sloučením vid. dvojic: –2451 lexémů (1338 impf, 1075 perf, 38 biasp) –6411 lexikálních jednotek po sloučení vidových dvojic –1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp) –4303 lexikálních jednotek, z toho 2623 u sloučených lexémů z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice závěr: –sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu (co do počtu lexémů i lexikálních jednotek) při zachování stejné informace

Další kandidáti na sloučení determinovaná / nedeterminovaná slovesa – jít-chodit, jet-jezdit, běžet-běhat... pro: –posun v (základním) lexikálním významu je srovnatelný s posunem u vidových dvojic proti: –jen malá uzavřená skupina –další zkomplikování datové struktury

Jak snížit počet rámců? tradiční pohled: –1 podheslo (LU) ~ 1 rámec ~ 1 význam řešení –více rámců/významů v jedné LU

Kandidáti na sloučení odevzdat nález policii – na policii ukradl bance peníze – peníze z banky vyčistit šaty od bláta – bláto z šatů naložit vůz cementem – cement na vůz osázet park stromy – stromy do parku prorazit hřebík plechem – plech hřebíkem vyjít na kopec – vyjít kopec oloupat slupku z jablka – jablko umístit nábytek do bytu – nábytek v bytě slunce vyzařuje světlo – světlo vyzařuje ze slunce tričko pouští barvu – barva pouští z trička

Volba termínu –diateze - Mel’čuk, Cholodovič, 1970 –hierarchizace – Daneš, 1985 –alternace – Levinová, 1993 Trojí projev alternace (1) změna (povrchové) formy predikátoru (2) změna valenčního rámce (3) změna lexikálního významu Pozn.: model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek Alternace

(1) Změna formy predikátoru alternace v širokém pojetí: –pasivizace (být vybrán) –reflexivizace (mýt se) –složený tvar s pomocným slovesem (dostat slíbeno) –dispoziční modalita (Knížka se mi čte dobře.) –? prefixace (nachodit se - alternace přes hranice lexému!)

(2) Změna valenčního rámce Změny ve valenčních rámcích: –přibyde aktant (Vyběhl kopec.) –ubyde aktant (Pepík už čte.) –záměna dvou valenčních členů s různým funktorem – např. ADDR-DIR3 (možný souvýskyt: Poslal jeden dopis babičce a dva domů.) –náhrada jednoho funktoru skupinou: DIFF – DIR1+DIR3, DIFF – ORIG+EFF (klesl o 10cm/ze 150 na 140 cm), LOC – DIR1+DIR3

(3) Změna lexikálního významu ne nutně zcela totožná situace, ale změna významu po provedení alternace je (pro třídu sloves, která se této alternace může účastnit) predikovatelná různý (ontologický,pragmatický?) vztah argumentů a predikátu –... hřebík.PAT plechem – plech.PAT hřebíkem

Příklad 1: „odstraňování z kontejneru“ vybalit (dárky,kufr), vykácet (stromy, zahradu), vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník)... (Daneš,1985) změna formy predikátoru: žádná změna valenčního rámce: ubude obl. DIR1 (ale: vysypat popelník z okna(?)) změna významu: –před alternací je kontejner na tg.rovině obsažen v DIR1, po alternaci je PAT –po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)

Příklad 2: dispoziční modalita dobře se mi čte (ta kniha) (ale: *zná se mi dobře, *umí se mi dobře, *cítí se mi dobře) změna formy predikátu: reflex. změna valence: přibude hodnotící obl.MANN, ACT(3) a non-obl PAT(1) změna významu: modální příznak

Příklad 3: „ztranzitivnění“ sloves pohybu vyjít/vyběhnout/vyjet/vylézt na kopec/kopec změna formy predikátu: žádná změna valence: ubude obl.DIR3, přibude obl. PAT změna významu: před alternací jde jen o dosažení cíle, po alternaci jde o zdolání úseku

ČNK: plavat + ak.

Alternační model valenčního slovníku LEXÉM LEX. JEDNOTKA RÁMEC lemma1 lemma2 LEX. FORMY LEXÉM LEX. JEDNOTKA ZÁKL. RÁMEC lemma1 lemma2 LEX. FORMY ODV. RÁMCE

Další výhody alternačního modelu –valence komparativů a superlativů tatáž lexikální jednotka, ale jiná valence –valence substantiv („přetížený“ genitiv) Karlův dluh dvou miliónů / dluh Karla –valence anglických sloves He gave Mary a book / He a book to Mary. –„nadfunktory“ DIR1-TFRWH: pochází z osmého století / ze střední Asie –krok k vyšší (sémanticko-logické?) rovině popisu jazyka napustil vanu vodou  napustil vodu do vany

Závěr sloučení vidových dvojic –významné snížení redundance slovníku –přiblížení FGP –komplikovanější datová struktura slovníku alternační model valenčního slovníku –snížení redundance slovníku –jednotný mechanismus pro popis řady dosud (v rámci VALLEXu) nezachytitelných situací –zásah do valenční teorie FGP –komplikovanější datová struktura slovníku otevřené otázky...

„Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko.“