Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005.

Podobné prezentace


Prezentace na téma: "Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005."— Transkript prezentace:

1 Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL,

2 Jak zmenšit VALLEX? Osnova: 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí

3 VALLEX Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“ –stát – někde, o někoho, za něco, za něčím, při někom… –odpovídat – někomu na něco, za někoho, něčemu –brát – něco někomu, za něco, roha, zasvé,… Teorie valence ve Funkčním generativním popisu –aktanty-volná doplnění, posouvání, obligatornost… VALLEX –valenční slovník českých sloves budovaný na základě FGP od jara 2001 –verze 1.0 zveřejněná na podzim 2003 (cca 1400 sloves) –http://ckl.mff.cuni.cz/zabokrtsky/vallex/1.0

4 Volba termínů pro popis slovníku Filipec, 1994 – lexém trojí úrovně: 1. odpovídat, 2. odpovídat 2 (čemu), 3. „ Neodpovídá požadavkům“ Mel’čuk, Žolkovskij, 1984 vocabel (odpovídat) vs. lexeme (odpovídat 2 ) Filipec,Čermák, 1985 lexém vs. lexie Cruse, 1986 lexém vs. lexikální jednotka

5 Jak snížit počet hesel ve VALLEXu tradiční pohled: –1 slovníkové heslo ~ 1 lexém ~ 1 lemma řešení: –více slovesných lemmat v jednom lexému

6 Sloučení vidových „dvojic“ do jediného lexému + přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness) + snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky) – vidové protějšky nesdílí všechny významy/rámce – problematické vymezení vidové dvojice – ztráta stromové struktury slovníku – nestandardní makrostruktura slovníku – jak má vypadat tektogramatické lemma (t-lemma v PDT 2.0)? dát dávat dávávat

7 Vidové dvojice způsoby tvoření vidových dvojic: (a) – sufixace (vypsat-vypisovat) (b) – prefixace (psát-napsat) (c) – supletivní dvojice (vzít-brát) problematické (b) –nejednoznačný dok. protějšek (zblednout/vyblednout) –hypotéza čistě vidové předpony –kritérium sekundární imperfektivizace (napisovat?) závěr: –ve VALLEXu do jednoho lexému raději jen (a) a (c)

8 Změna datové struktury VALLEX 1.0VALLEX 2.0 lemma-pf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-pf

9 Kvantitativní důsledky sloučení vidových dvojic ve VALLEX 1.5 před sloučením vid. dvojic: –2451 lexémů (1338 impf, 1075 perf, 38 biasp) –6411 lexikálních jednotek po sloučení vidových dvojic –1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp) –4303 lexikálních jednotek, z toho 2623 u sloučených lexémů z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice závěr: –sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu (co do počtu lexémů i lexikálních jednotek) při zachování stejné informace

10 Další kandidáti na sloučení determinovaná / nedeterminovaná slovesa – jít-chodit, jet-jezdit, běžet-běhat... pro: –posun v (základním) lexikálním významu je srovnatelný s posunem u vidových dvojic proti: –jen malá uzavřená skupina –další zkomplikování datové struktury

11 Jak snížit počet rámců? tradiční pohled: –1 podheslo (LU) ~ 1 rámec ~ 1 význam řešení –více rámců/významů v jedné LU

12 Kandidáti na sloučení odevzdat nález policii – na policii ukradl bance peníze – peníze z banky vyčistit šaty od bláta – bláto z šatů naložit vůz cementem – cement na vůz osázet park stromy – stromy do parku prorazit hřebík plechem – plech hřebíkem vyjít na kopec – vyjít kopec oloupat slupku z jablka – jablko umístit nábytek do bytu – nábytek v bytě slunce vyzařuje světlo – světlo vyzařuje ze slunce tričko pouští barvu – barva pouští z trička

13 Volba termínu –diateze - Mel’čuk, Cholodovič, 1970 –hierarchizace – Daneš, 1985 –alternace – Levinová, 1993 Trojí projev alternace (1) změna (povrchové) formy predikátoru (2) změna valenčního rámce (3) změna lexikálního významu Pozn.: model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek Alternace

14 (1) Změna formy predikátoru alternace v širokém pojetí: –pasivizace (být vybrán) –reflexivizace (mýt se) –složený tvar s pomocným slovesem (dostat slíbeno) –dispoziční modalita (Knížka se mi čte dobře.) –? prefixace (nachodit se - alternace přes hranice lexému!)

15 (2) Změna valenčního rámce Změny ve valenčních rámcích: –přibyde aktant (Vyběhl kopec.) –ubyde aktant (Pepík už čte.) –záměna dvou valenčních členů s různým funktorem – např. ADDR-DIR3 (možný souvýskyt: Poslal jeden dopis babičce a dva domů.) –náhrada jednoho funktoru skupinou: DIFF – DIR1+DIR3, DIFF – ORIG+EFF (klesl o 10cm/ze 150 na 140 cm), LOC – DIR1+DIR3

16 (3) Změna lexikálního významu ne nutně zcela totožná situace, ale změna významu po provedení alternace je (pro třídu sloves, která se této alternace může účastnit) predikovatelná různý (ontologický,pragmatický?) vztah argumentů a predikátu –... hřebík.PAT plechem – plech.PAT hřebíkem

17 Příklad 1: „odstraňování z kontejneru“ vybalit (dárky,kufr), vykácet (stromy, zahradu), vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník)... (Daneš,1985) změna formy predikátoru: žádná změna valenčního rámce: ubude obl. DIR1 (ale: vysypat popelník z okna(?)) změna významu: –před alternací je kontejner na tg.rovině obsažen v DIR1, po alternaci je PAT –po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)

18 Příklad 2: dispoziční modalita dobře se mi čte (ta kniha) (ale: *zná se mi dobře, *umí se mi dobře, *cítí se mi dobře) změna formy predikátu: reflex. změna valence: přibude hodnotící obl.MANN, ACT(3) a non-obl PAT(1) změna významu: modální příznak

19 Příklad 3: „ztranzitivnění“ sloves pohybu vyjít/vyběhnout/vyjet/vylézt na kopec/kopec změna formy predikátu: žádná změna valence: ubude obl.DIR3, přibude obl. PAT změna významu: před alternací jde jen o dosažení cíle, po alternaci jde o zdolání úseku

20 ČNK: plavat + ak.

21 Alternační model valenčního slovníku LEXÉM LEX. JEDNOTKA RÁMEC lemma1 lemma2 LEX. FORMY LEXÉM LEX. JEDNOTKA ZÁKL. RÁMEC lemma1 lemma2 LEX. FORMY ODV. RÁMCE

22 Další výhody alternačního modelu –valence komparativů a superlativů tatáž lexikální jednotka, ale jiná valence –valence substantiv („přetížený“ genitiv) Karlův dluh dvou miliónů / dluh Karla –valence anglických sloves He gave Mary a book / He a book to Mary. –„nadfunktory“ DIR1-TFRWH: pochází z osmého století / ze střední Asie –krok k vyšší (sémanticko-logické?) rovině popisu jazyka napustil vanu vodou  napustil vodu do vany

23 Závěr sloučení vidových dvojic –významné snížení redundance slovníku –přiblížení FGP –komplikovanější datová struktura slovníku alternační model valenčního slovníku –snížení redundance slovníku –jednotný mechanismus pro popis řady dosud (v rámci VALLEXu) nezachytitelných situací –zásah do valenční teorie FGP –komplikovanější datová struktura slovníku otevřené otázky...

24 „Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko.“


Stáhnout ppt "Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005."

Podobné prezentace


Reklamy Google