Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Korpusová lingvistika (6) Kolokace

Podobné prezentace


Prezentace na téma: "Korpusová lingvistika (6) Kolokace"— Transkript prezentace:

1 Korpusová lingvistika (6) Kolokace
Jan Radimský FF JU České Budějovice

2 Pojem kolokace... Kolokace = co – locare: to, co je (obvykle) v korpusu vedle sebe Korpus umožňuje získat velké množství informací o souvýskytech Slova se spojují do syntagmat podle syntaktických pravidel Ale ne všechny kombinace jsou stejně frekventované (bílá tráva, rozumný strom...) John R. Firth (1951, 1957): You shall know a word by the company it keeps První, kdo položil teoretické základy pro studium kolokací Určitá slova se navzájem předpokládají: slovo „Y“ se objevuje vedle báze „X“ častěji, než by bylo statisticky pravděpodobné (důkladná analýza, konečné rozhodnutí). Kolokace v sobě zahrnují idiomy (jako podmnožinu): modrá knížka

3 Přístupy ke kolokacím Existují dvě základní pojetí:
Kvantitativní (statistické): J.R.Firth, J. Sinclair... E. Tognini-Bonelli... nebere v úvahu syntaktické vztahy Fq: to je, to bylo, to v, to se, to na... MI-score: to nezakřikli, to nepřipomínej, to nepoplet, to autínko... ? to neva (vysoké MI), cf. levostranné kolokáty pro neva Funkční berou v úvahu sx. vztahy zajímají se pouze o určité typy kolokací

4 Kvantitativní přístup
Cf. prezentace o Tognini-Bonelli ... nepoužívat lematizaci popsat jazyk „bez syntaxe“, pouze statisticky Dva zajímavé principy: John Sinclair (1991): Corpus, concordance, collocation Open choice principle („slot and filler“) nakreslit + ? Idiom principle – nulový výběr (locutions) nemaluj čerta na + ?

5 Funkční přístup Existuje celá řada typologií FJ IJ ŠJ
V ČR – František Čermák (rozsáhlá bibliografie, vychází z ČNK) např.: Syntagmatika slovníku: typy lexikálních kombinací. In: Čeština – univerzália a specifika 3, Brno, 2001. FJ Langue française 150 (tématické číslo): Collocations, corpus, dictionnaires, 2006 Anderson, Wendy J. (2006), The Phraseology of Administrative French. A corpus-based study. Amsterdam-New York, Rodopi. G. Williams... IJ Marco Baroni, Elisabetta Ježek... ŠJ Např.: Joaquín Giráldez Ceballos-Escalera, LAS COLOCACIONES LÉXICAS EN EL LENGUAJE JURÍDICO DEL DERECHO CIVIL FRANCÉS. PhD. dizertace, UNIVERSIDAD COMPLUTENSE DE MADRID.

6 Čermák - typologie A Systémové 1 pravidelné
a: termínové kolokace (víceslovné termíny) b: propriální kolokace (víceslovná propria) 2 nepravidelné : idiomatické kolokace (idiomy a frazémy) B Textové 3 pravidelné a: běžné kolokace (gram-sémantické kombinace) b: analytické kombinace tvarů (analytické formy) 4 nepravidelné a: individuální metaforické kolokace (autorské metafory) b: náhodné kombinace sousední c: jiné kombinace (blábol)

7 Otevřené otázky ... jaká kritéria jsou použita?
Frekvenční: ustálenost (typický – běžný – řídký – potenciální) Sémantická lze dané jednotky kombinovat? je význam celku prediktabilní? odkazuje na jasně daný koncept? Formální existují formální restrice?

8 Funkční klasifikace kolokací: Marco Baroni
Volné kombinace (Combinazioni libere) lavare la macchina (umýt auto) quaderno rosso (červený sešit) Vázané kombinace Omezené kombinace (Combinazioni ristrette) parcheggiare la macchina (zaparkovat auto) capelli biondi (blond vlasy) Kolokace (Collocazioni) Konstrukce s kategoriálním slovesem (Costruzioni a verbo supporto) fare una telefonata (uskutečnit telefonní hovor) prendere sonno (být přemožen spánkem) Frazeologismy (Espressioni idiomatiche) Giovanni ha cantato (Giovanni zazpíval, tj. vyzradil tajemství) Ostatní kolokace stendere un documento (sepsat dokument) disco fisso (pevný disk)


Stáhnout ppt "Korpusová lingvistika (6) Kolokace"

Podobné prezentace


Reklamy Google