Korpusová lingvistika (6) Kolokace

Slides:



Advertisements
Podobné prezentace
Morfologie italštiny I (4) Determinační adjektiva & zájmena
Advertisements

Základní statistické pojmy
CJBB75 1 ZPK CJBB CJBB75 2 Je to, co je skryto ve značce „stupeň“, jediné, co je možné se z korpusu dozvědět o stupňování v češtině ? Pozice.
Korpusová lingvistika
Unità lessicali superiori
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
Počitatelná podstatná jména
Korpusová lingvistika (2)
AnotaceMateriál tvoří prezentace. Vyjádření vlastnictví, popsat předmět, určit barvu. AutorMgr. Olga Medunová JazykFrancouzština Očekávaný výstup Naučit.
Pojem / koncept Homonymie Ondřej Diblík – Simona Kukučová | |
Čeština jako ideální flexivní extrém?
MORFOLOGIE ČEŠTINY Přednáška je zaměřena na popis tvarosloví současné spisovné češtiny s ohledem na současnou morfologickou teorii, dále na zvládnutí.
Vybrané kapitoly z české morfologie a syntaxe iii.
PŘÍTOMNÝ ČAS PROSTÝ.
Portál autorit
Varianty výzkumu Kroky výzkumu Výběrový soubor
Název školy: Střední průmyslová škola, Ostrava - Vítkovice, příspěvková organizace Autor: Mgr. Dana Vicherková Datum: Název: VY_32_INOVACE_2.3.1.
Úvod do korpusové lingvistiky 8
STRUKTURA OSNOVY KURZU
ZS 2013/2014 Božena Bednaříková
Název školy: Střední průmyslová škola, Ostrava - Vítkovice, příspěvková organizace Autor: Mgr. Dana Vicherková Datum: Název: VY_32_INOVACE_2.3.4.
Korpusová lingvistika (4) Základy korpusové statistiky
Autorem materiálu a všech jeho částí, není li uvedeno jinak, je Kateřina Najmanová Trpný rod- The Passive.
Vítejte při prezentaci některých zajímavých vlastností slovníků Lingea Lexicon. Mezi stránkami můžete přecházet pomocí kláves, myší nebo počkat na automatické.
RUSKO, RUSKÝ JAZYK A LITERATURA VE VĚDECKÝCH ODBORNÝCH STUDENTSKÝCH PRACÍCH Bc. Kateřina Konečná Ruská slovesa bít a být s předponami ve srovnání s češtinou,
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
Logika: systémový rámec rozvoje oboru v ČR a koncepce logických propedeutik pro mezioborová studia (reg. č. CZ.1.07/2.2.00/ , OPVK)
AKM'06 Praha NA Nové nástroje pro archivaci webu Ing. Petr Žabička, MZK Mgr. Jan HUTAŘ, NK.
Korpusová lingvistika (5) Korpus CORTE Jan Radimský FF JU České Budějovice.
Metaetika Shrnutí.
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Rozhodovací procesy.
Dagmar Strejčková Kapitoly z lexikologie současné češtiny Kapitoly z lexikologie českého jazyka Dagmar Strejčková
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
LEXIKOSTATISTIKA A JEJÍ POSTAVENÍ V SYSTÉMU KVANTITATIVNÍ –STATISTIKA –TEORIE PRAVDĚPODOBNOSTI NEKVANTITATIVNÍ –ALGEBRA –MAT. LOGIKA –MAT. MODELOVÁNÍ.
REŠERŠNÍ STRATEGIE Mgr. Anna Vitásková.
Markéta Lopatková Karolína Skwarska Václava Kettnerová Eduard Bejček
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5.
NÁZEV ŠKOLY: Základní škola Javorník, okres Jeseník REDIZO: NÁZEV: VY_32_INOVACE_428_Minulý čas slovesa TO BE AUTOR: Ing. Magdalena Nemeškalová.
Využití Hilbertovy báze k ověření shodnosti strukturálních a kombinatorických imsetů Petr Šimeček(MFF UK) Milan Studený(ÚTIA AV ČR)
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Jana Holá Tvorba rešerše Jana Holá
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
HYPOTÉZY „Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v.
TEXTO 3. MARKETING Los trucos que nos hacen comprar 1)RESPONDA LAS PREGUNTAS. 1.¿Con qué motivo se distribuyen los productos en un supermercado en cierto.
Metody sociálního výzkumu 3. blok Denní studium LS 2008/ blok.
Tento projekt je financován z Operačního programu Vzdělávání pro konkurenceschopnost prostřednictvím Evropského sociálního fondu a státního rozpočtu ČR.
Vektorová grafika (11). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.
ELRC Seminář, Praha, Jan Hajič (MFF UK) Jak je možno se zapojit? 1.
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
Anglický slovosled v oznamovací větě CZ.1.07/1.4.00/ VY_32_INOVACE_3209_AJ6 ©Dagmar Markova,2012 Masarykova základní škola Zásada, okres Jablonec.
D OPADY ÚČETNÍ REFORMY VEŘEJNÝCH FINANCÍ V KONKRÉTNÍCH PODMÍNKÁCH VYBRANÉ ZÁKLADNÍ ŠKOLY Vysoká škola technická a ekonomická v Českých Budějovicích Ústav.
Slovosled v anglické větě
Klára Osolsobě, Hana Žižková
Sousloví v tezaurech dle normy ČSN
Spolupráce organizací občanské společnosti na úrovni EU
Varianty výzkumu Kroky výzkumu Výběrový soubor
Tento projekt je spolufinancován Evropskou unií.
Akvizice a informační fond
Diversity management organizace Masarykův ústav vyšších studií Autor: Eliška Jelínková 2016/2017 Vedoucí práce: Ing. Martin Šikýř Ph.D. Oddělení manažerských.
VIKMA05 Organizace znalostí
Jana Holá Tvorba rešerše Jana Holá
Jméno autora: Mgr. Jiří Kala Škola: ZŠ Náklo Datum vytvoření (období):
Automatická indexace Základní metody a postupy
Spojitá a kategoriální data Základní popisné statistiky
NÁZEV: VY_32_INOVACE_11 ČÍSLO PROJEKTU: CZ.1.07/1.4.00/
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Metody a techniky výzkumu II.
MOŽNOSTI PORTÁLU KNIHOVNY.CZ NEJEN PRO KNIHOVNÍKY
Transkript prezentace:

Korpusová lingvistika (6) Kolokace Jan Radimský FF JU České Budějovice

Pojem kolokace... Kolokace = co – locare: to, co je (obvykle) v korpusu vedle sebe Korpus umožňuje získat velké množství informací o souvýskytech Slova se spojují do syntagmat podle syntaktických pravidel Ale ne všechny kombinace jsou stejně frekventované (bílá tráva, rozumný strom...) John R. Firth (1951, 1957): You shall know a word by the company it keeps První, kdo položil teoretické základy pro studium kolokací Určitá slova se navzájem předpokládají: slovo „Y“ se objevuje vedle báze „X“ častěji, než by bylo statisticky pravděpodobné (důkladná analýza, konečné rozhodnutí). Kolokace v sobě zahrnují idiomy (jako podmnožinu): modrá knížka

Přístupy ke kolokacím Existují dvě základní pojetí: Kvantitativní (statistické): J.R.Firth, J. Sinclair... E. Tognini-Bonelli... nebere v úvahu syntaktické vztahy Fq: to je, to bylo, to v, to se, to na... MI-score: to nezakřikli, to nepřipomínej, to nepoplet, to autínko... ? to neva (vysoké MI), cf. levostranné kolokáty pro neva Funkční berou v úvahu sx. vztahy zajímají se pouze o určité typy kolokací

Kvantitativní přístup Cf. prezentace o Tognini-Bonelli ... nepoužívat lematizaci popsat jazyk „bez syntaxe“, pouze statisticky Dva zajímavé principy: John Sinclair (1991): Corpus, concordance, collocation Open choice principle („slot and filler“) nakreslit + ? Idiom principle – nulový výběr (locutions) nemaluj čerta na + ?

Funkční přístup Existuje celá řada typologií FJ IJ ŠJ V ČR – František Čermák (rozsáhlá bibliografie, vychází z ČNK) např.: Syntagmatika slovníku: typy lexikálních kombinací. In: Čeština – univerzália a specifika 3, Brno, 2001. FJ Langue française 150 (tématické číslo): Collocations, corpus, dictionnaires, 2006 Anderson, Wendy J. (2006), The Phraseology of Administrative French. A corpus-based study. Amsterdam-New York, Rodopi. G. Williams... IJ Marco Baroni, Elisabetta Ježek... ŠJ Např.: Joaquín Giráldez Ceballos-Escalera, LAS COLOCACIONES LÉXICAS EN EL LENGUAJE JURÍDICO DEL DERECHO CIVIL FRANCÉS. PhD. dizertace, UNIVERSIDAD COMPLUTENSE DE MADRID.

Čermák - typologie A Systémové 1 pravidelné a: termínové kolokace (víceslovné termíny) b: propriální kolokace (víceslovná propria) 2 nepravidelné : idiomatické kolokace (idiomy a frazémy) B Textové 3 pravidelné a: běžné kolokace (gram-sémantické kombinace) b: analytické kombinace tvarů (analytické formy) 4 nepravidelné a: individuální metaforické kolokace (autorské metafory) b: náhodné kombinace sousední c: jiné kombinace (blábol)

Otevřené otázky ... jaká kritéria jsou použita? Frekvenční: ustálenost (typický – běžný – řídký – potenciální) Sémantická lze dané jednotky kombinovat? je význam celku prediktabilní? odkazuje na jasně daný koncept? Formální existují formální restrice?

Funkční klasifikace kolokací: Marco Baroni Volné kombinace (Combinazioni libere) lavare la macchina (umýt auto) quaderno rosso (červený sešit) Vázané kombinace Omezené kombinace (Combinazioni ristrette) parcheggiare la macchina (zaparkovat auto) capelli biondi (blond vlasy) Kolokace (Collocazioni) Konstrukce s kategoriálním slovesem (Costruzioni a verbo supporto) fare una telefonata (uskutečnit telefonní hovor) prendere sonno (být přemožen spánkem) Frazeologismy (Espressioni idiomatiche) Giovanni ha cantato (Giovanni zazpíval, tj. vyzradil tajemství) Ostatní kolokace stendere un documento (sepsat dokument) disco fisso (pevný disk)