Karkulka měla navštívit babičku. Ale sežral ji vlk. Antecedent zájmena 3. osoby (předběžné) výsledky Alena Poncarová alena.poncarova@gmail.com Žďárek 5/2013
Příspěvek Antecedent zájmena 3. osoby Centering Hypotézy Data Výsledky PDT Dotazníkové šetření Výsledky
Antecedent zájmena 3. osoby tendence umisťování antecedentu zájmena třetí osoby v textu nejen povrchová vyjádření – nevyjádřené podměty atd. zájmena osobní, přivlastňovací ne ukazovací, relační a reflexivní – většinou jasná koreferenční vazba proměnné: AČV (T-R), větný člen (Po-Pt)
Centering syntaktická teorie modelující lokální vztahy v textu centering poskytuje kvantitativní předpoklady sémantické entity – centra pozornosti Cf – forward looking center réma možnost založit koreferenční řetězec Cp – prefered center (vztah k Cb) nejvíce pozornosti větný člen (Po > Pt > něco jiného), slovosled Cb - backward looking center téma, jen 1 ve větě Cp předchozí věty
Typy vztahů POKRAČOVÁNÍ HLADKÝ POSUN PONECHÁNÍ HRUBÝ POSUN Cb - téma Cp - podmět
Pracovní hypotézy CENTERING (angličtina) AČV a VČ ovlivňují utváření koreferenčního řetězce Navazování na T je signifikantně častější než na F. Navazování na Po je signifikantně častější než na Pt. OČEKÁVANÉ VÝSLEDKY nepotvrzení hypotézy T-F Byl jednou jeden král. Ten měl 3 dcery. První se jmenovala … Kruijff-Korbayová + Hajičová (1997) potvrzení hypotézy Po-Pt
PDT textová koreference: 6 000
PDT – téma X réma do: T/C F z T z C z F sum 4 489 26 31 4 515 1 547 18 1 565 F nezapočítán Welch Two Sample t-test data: PDTTR$TC and PDTTR$F t = 0.629, df = 2.464, p-value = 0.5828 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -4688.762 6666.096 sample estimates: mean of x mean of y 1515.3333 526.6667 Welchův test t=0.629 p-value = 0.5828 p > 0.05
PDT – téma X réma - efektivní brácha do: T C F z T z C z F 2 641 552 993 17 10 18 2 9 sum 3 210 20 bez ohledu na větněčlenskou platnost Welch Two Sample t-test data: PDTTRef$doTC and PDTTRef$do.F t = 2.1784, df = 2, p-value = 0.1612 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1359.735 4149.068 sample estimates: mean of x mean of y 1404.333333 9.666667 Welchův test t= -2.178 p-value = 0.161 p > 0.05
PDT – Po x Pt do: Po Pt do T do C do F sum 569 249 241 1 059 703 294 290 1 287 bez ohledu na to, z čeho se odkazuje Welchův test t = -0,4356 p-value = 0.6868 p > 0.05
PDT – Po x Pt – efektivní brácha do: Po Pt z Po z Pt z X 23 51 24 19 47 sum 97 90 konkurence jen v necelých 5% - jen 66 případů souvýskytu Po a Pt jako ef. br. ze 307 rozlišení Nom a Acc tvarů bez ohledu na postavení v T nebo F Welchův test t = 0.184 p-value = 0.863 p > 0.05
PDT neposkytuje signifikantní výsledky
Dotazníkové šetření
Dotazníkové šetření AČV Pan listonoš dnes doručil objednaný časopis. Zpozdil se. Objednaný časopis dnes doručil pan listonoš. VČ Panem listonošem byl dnes doručen objednaný časopis. Zpozdil se. nejednoznačné kontexty 16 testovacích kontextů x 4 varianty 4 varianty dotazníku: 5x(T, F, Po, Pt)
Přijatelnost 16 uměle vytvořených kontextů x 3 varianty, tj. 48 položek 80 respondentů škála 1-7 (1 = normální česká věta, 7 = ne) >>> pořadí přijatelnosti kontextů
Přijatelnost - výsledky počet řešení (aplikováno v celé trojici) průměr do 4.00 38 OK obě hodnoty do 4.5 4 zachovány jako testovací průměr nad 4.5, jediné ze 3 2 zachovány jako testovací, upraveny více variant v trojici hodnoceno negativně 2 (1) přesunuty do výplňkových kontextů, nahrazeno novým kontextem průměr i medián negativní (nad 5.0)
Vlastní dotazník 20 sledovaných položek v každé ze 4 variant stejné pořadí sledovaných vs. výplňkových položek ve všech variantách 1 otázka na stránku, bez možnosti návratu elektronická forma 20vteřinový limit pohlaví ani věk nemá signifikantní vliv age sex sum 15- m 2 f 16 - 30 52 197 145 31 - 45 14 31 17 46 - 60 15 43 28 61+ 6 12 87 285 198
Surové výsledky T F Po Pt . Q1 321 385 495 204 4+11 1 420 Q2 439 255 sum Q1 321 385 495 204 4+11 1 420 Q2 439 255 464 228 16+18 Q3 419 284 406 298 7+6 Q4 363 344 336 365 3+9 1 542 1 268 1 701 1 095 74 5 680
Surové výsledky T F Po Pt . Q1 321 385 495 204 4+11 1 420 Q2 439 255 sum Q1 321 385 495 204 4+11 1 420 Q2 439 255 464 228 16+18 Q3 419 284 406 298 7+6 Q4 363 344 336 365 3+9 1 542 1 268 1 701 1 095 74 5 680
Po Pt 1 701 1 095 T F 1 542 1 268
Statistika T F Po Pt 1 542 1 268 1 701 1 095 t = 1.724 t = 3.001 p-value = 0.136 p > 0.05 p-value = 0.024 p < 0.05
Statistika T F Po Pt 1 542 1 268 1 701 1 095 t = 1.724 t = 3.001 p-value = 0.136 p > 0.05 p-value = 0.024 p < 0.05
Statistika T F Po Pt 1 542 1 268 1 701 1 095 t = 1.724 t = 3.001 p-value = 0.136 p > 0.05 p-value = 0.024 p < 0.05
Statistika T F Po Pt 1 542 1 268 1 701 1 095 t = 1.724 t = 3.001 p-value = 0.136 p > 0.05 p-value = 0.024 p < 0.05
Hypotézy centeringové predikce nepotvrzené: Navazování na T je signifikantně častější než na F. potvrzené: Navazování na Po je signifikantně častější než na Pt. síla proměnných: VČ > AČV?
KarkulkaPo měla navštívit babičkuPt. Ale sežral ji vlk.
KarkulkaPo měla navštívit babičkuPt. Ale sežral ji vlk.
KarkulkaT měla navštívit babičkuF. Ale sežral ji vlk.
Literatura (výběr) BRENNAN, Susan (1995): Centering Attention in Discourse. Language and Cognitive Processes 10, s. 137-167. BRENNAN, Susan – FRIEDMAN, Marilyn – POLLARD, Carl (1987): A Centering Approach to Pronouns. IN Proceedings of the 25th Annual Meeting of the ACL. Stanford: Association of Computational Linguistics. GROSZ, Barbara – JOSHI, Aravind – WEINSTEIN, Scott (1995): Centering: A Framework for Modeling the Local Coherence of Discourse. Computational Linguistics 2, s. 203-225. KONG, Fang – ZHOU, GuoDong – ZHU, Qiaoming (2009): Employing the Centering Theory in Pronoun Resolution from the Semantic Perspective. IN Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics, s. 987-996. KRUIJFF-KORBAYOVÁ, Ivana - HAJIČOVÁ, Eva (1997): Topics and centers. A comparison of the salience-based approach and the Centering theory. The Prague Bulletin of Mathematical Linguistics 67, s. 25-50.
DĚKUJI ZA POZORNOST!