Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts Kateřina.

Podobné prezentace


Prezentace na téma: "An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts Kateřina."— Transkript prezentace:

1 An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts (frantisek.martinek@ff.cuni.cz) Kateřina Rysová, Charles University in Prague, Faculty of Mathematics and Physics (katerina.rysova@post.cz)

2 I. Characteristics of the Corpus - ballanced electronic corpus of printed texts from 1500 to 1620 - more than 500 000 word forms - approximately 50 texts and extracts of longer texts

3 Abraham z Gynterrodu Cyri paedia 1605 1a Cyri paedia, hodnověrná starožitná historia o chvalitebném ve všelikých wewsselikých knížecích Knjžetcých ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském heroický šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem způsob Pán Bůh monarchí monarchie kaldejskou chaldejský skrze Daria […] a Cýra […] na médský Medský a perský národ přenesti přenésti a monarchí médskou Medskou a perskou zříditi a utvrditi ráčil. […] Léta Páně 1605. M. DC. V.

4

5

6

7 - - common abreviations in prints, - graphical variants of some letters (two letters for s (ſ), r or b), - distribution of capital and small letters, - using of Gothic and Latin type, - original punctuation (changed to the syntactic one), - some orthographical variants: wijera/wiera → viera, wijra/wjra → víra, naylepſſij/naglepſſij → najlepší What (ortho)graphical phenomena have been changed in the transcription:

8 Teoretical background of the transcription A three-level approach: 1. individual phenomenon (anomaly) 2. collective phenomenon Examples from vowel quantity: litost in place of lítost; míle, kníha, pozdvíhnouti, náděje etc. in place of -i-/-a-, probably also in imperatives of verbs with the suffix -ova-/-uj- (6th infinitive class) like nekupůj/nekupuoj in place of nekupuj and doubtless in masculine nominatives like muží, doktoří in place of muži, doktoři. 3. systematic phenomenon

9

10 II. A Possible Use of the Corpus Word order in Older Czech constructions “somebody deals with somebody somehow”

11 Position of actant and free verbal modification •(Ty jsi) přístup sobě k dosáhnutí toho království strojil,. •

12 Free modification vs. actant •Free verbal modification expressing manner: (to deal) “somehow” •Actant (inner participant) – patient: (to deal) “with somebody”

13 Sentences from the Corpus •affirmative •declarative •predicative verb – valency frame: ACT (obligatory), PAT (obligatory), MANN (obligatory) •predicative verb – semantics: mental action (e.g., ‘deal’, ‘handle’, ‘treat’)

14 The aim of the paper •Is it more typical in Older Czech to use “(to deal) with someone somehow” or “(to deal) somehow with someone”?

15 Results of the paper •Basic word-order position: 1.context unbound MANN 2.context unbound PAT “(to deal) somehow with somebody”

16 Example 1 •A v městě Brodě Uherském tolikéž vnově najatý soldát učiněn byl profousem (dosti postavy krásné a spanilé) a tolikéž •

17 Example 2 •Když sme pak k Solnaku přitáhli, tu sme novinu uslyšeli, kterak jest Hatvan od našich vzat,. •

18 Example 3 •I dí: Nebude více nazýváno jméno tvé toliko Jákob, ale také Izrael;, a přemohls. •

19 •Another typical word-order position: 1. context bound PAT 2. context unbound MANN „(to deal) with him/her somehow“

20 Example 1 •Proti tomu neučiní-li to, že jim budou živnosti zastavené, vojáky že mušejí chovati, kteréž že je bíti. •

21 Example 2 •V nenávisti máte dobré a milujete zlé, násilně snímáte kůži z lidu mého i maso z těla jejich, jedli ste tělo lidu mého a z kůže jste je vyvlékli a kosti jejich jste zlámali a jako v moždíři stloukli. •

22 Example 3 •V čemž naříkáno bylo na některé přední pány a biskupy uherské,. •

23 Word-order “exceptions” 1. context unbound MANN 2. context bound PAT - syntactic needs: •

24 Word-order “exceptions” •I byl nákulhavý na obě nohy, na obě strany, a tu se na Horách Kutnách osadil, pojav k manželství Alžbětu, dceru nebožtíka kněze Jakuba Melisea, děkana tu na Horách Kutnách,. •

25 Thank you for your attention This talk was supported by the grants GAUK 16 809 Linguistic Analysis of Czech Humanistic Texts (Lingvistická analýza českých humanistických textů) and GA ČR 405/09/0729 From the structure of a sentence to textual relationships (Od struktury věty k textovým vztahům).


Stáhnout ppt "An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts Kateřina."

Podobné prezentace


Reklamy Google