Základy práce s korpusem seminář pro bakalářské studium

Slides:



Advertisements
Podobné prezentace
Environmentální výchova pro základní školu
Advertisements

Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
SEZNAMTE SE S ČESKÝM NÁRODNÍM KORPUSEM!
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Zpracování seminárních a kvalifikačních prací
Digitální publikace a e-knihy v Ústavu pro českou literaturu AV ČR Pavel Janáček, Michal Kosák, Praha,
Úvodní seminář pro studenty doktorského studia
Projekt Infogram aneb P.I.V.O. žije. Eva Svobodová, IVIG 2008, Česká zemědělská univerzita v Praze Praha,
Práce se Slovníkem spisovné češtiny
Jaroslava Sýkorová Milena Tomášková Karlovy Vary, 2014
Jazykověda a její disciplíny
Název školy: Střední průmyslová škola, Ostrava - Vítkovice, příspěvková organizace Autor: Mgr. Dana Vicherková Datum: Název: VY_32_INOVACE_2.3.1.
Úvod do korpusové lingvistiky 8
PŘÍPRAVA METODICKÉHO POKYNU REKTORA VŠSS KE ZPRACOVÁNÍ DIPLOMOVÝCH PRACÍ Zpracování diplomové bakalářské práce.
STRUKTURA OSNOVY KURZU
Název školy: Střední průmyslová škola, Ostrava - Vítkovice, příspěvková organizace Autor: Mgr. Dana Vicherková Datum: Název: VY_32_INOVACE_2.1.8.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Úvodní seminář pro studenty doktorského studia
Odborný styl PaedDr. Hana Vítová Střední průmyslová škola, Mladá Boleslav, Havlíčkova 456 CZ.1.07/1.5.00/ MODERNIZACE VÝU.
Číslo projektuCZ.1.07/1.5.00/ Název projektuEU peníze středním školám Masarykova OA Jičín Název školyMASARYKOVA OBCHODNÍ AKADEMIE, 17. listopadu.
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A5 Nástroje informatiky pro získávání informací a jejich zpracování.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A6 Rozpočet a plánování tvorby projektů a jejich následná realizace.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Anglické standardy při psaní projektu Osnova kurzu
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
MASARYKOVA UNIVERZITA PEDAGOGICKÁ FAKULTA Vítejte na zápise ke studiu na Pedagogické fakultě MU! 1/8.
JAZYKOVĚDA JAZYKOVÉ PŘÍRUČKY
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Enviromentální výchova na zahradnických školách
Úvod do psychologie PhDr. David Kuneš, Ph.D
Základní norma zdravotnických znalostí pro pedagogické pracovníky
Analýza nabídky bakalářských studijních programů ICV v rámci pedagogického vzdělávání Ing. Lenka Danielová, Ph.D., Mgr. Dita Janderková, Ph.D., Doc. PhDr.
CJBB CJBB75.
Dagmar Strejčková Kapitoly z lexikologie současné češtiny Kapitoly z lexikologie českého jazyka Dagmar Strejčková
Střední průmyslová škola, Mladá Boleslav, Havlíčkova 456
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
2 Karla Halenková Setkání uživatelů 2001 Báze znalostí produkt pro naplnění uživatelem.
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5.
Technická univerzita v Liberci LIBEREC I Studentská 2 Inovace vzdělávání v oboru čeština jako druhý jazyk (CZ.1.07/2.2.00/ ) podpořeného z.
VZDĚLÁVÁNÍ (BUDOUCÍCH) UČITELŮ ČEŠTINY JAKO CIZÍ JAZYKA
Základy pedagogické metodologie Mgr. Zdeněk Hromádka
E-learning z druhé strany: pohled studentů Jiří Zounek Ústav pedagogických věd FF MU A. Nováka Brno
METODICKÝ SEMINÁŘ Psaní závěrečné práce STUDIJNÍ PROGRAM: U Č ITELSTVÍ VŠEOBECN Ě VZD Ě LÁVACÍCH P Ř EDM Ě T Ů.
CJBB105 Úvod do korpusové lingvistiky
Úvod do korpusové lingvistiky seminář pro magisterské studium
Úvod do studia Základní informace o předmětu Robert Zbíral Maxim Tomoszek.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
CJBB75 Základy využití korpusu pro praxi st G13.
Mgr. Naděžda Fasurová, Ph.D.
Předmět Marketing BP522 Kontaktní údaje: Ing. Šárka Dvořáková, Ph.D. Středa.
VARIANTNÍ PROSTŘEDKY PŘI ÚPRAVĚ PUBLICISTICKÝCH TEXTŮ NA MATERIÁLU MF DNES Mgr. Barbora Albrechtová Ústav pro jazyk český AV ČR, v. v. i.
Připraveno s podporou programu Erasmus+ Evropské unie. Výsledky učení v pedagogické činnosti vysokých škol Představení metodiky.
ÚVODNÍ SEMINÁŘ CJBB75 Základy práce s korpusem seminář pro bakalářské studium.
Seminář Bakalářská práce
Klára Osolsobě, Hana Žižková
VZDĚLÁVACÍ PROGRAM NEZISKOVÉHO SEKTORU
Institut Celoživotního Vzdělávání
Obecná didaktika ÚVOD.
Nástroje podpory uživatelů
První zpracování odborných zdrojů Tématické rešerše
Financováno z ESF a státního rozpočtu ČR.
Jazykověda a její disciplíny
DSP Speciální pedagogika Marie Vítková
PRŮBĚH DOKUMENTACE UNIVERZITNÍHO INFORMAČNÍHO SYSTÉMU MZLU V BRNĚ
BEZBARIÉROVÉ KNIHOVNY
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Pravidla citování v absolventské práci
Spolupráce gymnázií s vysokými školami
Kurz 1FU191 Metodologický seminář
Transkript prezentace:

Základy práce s korpusem seminář pro bakalářské studium ÚVODNÍ SEMINÁŘ CJBB75 Základy práce s korpusem seminář pro bakalářské studium

dnes náplň semináře požadavky k ukončení harmonogram studijní literatura

Požadavky Podmínky – aktivní účast na semináři (referát) Požadavky ke kolokviu: Student musí prokázat schopnost pracovat s korpusovým manažerem Bonito (samostatné řešení zadaní – komentář odůvodnění pracovního postupu)

Náplň semináře ovládnutí práce s korpusovým manažerem BONITO řešení lingvistických problémů na základě materiálového výzkumu opřeného o korpusy

Harmonogram seminářů 1. Úvodní seminář (harmonogram, literatura) 25.9. 2. Bonito – I. (základní vyhledávání) 2.10. 3. Vyhledávání podle morfologické značky 9.10. 4. Bonito – II. (třídění, frekvenční seznamy) 16.10. 5. Vybrané problémy z morfologie 23.10. 6. Vybrané problémy ze slovotvorby 30.10. 7. Prezentace – host 6.11. 8. Složitější konstrukce dotazu 13.11. 9. Korpus a slovník 20.11. 10. Pravopisné problémy a korpus 27.11. 11. Korpusy a kodifikace 4.12. 12. Písemka- předtermín 11.12. 13. Písemka I. řádný termín 18.12.

Úvody Šulc, M.: Korpusová lingvistika. První vstup. Praha : Karolinum. 1999 Kocek, J. - Kopřivová, M. - Kučera, K. (eds.) (2000): Český národní korpus - úvod a příručka uživatele  Praha : FF UK - ÚČNK 2000.

Zajímavosti Čeština doma a ve světě 1 a 2, 2001.

Cvičebnice Blatná, R. - Čermák, F. (eds.) (2005): Jak využívat Český národní korpus. Praha : Nakladatelství Lidové noviny. 

ČNK František Čermák, Věra Schmiedtová (2004): Český národní korpus – základní charakteristika a širší souvislosti, Národní knihovna – knihovnická revue roč. 15, č. 3, s. 152-168. http://ucnk.ff.cuni.cz,

BONITO Marie Kopřivová, Jan Kocek : Manuál korpusového manažeru Bonito http://nlp.fi.muni.cz/projekty/bonito/ Kocek, J. - Kopřivová, M. - Kučera, K. (eds.) (2000): Český národní korpus - úvod a příručka uživatele  Praha : FF UK - ÚČNK 2000.

Práce v seminářích spuštění programu BONITO přihlášení vyvolání www ČNK paralelní práce s návodem

upozorňujeme download – články z KL ke stažení a studiu jak citovat korpus – citační normy pro jakoukoliv odbornou práci odvolávající se na korpus manuál a instalace – podrobný manuál zacházení s korpusovým manažerem

BONITO Autor :Pavel Rychlý, FI MU Použití: České korpusy (ČNK, korpusy FI MU) Korpusový manažer: program umožňující efektivní práci s korpusem.

PŘÍSTUP- HESLO Jméno: CJBB Heslo:leei7458

Mluvené korpusy a KSK Hlaváčková, D.: Brněnský mluvený korpus a jeho morfologická analýza. In: 3. mezinárodní setkání mladých lingvistů Olomouc. 2002, s. 167 – 173. Hlaváčková, D., Sedláček, R.: Morfologické značkování korpusu soukromé korespondence, XIV. kolokvium mladých jazykovedcov, 8. - 10. 12. 2004, Šintava pri Seredi, Slovenská republika.(V tisku) Hladká Z. (2005): Zkušenosti s tvorbou korpusů češtiny v ÚJČ FF MU v Brně, SPFFBU, A 53, s. 115-124. Osolsobě, K.: Hypokoristika v korpusu soukromé korespondence KSK, SP FF MU A, 53, Brno, 2005, s. 125-136. Osolsobě, K.: Korpus soukromé korespondence z hlediska morfologického značkování, SPFFBU A 54, s. 187-201, Brno.

PDT Hajičová Eva, Panevová Jarmila, Sgall Petr (2002): K nové úrovni bohemistické práce, Využití anotovaného korpusu. Část I. Slovo a slovesnost, 63, s. 161-177. Eva Hajičová , Jarmila Panevová, Petr Sgall (2002): K nové úrovni bohemistické práce: Využití anotovaného korpusu. Část II. Slovo a slovesnost, 63, s. 241-262. ??? též: http://ufal.mff.cuni.cz/pdt2.0/doc/pdt-guide/cz/html/ch06.html

MORFOLOGICKÉ ZNAČKOVÁNÍ Hajič J., Hladká B. (1997): Morfologické značkování korpusu českých textů stochastickou metodou. Slovo a slovesnost 4/1997, s. 288-304. Petkevič V.(2001): Neprojektivní konstrukce v češtině z hlediska automatické morfologické disambiguace. In: Hladká Z., Karlík P. (eds.) Čeština – univerzália a specifika 3. Brno : Masarykova univerzita, s. 197-206.

MORFOLOGICKÉ ZNAČKOVÁNÍ Bartůšková, D., Hlaváčková, D., Ungermannová, M.: Manuál pro značkování a desambiguaci slovních tvarů v jazykových korpusech, rkp. 58 s. Brno : FI MU, 2004. (pdf verze: http://nlp.fi.muni.cz/projekty/desman/)

DIACHRONNÍ KORPUSY Kučera K. (1998): Diachronní složka Českého národního korpusu : obecné zásady, kontext a současný stav. Listy filologické, 121, s. 303-313.

KL v širších souvislostech ČERMÁK, F., KLÍMOVÁ, J., PETKEVIČ, V (eds.): Úvod do korpusové lingvistiky, Karolinum, 2000.

Tzv. vytěžování (mining) korpusu Renata Blatná – Vladimír Petkevič (eds.): Jazyky a jazykověda: Sborník k 65. narozeninám prof. PhDr. Františka Čermáka, DrSc. Praha: Filozofická fakulta Univerzity Karlovy, Ústav Českého národního korpusu, 2005. (kap. Studie z korpusové lingvistiky) Karlík, P. (Ed.) (2004): Korpus jako zdroj dat o češtině, Brno : FF MU.

Poznámky ke cvičebnici Jak využívat Český národní korpus Příručce by podle našeho názoru prospělo více jasně formulovaných návodů, kde získat znalosti, které si je třeba osvojit k tomu, aby hlubší zamyšlení se nad různými problémy jazyka (češtiny), k němuž mají dát podnět jednotlivá cvičení, mohlo být plodné. (Máme na mysli případy, kdy nelze u celého širokého spektra adresátů, jimž je příručka určena, předpokládat patřičné znalosti jak lingvistické, tak technické.)

První kapitola „Práce s Českým národním korpusem krok za krokem“ obsahuje sedm tematických oddílů (A. Pravopis, B. Tvoření slov / slovotvorba (morfologie širší), C. Tvarosloví / morfologie užší, D. Slovní zásoba / lexikologie, E. Kolokace (slovní spojení), F. Syntax, G. Kombinovaná zadání) a zaměřuje se na jednodušší úkoly sledujíc přitom jednotlivé roviny jazyka.

Druhá kapitola „Co říká o různých slovech korpus a co slovníky“ sestává z jazykového kvízu zaměřeného na určování významů cizích slov.

Třetí kapitola „Význam slova prozrazuje kontext“ zahrnuje cvičení založená na příkladech vět vybraných z korpusu SYN2000. Jsou zaměřena na odhad výskytu konkrétního slova podle kontextu a řazena do tematických oddílů (A. Slovní tvary, B. Lemmata, C. Kolokace, D. Části slov, E. Formálně podobná slova, F. Význam slov).

Čtvrtá kapitola „Úkoly pro náročnější“ - její náročnost spočívá v tom, že u zájemce o procvičování nabízených úkolů se předpokládá u některých cvičení základní znalost programování a u všech podrobné studium kapitoly Popis morfologických značek v Manuálu korpusového manažeru Bonito ( http://ucnk.ff.cuni.cz/bonito/index.html).

Pátá kapitola „Práce se subkorpusy“ zahrnuje dva úkoly a je tedy jen úvodem do této problematiky.

Klíč Velmi pozitivní je fakt, že učebnice má klíč. Bohužel řada chyb

Hodnocení Jak využívat Český národní korpus je textem zaměřeným primárně k popularizaci výsledků práce projektu ČNK. I přes některé nedostatky lze uvítat, že v době, kdy se korpusový přístup k výzkumu jazyka prosadil jako jedna z nejdůležitějších metodologií lingvistického výzkumu, vychází prakticky orientovaná příručka pro studenty, badatele i širší veřejnost případných zájemců.

Návod Cennou pomůckou se tato cvičebnice může stát v rukou těch z řad uživatelů ČNK, kteří nelitovali, popřípadě nebudou litovat námahy věnované studiu lingvistické literatury nejen korpusově zaměřené (lakoničnost úvodů jednotlivých kapitol a oddílů předpokládá uživatele, který má již nějakou předchozí zkušenost jak s prací s jazykovými korpusy, tak s prací v materiálově orientovaném lingvistickém výzkumu).

Poučení Ti ostatní si mohou „pohrát“. (Je ovšem třeba upozornit na to, že ne každá hra je tím, co měl Jan Amos Komenský na mysli, když psal svoje dílo „Schola ludus“ a že řečeno s učitelem národů „student musí mít zadek z olova“, a to nejen k tomu, aby na něm seděl jsa „připojen“ k ČNK. )