CHYBOVÁ ANOTACE ŽÁKOVSKÉHO KORPUSU CZESL

Slides:



Advertisements
Podobné prezentace
Hodnocení efektivity výuky z pohledu pedagogiky
Advertisements

Interpretace práva.
Čeština jako nástroj komunikace zahraničních studentů Lékařské fakulty UP Magdalena Vintrová, Pavel Kurfürst Ústav cizích jazyků LF UP v Olomouci.
Katedra ekonomiky, manažerství a humanitních věd Baví vás práce s lidmi, chcete rozhodovat o nových projektech a řídit jejich realizaci? Chcete-li být.
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
Mosty mezi pedagogickou a psychologickou diagnostikou
Korpusová lingvistika (2)
ROD JMENNÝ.
VY_32_INOVACE_Čj-Ml 6.,7.15 Anotace: Prezentace je zaměřena na slovesné kategorie rod a vid. Ke každé kategorii je uvedena stručná definice s příklady.
Integrace a podpora studentů se specifickými vzdělávacími potřebami na Vysoké škole technické a ekonomické v Českých Budějovicích Registrační číslo: CZ.1.07/2.2.00/
Integrace a podpora studentů se specifickými vzdělávacími potřebami na Vysoké škole technické a ekonomické v Českých Budějovicích Registrační číslo: CZ.1.07/2.2.00/
CJBB84 1 ZPK CJBB75 čtvrtek G
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Zpracování seminárních a kvalifikačních prací
Tento materiál vznikl jako součást projektu In-TECH 2, který je spolufinancován Evropským sociálním fondem a státním rozpočtem ČR. Název přednášky/cvičení.
AUTOEVALUACE neboli VLASTNÍ HODNOCENÍ MŠ Martina Kupcová.
Hodnocení e-learninkových opor Inovace kombinované formy studia bakalářského a magisterského studijního programu „Tělesná výchova a sport“ a jeho učitelských.
Jak získat nadané žáky pro nové technologie Dora Kroisová 1.
Mgr. Alena Lukáčová, Ph.D., Dr. Ján Šugár, CSc.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Úvod do korpusové lingvistiky 8
Projekty mobilit programu Leonardo da Vinci 2002 ___________________ PhDr. Helena Úlovcová
Umělecký styl a odstraňování chyb při studiu češtiny jako cizího jazyka Karolína Štěpánková Západočeská univerzita v Plzni.
Úvod do korpusové lingvistiky 4
… ale taky protivný nepřítel … ROLE ICT VE VZDĚLÁVÁNÍ Počítač může být kamarádRadek Maca Co chceme? Chceme být zdraví a silní. Chceme být vzdělaní a.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Odborný styl PaedDr. Hana Vítová Střední průmyslová škola, Mladá Boleslav, Havlíčkova 456 CZ.1.07/1.5.00/ MODERNIZACE VÝU.
Diplomový seminář pro studenty ITaM B. Miniberger LS 2013.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09/C1 AutorIng. Liběna Krchňáková Období vytvořeníSrpen.
Systém dalšího vzdělávání pracovníků výzkumu a vývoje v MS kraji a jeho realizace Projekt A5 Nástroje informatiky pro získávání informací a jejich zpracování.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
Inovace je změna daného stavu a lze ji aplikovat ve všech směrech lidských aktivit. Tyto změny mají sedm řádů, sedm faktorů a sedm zdrojů. Inovační proces.
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Cíle studia didaktiky pedagogiky
DEN OTEVŘENÝCH DVEŘÍ 24. ledna Co u nás můžete studovat? Studijní obory na KBO 1.Bakalářské (bc.) 1.1. Učitelské1.2. Neučitelské 2. Magisterské.
Trasování lesních cest
Pohled pedagoga běžné základní školy na podporu komunikativních kompetencí žáků s narušenou komunikační schopností PhDr. Veronika Girglová Katedra speciální.
Didaktika distančního vzdělávání Základní pojmy a vztahy.
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
Statistika – základní pojmy, diagramy
Mémy tlumočení podle Franze Pöchhackera
Technická univerzita v Liberci LIBEREC I Studentská 2 Inovace vzdělávání v oboru čeština jako druhý jazyk (CZ.1.07/2.2.00/ ) podpořeného z.
Struktura bakalářské práce
E-learningový kurz e-learningu OP Vzdělávání pro konkurenceschopnost Další vzdělávání pracovníků škol GP – oblast podpory 1.3 CZ1.07/1.3.05/ Vysoká.
E-learning z druhé strany: pohled studentů Jiří Zounek Ústav pedagogických věd FF MU A. Nováka Brno
PLIN033_3 Přegenerovávání a podgenerovávání – dva problémy automatické analýzy přirozeného jazyka, konkrétně slovotvorby.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
CJBB75 Základy využití korpusu pro praxi st G13.
Projekt „Inovace vzdělávacího programu Inovace vzdělávacího programu VOŠS Ostrava a rozšíření o kombinovanou formu vzdělávání Mgr. Michaela Holaňová.
Název příspěvku: K pedagogické přípravě učitelů SOŠ z pohledu edukátora Karel OURODA, Ph.D., Mgr. et Mgr. novinář a odborný pedagog Workshop partnerství.
VARIANTNÍ PROSTŘEDKY PŘI ÚPRAVĚ PUBLICISTICKÝCH TEXTŮ NA MATERIÁLU MF DNES Mgr. Barbora Albrechtová Ústav pro jazyk český AV ČR, v. v. i.
II. Metodický výklad výzvy. Cíl oblasti podpory 1.1 Podpora výuky cizích jazyků a v cizích jazycích ve školách a školských zařízeních. Výzva č. 55 je.
Klára Osolsobě, Hana Žižková
Řešení stupňových převodovek
Varianty výzkumu Kroky výzkumu Výběrový soubor
Ostravská univerzita (1991 → )
NÁZEV ŠKOLY: SOŠ Net Office Orlová, spol. s r. o.
Zpracoval: Martin Bílek
Komplexní systém hodnocení
Analýza tamburu mykacího stroje
Citlivostní analýza a optimalizace II Zpracoval: Martin Bílek
Úloha syntézy čtyřčlenného rovinného mechanismu
Analýza a optimalizace tuhosti příruby osnovního válu
Citlivostní analýza a optimalizace I Zpracoval: Martin Bílek
Zpracoval: Martin Bílek
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
KURZY ČESKÉHO JAZYKA pro tzv. STÁŽISTY a POSTGRADUANTY
Transkript prezentace:

CHYBOVÁ ANOTACE ŽÁKOVSKÉHO KORPUSU CZESL Vladimír Petkevič ÚTKL FF UK Barbora Štindlová KČL TUL barbora.stindlova@tul.cz

ŽÁKOVSKÝ KORPUS learner corpus, interlanguage corpus, L2 corpus elektronická databáze autentických jazykových projevů produkovaných studenty daného jazyka jako jazyka cizího/druhého (tj. nerodilých mluvčích) S. Granger, 1999 užitečný zdroj pro každého, kdo chce zkoumat, jak se lidé učí jazyky a jaké jsou cesty k tomu, aby se je učili lépe G. Leech, 1998

CzeSL ŽÁKOVSKÝ KORPUS ČEŠTINY JAKO CIZÍHO JAZYKA Projekt: Inovace vzdělávání v oboru čeština jako druhý jazyk (CZ.1.07/2.2.00/07.0259) Katedra českého jazyka a literatury Fakulty přírodovědně-humanitní a pedagogické Technické univerzity v Liberci Ústav teoretické a komputační lingvistiky FF UK v Praze Projekt je podpořen ESF v rámci Operačního programu vzdělávání pro konkurenceschopnost.

FUNKCE ŽK přispívat k teoriím nabývání cizího jazyka a cizojazyčného vyučování podrobnější popis žákovského mezijazyka pochopení faktorů, které jej ovlivňují opora při vyvíjení nových pedagogických nástrojů a metod

MOŽNOSTI VYUŽITÍ ŽÁKOVSKÝCH KORPUSŮ kontrastivní srovnávání jazyka rodilých a nerodilých mluvčích srovnávání žákovských mezijazyků počítačem podporovaná chybová analýza žákovského jazyka

ANOTACE ŽÁKOVSKÉHO KORPUSU metadata autor (L1, věk, doba studia …) text (referenční pomůcky, elicitace …) chybová anotace 45 % korpusů anotováno pouze 7 % z nich komplexní taxonomie chyb lingvistická anotace slovnědruhové značkování (částečně) morfologická a syntaktická anotace výjimečně problém s aplikací automatických nástrojů

CzeSL - METADATA 18 parametrů text respondent k podrobněji značkovaným časová a rozsahová limitovanost, referenční pomůcky, elicitace, typ textu, způsob zadání … respondent pohlaví, věk, L1, znalost dalších jazyků, typ studia čj, úroveň znalosti dle SERR, rodinná jazyková anamnéza, délka pobytu v ČR …

CHYBOVÁ ANOTACE manuální přiřazení odpovídající značky (kódu / tagu) konkrétní chybě vyskytující se v žákovském projevu automatizace chybové anotace prozatím ne

TYPY CHYBOVÝCH TAXONOMIÍ deskriptivní podle povrchové realizace element chybí, přebývá, má chybnou formu, je chybně umístěn podle lingvistických kategorií vychází z popisu cílového jazyka rovina, jednotka, typ diagnostická komparativní inter-/intralingvální chyby, vynucené chyby … evaluační podle komunikačního efektu vliv chyby na komunikaci (globální, lokální …)

CzeSL – CHYBOVÁ ANOTACE reflektovat charakter češtiny jako vysoce flektivního jazyka se specifickým slovosledem umožnit budoucí rozšíření chybové taxonomie (automatická anotace) anotace dostatečně podrobná, ale zároveň zvládnutelná pro anotátory kombinace manuální a automatické anotace deskriptivní (lingvistické kategorie a povrchová realizace) 21 manuálních značek + 7 automatických

CzeSL – ANOTAČNÍ FORMÁT MANUÁLNÍ ANOTACE Bojal jsme se, že ona se ne bude libila slavnou prahu, proto to bylo velmí vadí pro mně.

třírovinný anotační formát dvoustupňová emendace chyb R0 (originál): chybový kód R1: odkaz R2: R1: incorInfl - chyba ve flexi R2: agr - chyba ve shodě rflx - chyba v užití reflexiva

R2: dep – chyba ve valenci vbx – chyba ve složeném slovesném tvaru agr – chyba ve shodě sec – sekundární chyba R1: wbdPre - chyba v hranici slova incorBase - chyba v slovotvorném základu

CzeSL: AUTOMATICKÁ ANOTACE - CHYBOVÁ doplnění anotace, pro niž není nezbytně nutný anotátor na R1 např. chyba v diakritice, resp. délce vokálu, chybu v palatalizaci, znělosti, záměnu i a y apod. na R2 např. detailnější specifikace chyby vbx na chybu v analytickém slovesném tvaru, verbonominálním predikátu, rezultativní konstrukci; doplnění anotační značky u interpunkčních chyb; formální popis chyby (vynechání, přidání, chybný tvar a chybný slovosled) apod.

- LINGVISTICKÁ doplnění lingvistických informací do textu (na R1 a R2) základní tvary slov (lemmatizace), slovnědruhové označení, morfologické značkování, paradigmata uvažujeme i o možnostech značkování R0 (tj. originálního textu)

krásný, adjektivum, nominativ mask.animatum, sg. nebo nominativ či akuzativ inan. sg., vzor dobrý tagy: AAMS1----1A----, AAIS1----1A----, AAIS4----1A---- náměstí, substantivum, nominativ neut. pl. tag: NNNP1-----A----- určeno z R1 krásný, adjektivum, nominativ, neut. pl., vzor mladý tag: AANP1----1A---- náměstí, substantivum, nominativ, neut. pl., vzor stavení tag: NNNP1-----A----

JAK VYUŽÍT ŽÁKOVSKÝ KORPUS? vyhledávání jazykových jevů s využitím kombinace chybové anotace, lingvistických informací i např. informací o mluvčím Dotazy např. hledat všechny chyby v použití sloves III. třídy, vzor kupuje u vietnamských mluvčích, začátečníků všechny chyby ve shodě či valenci u substantiv mužského živ. rodu všechny chyby u mluvčích s L1 ruštinou v délce vokálu -a- u adjektiv žensk. rodu apod.

reálný materiál pro analýzu poznání interlanguage srovnání jazyka nerodilých a rodilých mluvčích

vytipování jevů pro prohloubenější výklad pomoc při rozhodování, co je pro žáky-cizince, zvl. začátečníky, v užívání užitečné, tj. které jazykové jevy mohou (příp. mohou stěží) úspěšně používat indikovat, jak určité jevy vyučovat pomoci určovat pořadí, v jakém by měly být jednotlivé jevy vyučovány

čerpání příkladů úprava a optimalizace výukového procesu dle prvního jazyka studentů data-driven learning form-focused instruction

Děkujeme za pozornost.