Jazykové korpusy (lingvistika, filologie, výuka jazyků)

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Testy pro testování žáků 5. a 9. tříd 2012
Korpusová lingvistika (2)
Koncepce rozvoje a řízení vědy a výzkumu
SEZNAMTE SE S ČESKÝM NÁRODNÍM KORPUSEM!
(B1 Document Managment) B1UP – Správa dokumentů Ing. Radomír Možnar Servis/Helpdesk.
JAZYKOVÁ INFRASTRUKTURA Ústav Českého národního korpusu Filozofická fakulta UK Praha.
Korpus nejsou jenom dorty
Výzkum (pedagogického zhodnocení) volného času
Voki.com Tento jednoduchý nástroj oživí výuku anglického jazyka a je i velice oblíbený u dětí, které pracují na projektu etwinningu. Je dostupný na internetu,
ISS Úvodní informace o kurzu Sekundární analýza Management sociálních dat a datové archivy Jindřich Krejčí.
Analýza dat.
Název školy: Střední odborná škola stavební Karlovy Vary, Sabinovo náměstí 16, Karlovy Vary Autor: ING. JANA KOVAŘÍKOVÁ Název materiálu: VY_32_INOVACE_11_MARKETINGOVÝ.
Úvod do korpusové lingvistiky 8
STRUKTURA OSNOVY KURZU
Učte se anglicky 4krát rychleji Úvod Dr. Arkady Zilberman *US Patent 6,341,958.
Fakulta životního prostředí Katedra informatiky a geoinformatiky
Úvod do korpusové lingvistiky 4
Korpusová lingvistika (4) Základy korpusové statistiky
Název školy: Střední průmyslová škola, Ostrava - Vítkovice, příspěvková organizace Autor: Mgr. Dana Vicherková Datum: Název: VY_32_INOVACE_2.1.8.
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Seminární práce Mgr. Bc. Radka Burketová N_TiM/pMPH
PROJEKT ZVYŠOVÁNÍ KVALITY VÝUKY V ELEKTROTECHNICKÝCH OBORECH Realizátor projektu: Střední škola technická Žďár nad Sázavou od Vyšší odborná.
Co nejrychleji a nejpřesněji odpovídej na dané otázky.
VY_32_INOVACE_EKO_06 MARKETINGOVÝ VÝZKUM I. Autor: Ing. Hana Motyčková „Autor je výhradní tvůrce materiálu.“ Datum vytvoření: Klíčová slova:
Vítejte při prezentaci některých zajímavých vlastností slovníků Lingea Lexicon. Mezi stránkami můžete přecházet pomocí kláves, myší nebo počkat na automatické.
Moderní byznys Jan Kovařík. ”Zlepší-li se toky informací ve firmě, pak řešení jednotlivých podnikatelských problémů již přijdou sama.” Bill Gates, Byznys.
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
SU Aleph Repozitáře, archivy, a dlouhodobá ochrana digitálních informací Mgr. Eliška Pavlásková Ústav výpočetní techniky Univerzita Karlova.
DKV část 31 Design kvantitativního výzkumu 4. část ( ) Jiří Šafr UK FHS Historická sociologie (LS 2010)
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
2 Fučíková Sylvie HR/Win – moderní technologie pro osvědčené aplikace.
PLÁN DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DOKUMENTŮ V PRAXI Mgr. Andrea Fojtu, Mgr. Eliška Pavlásková ÚVT UK, ÚISK UK
Skupinové interview (Focus group)
CJBB84 1 GAK – CJBB84 st
B ORIS L EHEČKA, ODDĚLENÍ VÝVOJE JAZYKA ÚJČ AV ČR, V. V. I. DALIBORIS. CZ P RAŽSKÉ JARO V O STRAVĚ, 24. BŘEZNA 2015 Nástroje pro badatele (nejen)
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
ISOP/2 registr entit přírodního prostředí Roman Bukáček CENIA, laboratoř GIS Žďár nad Sázavou.
EndNoteWeb a ResearcherID – užitečné nástroje Web Of Science
Kvantitativní metody výzkumu v praxi
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
MorČe morfologické značkování češtiny
Lingvistický software Morfologický analyzátor – AJKA Morfologický analyzátor – AJKA Morfologická databáze – I_PAR Morfologická databáze – I_PAR Desambiguace.
PRAXE V ČESKÉM PROSTŘEDÍ Úvod do korpusové lingvistiky 5.
Mémy tlumočení podle Franze Pöchhackera
Technická univerzita v Liberci LIBEREC I Studentská 2 Inovace vzdělávání v oboru čeština jako druhý jazyk (CZ.1.07/2.2.00/ ) podpořeného z.
CHYBOVÁ ANOTACE ŽÁKOVSKÉHO KORPUSU CZESL
E-learningový kurz e-learningu OP Vzdělávání pro konkurenceschopnost Další vzdělávání pracovníků škol GP – oblast podpory 1.3 CZ1.07/1.3.05/ Vysoká.
Analýza kvantitativních dat I. Vstupní test ze znalostí designu kvantitativního sociologického výzkumu Jiří Šafr jiri.safr(at)seznam.cz poslední aktualizace.
Laser Simulation DSS Ing. Jana Hájková Doc. Ing. Pavel Herout, Ph.D.
Postup při empirickém kvantitativním výzkumu
PLIN033_3 Přegenerovávání a podgenerovávání – dva problémy automatické analýzy přirozeného jazyka, konkrétně slovotvorby.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Výzkumné techniky Neintervenující výzkumné techniky Sekundární analýza
CJBB75 Základy využití korpusu pro praxi st G13.
Den s románskou filologií FF JČU České Budějovice doc. PhDr. Jan Radimský, Ph.D.
Chemický experiment. Školní a vědecký experiment Školní experiment: Dříve řešený problém Známý výsledek pro experimentátora Vyvození výsledku na základě.
Seminář Bakalářská práce
Klára Osolsobě, Hana Žižková
TIPY A RADY PRO PRÁCI S WEB OF SCIENCE – SLUŽBY DOSTUPNÉ PO REGISTRACI
Kvantitativní analýza cestopisů Karla Čapka
Co možná nevíte aneb 5 zajímavých faktů ze světa literatury
Základy práce s korpusem seminář pro bakalářské studium
Cvičení 3 Microsoft Word
Moderní metodické materiály a metody výuky angličtiny pro 1. a 2
Ing. Milan Houška KOSA PEF ČZU v Praze
KVALITATIVNÍ VÝZKUM - ÚVOD
Úvod do korpusové lingvistiky 3
Informatika pro ekonomy I LS 2009/2010
MOŽNOSTI PORTÁLU KNIHOVNY.CZ NEJEN PRO KNIHOVNÍKY
Transkript prezentace:

Jazykové korpusy (lingvistika, filologie, výuka jazyků) Klára Osolsobě Osolsobe@phil.muni.cz G 32 9.10-10.50 DO1

O čem budeme mluvit Krátký historický exkurz Definice korpusu v moderním slova smyslu Dva metodologické přístupy k vytěžování korpusu Dva pohledy na korpus (lingvista a informatik) Filologie a korpusy Výuka jazyků a korpusy DO1

Krátký historický exkurz Myšlenka korpusu Korpusová lingvistika – empirická disciplína Data a introspekce Technický pokrok DO1

Konkordance – KWIC(Key Word In Context) DO1

PSJČ DO1

SEU (SURVEY OF ENGLISH USAGE) DO1

BROWN CORPUS W. Nelson Francis - Henry Kucera 1964 1. elektronicky zpracovaný korpus 1 milion slovních tvarů britská a americká angličtina pečlivý výběr textů vzorky DO1

Definice korpusu v moderním slova smyslu Elektronické uložení Elektronická přístupnost Definovaný obsah (ČEHO) a rozsah (KOLIK) Standardní anotace – metada a interpretace jazykových jednotek Rychlost, spolehlivost a opakovatelnost vyhledávání a kvantifikace nalezeného DO1

Dva metodologické přístupy k vytěžování korpusu Corpus based / korpusem ověřovaný, na korpusu založený výzkum Pravidlo/výjimka – otevřený/uzavřený seznam, frekvence Corpus driven / korpusem inspirovaný výzkum, korpusem řízený výzkum Výzkum kolokací /lexical bundles DO1

Maskulina mají v češtině v gen. pl Maskulina mají v češtině v gen. pl. koncovku –ů (pánů, hradů, mužů, strojů, předsedů, soudců). Z tohoto pravidla existují výjimky. Které? Kolik? [lc!=".*ů" & tag="NN[MI]P2.*"] DO1

Jaké je mínění o Češích? Kolokace na pozici 1-3 vpravo od KWIC <Češi jsou> seřazené podle míry MI-score DO1

Dva pohledy na korpus (lingvista a informatik) Nástroje NLP a korpusy Konverzní programy, vertikál, tokenizér Korpusové manažery Automatické analyzátory Lingvistické interpretace v korpusech DO1

Vyhledání slovního tvaru jít DO1

Vyhledání lemmatu jít (KWIC+lemma+tag) DO1

desambiguace Pánové, nežeňte se. Nemluv a rožni. Jan je osel. DO1

Víceznačné tvary nežeňte/(ne)hnat/V nežeňte/(ne)ženit/V se/se/P se/s/R rožni/rožnit/V rožni/rozžehnout/V rožni/rožeň/N je/být/V je/on/P osel/osel/N osel/osít/V DO1

hnát/ženit DO1

být/on DO1

rožeň/rožnit/rozžehnout DO1

Filologie a korpusy Obecné a specializované korpusy Příklady z českého prostředí Tvorba vlastního korpusu DO1

ÚČNK http://ucnk.ff.cuni.cz/cs/ akademický projekt 1994 systematicky mapuje češtinu i další jazyky po bezplatné registraci otevřeny všem zájemcům DO1

Korpusy ÚČNK https://kontext. korpus. cz/first_form DO1

Specializovaný - příklad Korpus Jerome je jednojazyčný srovnatelný korpus (monolingual comparable corpus) speciálně sestavený pro zkoumání překladové češtiny (tedy textů přeložených do češtiny z jiných jazyků) v porovnání s češtinou nepřekladovou (původní česky psanou). DO1

autorský Karel Čapek Bohumil Hrabal Korespondence Karla Havlíčka Borovského DO1

Tvorba vlastního korpusu - DIY https://nlp.fi.muni.cz/cs/JakVytvoritKorpus1 https://ske.fi.muni.cz/auth/create_corpus/ DO1

Výuka jazyků a korpusy Metoda DDL (Tim Johnes) Žákovské korpusy (Learner Corpora) Učebnicové korpusy DO1

Žákovské korpusy Texty mluvčích L2 Výzkum interlanguage Zpětná vazba na základě analýzy chyb Sledování růstu jazykových kompetencí DO1

Učebnicový korpus Učko DO1

chodit do/na (porovnání obecného a učebnicového korpusu)

Závěr Historie a současnost – technický pokrok a metodologické přístupy Rychlost- spolehlivost – opakovatelnost experimentu Zdroje nespolehlivosti Co je k dispozici a co si mohu sám udělat Na co nezbyl čas DO1

Děkuji vám za pozornost DO1