Korpusová lingvistika (2)

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

Úvod do studia jazyka – 4. Gramatika Morfologie.
Interpretace práva.
Redukce textů, obsahová analýza, anotace
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
Korpusová lingvistika
Úvod do metodologie vědy
Sociologie – metody a techniky sociologického výzkumu
Osnova rozboru uměleckého textu
Výzkum (pedagogického zhodnocení) volného času
Metodologie historického výzkumu volného času
Metody zkoumání ekonomických jevů
Bakalářský seminář Úvod BP Závěr BP.
FYZIKA VÝZNAM FYZIKY METODY FYZIKY.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Hypotézy ve výzkumu.
Aristotelés – část druhá
Předmět sociologie Věda společenská a behaviorální
Název školy Název školy Obchodní akademie a Hotelová škola Havlíčkův Brod Obchodní akademie a Hotelová škola Havlíčkův Brod Název OP Název OP OP Vzdělávání.
Popper. Vědecká teorie Zaměření na konkrétní detail zvláštní pozornost vědce očekávání konkrétního výsledku potvrzujícího teorii doufání ve verifikaci.
Metody výstavby vědeckých teorií Podklady k přednášce Prof. PhDr. František Ochrana,DrSc. CESES FSV KU
Text: Reprodukce nálevníků Metody získávání vědeckých poznatků
Korpusová lingvistika (6) Kolokace
Zpracování dat Kvalitativní výzkum.
Úvod do korpusové lingvistiky 4
Korpusová lingvistika (4) Základy korpusové statistiky
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
Odborný styl PaedDr. Hana Vítová Střední průmyslová škola, Mladá Boleslav, Havlíčkova 456 CZ.1.07/1.5.00/ MODERNIZACE VÝU.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_32_INOVACE_09/C1 AutorIng. Liběna Krchňáková Období vytvořeníSrpen.
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
Základy zpracování geologických dat
Metaetika Shrnutí.
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Nonverbální úlohy Jiří Tesař. Výuka fyziky na ZŠ - zamyšlení  Fenclová, J.: Didaktické myšlení a jednání učitele fyziky: „Jeden učitel položí v jedné.
VÝUKOVÉ METODY Přehled.
Kvantitativní metody výzkumu v praxi
Základy pedagogické metodologie
Predikátová logika1 Predikátová logika 1. řádu Teď „logika naostro“ !
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Inovace filologických studijních oborů v souladu s potřebami na trhu práce Reg. č.: CZ.1.07/2.2.00/
Předmět sociologie Určení sociologie: Věda společenská a behaviorální Empirická sociologie Empirická sociologie Sociální jevy a formy vztahů Sociální jevy.
Pojetí sociálněvědního výzkumu
Postup při empirickém kvantitativním výzkumu
Mgr. Karla Hrbáčková Metodologie pedagogického výzkumu
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
HYPOTÉZY „Hypotéza není ničím jiným než podmíněným výrokem o vztazích mezi dvěma nebo více proměnnými. Na rozdíl od problému, který je formulován v.
Vymezení problému výzkumu Volba oblasti výzkumu Volba metodologického přístupu Formulace hypotéz !REŠERŠE! proč?
Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
Cogito ergo sum. - Myslím, tedy jsem. René Descartes.
VY_32_INOVACE_BATKOVA_CEJJLI. 03 VÝTAH (Teorie). VÝKLAD.
Vymezení demografie, její vnitřní diferenciace a vnější návaznosti.
Chemický experiment. Školní a vědecký experiment Školní experiment: Dříve řešený problém Známý výsledek pro experimentátora Vyvození výsledku na základě.
Mentální reprezentace
Volba paradigmatu a metodologie v sociálních a ekonomických vědách a její dopad na řešení vědeckých problémů František Ochrana Centrum pro sociální a ekonomické.
Myšlení a myšlenkové operace
Klára Osolsobě, Hana Žižková
Financováno z ESF a státního rozpočtu ČR.
Varianty výzkumu Kroky výzkumu Výběrový soubor
Základní metodologická pravidla při zpracování odborného textu
OZNAČENÍ MATERIÁLU: VY_32_INOVACE_297_ČJ9
Věda & struktura vědecké práce
Úvod do kvalitativního výzkumu
OZNAČENÍ MATERIÁLU: VY_32_INOVACE_276_ČJ8
KVALITATIVNÍ VÝZKUM - ÚVOD
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Induktivní postupy ve výuce matematiky
KMT/DIZ1 Věty, poučky a jejich důkazy ve školské matematice
Základní filozofické otázky
Větné členy VY_32_Inovace_20SJ - 1
Metody pedagogiky.
Transkript prezentace:

Korpusová lingvistika (2) Jan Radimský FF JU České Budějovice

Korpusová lingvistika… … samostatná lingvistická disciplína / teorie? ... podle některých autorů ano! K tomu viz zejm.: Tognini-Bonelli E., Corpus linguistics at work (2001) Rozlišuje dva přístupy k využití korpusových dat: corpus based approach corpus driven approach Před četbou: malý exkurz do metodologie vědy

Několik obecně metodologických pojmů... Věda rozumové poznání, vychází z rozvažování nebo z pozorování jevů Dedukce – indukce Všichni lidé jsou smrtelní. Sokrates je člověk. ... ? Tato labuť je bílá. Všechny labutě jsou bílé. Princip falsifikace (K. Popper) verifikace: nalézt příklady, které teorii potvrzují falsifikace: možnost hledat příklady, které teorii vyvracejí Hypoteticko-deduktivní metoda Proč jsou labutě bílé? (teorie) Mohu najít/hledat nějakou ne-bílou labuť?

Korpusová lingvistika jako teorie Popis - viz Elena Tognini-Bonelli (dále TB) Vychází z metodologických základů, které jsou společné i mnoha dalším teoretickým popisům jazyka Některé aspekty dovádí do krajnosti. Cíle KL: popis a analýza užívání jazyka v textech (TB, s. 2) Podobně je zaměřena i textová lingvistika Text je ale vnímán jako celek, čten horizontálně, s cílem porozumět obsahu... Korpus je analyzován fragmentárně, čten vertikálně, studují se opakované „události“ (výskyty)... (TB.,3)

Teoretické základy KL J. Firth: kontextová teorie významu (contextual theory of meaning) Každý výraz je nedílnou součástí konkrétního kontextu (jazykového, situačního): kontext je určující pro interpretaci významu Každá jednotka (item) se vyskytuje vždy v kontextu (context) Kolokace (collocation) – bezprostřední kontext / okolí dané jednotky Koligace (colligation) – bezprostřední kontext vyjádřený jako gramatická kategorie Podobné myšlenky najdeme i jinde, ale s více či méně podstatnými modifikacemi M. Gross: jednotkou lexikálního popisu je jednoduchá věta (protože každé slovo musí být v kontextu) Ale tato věta může být umělá (uměle vytvořená), nemusí pocházet z reálného textu.

TB (s. 27): ukázka kolokačního / koligačního paradigmatu all but + X

Corpus-based approach Přístup, který má využívat korpus pouze k „ilustraci“ předem známých faktů / jevů Z dat (korpusu) má vybírat pouze jevy, které považuje za „správné“ (tj. v souladu s teorií) Ostatní data přehlíží nebo popíše tak, aby nebyla s teorií v rozporu Nezajímá se o četnost jevů Používá předem dané kategorie (slovní druhy, větné členy...)

Corpus-driven approach Pro popis jednotek a vymezení kategorií se používá výhradně reálný kontext: kolokace, koligace Opakovaný souvýskyt jednotek má dopad na sémiotický systém cf. časté přívlastky slov jako žena / muž - [tag="A.*"] [lemma="žena"] v SYN2005 Typické kolokace mohou souviset s konotací dané jednotky (slova) Obecná pravidla se odvozují induktivně Neužívá se předem daná lematizace

Příklad použití corpus-driven přístupu It. adjektivum bello (TB, 120) význam krásný delexikalizované významy pořádný / pěkný / úplný – jako kvantifikátory Příklady C’è un bel rumore Continuammo a camminare per un bel pezzo... Quel rumore non era bello Závěry: Alomorfy bell’ a bel se užívají jako delexikalizované (46% a 27% případů) Alomorfy belli, begli ne Nejde tedy o stejné paradigma Vaše interpretace?

Jiné využití korpusu Distinkce corpus driven / corpus based je dnes překonaná Korpus lze využít k ověřování hypotéz v rámci hypoteticko-deduktivní metody