Větná polarita v češtině Kateřina Veselovská Žďárek – Hořovice, 27. 11. 2009 1.

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

PRŮZKUM NA TÉMA: „Dopady finanční krize“ eficia .
2 3 Lokalita Pod Javornic kou silnicí 4 směr Solnice směr Javornice směr Vamberk CENTRUM 10min. směr Častolovice.
ZÁKLADNÍ ŠKOLA PODBOŘANY, HUSOVA 276, OKRES LOUNY
Zpracování informací a znalostí Booleovský model vyhledávání dokumentů a jeho rozšiřování Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního.
Sídliště Dukla - Pardubice

*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Ukončení 1.etapy výuky cizího jazyka
Spektra zatížení Milan Růžička 1 Dynamická pevnost a životnost
PROCVIČOVÁNÍ spustíte klávesou F5
Vliv konceptu zelených budov na provozní fázi výstavbového projektu Ing. Jiří Dobiáš LEED AP.
PROGRAM PRO VÝUKU T ČLÁNKU
základní pojmy posloupností
Vzorce se slovesy s obecným významem změny Jiří Řezáč VMS, 8. prosince 2009.
Lego Mindstorms Martin Flusser.
AutorMgr. Lenka Závrská Anotace Očekávaný přínos Tematická oblastOperace s reálnými čísly Téma PředmětMatematika RočníkPrvní Obor vzděláváníUčební obory.
Ten, ta, to II Fill in the blanks with the appropriate forms of ten. Vzor: Proč potřebuješ ___ knihy? Proč potřebuješ ty knihy? *Taken from Review Lesson.
Dynamické rozvozní úlohy
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
Elektrický obvod a jeho části
Pedagogika volného času II Vladimír Jůva
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Komunikace o evropských fondech Názory široké veřejnosti Tisková konference Ministerstva pro místní rozvoj
ČLOVĚK A JEHO SVĚT 2. Ročník - hodiny, minuty Jana Štadlerová ŽŠ Věšín.
Dělení se zbytkem 3 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
ARITMETICKÁ POSLOUPNOST II
Proč je důležité studovat Principy
ARITMETICKÁ POSLOUPNOST I
ZOHO OFFICE Vypracovala: Iva Ptáčková, A11B0605P 1.
Decision Trees & Genetic Programming 1 Klasické DT V některých případech nepraktické.
Vyhodnocení dotazníkových šetření prováděných na veletrhu GAUDEAMUS Přípravný výbor – Slavonice Přípravný výbor – Slavonice
Regresní analýza a korelační analýza
Získávání informací Získání informací o reálném systému
Gravitační vlny v přesných řešeních Einsteinových rovnic RNDr
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Мetafora a metonymie v české mluvnici
1 Úvodní snímek slouží pro počáteční orientaci a jako návěští pro hypertextové odkazy. Při použití jako předlohy jej uživatel odstraní.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
Vnímání a mínění Eliška Jungová, IKŽ, FSV UK LS 2007/8.
KASKÁDOVÉ STYLY 4.
1 Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUMVY_52_INOVACE_01/A3 AutorIng. Marie Grygarová Období vytvořeníZáří 2012.

Projekt PŘEDPOVĚĎ POČASÍ. Předpověď počasí na
Nejmenší společný násobek
DĚLENÍ ČÍSLEM 3 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 46.
předpověď počasí na 14. května 2009 OBLAČNOST 6.00.
Novohradské statistické dny Poznámky k problematice určování počtu shluků Hana Řezanková Vysoká škola ekonomická v Praze.
Cvičná hodnotící prezentace Hodnocení vybraného projektu 1.
Startegie a perspektivy trhu s biopalivy v ČR Česká zemědělská universita, Praha, listopad Česká asociace petrolejářského průmyslu a obchodu.
Projekt PŘEDPOVĚĎ POČASÍ. projekt PŘEDPOVĚĎ POČASÍ.
EDITOR BY: SPRESS 15. ledna ledna ledna 2015.
Úvod do managementu 1. seminář
VY_32_INOVACE_Čj-Ml 6.,7.16 Anotace: Prezentace uvádí přehled a stručnou definici jednotlivých neohebných slovních druhů. Vzdělávací oblast: český jazyk.
KEG Použití vzorů při vyhledávání na webu Václav Snášel.
Pojmy a interpretace.
25/1 Příčina globální krize? Smilovice ‘09 M. Vlček.
STAVOVÁ ROVNICE IDEÁLNÍHO PLYNU.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Magnetické vlastnosti látek
Elektronická zařízení
5. Měření a vytyčování úhlů
1 © Mediaresearch, a.s., 2008 NetMonitor a AdMonitoring Výsledky za říjen 2008.
Přednost početních operací
Změny v SOILINu ve SCIA Engineer oproti Nexis32
Ovoce a zelenina Svět kolem nás
DIGITÁLNÍ UČEBNÍ MATERIÁL Test určování a zařazování členovců

Statistická extrakce idiomů Jan Bušta CZPJ FI MU, Brno PV
Transkript prezentace:

Větná polarita v češtině Kateřina Veselovská Žďárek – Hořovice,

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 2

Polarita podoblast tzv. Opinion Miningu klasifikace textu v rámci Opinion Miningu: faktorem míra subjektivity – fakta vs. názory Český prezident je volen oběma komorami Parlamentu vs. Český prezident je ve světě velmi oblíben. určení polarity = zhodnocení názoru vyjádřeného v textu v rámci opozice pozitivní vs. negativní Mám ráda rýži vs. Nesnáším brambory 3

Polaritu určujeme na základě polárních výrazů (např. dobrý, špatný atd.) polárními výrazy nemusejí být vždy frekventovaná slova polární výrazy jsou závislé na kontextu Př. vyjádření členské negace: [Ne hodný] byl ten chlapec, ale vypočítavý a mstivý. 4

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 5

Cíl Rozhodnout, zda daná věta vyjadřuje pozitivní či negativní názor. Všechny věty, jejichž polaritu budeme určovat, musejí být vyhodnoceny v rámci Opinion Miningu jako subjektivní názory. 6

Motivace Proč se zabývat polaritou na úrovni věty? přesnější rozlišení než na delších úsecích textu – užitečné v oblastech NLP jako je Question Answering Sumarizace textu polární výrazy obvykle nebývají v textu rozmístěny rovnoměrně (vliv na celkové hodnocení) 7

TEXT … dobře … … … … … … … … … … … … … … špatný … … … … … … … … … … … … … … … … … … … … … skvělý … … … … … … … … … … rád … … … … … … … … … … … … úžasné … … … … … … … … … … … … … … … …pěkně… … … … … … … … … bezvadný … … … … … … … … … … P OLARITA = POZITIVNÍ Polarita na úrovni textu Určující je četnost Není nutná přesná interpretace každého slova Není nutné slovnědruhové zařazení 8

Polarita na úrovni věty Nutná přesná interpretace jednotlivých výrazů Ve větě obsaženo méně informací Nutno určit slovní druh … … … … dobře … … … … … POLARITA = POZITIVNÍ 9

Přínos Zkoumání jazykových rysů v souvislosti se strukturou věty Využití kombinace jazykových rysů + polarity ve strojovém učení (supervised machine learning) 10

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 11

Polarita na úrovni slova Slovo neobsahuje samo o sobě žádnou jasnou informaci o polaritě obsahuje (obecnou) morfologickou charakteristiku ( x tvarová homonymie) neobsahuje informace o hloubce uzlu ve stromě 12

Je to bohudíky za námi. 13

14

Další důležité rysy důležitá informace o pozici slova ve větě (je větným členem?) dosah částic určující vliv predikátu druh klauze „síla“ spojky či předložky 15

Polarita na úrovni věty kontext – snazší orientace +/- stejně jako v textu rozhodující počet +/- výrazů, jejich větněčlenská platnost a dosah - počet polárních výrazů v hlavní větě - celkový počet „silných“ polárních výrazů - počet znegovaných pozitivních výrazů (Př. Ne hezky, nemám rád atp.) 16

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 17

Možnosti výzkumu vytvořit „subjectivity lexicon“ pro češtinu – set frekventovaných polárních výrazů s přisouzenou platností + / - implementace hodnot těchto výrazů do vět v korpusu trénovací data – porovnání úspěšnosti (s jakou přesností odpovídá výsledná polarita na označkovaných datech) 18

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 19

Větná polarita a vyhledávání (QA) Cílem je najít v korpusu dat věty, které mají nějakou polaritu vzhledem k danému dotazu Zadání: Vyhledat pozitivní názory spojené se jménem Alexandra Sticha. Výsledek: K největším zásluhám všestranného bohemisty Alexandra Sticha patří to, že na počátku 90. let minulého století inicioval a zaštítil studium jazyka a literatury doby baroka. 20

Předpoklady úspěšného vyhledávání správně označkované polární výrazy shoda vyhledávaného jména/pojmu a polárního výrazu blízkost vyhledávaného jména/pojmu a polárního výrazu 21

Polarita - úvod do problematiky Větná polarita: a) Cíl a motivace b) Charakteristika c) Možnosti výzkumu Větná polarita a vyhledávání Závěr 22

Závěr Větná polarita: jednotlivá slova sama o sobě neposkytují relevantní informaci předpoklad relevantních výsledků: větší množství slov + informace o jejich polaritě + další charakteristika Větná polarita vztažená k tématu: velký podíl jazykových rysů důležitá informace o vzdálenosti daných výrazů 23

Souhrn faktorů ovlivňujících větnou polaritu Morfologické vlastnosti Hloubka polárního výrazu ve stromě Polarita predikátu Druh klauze „Síla“ polárního výrazu Dosah negace (ne zrovna milý) Dosah intenzifikátoru (velmi milý) Vliv modality Modifikace pomocí pozitivního nebo negativního polárního výrazu (hrozně milý, pěkný hlupák) 24

Ideální věta Polární výraz: Morfologie: sloveso Větný člen: predikát Hloubka ve stromě: nízká Typ věty: hlavní + modifikace polárním výrazem se stejnou platností - pozitivní pozitivním a naopak – strašně zlý 25

Literatura: Annotating Expressions of Opinions and Emotions in Language. J. Wiebe, T. Wilson, C. Cardie. Language Resources and Evaluation, Making Large-Scale SVM Learning Practical. T. Joachims. In B. Schölkopf, C Burges, and A. Smola eds. Advances in Kernel Methods- Support Vector Learning. MIT Press, Examining the Role of Linguistic Knowledge Sources in the Identification and Classification of Reviews. V. Ng, S. Dasgupta, and S. M. Niaz Arifin. Proceedings of the COLING/ACL,

27 Děkuji za pozornost