Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.

Slides:



Advertisements
Podobné prezentace
Cíle a postupy empirického výzkumu
Advertisements

MUDr. Martin Kučera Mgr. Kateřina Fritzlová
JAZYKOVĚDA, JAZYKOVÁ KULTURA, ŘEČ A JAZYK
Čeština pro cizince a azylanty – B1 (učebnice, cvičebnice, metodika)
Korpusová lingvistika (2)
1 Počítačové sítě Úvodní přednáška Cíl předmětu –seznámit se s principy datové komunikace –seznámit se s principy distribučních systémů –seznámit se s.
Pojem / koncept Homonymie Ondřej Diblík – Simona Kukučová | |
Sémantická analýza založená na lingvistických a ontologických zdrojích Adéla Kereková
SEMANTICKÝ WEB. Semantický Web WWW – Tim Berners-Lee, CERN, univerzum propojených HTML stránek, prostor hyperlinkovaných dokumentů – Informace jsou zobrazeny.
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Úvod do umělé inteligence
Koreferát: LISp-Miner a (lékařské) ontologie Vojtěch Svátek.
Priorita č. 3 Aktivní zapojení výzkumné a vývojové základny do rozvoje podnikání.
1 Číslo-název šablony klíčové aktivityIII/2–Inovace a zkvalitnění výuky prostřednictvím ICT Tematická oblastZáklady informatiky a hardware DUMVY_32_INOVACE_ODB_525.
Úvod do korpusové lingvistiky 8
Formální jazyky a gramatiky
Kam se obrací „gramatická“ vlna?
Učte se anglicky 4krát rychleji Úvod Dr. Arkady Zilberman *US Patent 6,341,958.
Systémy pro podporu managementu 2
Úvod do korpusové lingvistiky 4
Ústav automatizace a měřicí techniky
Artificial Intelligence (AI).  „Úloha patří do oblasti umělé inteligence, jestliže řešení, které najde člověk považujeme za projev jeho inteligence.
Věta, výpověď, promluva Název materiálu: VY_32_INOVACE_CJ3r0101
Seminář HCI, ÚISK FF UK, HCI v kontextu kognitivní vědy.
Získávání znalostí z medicínských textů Petr Kolesa EuroMISE Centrum.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Umělá inteligence Minského definice: UI je věda o vytváření strojů nebo systémů, které budou při řešení určitého úkolu užívat takového postupu, který –
DIACHRONIE A KORPUSY (DČNK) Úvod do korpusové lingvistiky 10.
Realtime identifikace osob podle hlasu
JAZYKOVĚDA JAZYKOVÉ PŘÍRUČKY
B i o c y b e r n e t i c s G r o u p Vztah výpočetní techniky a biomedicíny  počítač - nástroj pro vývoj nových přístrojů  počítač - součást přístrojových.
CKL --- Centrum komputační lingvistiky Projekt MŠMT LC536 (LC05) Univerzita Karlova v Praze, ÚFAL MFF Západočeská univerzita Plzeň, KKY FAV Masarykova.
Atomární (nomenklaturní) teorie významu - REKAPITULACE
Korpusová lingvistika ( 3 ) Jan Radimský FF JU České Budějovice.
Pohled pedagoga běžné základní školy na podporu komunikativních kompetencí žáků s narušenou komunikační schopností PhDr. Veronika Girglová Katedra speciální.
VÝUKOVÉ METODY Přehled.
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
Kontextové vyhledávání pro knowledge management Helena Palovská.
Markéta Lopatková Karolína Skwarska Václava Kettnerová Eduard Bejček
MorČe morfologické značkování češtiny
INTERAKCE KOMUNIKACE PEDAGOGICKÁ KOMUNIKACE
PŘEDMĚT: ORGANIZACE ZNALOSTÍ PŘEDNÁŠEJÍCÍ: Josef Schwarz Automatická indexace Základní metody a postupy.
Mémy tlumočení podle Franze Pöchhackera
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
SOCIÁLNÍ DATA JAKO ZDROJ PRO STUDIUM PERCEPCE PROSTORU Vít Voženílek.
CJBB105 Úvod do korpusové lingvistiky
PLIN033_3 Přegenerovávání a podgenerovávání – dva problémy automatické analýzy přirozeného jazyka, konkrétně slovotvorby.
Využití neuronových sítí IVTH – Informační technologie ve vodním hospodářství Vypracoval: Jiří Vacek Z-92.
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
Volitelný jazykový seminář STYLISTICKÉ HODNOCENÍ PŘEKLADU Božena Bednaříková.
Vzdělávací portál eKabinet.cz a digitální obsah pro střední školy Ing. Richard Valenta
Podpora méně frekventovaných jazyků SŠ Mgr. Lucie Pospíšilová.
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
JAZYK: POPIS, ZÁKLADNÍ PRVKY A VLASTNOSTI PERCEPCE ŘEČI: PERCEPCE SLOV POROZUMĚNÍ VĚTÁM, TEXTU PRODUKCE ŘEČI JAZYK A MYŠLENÍ OSVOJOVÁNÍ JAZYKA Jazyk a.
Mentální reprezentace
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Klára Osolsobě, Hana Žižková
Financováno z ESF a státního rozpočtu ČR.
Business Inteligence – úvod
Dobývání znalostí z databází znalosti
Zdravotnický management
JAZYKOVĚDA A JEJÍ DISCIPLÍNY
Automatická indexace Základní metody a postupy
Ing. Milan Houška KOSA PEF ČZU v Praze
Geografické informační systémy
Jazykové korpusy (lingvistika, filologie, výuka jazyků)
Modelování Transportních Procesů 2
Současné trendy důraz na kontinuitu předškolního a počátečního školního rozvoje teorie emergentního rozvoje gramotnosti předškolní období – diskuse o systematické.
Transkript prezentace:

Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací2 … zpracování přirozeného jazyka Natural Language Processing (NLP) oblast témat a úloh, spojení mnoha vědních oborů moderní, nutné, mimořádně složité rozšíření a aplikace dnešní IT, její původní motivace Computer/Computational Linguistics (CL) počítačová/komputační lingvistika teoretická/formální lingvistika, korpusová lingvistika … Artificial Intelligence (AI) umělá inteligence, automatické učení, strojové vnímání

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací3 Proč je jazyk složitý? Systém a jeho projevy (langue vs. parole) přístupy pravidlové, korpusové, rozumové, statistické Nekonečnost, produktivita, Zipfův zákon omezený počet hodně častých/očekávaných jevů nekonečně výčtem nepopsatelných řídkých jevů Homonymie, synonymie, elipsa, aktuální kontext May I watch TV? – It’s bath time, honey. Znalost světa, neverbální komunikace, humor čas, společenské zvyklosti, vlastní jména …

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací4 Hlavní oblasti výzkumu Speech recognition and synthesis rozpoznávání/generování mluvené řeči Information retrieval (IR) vyhledávání informací, nikoli jen textu Sémantika, konstrukce ontologií, logika modelování významu, reprezentace znalostí Machine translation (MT) automatický překlad, analýza a syntéza jazyků

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací5 Jazyková data a jejich anotace Model jazyka podle zvoleného kritéria psané x mluvené, obecné x oborové, paralelní, historické popis struktury jazyka x popis informací, binární x fuzzy Reprezentace jazyka závislá na teorii popisu (ne)úplnost, různý detail, sledovaný cíl závislostní syntax vs. složková syntax, morfologie, TFA Jazykové zdroje jsou přesto široce využitelné pro všechny zmiňované výzkumné oblasti Linguistic Data Consortium, University of Pennsylvania ÚFAL & CKL, ÚJČ, ÚSJ, projekty EU, MALACH

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací6 Prague … Dependency Treebank Morfologická rovina (r. slovních druhů) analýza slovních forem v textu, určení základního slovního tvaru a způsobu jeho odvození z/do formy Analytická rovina (r. povrchové syntaxe) popis struktury věty a nalezení funkcí větných členů, vyjádření vlastní gramatiky jazyka Tektogramatická rovina (r. jazykového významu) zachycení významu promluvy (vět v celém kontextu) a jeho reprezentace tak, že je do jisté míry popisem myšlenky a lze jej využít k porozumění textu, tj. i k překladu mezi jazyky

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací7 Když mám treebank, co umím? Morfologická analýza (a vymezení jednotek řeči) slovník aktuálního jazyka, algoritmus odvozování forem, jejich verifikace a rekonstrukce, lemmatizace slov textu Tagging, disambiguace (nejen morpho) automatický výběr správných anotací v daném kontextu, strojové učení, rozhodovací modely Syntaktická analýza (i tecto) rozbor textu a jejího členů, redukce vět, interpretace Jazykový model (různé úrovně) identifikace jazyků, třídy slov/struktur, rozpoznávání

25. června 2003Natural Language Processing: Motivační přehled problémů, řešení a aplikací8 Pro skutečný svět … … existuje zřejmé využití ;) vysoce organizované slovníky a lexikální sítě, studijní pomůcky automatické kontroly pravopisu a gramatiky, odhad srozumitelnosti doplňování textu v průběhu psaní, víceznačné klávesnice (mini- přístroje, usnadnění komunikace pro handicapované) komprese dat (rychlost, kapacita), užitečný signál interpretace textu, IR, zjišťování informací z internetu i jiných DB dialogové systémy, obchod, služby, interview (i v lékařství) hlasová komunikace s počítačem (rozuměj obecně, např. navigace) úplný automatický překlad, machine-assisted translation, orientační překlad, interaktivní překlad Mnoho vedlejších efektů (od modelování živých organizmů ke čtení DNA, rozpoznávání obrazu,...)