VYSTADIAL Vývoj metod pro návrh statistických mluvených dialogových systémů Hana Bednářová.

Slides:



Advertisements
Podobné prezentace
Využití cloudových služeb ve školství
Advertisements

Dynamické systémy.
Úvod do Teorie her. Vztah mezi reálným světem a teorií her není úplně ideální. Není úplně jasné, jak přesně postavit herněteoretický model a jak potom.
Střední průmyslová škola strojnická Olomouc, tř.17. listopadu 49 Výukový materiál zpracovaný v rámci projektu „Učíme moderně“ Registrační číslo projektu:
ESCH, generování výstupů Bc. Tomáš Milerski Střední škola, Havířov-Šumbark, Sýkorova 1/613, příspěvková organizace Tento výukový materiál byl zpracován.
Natural Language Processing Prague Arabic Dependency Treebank Otakar Smrž koordinátor projektu Motivační přehled problémů, řešení a aplikací.
Přednáška č. 3 Normalizace dat, Datová a funkční analýza
“W questions” with a preposition
Číslo šablony: III/2 VY_32_INOVACE_P4_3.10 Tematická oblast: Aplikační software pro práci s informacemi II. HTML - tagy Typ: DUM - kombinovaný Předmět:
Algoritmy a struktury neuropočítačů ASN - P1 Prof.Ing. Jana Tučková,CSc. Katedra teorie.
Vypracoval: Ladislav Navrátil, EI-4 Umělá inteligence Zaměření Expertní systémy.
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Přínosy virtualizace a privátního cloudu
IS V EKONOMICKÝCH SUBJEKTECH Ing. Jiří Šilhán. IS IS – data+lidi+HW, prvky + relace mezi uživateli, které splňují nějaké cílové chování – tak aby byly.
Gecko mbH. Rostock, SRN –  V současnosti jsou používány nezávislé systémy pro jednotlivá oddělení a centrální systém SAP IS-H* MED.
Definování prostředí pro provozování aplikace dosud jsme řešili projekt v obecné rovině aplikace bude ovšem provozována v konkrétním technickém a programovém.
ÚČEL AUTOMATIZACE (c) Tralvex Yeap. All Rights Reserved.
RPS/CSF Česká republika 2004>2006 Rámec podpory Společenství Ministerstvo pro místní rozvoj, ČR Odbor RPS, SROP a JPD 2 Komunikační aktivity Rámce podpory.
Informatika I Informatika pro 1. ročník 4 letého gymnázia
Úvod do korpusové lingvistiky 8
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Projekt: CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“
© 2007 Cisco Systems, Inc. All rights reserved.Cisco Public ITE PC v4.0 Chapter 1 1 Operating Systems Networking for Home and Small Businesses – Chapter.
IT Session Two Lessons Three and Four. Outline  IT Test 1  International Phonetic Alphabet  IPA – Interactive chart  Exercise 1  Český národní korpus.
Systémy pro podporu managementu 2
Databázové systémy Přednáška č. 6 Proces návrhu databáze.
3. Příkazy  Příkazy dělíme na jednoduché a strukturované.  Jednoduché příkazy - žádnou jejich dílčí částí neni příkaz - přiřazovací, vstupu a výstupu,
Association for Computing Machinery - Založena v r Zaměření informační technologie - Podporující publikace počítačové literatury (portál ACM) -
Využití inteligentních botů pro výuku anglického jazyka v herním prostředí Jakub Forman
Objednávka v restauraci
Gymnázium, Broumov, Hradební 218 Vzdělávací oblast: Anglický jazyk – gramatika, slovní zásoba Číslo materiálu: EU Název: Vocabulary Microprocessors.
Artificial Intelligence (AI).  „Úloha patří do oblasti umělé inteligence, jestliže řešení, které najde člověk považujeme za projev jeho inteligence.
Seminář HCI, ÚISK FF UK, HCI v kontextu kognitivní vědy.
Geoinformační technologie Geografické informační systémy (GIS) Výukový materiál pro gymnázia a ostatní střední školy © Gymnázium, Praha 6, Nad Alejí 1952.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Obchodní akademie a Střední odborná škola, gen. F. Fajtla, Louny, p.o. Osvoboditelů 380, Louny Číslo projektu CZ.1.07/1.5.00/ Číslo sady 04Číslo.
Umělá inteligence Minského definice: UI je věda o vytváření strojů nebo systémů, které budou při řešení určitého úkolu užívat takového postupu, který –
Realtime identifikace osob podle hlasu
Souběžný návrh hardware a software (Language for Instruction Set Simulator-Oriented Model) MPO ČR, FT-TA3/128, Jazyk a vývojové prostředí pro.
Prototypování, testování prototypů Lenka Němečková Komunikace člověk-počítač KISK FF MUNI
KORPUS V MODERNÍM SLOVA SMYSLU A BUDOVÁNÍ KORPUSŮ 1 Úvod do korpusové lingvistiky 2.
Modely uživatelských preferencí. Obsah Jak se vyjadřují preference Modely preferencí a jejich učení Model založený na atributech Kolaborativní filtrování.
Tento výukový materiál vznikl v rámci Operačního programu Vzdělávání pro konkurenceschopnost 1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,
Anotace: prezentace je určena pro žáky pátého ročníku materiál slouží k procvičení tématu nakupování měny – nejpoužívanější měny a jejich označení čtení.
Nové technologie pro webové aplikace v cestovním ruchu Nové technologie pro webové aplikace v cestovním ruchu Pavel Čech Unverzita Hradec Králové.
PŘÍSTUPNOST WEBU (ACCESSIBILITY) Filip Rubáček, 2013.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
KORPUSY A KVANTITATIVNÍ DATA Úvod do korpusové lingvistiky 11.
ZÁSADY KONCIPOVÁNÍ LOGISTICKÝCH SYSTÉMŮ KAPITOLA 5: VZTAH STRATEGIE PODNIKU A LOGISTICKÉHO PLÁNOVÁNÍ, CÍLE, METODY A NÁSTROJE PLÁNOVÁNÍ, POSTUPOVÉ KROKY.
Umělá inteligence Robin Horniak. Definice Umělá inteligence (Artificial Intelligence), zkráceně UI (AI) věda, která se zabývá tím, jak přinutit stroje.
Vizuálně motorické komunikační systémy SP
Počítačové zpracování češtiny v Ústavu formální a aplikované lingvistiky
Elektrotechnická fakulta ČVUT KATEDRA KYBERNETIKY Vedoucí prof. Ing. Vladimír Mařík, DrSc. KATEDRA KYBERNETIKY ELEKTROTECHNICKÁ.
centrální porucha zpracování řečového signálu
At the shop Dialogues. Phrases / Potřebné fráze Mohu Vám pomoct? Kolik stojí….? How much is / are…..? Can I help you? tato (tento,toto) / tyto … Ještě.
Datum: Projekt: Kvalitní výuka Registrační číslo: CZ.1.07/1.5.00/ Číslo DUM: VY_22_INOVACE_9 Jméno autora: Irena Moučková Název práce:
Analýza a interaktivní reporting nad medicinským kurikulem
Operační Systém Operační systém je v informatice základní programové vybavení počítače (tj. software), které je zavedeno do paměti počítače při jeho.
Business Inteligence – úvod
Big Data-Analytics.
OPERAČNÍ SYSTÉMY Číslo projektu CZ.1.07/1.5.00/ Název školy
Dobývání znalostí z databází znalosti
Čeština: 11. lekce Czech language: 11th lesson
Ing. Athanasios Podaras, Ph.D 2016
Reporting as a Part of DSS
Název školy: ZŠ Bor, okres Tachov, příspěvková organizace
NÁZEV ŠKOLY: Základní škola Karla Klíče Hostinné
Digitální učební materiál
Kinds of shops Shopping dialogue Payment
Transkript prezentace:

VYSTADIAL Vývoj metod pro návrh statistických mluvených dialogových systémů Hana Bednářová

VYSTADIAL Vývoj statistických dialogových systémů Cílem projektu je vývoj statistických metod, které umožní návrh komplexních dialogových systémů včetně optimalizace jednotlivých statistických modelů z dat Budou vyvíjeny metody, které umožňují optimalizaci strategie řízení z již dříve pořízených dat (korpusu) nebo přímo z interakce s reálnými uživateli

Hlasové dialogové systémy Hlasové dialogové systémy mají široké možnosti uplatnění, kterými jsou například automatizace hlasových kontaktních center nebo pomoc hendikepovaným Přestože se tyto systémy začínají čím dál víc uplatňovat v praxi, stále neumožňují plynulou konverzaci, zejména proto, že metody řízení dialogu využívají deterministických algoritmů, které jsou pouze manuálně optimalizovány

Hlasové dialogové systémy Zkušenosti z vývoje statistických metod pro zpracování přirozeného jazyka naznačují, že učení z dat a optimální rozhodování významně zlepšuje kvalitu a usnadňuje nasazení takových technologií Proto budou v rámci tohoto projektu hlasové dialogové systémy modelovány jako tzv. částečně pozorovatelný Markovův proces (POMDP) a trénování takových systémů bude založeno na statistických metodách

VYSTADIAL Ačkoliv se projekt bude zabývat především vývojem statistických metod pro popis a poznání zákonitostí dialogu v přirozeném jazyce, a tedy bude převážně výzkumem základním, hmatatelným výsledkem projektu bude prototyp dialogového systému a metody pro jeho trénování z dat Vývoj a popis těchto technologií následně povede ke zvýšení robustnosti a přirozenosti dialogových systémů za současného snížení nákladů na jejich uvedení do provozu

Dialogový systém Dialogový systém je počítačový program, jehož účelem je komunikovat s člověkem pomocí mluvené řeči Hlasové dialogové systémy mají široké možnosti uplatnění, kterými jsou například automatizace hlasových kontaktních center, interaktivní zábava, výuka jazyků, pomoc hendikepovaným a aplikace, kde jiné ovládací a prezentační možnosti zařízení (například zobrazovací) jsou omezené

Dialogový systém Typický dialogový systém se skládá z těchto základních komponent: – rozpoznávání mluvené řeči – porozumění přirozenému jazyku – řízení dialogu – generování odezvy a syntézy řeči

Dialogový systém Účelem komponenty rozpoznávání řeči v dialogovém systému je převedení spontánní řeči do textové podoby V současnosti se pro tyto účely nejčastěji používají statistické přístupy založené na skrytých markovských modelech a umělých neuronových sítí (Psutka & Müller, 2006)

Dialogový systém V obou přístupech se model rozpoznávání řeči dělí na model akustický, který modeluje, jak se jednotlivé hlásky slov vyslovují, a na model jazykový, který modeluje, jak se řadí slova do vět Dialogové systémy musí pracovat se spontánní řečí, která se významně liší od řeči čtené

Dialogový systém Spontánní řeč je typická používáním nespisovného jazyka a negramatických vět, dále častými přeřeknutími, opakováním již vysloveného, užitím výplňových frází, výskytem neřečových událostí, jako je například váhání, hlasitý nádech, řeč na pozadí nebo hluk okolí

Dialogový systém Proto se komponenta rozpoznávání řeči připravuje dialogové úloze většinou na míru na základě dat podobných řešené úloze, ideálně na základě anotovaných dat komunikace uživatele a prototypu vyvíjeného dialogového systému

Dialogový systém Přestože v úloze rozpoznávání čtené řeči se již běžně dosahuje chybovosti rozpoznaných slov méně než 5 %, v úloze rozpoznávání spontánní řeči v rámci dialogového systému provozovaném v reálném prostředí se spolehlivost rozpoznávání řeči pohybuje mezi 20–30 %

Dialogový systém Komponenta porozumění přirozenému jazyku převádí textový přepis řeči do sémantické reprezentace Mezi používané formalismy reprezentace sémantické informace patří dialogové akty (Austin, 1962), sémantické rámce (Psutka & Müller ad., 2006), lambda kalkulus (Zettlemoyer & Collins, 2007)

Dialogový systém V současnosti se v praktických dialogových systémech nejčastěji používá reprezentace významu založená na dialogových aktech (Thomson & Young, 2010; Young & Gašić ad., 2010) Dialogový akt se skládá z typu aktu a jeho atributů a hodnot (Young & Gašić ad., 2010) (atributům se také často říká koncepty nebo sloty)

Dialogový systém Typ aktu reprezentuje základní význam promluvy, jako je „pozdrav“, „poděkování“, „rozloučení“, nebo že uživatel o něčem informuje, chce něco potvrdit nebo zjistit To, o čem chce uživatel informovat nebo co chce potvrdit či zjistit, má potom podobu atributů a jejich hodnot inform(to_stop="Chodov")

Dialogový systém Například v úloze spočívající v poskytování informací o restauracích by byl atributem „typ jídla“ nebo „poloha“ a jim odpovídající hodnoty by byly „italské“ nebo „centrum“ inform(food_type="škvarky") Úloha interpretace mluvené řeči z rozpoznaného textu je složitá nejenom kvůli dříve popsaným aspektům spontánní řeči, ale také kvůli velké chybovosti rozpoznaného textu

Dialogový systém Z těchto důvodů se standardní techniky vyvinuté v oboru komputační lingvistiky nepoužívají v praxi přímo, ale jsou upraveny tak, aby dosáhly vysoké robustnosti vůči výše popsaným jevům Příkladem tohoto postupu je sémantický interpret Phoenix (Ward & Issar, 1994), který je založen na robustní kombinaci bezkontextových gramatik odpovídající jednotlivým konceptům v řešené úloze

Dialogový systém Robustnost tohoto řešení spočívá v tom, že umožňuje přeskočit slova v textu, která neodpovídají žádné gramatice Pro účely zpracování spontánní řeči nebo špatně rozpoznané promluvy je interpret doplněn o další kombinační pravidla, která umožní vynechat nebo naopak doplnit některá slova promluvy tak, aby se dala odvodit i negramatická věta (Zettlemoyer & Collins, 2007)

Dialogový systém Komponenta řízení dialogu reaguje na vstup uživatele a generuje systémový akt jako odpověď Komponenta řízení dialogu se typicky dělí na dvě části: – model dialogu, který modeluje stav dialogu – strategii řízení dialogu, která určuje následující akci dialogového systému na základě odhadnutého stavu

Dialogový systém Stav dialogu reprezentuje všechnu informaci potřebnou k úspěšnému pokračování dialogu, tj. zejména cíl uživatele a to, co bylo během konverzace již řečeno a potvrzeno V současné praxi je komponenta řízení dialogu většinou založena na využití ručně psaných deterministických algoritmů a stavových automatů

Dialogový systém Dialogové systémy mohou kromě hlasu využít také jiných výrazových prostředků ke komunikaci s člověkem; v takovém případě hovoříme o multimodálních dialogových systémech Multimodální vstup může mít podobu textu vloženého pomocí klávesnice (angl. typed text), ručně psaného textu (angl. handwritten text), gest pořízených pomocí dotykových obrazovek a gest vyjádřených pohybem například rukou nebo hlavy a pořízených videokamerou

Example of a TownInfo conversation S: Thank you for calling. How may I help you? U: I am looking for a Chinese restaurant. S: Right, what price range do you have in mind? U: Cheap. S: Charles Sue is a Chinese restaurant in a cheap price range. U: Is it in the centre? S: Yes, Charles Sue is in the city centre. U: What is the phone number? S: Phone number of Charles Sue is U: Thank you good bye.

Example of a TownInfo conversation I am looking for a Chinese restaurant. inform(venue_type=restaurant,food_type=Chinese)

Sémantické anotace českých DA ANO affirm() ZÁBAVNÁ PANÍ null() TOHO null() Z HUSINECKÁ inform(from_stop="Husinecká") DALŠÍ MOŽNOST PROSÍM inform(alternative="next")

Sémantické anotace českých DA DO ZASTÁVKY MALOSTRANSKÉ NÁMĚSTÍ inform(to_stop="Malostranské náměstí") ZE ZASTÁVKY LETŇANSKÁ inform(from_stop="Letňanská") SLYŠET ZNOVA TY SPOJENÍ repeat() CHTĚL BYCH JET ZE ZASTÁVKY LETŇANSKÁ DO ZASTÁVKY MALOSTRANSKÉ NÁMĚSTÍ inform(from_stop="Letňanská")&inform(to_st op="Malostranské náměstí")

Sémantické anotace českých DA NE NECHCI JET Z ANDĚLA deny(from_stop="Anděl")&negate() NE NEJEDU Z CENTRA negate()&deny(centre_direction="from") NE ZE ZASTÁVKY ŠPERLOVA inform(from_stop="Šperlova")&negate() nebo deny(from_stop="Šperlova")?

Informace o pražské MHD  Data z rozhovoru budou použita pro rozvoj dialogového systému; při komunikaci s automatem prosím o strpení, někdy se „nechytne“ hned. Děkuji za pozornost.

Literatura AUSTIN, J. L. How to do Things with Words, BOHUS, D. & A. RUDNICKY. The RavenClaw dialog management framework: Architecture and systems, Computer Speech & Language, 23(3), 332–361, HUNT, A. & A. W. BLACK. Unit selection in a concatenative speech synthesis system using a large speech database. In Proceedings of ICASSP 96, vol. 1, 1996, 373–376. MAIRESSE, F. & M. GAŠIĆ AD. Spoken language understanding from unaligned data using discriminative classification models. In: ICASSP '09: Proc. IEEE Int. Conf. Acoustics, Speech and Signal Processing, 2009, 4749 – MAIRESSE, F. & M. GAŠIĆ AD. Phrase-based Statistical Language Generation using Graphical Models and Active Learning. In Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL), 2010, 1552–1561. MAIRESSE, F. & M. A. WALKER. Controlling User Perceptions of Linguistic Style: Trainable Generation of Personality Traits, Computational Linguistics, vol. 37, no. 3, 2011, 455–488. PSUTKA, J. & L. MÜLLER AD. Mluvíme s počítačem česky, RIESER, V. & O. LEMON. Learning and Evaluation of Dialogue Strategies for New Applications: Empirical Methods for Optimization from Small Data Sets, Computational Linguistics, vol. 37, no. 1, 2011, 153–196. STEEDMAN, M. Surface Structure and Interpretation,1996. SUTTON, R. S. & A. G. BARTO. Reinforcement Learning: An Introduction, THOMSON, B. & S. YOUNG. Bayesian update of dialogue state: A POMDP framework for spoken dialogue systems, Computer Speech & Language, vol. 24, no. 4, 2010, 562–588. YOUNG, S. & M. GAŠIĆ AD. The Hidden Information State Model: a practical framework for POMDP-based spoken dialogue management, Computer Speech and Language, 24(2), 2010, 150–174. VOICEXML 2.1, Working Draft, 2013 ( 2004/WD-voicexml ). WARD, W. & S. ISSAR. Recent improvements in the CMU spoken language understanding system. In Proceedings of the workshop on Human Language Technology (ACL), 1994, 213–216. ZEN, H. & K. OURA AD. Recent development of the HMM-based speech synthesis system (HTS). In Asia-Pacific Signal and Information Processing Association (APSIPA), 2009, 121–130. ZETTLEMOYER, L. S. & M. COLLINS. Online learning of relaxed CCG grammars for parsing to logical form. In Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning EMNLPCoNLL, 2007, 678–687.

Literatura Text příspěvku upraven podle: JURČÍČEK, F. VYSTADIAL: Vývoj metod pro návrh statistických mluvených dialogových systémů. Dostupné z: F. Jurčíček, B. Thomson, S. Young: Reinforcement learning for parameter estimation in statistical spoken dialogue systems. (GS) In: Computer Speech and Language, 3, June F. Jurčíček, B. Thomson, S. Young: Natural actor and belief critic: Reinforcement algorithm for learning parameters of dialogue systems modelled as POMDPs. (GS) In: ACM Trans. Speech Lang. Process., June 2011.