Doménový expert místo vzorce 26.4.2012, MFF UK, Tomáš Kliegr.

Slides:



Advertisements
Podobné prezentace
(B1 Print and Delivery) B1 Tisk a odeslání Ing. Miroslav Beran Servis/Helpdesk.
Advertisements

(Master Data Manager) B1UP - Správa kmenových dat Ing. Miroslav Beran Servis/Helpdesk.
NSWI117 – Technologie vývoje webových aplikací Martin Nečaský Katedra softwarového inženýrství MFF UK.
Ing. Jan Mittner MySQL Workbench 2. Základy práce s databází 3. Subversion 2.
KEG Marek RŮŽIČKA EuroMISE – Kardio, VŠE Praha Projekt Stepper – Aplikace pro podporu víceúrovňové formalizace textových dokumentů.
LOV, Listbox, Poplist a Combobox v Oracle Forms LOV – seznam hodnot, které se zobrazí po stisku klávesy Enter v textovém poli. LOV – seznam hodnot, které.
Modelování procesů pomocí workflow
Zpracování informací a znalostí Zadání úkolu č. 4 – DZD Jan Rauch Katedra informačního a znalostního inženýrství.
Quo vadis, KEG? Zamyšlení nad vznikem a budoucností “Knowledge Engineering Group”na VŠE Praha V. Svátek, září 2003.
Vypracoval: Ladislav Navrátil, EI-4 Umělá inteligence Zaměření Expertní systémy.
Životní cyklus EIZ POŘÍZENÍ PŘIZPŮSOBENÍ PŘÍSTUP OHODNOCENÍ SPRÁVA PROZKOUMÁNÍ OBNOVA? TRIAL.
Referát č. 15. Hledání textu  Čím delší a obsáhlejší je textový dokument, tím je v něm orientace obtížnější. V takových situacích přijde vhod funkce.
Systémy pro zpřístupňování eVŠKP 2008, Brno Ing. Jan Mach, CIKS Vysoká škola ekonomická v Praze Přenos VŠKP pomocí protokolu OAI-PMH.
MySQL - Vytvoření nové tabulky  create table jméno_tabulky (jméno_položky typ_položky,... ) Přehled nejběžnějších datových typů Přehled nejběžnějších.
4IZ 229 GEBZ (grafický editor báze znalostí) Vladimír Laš.
Daniel Mikeš, I4.E Vedoucí práce: Lukáš Masopust.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
17.Tabulkový procesor (filtrování a řazení dat, formuláře, podmínky a podmíněné formátování, export a import dat) Barbora Skoumalová 4.A.
Popis systému DBMAN. Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním záměrem.
Budování Digitální knihovny Vysokého učení technického v Brně Barbara Šímová /
Microsoft Access Prezentace základních uživatelských nástrojů
INSPIRE Metadata Štěpán Kafka. Draft Implementing Rules Profil pro vyhledávání Obsah/vyhledávání (směrnice INSPIRE) a)Souhlas prostorových dat s implementačními.
Jako intranet Bc. Jan Beneš. Intranet - obecná funkcionalita  sdílení dokumentů  diskusní fórum  databáze kontaktů  novinky a aktuality  firemní.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Spisová služba GINIS Bc. Jan Podloučka.
Úvod. školní: příprava na předmět Databázové systémy praktický: webové aplikace databázové systémy základy vývoje webových aplikací od návrhu databáze.
A weak fuzzy description logic with aggregation Peter Vojtáš na Pracovním semináři pořádaném Knowledge Engineering Group Knowledge Engineering.
Systémy pro podporu managementu 2
Relační databáze.
JIRA školení.
Databázové systémy Přednáška č. 7 Uživatelské rozhraní.
Reporting Ing. Jan Přichystal, Ph.D.. Úvod Uživatelé obvykle přistupují k DW pomocí BI aplikace Většina využívá předdefinované reporty Poskytují standardizovaný.
Association for Computing Machinery - Založena v r Zaměření informační technologie - Podporující publikace počítačové literatury (portál ACM) -
 BA_EM Electronic Marketing Pavel Agenda  Efektivní data mining jako zdroj relevantních dat o potřebách zákazníků.
Microsoft Office InfoPath 2003 Tomáš Kutěj Account Technology Specialist
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_01B16 Autor Ing. Jiří Kalousek Období vytvoření březen.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
Web 2.0, folksonomie a uživatelská rozhraní Lenka Němečková Eliška Pavlásková Založeno mimo jiné na prezentacích prof. B. Whitea „The Promise of Rich User.
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Centrální evidence výkonů U3V Ing. Jan Krňoul,
PRAKTICKÉ ZKUŠENOSTI Z VÝUKY David Chudán 1. NASAZENÍ VE VÝUCE SEWEBAR-CMS je nasazen při výuce OP předmětu 4IZ210 druhý semestr. Za tyto dva semestry.
4IZ 229 – Cvičení 2 Tvorba báze znalostí Vladimír Laš.
Obchodní akademie, Ostrava-Poruba, příspěvková organizace Vzdělávací materiál/DUM VY_32_INOVACE_01B13 Autor Ing. Jiří Kalousek Období vytvoření březen.
Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
Převody pojistných kmenů Team4 Ciasnocha Michal, Kokaisl Standa, Mathauser Jan, Molda Milan, Puncman Daniel.
Možnosti využití programu HYDATA. Co je HYDATA? program pro tvorbu databáze dat a jejich dalšího zpracování –(srážky, průtok, výpar a další meteorologická.
Databázové aplikace v Delphi
Možnosti GIS při tvorbě trojrozměrných map zemětřesení Vedoucí práce: Doc.Ing.Petr Rapant CSc. Odborná konzultace: Ing. Aleš Poláček CSc. Zpracoval : Pavel.
Popis systému DBMAN (KEVIS). Obecná charakteristika Systém DBMAN vychází ze snahy maximálně zobecnit přístup k datům v jednoduchých databázích. Původním.
Tvorba metainformačního systému pro prostorová data s využitím Internetových technologií Zpracovatel: Tomáš Duchoslav Vedoucí: Dr. Ing. Bronislava Horáková.
filtrování a řazení dat, podmíněné formátování,
Publikování výsledků skenování Ntrip Casters pomocí mapového serveru Autor: Bc. Filip Lombart Vedoucí: Ing. David Vojtek Ph.D.
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
Struktura a Koncept portálu ČVUT, © 2013 IBA CZ, s. r. o. Agenda Teoretický průřez strukturou a konceptem Liferay portálu Company Sites Pages (stránky)
Import dat Access (16). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Integrační trendy při tvorbě multimediálních výukových portálů pro medicínu a zdravotnictví V. Mihál, J. Potomková Lékařská fakulta Univerzity Palackého.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Legislativní helpdesk Projekt: Úprava Informačního systému ODok Reg. č.: CZ.1.06/1.1.00/
KIV/ZD cvičení 8 Tomáš Potužák.
Registr digitalizace Registr digitalizace Helena Dvořáková
Databázové systémy a SQL
Dobývání znalostí z databází znalosti
Ing. Athanasios Podaras, Ph.D 2016
Interoperabilita ISO 19115, ISO Jan Růžička,
Projekt studentů oboru Informatika
Vytvoření IS pro správu místností v prostředí WWW
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J
GaP a správa úvazků.
Transkript prezentace:

Doménový expert místo vzorce , MFF UK, Tomáš Kliegr

Popis problému „Zajímavá“ pravidla

Toto workflow nefunguje Přenos znalostí experta na analytika je drahý a neúplný Neexistuje objektivní míra zajímavosti pravidla

Nahraďme vzorce lidmi doménovými experty

Nahrazením data-minera doménovým expertem vyžaduje jiné uživatelské rozhraní

Autogenerated HTML Report from PMML 1 CMS Repository CMS Repository PMML Doc 1 PMML Doc 1 BKEF Data Mining Software Analytical Report PMML Doc 2 PMML Doc 2 Legend Semantic Know- ledge Base a) Input from DM software Report Generation FML Semantization Web Service Import Background Knowledge Elicitation Interface Background Knowledge Elicitation Interface Autogenerated HTML Report from BKEF Knowledge Base Include PMML Fragment Include Human Interaction SEWEBAR-CMS Joomla! Extension SEWEBAR-CMS Joomla! Extension XML document b) Input from domain experte) Report Authoring by the data analyst c) Automatic report generation Data flow External SEWEBAR component d) Further processing Desktop software Mapping Web Service Export XML Database Query 2 Query 2 Query 1 Query 1

Příprava dat U sloupců je automaticky detekován „archetyp“ a navrženy transformační scénáře S každým použitím systémů se databáze archetypů rozšiřuje

Okamžité výsledky Uživatel pomocí drag&drop tvoří pravidla Hodnoty atributů lze nahradit „divokými znaky“ Okamžitá odpověď, jestli existují pravidla odpovídající zadání

Vestavěný expertní systém Uživatel okamžitě vidí, jestli nalezené pravidlo potvrzuje, vyvrací, nebo je výjimkou k existujícímu pravidlu ve znalostní bázi Do znalostní báze je možné pravidla vkládat ručně, nebo na základě zpětné vazby na nalezené pravidlo (experimentální funkce)

Komunitní a komunikativní Postavený na CMS Joomla! Využívá rozšíření standardu PMML Začala práce na podpoře SBVR

Následuje Dr. Milan Šimůnek - LISp-Miner ETree, data miningový backend Ing. Stanislav Vojíř – Automatická příprava dat Bc. Radek Škrabal - Inteligentní uživatelské rozhraní

Vybrané publikace Kliegr T., Svátek V, Ralbovský M., Šimůnek M SEWEBAR-CMS: semantic analytical report authoring for data mining results. Journal of Intelligent Information Systems Kliegr T., Chudán D, Hazucha A., Rauch J SEWEBAR-CMS: A System for Postprocessing Association Rule Models. In: RuleML-2010 Challenge; p ISSN: Runner Up Prize Kliegr T., Hazucha A., Marek T., Instant Feedback on Discovered Association Rules with PMML-Based Query-by-Example. In Web reasoning and rule systems. Berlin: Springer, 2011, s ISBN Kliegr T., Vojíř S., Rauch J. Background Knowledge and PMML: first considerations In PMML '11. New York: ACM, 2011, s ISBN

Mapování PMML-BKEF, preprocessing Komponenty systému SEWEBAR Stanislav Vojíř,

Datamining z webu - workflow Konfigurace připojení k databázi – MySQL – Výběr sloupců pro danou úlohu Výběr vhodné báze znalostí (BKEF) Namapování DB tabulky na BKEF Vygenerování zadání dataminingové úlohy – PMML Vytvoření zdroje na lmcloud.vse.cz – LISp-Miner

Technické předpoklady Rozšiřujeme CMS Joomla! (1.5, 2.5) PHP, MySQL, AJAX, HTML5 Pro samotný datamining využíváme LISp- Miner

Báze znalostí - BKEF Formát založený na XML Zachycení informací od expertů – Metaatributy a jejich formáty – Rozsahy hodnot – Předzpracování – Vztahy mezi metaatributy, skupiny metaatributů

Báze znalostí - BKEF Preprocessing – Each value one category – Interval enumeration – Equidistant intervals – Nominal enumeration

Mapování DB tabulky na BKEF Zisk dat z databáze Mapování sloupců na metaatributy – Automatické – manuální úpravy Mapování hodnot – Automatické – manuální úpravy Vygenerování mapovacího souboru – Propojení s úlohou

Mapování – určení podobnosti Porovnávání názvů – Edit distance Textové položky – Porovnávání prostřednictvím trigramů Intervaly, číselné hodnoty – Hodnocení překryvů Na základě dřívějších mapování Uživatel má možnost nastavit váhy pro jednotlivá kritéria

Mapování – párování sloupec-metaatribut Jednoduché učení se správného napárování u sloupců-metaatributů Režimy „párování“ – Na základě největší podobnosti (1:N) – Vlastní heuristický algoritmus (1:1) – Na základě globálně největší podobnosti (1:1) – Manuálně

Mapování – vše pod kontrolou uživatele Aplikace vyhodnocuje a navrhuje „nejlepší“ kombinaci mapování, ale konečné rozhodnutí je na uživateli

Mapovací komponenta Pro testování mapovací komponenty byla užívána data Barbora/Adamek, ale také datasety z Illinois Semantic Integration Archive – – převod na PMML prostřednictvím Lisp-Mineru

Výběr preprocessingu, vygenerování zadání úlohy Po dokončení mapování uživatel vybere preprocessing pro jednotlivé sloupce Vygenerování PMML zadání úlohy – DataDictionary – TransformationDictionary Zaregistrování DB na lmcloud.vse.cz, odeslání PMML

Praktická ukázka

Dotazy?