Setkání KIZI se studenty a zájemci o obor ZWT V. Svátek,
Předměty HS ZWT a praxe 4IZ460 Pokročilé přístupy k DZD – Dolování z reálných dat: kriminalita v Chicagu – Vystoupení odborníka z praxe 4IZ440 Propojená data na webu – Transformace reálných rozpočtových dat (EU, ČR) do formátu RDF a dotazování nad nimi
Předměty HS ZWT – novinky IZ460 Pokročilé přístupy k DZD – Nová verze webových stránek pro seznámení se systémem LISp-Miner, včetně ukázkového postupu 4IZ470 Dolování znalostí z webu – Lingvistické zpracování textů jako detektivní hra – Phrase Detectives 4IZ440 Propojená data na webu – Vznikne interaktivní cvičebnice jazyka SPARQL (projekt IRS) – Předběžně dále: Vyzkoušení nových technologií: Linked Data Fragments Vystoupení odborníka z praxe – reálný případ transformace českých veřejnosprávních dat do RDF (např. ČSSZ) 4IZ530 Logické programování – Zásadní inovace předmětu, zaměření na aplikace z oblasti operačního výzkumu (grafy, optimalizace, …)
Pracovní skupiny KIZI Neformální „uzlové body“ pro výzkum, výuku (viz „profesní profily“ ZWT) i spolupráci s praxí Zahrnují učitele, doktorandy i studenty – Ideálně by se měli do některé zapojit všichni Zformovány v letech – Viz („Research groups and projects“) – Projekty vesměs přístupné z webu: v posledních 5 letech celkem 4x RP EU, 4x GAČR, 9x IGA, aj.
Pracovní skupiny KIZI DMKD – Data Mining and Knowledge Discovery SWOE – Semantic Web and Ontological Engineering IIS - Intelligent Information Systems WELT – Web Engineering and Library Technology
Skupina DMKD Vedoucí: Rauch, Kliegr, Berka, Šimůnek Vybrané tematické směry – Datamining v praktických úlohách – Software pro datamining – Využití doménových znalostí v dataminingu – Datamining a datová kvalita – Automatizace procesu dataminingu – Datamining přes webové rozhraní – Dolování z textů, webu (např. Wikipedie) a multimédií – Dolování uživatelských preferencí pro doporučovací systémy – Dolování byznys pravidel – Datamining nad linked open data (LOD) – Propojení dataminingu a OLAP/reportování
Skupina SWOE Vedoucí: Svátek, Zamazal Vybrané tématické směry – Převod dat veřejné správy na linked open data (LOD) – Tvorba slovníků/ontologií pro LOD; návrhové vzory – Tvorba aplikací využívajících LOD, mj. herně-výukových – Datamining nad LOD – Vizualizace LOD i slovníků/ontologií – Lingvistické aspekty slovníků/ontologií pro LOD – Vzájemné mapování pojmů mezi slovníky/ontologiemi – Využití LOD pro analýzu veřejných rozpočtů, veřejné zakázky a e-commerce – LOD jako encyklopedický zdroj – DBpedia (i česká)
Skupina IIS Vedoucí: Berka, Ivánek Vybrané tematické směry – Expertní systémy založené na pravidlovém a případovém usuzování – Principy logického a pravděpodobnostního odvozování – Problémy algoritmické složitosti – Vztah lidské a umělé inteligence – Inteligentní domy pro péči o zdravotně postižené
Skupina WELT Vedoucí: Sklenák, Kosek Vybrané tematické směry – Rozvoj standardů pro webová a polostrukturovaná data (XML, HTML, XSLT, XQuery, …) – Ergonomie webových aplikací – Využívání moderních (zvl. webových) technologií v knihovním prostředí – Sledování internetových aktivit
Diplomové práce Aktuálně 6 řešených se zadáním v ISIS (předp. obhajoba 2016) 22 obhájených v letech Cca 50 vypsaných témat k přihlášení Vedle toho lze vedoucímu navrhnout vlastní téma
Řešené práce Pavel Nepomucký (prof. Rauch) DMKD Vytváření webové analytické zprávy z metabáze systému LISp-Miner Přemysl Václav Duben (Ing. Vojíř) DMKD Filtrování zajímavých pravidel v systému EasyMiner Leontýna Blahová (Ing. Pejčoch) DMKD Big Data Governance Petr Fišer (prof. Ivánek) IIS Simplification of quantum circuits for modular exponentiation Richard Prajer (Dr. Palovský) WELT Možnosti identifikace botnetové robotické aktivity Martin Snížek (doc. Sklenák) WELT Moderní web
Obhájené práce DMKD (1) Prof. Rauch – Tomáš Koválik: Možnosti prezentace výsledků DZD na webu – Miroslav Prokůpek: Aplikace metod DZD na otevřená data – Tomáš Soukup: Automatizace dataminingového procesu v datech o dopravních nehodách v Londýně – Petr Šimeček: Analýza reálných dat z restauračního prostředí Prof. Berka – Bohuslav Čech: Použití metod dobývání znalostí v oblasti kardiochirurgie – Martin Válek: Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD – Ján Černý: Implementace procedur pro předzpracování dat v systému Rapid Miner
Obhájené práce DMKD (2) Doc. Šimůnek – Jan Beskyba: Automatizace předzpracování dat za využití doménových znalosti – Tereza Hlaváčová: Využití systému LISp-Miner při analýze faktorů ovlivňujících dominanci sinic ve fytoplanktonu – Zuzana Ochodnická: Data mining process automatization of air pollution data by the LISp-Miner system Ostatní vedoucí – Jan Černý (Ing. Pejčoch): Benchmark nástrojů pro řízení datové kvality – David Fišer (Ing. Pejčoch): Úloha profilace v řízení datové kvality – Kateřina Mansfeldová (Ing. Máša): Reálná aplikace metod dobývání znalostí z databází na praktická data – Petr Fiala (Ing. Neumann): Rozpoznávání znaků z reálných scén pomocí neuronových sítí
Obhájené práce SWOE Doc. Svátek – Tomáš Hanzal: Modeling Events on the Semantic Web – Petr Hazuza: Ontologie přístupnosti budov – Šárka Turečková: Využití propojených dat na webu ke tvorbě strategické znalostní hry Ostatní vedoucí – Štěpán Pilař (Mgr. Mynarz):Komponentizace transformací linked data – Matěj Vacek (doc. Strossa): Pragmatický lematizátor českých slov
Obhájené práce IIS a WELT IIS – Petr Dušák (prof. Ivánek): Fractal application in data compression WELT – Jakub Řihák (Ing. Kosek): Automatizace digitalizačního workflow NTK – Tomáš Herma (Dr. Palovský): Platformně nezávislé aplikační rozhraní na architektuře REST
Vypsaná témata DMKD (1) Prof. Berka – Implementace metod dobývání znalostí z databází – Systém předzpracování dat pro dobývání znalostí z databází – Reálná úloha dobývání znalostí Doc. Šimůnek – Využití doménových znalostí při intepretaci výsledků procedury 4ft-Miner – Předzpracování dat a využítí doménových znalostí (domain knowledge) – Automatizace vybrané části procesu DZD – DZD a analýza časových řad – Evoluční algoritmy a jejich využití v praxi – Případová studie analýzy reálných dat s důrazem na možnosti automatizace – Návrh na rozšíření systému LISp-Miner
Vypsaná témata DMKD (2) Ing. Pejčoch – Benchmark nástrojů pro řízení datové kvality – Úloha profilace v řízení datové kvality Doc. Holeňa – Modely sociálních sítí – Hledání spřízněných skupin v sociálních sítích – Moderní evoluční algoritmy pro hledání oblastí s vysokou fitness – Objevování zajímavých znalostí v datech pomocí evolučních algoritmů – Studium a srovnávání hlavních typů evolučních algoritmů – Využití jádrových funkcí k urychlení evolučních algoritmů – Urychlení evolučních algoritmů pomocí náhodných lesů – Vizualizace dat pro klasifikační a regresní stromy – Moderní regresní metody při dobývání znalostí z dat – Vizualizace dat při konstrukci regresních modelů – Získávání pravidel pro výzkum vlastností materiálů
Vypsaná témata DMKD (3) + DMKD SWOE Doc. Svátek – Grafické rozhraní nad vydolovanými asociačními pravidly – Specifikace a implementace doporučovacího systému pro podporu OLAP technikami dolování z dat – Implementace rozhraní mezi nástroji pro OLAP a dolování z dat Ing. Kliegr – Python parser for Wikipedia/MediaWiki – Sestavování platformně heterogenních projektů se systémy Ant/Maven Doc. Svátek – Dolování z dat ve formátu RDF – Automatická extrakce webových nabídek produktů a služeb a sémantický web – Extrakce nespecifikovaných relací z webu Ing. Labský – Extrakce informací z textu Ing. Zeman – Extrakce informací z českého Wikislovníku
Vypsaná témata SWOE (1) - LOD Doc. Svátek – Témata z oblasti extrakce, transformace, propojování a vizualizace fiskálních dat – návaznost na projekt EU OpenData.eu – Tvorba strukturovaných dat pro Wikipedii – návaznost na připravovaný projekt EU i spolupráci s praxí – Převod databáze publikační činnosti VŠE do formátu Linked Data – Empirické porovnání možností běžných webových API a koncových bodů SPARQL při tvorbě webových mashupů – Využití báze odborných kartografických znalostí pro podporu vývoje webových aplikací nad mapovým rozhraním – Analýza možnosti propojení dokumentů XML pomocí struktur RDF Mgr. Mynarz – Testování použitelnosti slovníků pro linked data – Webová aplikace pro vyhledávání oponentů vysokoškolských kvalifikačních prací postavená nad linked data
Vypsaná témata SWOE (2) - různé Doc. Svátek – Ekonomické aspekty znalostních technologií – Identifikace a typologizace výjimek z axiomů ve webových ontologiích – Návrh víceúrovňové struktury webových ontologií pro Linked Data – Návrh využití anotací v ontologickém jazyce OWL 2 Ing. Zamazal – Extrahování instancí pro ontologie z domény organizování konferencí – Mapování ontologických entit s využitím doménových znalostí Témata ve spolupráci s MSD Center Prague – Medical terminology alignment (Ontology engineering) – Semantic Patient information leaflet (Semantic Linked Data app) – Semantic personalized brochures for patients (Social Web)
Vypsaná témata IIS Prof. Berka – Pravidlové a případové usuzování ve znalostních systémech Doc. Vejnarová – Vlastnosti posibilistické verze IPF procedury
Dotazy, náměty?