Automatizovaná podpora výběru nástroje pro dobývání znalostí Jakub Štochl
Motivace Existuje velké množství metod pro dobývání znalostí Ještě větší množství nástrojů, které tyto metody implementují Rostoucí složitost Různorodá omezení v předpokladech analýz
Obvyklý postup Snaha využít nástroje s nímž je uživatel nejlépe obeznámen Důmyslné ohýbání možností programu pro dosažení žádaného výsledku Možnost opomíjení jednodušších a výhodnějších řešení
Základní návrh řešení Poskytnout uživateli ohodnocený seznam metod použitelných pro jeho úlohu Umožnit uživateli zadat vstupní požadavky v libovolné míře konkrétnosti Zpřístupnit uživateli parametry rozhodovacích algoritmů a umožnit jejich modifikaci Využít již provedených úloh
Momentálně dostupná řešení Obecné popisy pro úlohy dobývání znalostí –nepracují s konkrétními řešeními Automatizované systémy výběru úlohy –Neposkytují možnost změny parametrů –Často uvažují rychlost implementace algoritmu –Nebývá umožněn náhled do zpracování úlohy –Nevyužívá se znalostí uživatele
Implementace řešení Využití XML jako standardu pro popis dat Popis jednotlivých metod v podobě XML- schémat Parametry úlohy zadány jako XML dokument Popis úloh, výsledků a parametrů transformován pomocí XSLT do uživatelsky přijatelné podoby
Využití XML Jedná se o univerzální řešení, nevyžaduje od uživatele znalost nějakého speciálně vyvinutého značkování Umožňuje využít již vyvinutých nástrojů a podpory v nejrůznějších produktech Využití XML schémat vzhledem k implementaci datových typů Maximální využití PMML pro možnost konverze
Popis jednotlivých metod Hlavní schéma, které určuje všechny povolené elementy Každá metoda má své vlastní schéma, dědící elementy z hlavního schématu (pomocí namespace) Parametry ‘vhodnosti’ jsou řešeny pomocí fixních hodnot atributů
Popis jednotlivých metod
Implementace řešení Využití XML jako standardu pro popis dat Popis jednotlivých metod v podobě XML- schémat Parametry úlohy zadány jako XML dokument Popis úloh, výsledků a parametrů transformován pomocí XSLT do uživatelsky přijatelné podoby
Zadání úlohy XML dokument s libovolně konkrétním zadáním Uživatel je od XML zápisu odstíněn pomocí klienta Čím konkrétnější je zadání, tím méně metod je vybráno při validaci dokumentu
Transformace pomocí XSL Primárně využívána k zobrazení informací uživateli (úlohy, popis metod….) Pokud dokument projde validací, transformace počítá dále ohodnocení metody
Výběr doporučovaných metod Na základě porovnání úlohy s popisem metody –vyřazení neakceptovatelných metod validací –výpočet ‘vhodnosti’ ostatních při transformaci Na základě porovnání s bází již provedených úloh
Báze provedených úloh Úlohy mají definovanou minimální hranici konkrétnosti popisu Navíc obsahují vybranou metodu a její ohodnocení (i záporné) a stručný popis Báze úloh lze sdílet Funkci pro porovnání podobnosti může uživatel modifikovat
Nedořešené úkoly Vytvoření klientské aplikace, odstiňující uživatele od jádra aplikace Vytvoření schémat pro další metody a rozšiřování současných Rozšiřování báze provedených úloh Vylepšování funkcí pro porovnání jednotlivých úloh
Děkuji za pozornost