Jak mravenč í kolonie dobývaj í znalosti Daniel Vodák a Luboš Popelínský Laboratoř dobývání znalostí Fakulta informatiky MU Brno

Slides:



Advertisements
Podobné prezentace
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ ÚSTAV GEODÉZIE
Advertisements

Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
UNIVERZITA TOMÁŠE BATI VE ZLÍNĚ, FAKULTA MULTIMEDIÁLNÍCH KOMUNIKACÍ
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
Řízení polohovacího mechanismu
Rozložení EEG elektrod (10-20 system)
ROZHODOVACÍ PROCESY PRO VÍCECESTNÉ TELEMATICKÉ APLIKACE Filip Ekl
Automated data mining Ing. Jan Černý Czech Technical University in Prague Faculty of Information Technology.
Induktivní logické programování
Strojové učení I (Mitchell93) učicí množina příkladů hledáme generalizaci učicí množiny ověřujeme na testovací množině pokrytí, přesnost, F-kriterium.
Odpovědi na otázky Praha 2007 Bc. Dalibor Barri ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE Fakulta elektrotechnická Katedra mikroelektroniky.
Skip-List je datová struktura, která může být použita jako náhrada za vyvážené stromy. představují pravděpodobnostní alternativu k vyváženým stromům (struktura.
Optimalizace v simulačním modelování. Obecně o optimalizaci  Optimalizovat znamená maximalizovat nebo minimalizovat parametrech (např. počet obslužných.
FORMALIZACE PROJEKTU DO SÍŤOVÉHO GRAFU
Decision Trees & Genetic Programming 1 Klasické DT V některých případech nepraktické.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Komunikační techniky užívané v komunikaci sluchově postižených studentů s vyučujícími na vysoké škole Lenka Doležalová Brno, 2007.
FÁZE A CYKLUS SUMP: Od myšlenky k praktickým řešením Petr Kurfürst, Centrum dopravního výzkumu, v.v.i. Praha, Kongresové centrum
Vysoké učení technické v Brně
Vyhledávání podobností v datech s využitím singulárního rozkladu
Systémy pro podporu managementu 2
Časová složitost algoritmů, řazení a vyhledávání
Zavádění a údržba informačních systémů
Reprezentace znalostí v UI Inteligentní systém musí umět předvídat důsledky svých akcí – potřebuje „model svého prostředí“. K jeho konstrukci potřebuje.
Luděk Novák dubna 2006 Proč a jak řídit informační rizika ve veřejné správě.
Definice, druhy, chyby, abstrakce
Dokumentace objektů a zveřejnění funkcí
Návrh klasifikátoru inovací Dynamický model transformace dat ve znalost organizace.
Reinženýring cesta ke zvyšování výkonnosti státní správy s využitím procesního řízení Ing. Martin Čulík Notes CS a.s. Konference ISSS 2003 Hradec Králové.
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Dokumentace informačního systému
Zjišťování zásoby porostu pomocí objemových tabulek
ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ FAKULTA STROJNÍ ÚSTAV PŘÍSTROJOVÉ A ŘÍDICÍ TECHNIKY ODBOR AUTOMATICKÉHO ŘÍZENÍ A INŽENÝRSKÉ INFORMATIKY Aplikace objektově.
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Mravenci Mravenci jsou drobný blanokřídlý hmyz s velikostí od několika milimetrů po několik centimetrů. Jejich tělo tvoří oddělené části: - hlava - hruď.
Autor práce:Michal Havelka Vedoucí práce: Ing. Michal Skořepa Ústav telekomunikací FEKT VUT v Brně Mobilita sítí v Mobile IP.
Jan Šaršon Milan Jaška 1Dobývání znalostí, MFF UK, 2008.
Monitorování a prognózování trhu práce: Švédskou cestou? Konference, Projekt ”Aktivní matching: Strategická podpora poradenství na pracovním.
AKD VII.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Prožitkové programy Centra nové naděje Frýdek-Místek
1 Jak se sociální původ patnáctiletých žáků odráží v jejich počítačové gramotnosti? Josef Basl Doktorský seminář VSP 1. března 2007.
Sněm RVŠ - bod 4.1 RVŠ Sněm RVŠ - bod 4.2 Základní informace: Bilanční a hodnotící zpráva RVŠ za funkční období
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Plošná inovace předmětů s využitím e- learningových nástrojů Informačního systému Masarykovy univerzity (IS MU)
ISOP/2 registr entit přírodního prostředí Roman Bukáček CENIA, laboratoř GIS Žďár nad Sázavou.
Plánování trajektorie pro bezpilotní letoun za účelem sledování pozemních objektů pomocí inerciálně stabilizované kamerové platformy Michal Kreč Vedoucí.
Návrh a implementace algoritmu SLAM pro mobilní robot
Informatika pro ekonomy přednáška 4
Optimalizace versus simulace 8.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
Hodnocení žáků. Zpráva OECD o hodnocení vzdělávání Česká republika 2012: Převládá sumativní hodnocení Velký důraz na známky Žáci jsou často zkoušeni ústně.
VÝZKUM A INTERNET Internet Advertising Conference Vít Smékal, OMG
Doc. Vladimír Rogalewicz, CSc. CzechHTA, České vysoké učení technické v Praze Fakulta biomedicínského inženýrství, Kladno Využití.
Dolování znalostí z vícejazyčných textových dat Luděk Svozil , Brno Vedoucí práce: doc. Ing. František Dařena, Ph.D.
Statistické metody pro prognostiku Luboš Marek Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze.
České vysoké učení technické v Praze Fakulta dopravní K620 – ÚSTAV ŘÍDICÍ TECHNIKY A TELEMATIKY ČVUT FD, Konviktská 20, Praha května 2016 Stávající.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Testování biometrického systému založeného na dynamice podpisu
Úvod do databázových systémů
Klára Osolsobě, Hana Žižková
Dobývání znalostí z databází dolování dat
Výpočetní technika Akademický rok 2008/2009 Letní semestr
Projekt Impuls / Seminář
Projekt Impuls / Seminář
Postavení osob na trhu práce dle nejvyššího dosaženého vzdělání
Projekt - K620 Řízení a modelování silniční dopravy
Podpora adaptivní navigace
Přijímání informace a porozumění sdělovanému
Ing. Patrik Horažďovský Ing. Martin Heindl
Rozvoj sociálních služeb a vzdělávání pracovníků v sociálních službách
Transkript prezentace:

Jak mravenč í kolonie dobývaj í znalosti Daniel Vodák a Luboš Popelínský Laboratoř dobývání znalostí Fakulta informatiky MU Brno Daniel Vodák a Luboš Popelínský Laboratoř dobývání znalostí Fakulta informatiky MU Brno

klasifikace dat Inspirace sociální chování společenstev hmyzu včel, termitů nebo mravenců klasifikace dat Inspirace sociální chování společenstev hmyzu včel, termitů nebo mravenců

Mraveniště a vyhledávání zdrojů Bez řídícího centra Bez přímé komunikace na úrovni jedinců Mravenec-agent buduje cestu Uspěje-li, během návratu zanechává feromonovou stopu = pozitivní zpětná vazba Důsledek = hromadění mravenců na nejlepších cestách Bez řídícího centra Bez přímé komunikace na úrovni jedinců Mravenec-agent buduje cestu Uspěje-li, během návratu zanechává feromonovou stopu = pozitivní zpětná vazba Důsledek = hromadění mravenců na nejlepších cestách

Mraveniště a vyhledávání zdrojů Klasifikace: Zdroj = učící příklady z jedné třídy Cesta = cesta mezi uzly Atribut=hodnota výsledkem klasifikační pravidlo A1=h1 ^ A2=h2 ^ … ^ An=hn => třída Klasifikace: Zdroj = učící příklady z jedné třídy Cesta = cesta mezi uzly Atribut=hodnota výsledkem klasifikační pravidlo A1=h1 ^ A2=h2 ^ … ^ An=hn => třída

Obsah Ant-Miner Data GUI Ant-Miner: závislost na parametrech Ant-Miner+ Porovnání s jinými učícími algoritmy Ant-Miner Data GUI Ant-Miner: závislost na parametrech Ant-Miner+ Porovnání s jinými učícími algoritmy

Ant-Miner 0) Odhadni míru informace pro Ai=hj 1) Pro každého mravence se nauč pravidlo 2) Odstraň termy, dokud kvalita neklesne 3) Vyber pravidlo s nejvyšši kvalitou; Odstraň pokryté příklady 4) Pokud zbývá hodně učících příkladů, jdi na 1. 0) Odhadni míru informace pro Ai=hj 1) Pro každého mravence se nauč pravidlo 2) Odstraň termy, dokud kvalita neklesne 3) Vyber pravidlo s nejvyšši kvalitou; Odstraň pokryté příklady 4) Pokud zbývá hodně učících příkladů, jdi na 1.

Ant-Miner: parametry Počet mravenců v kolonii Max. počet stejných pravidel (nalezených v jednom cyklu) Min. počet příkladů pokrytých pravidlem Max. počet zbývajících nepokrytých příkladů Počet mravenců v kolonii Max. počet stejných pravidel (nalezených v jednom cyklu) Min. počet příkladů pokrytých pravidlem Max. počet zbývajících nepokrytých příkladů

Ant-Miner: kriterium kvality Q = truePos / (truePos + falseNeg) * trueNeg / (falsePos + trueNeg) Q = truePos / (truePos + falseNeg) * trueNeg / (falsePos + trueNeg)

Data Breast Cancer Wisconsin 699 příkladů, 8 spojitých atributů King-rook-vs-king-pawn 959 příkladů, 36 nominálních atributů Yeast 1484 příkladů, 7 spojitých atributů Waveform příkladů, 19 spojitých atributů diskretizace, 10tisložková křížová validace Breast Cancer Wisconsin 699 příkladů, 8 spojitých atributů King-rook-vs-king-pawn 959 příkladů, 36 nominálních atributů Yeast 1484 příkladů, 7 spojitých atributů Waveform příkladů, 19 spojitých atributů diskretizace, 10tisložková křížová validace

GUI Ant-Miner: analýza

Ant-Miner+ přidáno nové kriterium kvality odstraněny chyby v algoritmu Ant-Miner implementováno v javě bez časové optimalizace přidáno nové kriterium kvality odstraněny chyby v algoritmu Ant-Miner implementováno v javě bez časové optimalizace

Porovn á n í krit é ri í kvality Původní kriterium kvality Nové kriterium kvality Přesnost Pravidel Čas Přesnost Pravidel Čas Wisc.BC 92.3% 12 29vt 94.0% 24 1min KRKS 82.4% 9 15min min Wav % 14 1h 74.5% h Yeast 41.4% 15 15vt 35.0% 70 14min Původní kriterium kvality Nové kriterium kvality Přesnost Pravidel Čas Přesnost Pravidel Čas Wisc.BC 92.3% 12 29vt 94.0% 24 1min KRKS 82.4% 9 15min min Wav % 14 1h 74.5% h Yeast 41.4% 15 15vt 35.0% 70 14min

Srovn á n í s jinými uč í c í mi algoritmy Baseline Ant-Miner+ J48 NB AdaBoost Dtable Wisc.BC 65.5% 94.0% 94.1% 97.3% 95.0% 95.7% KRKS 52.2% 82.4% 98.8% 87.5% 93.1% 96.2% Wav % 74.5% 76.7% 81.0% 70.4% 73.2% Yeast 31.2% 35.0% 59.1% 59.1% 40.7% 57.4% Baseline Ant-Miner+ J48 NB AdaBoost Dtable Wisc.BC 65.5% 94.0% 94.1% 97.3% 95.0% 95.7% KRKS 52.2% 82.4% 98.8% 87.5% 93.1% 96.2% Wav % 74.5% 76.7% 81.0% 70.4% 73.2% Yeast 31.2% 35.0% 59.1% 59.1% 40.7% 57.4%

Z á věrem + výhodou snadné ovládání + parametry jsou intuitivní + model mravenčí kolonie je přitažlivý - časová náročnost …? - přesnost učení + výhodou snadné ovládání + parametry jsou intuitivní + model mravenčí kolonie je přitažlivý - časová náročnost …? - přesnost učení

Děkuji za pozornost