Memory-based Learning Učení založené na paměti (výtah z přednášky Waltera Daelemanse, GSLT, Göteborg 2003) + TiMBL -ukázka použití programu Jiří Mírovský,

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

LOGISTICKÉ SYSTÉMY 14/15.
Matematická analýza Lineární algebra Diferenciální rovnice
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
TENTO PROJEKT JE SPOLUFINANCOVÁN EVROPSKÝM SOCIÁLNÍM FONDEM
Úvod Klasifikace disciplín operačního výzkumu
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
ASN - cvičení 2 : Ukázky práce s NN-Toolboxem
Plošná interpolace (aproximace)
Induktivní logické programování
Strojové učení I (Mitchell93) učicí množina příkladů hledáme generalizaci učicí množiny ověřujeme na testovací množině pokrytí, přesnost, F-kriterium.
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Tloušťková struktura porostu
Řadicí algoritmy autor: Tadeáš Berkman.
Shluková analýza.
Rozšíření dotazu a vývoj tématu v IR Jiří Dvorský Jan Martinovič Václav Snášel.
Případové usuzování v expertním systému NEST Vladimír Laš, Petr Berka Vysoká škola ekonomická, Praha.
Matematická teorie rozhodování
Gymnázium, Broumov, Hradební 218 Tematická oblast: Informační a komunikační technologie Číslo materiálu: E Název: Hardware – operační paměť Autor:
Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/ Šablona:III/2č. materiálu:VY_32_INOVACE_95.
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
IGrid index Roman Krejčík. Obsah Motivace Prokletí dimenze Míry podobnosti IGrid, IGrid+ Experimentální porovnání.
Saatyho metoda – určuje, kolikrát je jedno kritérium významnější než druhé – zobecnění, více rozlišuje mezi kritérii Počet bodů Popis 1 Kritéria stejně.
KASKÁDOVÉ STYLY 1. 2 PRVNÍ STANDARD (CSS1) BYL PŘEDSTAVEN V ROCE 1996, PROTO STARŠÍ PROHLÍŽEČE ("ČTYŘKOVÉ" VERZE) IE A NN KASKÁDOVÉ STYLY NEPODPORUJÍ.
Inkluzívní škola Anketa říjen ZŠ (Praha a Střední Čechy)
Shluková analýza.
1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:
Gymnázium Jiřího Ortena KUTNÁ HORA Předmět: Matematika Cílová skupina: 1. ročník (kvinta) gymnázia Oblast podpory: IV/2 Inovace a zkvalitnění výuky směřující.
Metody výběru variant Používají se pro výběr v případě více variant řešení stejného problému Lze vybírat dle jednoho nebo více kritérií V případě více.
Databázové systémy 2 Zkouška – 8:00. Příklad I – Procedura – 5 bodů Vytvořte proceduru P_ZK4(p_oddeleni_id_from NUMBER, p_oddeleni_id_to NUMBER)
Realtime identifikace osob podle hlasu
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Modely uživatelských preferencí. Obsah Jak se vyjadřují preference Modely preferencí a jejich učení Model založený na atributech Kolaborativní filtrování.
Vektorová kvantizace (VQ) (Vector Quantization)
Rozpoznávání v řetězcích
CIDEAS 2006ČVUT v Praze, FSv Spolehlivost a rizika výběru technicko-ekonomických variant V. Beran P. Dlask Fakulta.
MNOŽINY – poslední příklad
Paralelní algoritmy ve zpracování dat Bc. Jan Hofta Výzkumný úkol:
Real time jádro operačního systému Lukáš Hamáček.
8. přednáška Value Based Management (řízení hodnoty) – propojení cílů akcionářů s cíli managementu pro maximalizaci tvorby hodnoty pro vlastníky (shareholder.
W i ref (t+1) = W i ref (t) + h ci (t) [X(t) - W i ref (t)], i Nc h ci (t) 0, t  proces konverguje Algoritmy a struktury neuropočítačů ASN – P3 SOM algoritmus.
Lineární rovnice s parametrem Autor: Jiří Ondra. Rovnici s parametrem považujeme za zápis množiny všech rovnic, které získáme dosazením konstant za parametr.
Anti – Aliasing Ondřej Burkert atrey.karlin.mff.cuni.cz/~ondra/stranka.
Optimalizace versus simulace 8.přednáška. Obecně o optimalizaci  Maximalizovat nebo minimalizovat omezujících podmínkách.  Maximalizovat nebo minimalizovat.
MorČe morfologické značkování češtiny
Mgr. Michal LOUTHAN Katedra geoinformatiky, UP Olomouc
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Neuronové sítě.
Využití neuronových sítí IVTH – Informační technologie ve vodním hospodářství Vypracoval: Jiří Vacek Z-92.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Geografické informační systémy pojetí, definice, součásti
Prioritní osa: 1 − Počáteční vzdělávání Oblast podpory: 1.4 − Zlepšení podmínek pro vzdělávání na základních školách Registrační číslo projektu: CZ.1.07/1.4.00/
Charakteristiky úrovně Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí.
PROGRAMOVÁNÍ 3ITA,3ITB Jaroslav Burdys Hlavní zdroj:
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
SOFTWAROVÁ PODPORA PRO VYTVÁŘENÍ FUZZY MODELŮ Knihovna fuzzy procedur Ing. Petr Želasko, VŠB-TU Ostrava.
Kombinované metody oceňování. Metody založené na analýze trhu
Rozmístění středisek obsluhy v dopravní síti Předmět: Teorie dopravy - cvičení Ing. František Lachnit, Ph.D.
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Procesor Procesor (CPU – Central Processing Unit) je ústřední výkonnou jednotkou počítače, která čte z paměti instrukce a na jejich základě vykonává program.
C-síť (circle – net) Petr Kolman.
1. ročník oboru Mechanik opravář motorových vozidel
Portfolio analýza Model GE
Konflikt daňových příslušností
Metody strojového učení
Spojitá a kategoriální data Základní popisné statistiky
Neuronové sítě.
Neuronové sítě.
ANALÝZA A KLASIFIKACE DAT
Autor: Honnerová Helena
Transkript prezentace:

Memory-based Learning Učení založené na paměti (výtah z přednášky Waltera Daelemanse, GSLT, Göteborg 2003) + TiMBL -ukázka použití programu Jiří Mírovský, ÚFAL, 2005

Učení a klasifikace ➲ Učení: ● ulož trénovací příklady do paměti ➲ Klasifikace testovacího příkladu X: ● porovnej X s každým příkladem v paměti: ● spočítej vzdálenost mezi X a příkladem v paměti ● aktualizuj k dosud nalezených nejbližších příkladů (sousedů) ● nejvýznamnější třídu mezi k nejbližšími sousedy vezmi jako klasifikaci příkladu X

Vlastnosti MBL ➲ příklad tzv. líné metody ➲ dobře zobecňuje ➲ dobře zvládá výjimky ➲ neabstrahuje ➲ náročná na paměť a práci s ní

Parametry ➲ jádro algoritmu MBL ➲ tři hlavní parametry: ● reprezentace příkladů ( samozřejmě, jako u všech ostatních metod strojového učení ) ● určení podobnosti příkladů (metrika) ● výběr nejvýznamnější třídy z k nejbližších sousedů

Metriky -metrika překrytí ➲ metrika překrytí ● počet atributů s různými hodnotami (u nečíselných atributů)

Metriky -MVDM ➲ Modified Value Difference Metric (modifikovaná metrika různosti hodnot) ● pro nečíselné atributy ● 'p' a 'b' ve fonetice jsou podobnější než 'p' a 'a' ● jak často se v 1 vyskytuje se stejnými třídami jako v 2

Metriky -váhy atributů ➲ různé váhy atributů ● výpočet vah: např. informační zisk: ● spočítej základní entropii dat H ● pro každý atribut: ● rozděl data na množiny dané hodnotami atributu ● spočítej entropii každé z těchto množin ● spočítej váženou průměrnou entropii těchto množin ● rozdíl této vážené průměrné entropie a základní entropie dat H je informační zisk daného atributu

Výběr z k nejbližších sousedů ➲ třída s největší četností vyhrává ➲ hlasování vážené vzdáleností ● lineárně, inverzně, exponenciálně ➲ řešení nerozhodných případů

TiMBL ➲ Tilburg Memory-Based Learner ➲ ➲ zdarma pro výzkum a vzdělávání ➲ implementace mnoha variant MBL