1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW:

Slides:



Advertisements
Podobné prezentace
LOGISTICKÉ SYSTÉMY 14/15.
Advertisements

Fakulta životního prostředí Katedra informatiky a geoinformatiky
Fakulta životního prostředí Katedra informatiky a geoinformatiky
 př. 3 Je dán vektor u=(2;-4) a bod M[3;9]. Na ose x najdi bod N tak, aby vektor MN byl s vektorem u rovnoběžný. výsledek postup řešení.
Dualita úloh lineárního programování a analýza citlivosti
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
A5M33IZS – Informační a znalostní systémy Datová analýza I.
57. ročník MO Soustředění řešitelů Kategorie A Exponenciela Litoměřice 2007.
Cvičení 6 – 25. října 2010 Heteroskedasticita
Statistika schématicky Tomáš Mrkvička. Základy znáte Konfidenční intervaly Porovnání 2 či více výběrů Regresní modely Základy časových řad.
Úvod do umělé inteligence
DOK „Umělá inteligence“ v DOK (i jinde). NEURONOVÉ SÍTĚ.
Neuronové sítě Jakub Krátký.
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
Biometrické Bezpečnostní Systémy Filip Orság Technologie rozpoznání mluvčího.
Formulace a vlastnosti úloh lineárního programování
Systémy pro podporu managementu 2
Podnikové informační systémy C7 – Data Mining a získávání znalostí České vysoké učení technické v Praze Fakulta strojní ústav Řízení a ekonomiky podniku.
Lineární regrese.
Regrese Aproximace metodou nejmenších čtverců
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
WinBase tiskové sestavy Návod Postupy Příklady.
U MĚLÁ INTELIGENCE Lucie Ježková O3.B. C O TO VLASTNĚ JE ? Obor informatiky, který se zabývá vytvářením strojů, které se dokážou „inteligentně chovat“
Korelace a elaborace aneb úvod do vztahů proměnných
Systémy pro podporu managementu 2 Inteligentní systémy pro podporu rozhodování 1 (DSS a znalostní systémy)
Další spojitá rozdělení pravděpodobnosti
Umělá inteligence Minského definice: UI je věda o vytváření strojů nebo systémů, které budou při řešení určitého úkolu užívat takového postupu, který –
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Dolce: Databáze lokálních konformací DNA
Úvod do databázových systémů
Databázové systémy Informatika pro ekonomy, př. 18.
Využití ontologií při dobývání znalostí z databází Hana Češpivová.
Obecná kvantifikace v relačních databázích Přehled typů dat a algoritmů Alan Eckhardt.
Vektorové prostory.
Graf nepřímé úměrnosti
 Agregační funkce  Agregační funkce jsou to funkce, které nějakým způsobem zpracují více hodnot a jako výsledek vrátí hodnotu jednu COUNT()  Funkce.
Aplikační a programové vybavení
Lineární programování - charakteristika krajních bodů
Základní principy geografického výzkumu
Plánování trajektorie pro bezpilotní letoun za účelem sledování pozemních objektů pomocí inerciálně stabilizované kamerové platformy Michal Kreč Vedoucí.
Vzdálenost rovnoběžných rovin
Biostatistika 1. přednáška Aneta Hybšová
 př. 2 Jsou dány vektory u=(4;-1;2), v=(0;5;6), w=(s;t;5). Určete souřadnice s, t vektoru w, jestliže víte, že vektor w je kolmý k vektoru u i k vektoru.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
Vzájemná poloha dvou rovin
Vyhledávání vzorů (template matching)
Algoritmy a struktury neuropočítačů ASN - P14 Hopfieldovy sítě Asociativní paměti rekonstrukce původních nezkreslených vzorů předkládají se neúplné nebo.
BioTech 2011, Strážná. O čem to bude? Stochastické simulace Diferenciální rovnice (ODR) Automaty.
Praktická využití UNS V medicínských aplikacích Jan Vrba 2006.
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Skalární součin 2 vektorů
Repetitorium z matematiky Podzim 2012 Ivana Medková
Simulátory umělého života Aplikovatelné v environmentálních informačních systémech.
● Databaze je soubor dat,slouží pro popis reálného světa(např.evidence čkolní knihovny..) ● Relační databaze je databáze založená na relačním modelu.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Úvod do databázových systémů
Vlastnosti souborů Jaroslava Černá.
Centrální databáze RIV aneb Co se s vašimi daty děje dál
Co se dá změřit v psychologii a pedagogice?
Metody strojového učení
Regresní analýza výsledkem regresní analýzy je matematický model vztahu mezi dvěma nebo více proměnnými snažíme se z jedné proměnné nebo lineární kombinace.
1 Lineární (vektorová) algebra
Rovnice a graf přímé úměrnosti.
KOLEKCE ÚLOH PRO MATEMATICKÝ SEMINÁŘ trojúhelník z těžnic
Úvod Aritmetické a geometrické posloupnosti a jedna zajímavá funkcionální rovnice.
Toky v sítích.
Počítačová grafika.
Datové sklady (Data Warehouse)
Datové sklady (Data Warehouse)
Transkript prezentace:

1 Kognitivní inspirace třídění na základě závislostí atributů Jan Burian Eurfomise centrum – Kardio, Ústav informatiky AV ČR Článek je dostupný na WWW: burian_classification.rtf

2 Učení bez učitele a třídění Učení bez učitele – rozpoznáváme v datech jisté pravidelnosti, aniž bychom disponovali informací, kde a jak tyto pravidelnosti hledat Typická úloha – nalézt způsob jak roztřídit záznamy v tabulce relační databáze Klasické třídění – nalézt funkci rozdělující shluky záznamů v prostoru atributů s danou metrikou

3 Problém klasického třídění V případě, že máme kategoriální atributy, klasické třídění postihuje vztahy mezi záznamy v třídě vždy v rámci jednoho atributu, nepostihuje vztahy mezi atributy Vztah mezi atributy je vlastností celku Klasické třídění nepostihuje vlastnost skupiny záznamů jako celku, vlastnosti třídy se dají redukovat na vlastnosti jednotlivých částí (záznamů) Inspirativní řešení – kognitivní vědy

4 Kognitivní vědy Zabývají se procesem poznávání v živých i umělých systémech Poznávání můžeme chápat jako proces získávání znalostí Učení jedna ze základních složek poznávání Inspirace – neurofyziologie ukládání a vybavování znalostí v mozku

5 Kognitivní inspirace Poškození mozku nezpůsobuje úplnou ztrátu schopnosti vybavovat si naučené znalosti, ale pouze zmenšení této schopnosti Znalosti nejsou poškozením odstraněny nebo vymazány, jen je snížena jejich celková kvalita

6 Kognitivní inspirace Znalosti nejsou v mozku uložené v jednotlivých neuronech, ale jsou distribuovány v rozsáhlých vzorech aktivit neuronových drah Znalosti v mozku se nedají redukovat na součet jednotlivých částí, ale vznikají až jako vlastnost celku Inspirace - chápat vztahy mezi třídami záznamů v databázi nikoliv jako odlišnost jednotlivých záznamů, ale jako odlišnost mezi charakteristikami celků jednotlivých tříd

7 Vztah atributů Vhodnou charakteristikou skupiny záznamů je ohodnocení závislostí atributů na základě kontingenční tabulky

8 Třídící atribut V odlišných skupinách záznamů mohou (ale nemusí) být odlišné závislosti atributy Chceme najít způsob jak roztřídit záznamy tak, aby mezi třídami byly co nejodlišnější závislosti mezi atributy Pokusme se najít takový atribut jehož kategorie roztřídí záznamy do tříd s maximálně odlišnými závislostmi atributů.

9 Závislost atributů Nechť V je množina všech atributů tabulky databáze Nechť C  V je kandidát na třídící atribut a C 1,C 2 … C k jsou kategorie (třídy) tohoto atributu Pro A,S  V; A  S; A,S  C označme AD(A,S|C i ) odnotu nějaké testové statistiky (například χ², Kendallův koeficient apod.) o závislosti dvou atributů A a S ve třídě C i.

10 Odlišnost jako úhel mezi vektorem závislostí a osou souřadnic Pro AD(A,S|C 1 ) =AD(A,S|C 2 ) bod [AD(A,S|C 1 ) ; AD(A,S|C 2 ) ] se nalézá na ose souřadnic úhel  je nulový závislost A a S není podmíněna C

11 Odlišnost závislostí atributů v třídách ADCD (Attribute Dependency Class Difference) Suma odlišností závislostí atributů v třídách pro různé kombinace atributů Použití kosinové věty Maximální odlišnost závislostí mezi atributy má minimální ADCD 

12 Postup identifikace třídícího atributu Pro každého kandidáta na třídící atribut vyber z databázové tabulky třídy podle jeho kategorií (skupina záznamů, u kterých se daná kategorie vyskytuje). Pro tyto třídy vygeneruj závislosti dvojic ostatních atributů. Urči odlišnost závislostí atributů v třídách (ADCD) pro jednotlivé kandidáty na třídící algoritmus. Vyber jako třídící ten atribut, u nějž je odlišnost závislostí atributů v třídách maximální.

13 Závěr a další vývoj Zatím není implementováno, ale … Procedura KL-Miner (součást systému LISp-Miner), generuje vztahy mezi atributy na základě kontingenční tabulky Ve vývoji je program SDKL-Miner hledající zajímavé odlišnosti mezi vztahy atributů ve dvou zadaných skupinách záznamů

14 Závěr a další vývoj Obecný problém: Tvorba nového atributu, který záznamy roztřídí tak, aby odlišnost závislostí atributů v třídách byla maximální ze všech možných roztřídění. Patrně vhodné použití suboptimálních a subsymbolických metod (neuronové sítě, genetické algoritmy)