© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Slides:



Advertisements
Podobné prezentace
Algoritmy zpracování textů II
Advertisements

Fakulta životního prostředí Katedra informatiky a geoinformatiky
Dynamické systémy.
Mechanika s Inventorem
Algebra.
ENVIRONMENTÁLNÍ INFORMATIKA A REPORTING
Příklady použití zásobníkového automatu
Obsah statistiky Jana Zvárová
ORIENTOVANÉ GRAFY V této části se seznámíme s následujícími pojmy:
F U N K C E.
 Diskrétní  Abstraktní  Sekvenční  Deterministický  Dynamický.
Formální jazyky a gramatiky
Příklady jazyků Příklad 1: G=({S}, {0,1}, P, S)
Gramatiky a jazyky Přednáška z předmětu Řízení v komplexních systémech
Algoritmy vyhledávání a řazení
Úvod do databázových systémů
Úvod do předmětu Opakování
Vztah bezkontextových jazyků a ZA
Regulární výrazy Regulární výrazy představují další možnost popisu regulárních jazyků (právě od nich dostaly své jméno). Definice: Množina všech regulárních.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Databázové modelování
Srovnání Petriho sítí a HDA David Ježek. Vícedimensionální automaty Klasické automaty –nemají metodu jak vyjádřit „pravou“ souběžnost událostí A, B 0.
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
JADEGen Nástroj pro generování chování z prostředí Agent Studio Implementace (ver0.1)
Turingův stroj.
Množiny.
Úvod do teorie konečných automatů
Automaty a gramatiky.
Posloupnosti – základní pojmy Střední odborná škola Otrokovice Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Konečné automaty a vyhledávání
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ZPRACOVÁNÍ A ANALÝZA BIOSIGNÁL Ů FREKVENČNÍ SPEKTRUM SPOJITÝCH SIGNÁLŮ.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
ANALÝZA A KLASIFIKACE DAT
Vyhledávání vzorů (template matching)
SIGNÁLY A LINEÁRNÍ SYSTÉMY
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc.
SIGNÁLY A LINEÁRNÍ SYSTÉMY
Systémy. Definice systému Systém je množina navzájem souvisejících prvků a vztahů mezi nimi.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
© Institut biostatistiky a analýz ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT prof. Ing. Jiří Holčík, CSc.
Množiny Matematika Autor: Mgr. Karla Bumbálková
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Překladače 4. Lexikální analýza © Milan Keršlágerhttp:// Obsah: ● vstupní formáty,symboly.
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Kateřina Linková. Dostupné z Metodického portálu ISSN: , financovaného.
ANALÝZA A KLASIFIKACE DAT
Toleranční analýza Zpracoval: Prof. Ing. Ladislav Ševčík, CSc
Znázornění dopravní sítě grafem a kostra grafu Předmět: Teorie dopravy - cvičení Ing. František Lachnit, Ph.D.
Překladače 5. Syntaktická analýza
ČASOVÉ ŘADY (SIGNÁLY A LINEÁRNÍ SYSTÉMY )
MATEMATIKA Obsah přednášky. Opakování, motivační příklady Funkce.
Financováno z ESF a státního rozpočtu ČR.
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Analýza a optimalizace tuhosti příruby osnovního válu
Geografické informační systémy
MNOŽINY Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Kateřina Linková. Dostupné z Metodického portálu ISSN: , financovaného.
MNOŽINY RNDr. Jiří Kocourek.
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
ANALÝZA A KLASIFIKACE DAT
Transkript prezentace:

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS  relační struktura je vytvořena z určitých elementárních popisných částí dat, tzv. primitiv a vzájemných vztahů mezi nimi – relacemi;  relační struktury zpravidla vyjadřujeme pomocí grafů;

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz TYPY RELA Č NÍCH STRUKTUR  řetězce (uvuuyzuvw)  pole (především pro reprezentaci 2D obrazů)  stromy (relační struktura neobsahující cykly a paralelní cesty)  obecné grafy

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz KOMBINOVANÝ STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  Gramatika je čtveřice G = (V n, V t, P, S), kde V n a V t jsou konečné disjunktní množiny (abecedy), přičemž prvky množiny V n nazývají neterminální pomocné symboly a prvky V t terminální symboly, S  V n je tzv. axiom gramatiky nebo také počáteční symbol a P je množina substitučních pravidel tvaru , které definují způsob náhrady dílčí relační struktury  novou strukturou .

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  Příklad gramatiky: G = ((A,B), (0,1), P, A), P = (A  0B1, 0B00B, B  „e“). Příklad generování řetezce: A  0B1  00B1  000B1  0001

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  různé typy automatů podle charakteru relační struktury a substitučních pravidel – nejjednodušší konečný automat  Konečný stavový automat A je pětice A = (X, S, s 0, S c, ), kde X je konečná vstupní abeceda, S je množina vnitřních stavů, s 0 je počáteční stav automatu, S c je množina cílových stavů automatu a : X x S  S je přechodová funkce.

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  Příklad konečného stavového automatu

© Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  ekvivalence gramatiky a automatu – gramatika a automat jsou ekvivalentní, pokud množina relačních struktur generovaná gramatikou a množina akceptovaná automatem jsou stejné

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE nedeformované relační struktury  ztotožnění s reprezentativními relačními strukturami;  přijetí automatem

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury

© Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury  podle vzdálenosti od etalonu jak vzdálenost určíme?

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury  podle vzdálenosti od etalonu jak vzdálenost určíme? vzdálenost vs. metrika ?

© Institut biostatistiky a analýz METRIKA - VZDÁLENOST Metrika ρ na X je funkce ρ: X × X  R, kde R je množina reálných čísel, taková, že: ρ 0 R: - < ρ 0  ρ(x,y) < +, x,y  X ρ(x,x) = ρ 0, x  X a ρ(x,y) = ρ(y,x), x,y  X. (symetrie) Když dále ρ(x, y) = ρ 0 když a jen když x = y (totožnost) a ρ(x, z)  ρ(x, y) + ρ(y, z), x,y,z  X. ( nerovnost) Prostor X, ve kterém metrika ρ definována, nazýváme metrickým prostorem. Vzdálenost je hodnota určená podle metriky.

© Institut biostatistiky a analýz METRIKA PODOBNOSTI - PODOBNOST Metrická míra podobnosti s na X je funkce s: X × X  R, kde R je množina reálných čísel, taková, že: s 0 R: - < s(x,y)  s 0 < +, x,y  X s(x,x) = s 0, x  X a s(x,y) = s(y,x), x,y  X. (symetrie) Když dále s(x,y) = s 0 když a jen když x = y (totožnost) a s(x,y).s(y,z)  [s(x,y) + s(y,z)].s(x,z), x,y,z  X. ( nerovnost ?)

© Institut biostatistiky a analýz STRUKTURÁLNÍ VZDÁLENOST V případě řetězců lze deformační vlivy vyjádřit (na úrovni primitiv) trojicí tzv. elementárních deformačních transformací – eliminací, substitucí a inzercí

© Institut biostatistiky a analýz VÁHOVANÁ LEVENŠTEJNOVA METRIKA

© Institut biostatistiky a analýz VÁHOVANÁ LEVENŠTEJNOVA METRIKA

© Institut biostatistiky a analýz DALŠÍ STRUKTURÁLNÍ METRIKY  řetězce  prostá (neváhovaná) Levenštejnova metrika  Hammingova metrika  stromy :

© Institut biostatistiky a analýz KLASIFIKACE DEFORMOVANÝCH STRUKTUR  výpočet vzdálenosti mezi reprezentativními strukturami (etalony) klasifikační třídy a klasifikovanou strukturou;  začlenění deformačních pravidel do substitučních pravidel gramatiky (resp. automatu);

© Institut biostatistiky a analýz VYTVO Ř ENÍ STRUKTURÁLNÍHO ETALONU MNO Ž INY PÍSMEN

© Institut biostatistiky a analýz VYTVO Ř ENÍ STRUKTURÁLNÍHO ETALONU MNO Ž INY PÍSMEN

© Institut biostatistiky a analýz SHRNUTÍ – POKUD MO Ž NO CO NEJOBECN Ě JI  základní klasifikační úloha je zatřídit (z hlediska prostoru i času) (matematický, abstraktní) popis daného klasifikovaného objektu do odpovídající třídy/kategorie;  děje se to na základě klasifikačního pravidla, pomocí kterého je definována klasifikační třída;  klasifikační třída může být definována:  výčtem prvků do ní patřících;  vzdáleností/podobností (od) vzorů té které třídy;  hranicemi, vymezujícími prostor dané třídy.

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE DALŠÍ PŘÍKLAD ZE ŽIVOTA

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů indexřetězec četnost výskytu indexřetězec četnost výskytu 1ABCJEF610ABCDDEL1 2ABCJE311ACJE1 3ACJEFF112ACDJE1 4GBCDDEF313ABCJFF1 5AIDDE214ABIDDF2 6GBCDDE115ACDDK1 7ABCJ216ABCDDKF1 8ACJEF217 9ABCJF1

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů Minimální kostra (minimum spanning tree) je graf, který spojuje všechny objekty tak, že se zde nevyskytují žádné smyčky a zároveň součet délky spojnic mezi uzly (objekty) je minimální

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

© Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů  etalonové řetězce pro jednotlivé shluky určené iteračními algoritmy jsou: IaABCJEFVaACDDKIbABCJEF IIaACJEFVIaABIDDFIIbACDDE IIIaAIDDEVIIaGBCDDEFIIIbABCDDE IVaGCDDF

© Institut biostatistiky a analýz Příprava nových učebních materiálů oboru Matematická biologie je podporována projektem ESF č. CZ.1.07/2.2.00/ „ VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE “ INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ