Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

Podobné prezentace


Prezentace na téma: "© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc."— Transkript prezentace:

1 © Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.

2 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE

3 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS  relační struktura je vytvořena z určitých elementárních popisných částí dat, tzv. primitiv a vzájemných vztahů mezi nimi – relacemi;  relační struktury zpravidla vyjadřujeme pomocí grafů;

4 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

5 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

6 © Institut biostatistiky a analýz TYPY RELA Č NÍCH STRUKTUR  řetězce (uvuuyzuvw)  pole (především pro reprezentaci 2D obrazů)  stromy (relační struktura neobsahující cykly a paralelní cesty)  obecné grafy

7 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

8 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

9 © Institut biostatistiky a analýz KOMBINOVANÝ STRUKTURÁLNÍ POPIS

10 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)

11 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  Gramatika je čtveřice G = (V n, V t, P, S), kde V n a V t jsou konečné disjunktní množiny (abecedy), přičemž prvky množiny V n nazývají neterminální pomocné symboly a prvky V t terminální symboly, S  V n je tzv. axiom gramatiky nebo také počáteční symbol a P je množina substitučních pravidel tvaru , které definují způsob náhrady dílčí relační struktury  novou strukturou .

12 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  Příklad gramatiky: G = ((A,B), (0,1), P, A), P = (A  0B1, 0B00B, B  „e“). Příklad generování řetezce: A  0B1  00B1  000B1  0001

13 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  různé typy automatů podle charakteru relační struktury a substitučních pravidel – nejjednodušší konečný automat  Konečný stavový automat A je pětice A = (X, S, s 0, S c, ), kde X je konečná vstupní abeceda, S je množina vnitřních stavů, s 0 je počáteční stav automatu, S c je množina cílových stavů automatu a : X x S  S je přechodová funkce.

14 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  Příklad konečného stavového automatu

15 © Institut biostatistiky a analýz REPREZENTACE KLASIFIKA Č NÍ T Ř ÍDY  výčtem relačních struktur (může být bohužel velký až nekonečný)  generátorem relačních struktur – gramatika  příjemcem relačních struktur – automat  ekvivalence gramatiky a automatu – gramatika a automat jsou ekvivalentní, pokud množina relačních struktur generovaná gramatikou a množina akceptovaná automatem jsou stejné

16 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE nedeformované relační struktury  ztotožnění s reprezentativními relačními strukturami;  přijetí automatem

17 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury

18 © Institut biostatistiky a analýz STRUKTURÁLNÍ POPIS

19 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury  podle vzdálenosti od etalonu jak vzdálenost určíme?

20 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE deformované relační struktury  podle vzdálenosti od etalonu jak vzdálenost určíme? vzdálenost vs. metrika ?

21 © Institut biostatistiky a analýz METRIKA - VZDÁLENOST Metrika ρ na X je funkce ρ: X × X  R, kde R je množina reálných čísel, taková, že: ρ 0 R: - < ρ 0  ρ(x,y) < +, x,y  X ρ(x,x) = ρ 0, x  X a ρ(x,y) = ρ(y,x), x,y  X. (symetrie) Když dále ρ(x, y) = ρ 0 když a jen když x = y (totožnost) a ρ(x, z)  ρ(x, y) + ρ(y, z), x,y,z  X. ( nerovnost) Prostor X, ve kterém metrika ρ definována, nazýváme metrickým prostorem. Vzdálenost je hodnota určená podle metriky.

22 © Institut biostatistiky a analýz METRIKA PODOBNOSTI - PODOBNOST Metrická míra podobnosti s na X je funkce s: X × X  R, kde R je množina reálných čísel, taková, že: s 0 R: - < s(x,y)  s 0 < +, x,y  X s(x,x) = s 0, x  X a s(x,y) = s(y,x), x,y  X. (symetrie) Když dále s(x,y) = s 0 když a jen když x = y (totožnost) a s(x,y).s(y,z)  [s(x,y) + s(y,z)].s(x,z), x,y,z  X. ( nerovnost ?)

23 © Institut biostatistiky a analýz STRUKTURÁLNÍ VZDÁLENOST V případě řetězců lze deformační vlivy vyjádřit (na úrovni primitiv) trojicí tzv. elementárních deformačních transformací – eliminací, substitucí a inzercí

24 © Institut biostatistiky a analýz VÁHOVANÁ LEVENŠTEJNOVA METRIKA

25 © Institut biostatistiky a analýz VÁHOVANÁ LEVENŠTEJNOVA METRIKA

26 © Institut biostatistiky a analýz DALŠÍ STRUKTURÁLNÍ METRIKY  řetězce  prostá (neváhovaná) Levenštejnova metrika  Hammingova metrika  stromy :

27 © Institut biostatistiky a analýz KLASIFIKACE DEFORMOVANÝCH STRUKTUR  výpočet vzdálenosti mezi reprezentativními strukturami (etalony) klasifikační třídy a klasifikovanou strukturou;  začlenění deformačních pravidel do substitučních pravidel gramatiky (resp. automatu);

28 © Institut biostatistiky a analýz VYTVO Ř ENÍ STRUKTURÁLNÍHO ETALONU MNO Ž INY PÍSMEN

29 © Institut biostatistiky a analýz VYTVO Ř ENÍ STRUKTURÁLNÍHO ETALONU MNO Ž INY PÍSMEN

30 © Institut biostatistiky a analýz SHRNUTÍ – POKUD MO Ž NO CO NEJOBECN Ě JI  základní klasifikační úloha je zatřídit (z hlediska prostoru i času) (matematický, abstraktní) popis daného klasifikovaného objektu do odpovídající třídy/kategorie;  děje se to na základě klasifikačního pravidla, pomocí kterého je definována klasifikační třída;  klasifikační třída může být definována:  výčtem prvků do ní patřících;  vzdáleností/podobností (od) vzorů té které třídy;  hranicemi, vymezujícími prostor dané třídy.

31 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE DALŠÍ PŘÍKLAD ZE ŽIVOTA

32 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

33 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

34 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

35 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů indexřetězec četnost výskytu indexřetězec četnost výskytu 1ABCJEF610ABCDDEL1 2ABCJE311ACJE1 3ACJEFF112ACDJE1 4GBCDDEF313ABCJFF1 5AIDDE214ABIDDF2 6GBCDDE115ACDDK1 7ABCJ216ABCDDKF1 8ACJEF217 9ABCJF1

36 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

37 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

38 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

39 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů Minimální kostra (minimum spanning tree) je graf, který spojuje všechny objekty tak, že se zde nevyskytují žádné smyčky a zároveň součet délky spojnic mezi uzly (objekty) je minimální

40 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů

41 © Institut biostatistiky a analýz STRUKTURÁLNÍ KLASIFIKACE AKUSTICKY EVOKOVANÝCH KMENOVÝCH POTENCIÁL Ů  etalonové řetězce pro jednotlivé shluky určené iteračními algoritmy jsou: IaABCJEFVaACDDKIbABCJEF IIaACJEFVIaABIDDFIIbACDDE IIIaAIDDEVIIaGBCDDEFIIIbABCDDE IVaGCDDF

42 © Institut biostatistiky a analýz Příprava nových učebních materiálů oboru Matematická biologie je podporována projektem ESF č. CZ.1.07/2.2.00/ „ VÍCEOBOROVÁ INOVACE STUDIA MATEMATICKÉ BIOLOGIE “ INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ


Stáhnout ppt "© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc."

Podobné prezentace


Reklamy Google