Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Dnešní témata UISK – PVI K02 1 Technologie pořádání informací a znalostí v 21. století ■dokumenty → data ■data → znalosti ■ontologie ■vizualizace znalostní.

Podobné prezentace


Prezentace na téma: "Dnešní témata UISK – PVI K02 1 Technologie pořádání informací a znalostí v 21. století ■dokumenty → data ■data → znalosti ■ontologie ■vizualizace znalostní."— Transkript prezentace:

1 Dnešní témata UISK – PVI K02 1 Technologie pořádání informací a znalostí v 21. století ■dokumenty → data ■data → znalosti ■ontologie ■vizualizace znalostní (informační) systém  sémantika  (umělá) inteligence

2 Vizualizace – notace UML UISK – PVI K02 2

3 Znalostní (informační) systém 3

4 Informační systémy podle typu řešených úloh databázové (informační)znalostní, expertní (AI, BI) uchování a vyhledání elementárních dat (faktů) a mechanická manipulace s nimi uchování a využívání explicitních znalostí, tj. „návodů“ pro vyvozování nových faktů z faktů známých výsledek zpracování materiál pro rozhodování již známá informace rozhodnutí nová informace UISK – PVI K02 4

5 5 Znalostní systém v širším pojetí aplikace umělé inteligence business intelligence expertní systémy big data – objemná data sémantický web

6 Znalostní (informační) systém UISK – PVI K02 6 umělá inteligenceznalostní management

7 UISK – PVI K027 Znalost Schopnost člověka nebo jakéhokoli jiného inteligentního systému uchovávat, komunikovat a zpracovávat informace do systematicky a hierarchicky uspořádaných znalostních struktur. Znalost je charakterizována schopností abstrakce a generalizace dat a informací. [TDKIV]

8 8 Přístupy k chápání znalosti UISK – PVI K02 1)Znalost jako vědění, případně moudrost zkoumá filozofie, teorie poznání (gnozeologie, epistemologie, noetika), psychologie, kognitivní vědy Klíčová otázka: Co je to znalost? (Platón: Theiaitétos) 2)Znalost jako použitelná informace zkoumá informační věda (znalosti ve společnosti), umělá inteligence (znalosti v počítači) a znalostní management (znalosti lidí v podniku) Klíčová otázka: Jak zpracovat / komunikovat / využívat znalost?

9 UISK – PVI K029

10 SECI – Ikujiro Nonaka, NONAKA, Ikujiro. A dynamic theory of organizational knowledge creation. In: Organization science. February 1994, 5(1), ISSN

11 UISK – PVI K0211 Znalosti – obsah ■Bohumil Hrabal vydal v roce 1964 ve vydavatelství Mladá Fronta knihu Pábitelé, která patří do žánrové kategorie "české povídky" a obsahuje povídku Jarmilka. ■V roce 2009 vydalo nakladatelství Albatros Povídky Malostranské Jana Nerudy. Kniha je v NK ČR zařazená do kategorie "české povídky" se signaturou 54 F ■"České povídky" a "české novely" jsou podkategorií kategorie "česká próza", která je podkategorií kategorie "česká literatura".

12 UISK – PVI K0212 Znalosti – formát ■Hrabal, Bohumil. Pábitelé: Povídky. 1. vyd. Praha: Mladá fronta, , [3] s. Boje; Sv URL URL ■Neruda, Jan. Povídky malostranské. V této podobě 1. vyd. Praha: Albatros, s. ISBN URL URL ■česká literatura česká próza české novely české povídky

13 Znalosti – model obsahu podle ISO 690 Implementace modelu obsahu podle ISO 690

14 14 Znalosti – model obsahu podle FRBR entity a atributy: DÍLO.název díla DÍLO.forma díla VYJÁDŘENÍ.forma vyjádření PROVEDENÍ.datum vydání PROVEDENÍ.nakladatel PROVEDENÍ.údaje o odpovědnosti JEDNOTKA.identifikátor jednotky OSOBA.jméno osoby KORPORACE.jméno korporace asociace: OSOBA,KORPORACE vytváří DÍLO OSOBA,KORPORACE realizuje VYJÁDŘENÍ OSOBA,KORPORACE vyrábí PROVEDENÍ OSOBA,KORPORACE vlastní JEDNOTKU DÍLO je realizováno pomocí VYJÁDŘENÍ VYJÁDŘENÍ je ztělesněno v PROVEDENÍ PROVEDENÍ je ilustrováno JEDNOTKOU

15 15 Znalosti – implementace pojmového modelu obsahu podle FRBR výroky: DÍLO.název díla = Pábitelé: Povídky DÍLO.forma díla = české povídky VYJÁDŘENÍ.forma vyjádření = kniha PROVEDENÍ.datum vydání = 1964 PROVEDENÍ.nakladatel = Mladá Fronta PROVEDENÍ.údaje o odpovědnosti = Bohumil Hrabal JEDNOTKA.identifikátor jednotky = 54 F OSOBA.jméno osoby = Bohumil Hrabal KORPORACE.jméno korporace = Mladá Fronta  OSOBA,KORPORACE vytváří DÍLO OSOBA,KORPORACE realizuje VYJÁDŘENÍ OSOBA,KORPORACE vyrábí PROVEDENÍ OSOBA,KORPORACE vlastní JEDNOTKU DÍLO je realizováno pomocí VYJÁDŘENÍ VYJÁDŘENÍ je ztělesněno v PROVEDENÍ PROVEDENÍ je ilustrováno JEDNOTKOU UISK – PVI K02

16 Vliv typu znalostí na způsob jejich organizace UISK – PVI K02 16 každodenní znalost commonsense, naїve physics, běžné chápání skutečnosti, všeobecné znalosti, „zdravý rozum“

17 17 Znalost (poznatek) je, když víme: Co to je? Co to znamená? Jak to probíhá? Jak to funguje? Jak se to dělá? UISK – PVI K02 abychom věděli… poznání, vědění, moudrost abychom mohli… činnost, akce / metoda deklarativní procedurální

18 18 Karel Čapek: Jak se zakládají zahrádky Zahrádky je možno zakládati několikerým způsobem; nejlepší je ten, že se na to vezme zahradník. Zahradník vám tam nasází všelijaké hůlky, proutí a košťátka, o kterých tvrdí, že jsou to javory, hlohy, bezy, vysokokmeny, polokmeny a jiné přírodní druhy; potom se ryje v hlíně, zobrací ji naruby a zase ji uplácá, udělá ze škvárů cestičky, nastrká tu a tam do země jakési zvadlé lupení, o němž prohlašuje, že to jsou pereny, naseje na příští trávník semínko, jež nazývá anglickým jílkem a psinečkem, psárkou, poháňkou a bojínkem, a potom odejde, nechávaje za sebou zahrádku hnědou a holou, jako byla dne prvého o stvoření světa; jen vám klade na srdce, abyste tu všechnu hlínu země denně pečlivě kropili, a až vzejde tráva, abyste si nechali přivézt na cestičky písek. Nu dobře. UISK – PVI K02

19 19 Co je to inteligence? The reason that computers have found such widespread use is that they perform well in areas where humans perform poorly (and vice versa). Chisnall, David. Is computer science dying? InformIT Is computer science dying Manželka posílá programátora nakoupit. Kup deset rohlíků a když budou mít vejce, kup jich 30. Programátor přijde do obchodu a povídá: „Máte vejce?“ „Ano, máme“ odpoví prodavačka. „30 rohlíků, prosím.“ UISK – PVI K0219

20 20 Implicitní – explicitní UISK – PVI K02 1) Implicitní znalost Není vyjádřená a dostupná přímo a je zahrnuta v jednání, způsobu řešení úloh, souboru dat apod. 2) Explicitní znalost Logicky zformulovaná a abstraktně vyjádřená, zaznamenaná v určitém jazyce a dostupná přímo v nějakém formálním zdroji (dokument, záznam v databázi).

21 Vliv typu znalostí na způsob jejich organizace UISK – PVI K02 21

22 Sémantický rozměr znalosti D denotát (skutečnost, objekt) smysl S (koncept, pojem) J znak (jazykový výraz) – lexikální jednotka označení (denotace) odraz vyjádření 22 UISK – PVI K02  znalost  informace / data ?

23 23 Knowledge discovery in databases, KDD Technika automatizovaného získávání implicitních znalostí z rozsáhlých databází a datových skladů pro využití v rozhodovacích procesech nebo v expertním systému. Řešené úlohy deskripční neboli popisné (nalézání struktur a vztahů) klasifikační/predikční (umožňují automatizovanou klasifikaci nových případů) technologické jádro: data mining UISK – PVI K02

24 24 Data mining (dolování v datech) Technologie vyhledávání, modelování a prezentace předem neznámých informací, příp. znalostí a vztahů mezi daty v rozsáhlých databázích. Analýzy se odvozují přímo z obsahu dat, nikoliv na základě hypotéz či dotazů uživatele. používané techniky: umělá inteligence (neuronové sítě, rozpoznávání, samoučící se algoritmy) statistické a matematické modelování (klasifikační pravidla nebo stromy, regrese, shluková analýza) OLAP UISK – PVI K02

25 Umělá inteligence artificial intelligence, AI „Počítač není inteligentní. Jen si to o sobě myslí.“ Anonym ■Marvin Minsky: „Věda o vytváření strojů, které vykonávají věci, jež by v případě vykonávání lidmi vyžadovaly inteligenci.“ „The science of making machines do things that would require intelligence if done by men.“ ■Russel – Norvig: „Věda o (inteligentních) agentech, kteří dostávají vjemy z okolí a vykonávají akce.“ „We define AI as the study of agents that receive percepts from the environment and perform actions.“Russel – Norvig 25

26 MAŘÍK, Vladimír, LAŽANSKÝ, Jiří a ŠTĚPÁNKOVÁ, Olga Umělá inteligence 1. Praha: Academia, s. Umělá inteligence 2. Praha: Academia, s. Umělá inteligence 3. Praha: Academia, s. Umělá inteligence 4. Praha: Academia, s. Umělá inteligence 5. Praha: Academia, s. VOŠIS - ZIZ 16 26

27 27 Klíčová úloha znalostních systémů 1) Reprezentace znalostí 2)Inference znalostí UISK – PVI K02

28 28 Reprezentace znalostí knowledge representation UISK – PVI K02 reprezentace Proces, který zajišťuje, aby informace byla dostupná tomu, kdo ji má používat. předmět zkoumání metody a techniky vyjádření znalostí a jejich vztahů především pro využití v bázích znalostí expertních systémů

29 Reprezentace znalostí – pokus o typologii UISK – PVI K02 29

30 30 Reprezentace znalostí a) procedurální vyjádření znalostí ve formě pravidel b) neprocedurální či deklarativní vyjádření znalostí ve formě poznatků (ontologie) nejčastěji používané typy jazyků: predikátová logika 1. řádu, produkční systémy, sémantické (asociativní) sítě a rámce UISK – PVI K02

31 31 Reprezentace znalostí ve formě pravidel

32 Reprezentace znalostí podle přístupu k řešení neurčitosti 1) symbolická 32 ■explicitní vyjádření prostřednictvím jednoznačných symbolů (konceptualizace) sémantické sítě: vizualizace sémantických vztahů ve formě grafu specifické aplikace: rámce, mapy námětů (topic maps) nebo datové modely (ERA diagramy nebo UML diagramy tříd) (produkční) pravidla: reprezentace procedurálních znalostí typu předpoklad – závěr (if – then) UISK – PVI K02

33 Rámce frames UISK – PVI K02 33 ■kombinace deklarativní a procedurální reprezentace objektů prostřednictvím položek (slots), sloužících k popisu jejich vlastností a vzájemných vztahů ■předchůdce objektově orientovaného přístupu + hodnoty atributů + vztah k ostatním třídám

34 Rámce frames UISK – PVI K02 34

35 Reprezentace znalostí podle přístupu k řešení neurčitosti 2) komputační UISK – PVI K02 35 alternativní názvy: výpočetní, distribuovaná, statistická, pravděpodobnostní, konekcionistická, fuzzy reprezentace; soft computing, soft programming ■zpracování neurčité informace pomocí statistických a pravděpodobnostních metod ■funkcionální simulace lidských myšlenkových procesů v počítači specifické aplikace: neuronové sítě genetické algoritmy reprezentace neurčitých znalostí

36 36 Neuronová síť neural network Počítačová aplikace využívající k řešení úloh model funkcí biologického neuronu (tzv. procesor). Procesor má více vstupů, které dokáže klasifikovat a na jejich základě generovat výstup. Procesory jsou navzájem propojeny do sítí ohodnocenými vazbami, což umožňuje nealgoritmické a paralelní zpracování složitých úloh. Činnost sítě je založena na procesu učení, tj. adaptace na konkrétní úlohu za pomoci vnějšího činitele (síť s učitelem) nebo na základě stimulů (samoorganizující se síť). UISK – PVI K02

37 37 Neuronová síť neural network Neuron UISK – PVI K0237

38 Reprezentace znalostí podle techniky odvozování UISK – PVI K02 38 odvozování / inference: jakýkoli způsob, jak získat (odvodit) nové výrazy ze starých Používané techniky odvozování: indukce – dedukce ■dědičnost (generalizace, ISA, „inference by inheritance“ ) ■logická pravidla ( IF – THEN, rezoluční metoda odvozování – „inference by resolution“ ) ■sylogismus ■ekvivalence (např. synonyma, antonyma) ■koordinace (členství ve stejné kategorii) ■celek – část

39 Pojmové schéma UISK – PVI K02 39 Systém organizace znalostí jako metadatové schéma články deskriptory tezaurus

40 Typy systémů (modelů) organizace znalostí UISK – PVI K0240

41 Pojmový model / schéma UISK – PVI K02 41 = schéma vytvořené z pojmů komponenty: pojmy reprezentující realitu a vztahy mezi nimi D skutečnost S pojem J znak

42 UISK – PVI K0242 Pojmový model systému organizace znalostí model tezauru články deskriptory tezaurus

43 UISK – PVI K0243

44 Znalostní (informační) systém 44UISK – PVI K02

45 Znalostní (informační) systém UISK – PVI K02 45

46 Jazyky pro reprezentaci znalostí 1) RDF – resource description framework formát metadat 2) RDFS – RDF schema 3) OWL – Web ontology language obsah metadat 4)SKOS 5) Topic maps – mapy námětů (ISO 13250) 6) ERA – entity relationship attribute 7) UML – unified modeling language (ISO 19501) UISK – PVI K02 46

47 Znalostní (informační) systém UISK – PVI K02 47

48 Znalostní (informační) systém UISK – PVI K02 48

49 Znalostní (informační) systém UISK – PVI K02 49

50 Znalostní (informační) systém UISK – PVI K02 50

51 Znalostní (informační) systém 51 UISK – PVI K02

52 52 Sémantický web 3 stadia standardizace (unifikace) WWW: protokol http HTML, URI sémantika UISK – PVI K02

53 Technologie Sémantického webu UISK – PVI K02 53

54 Standardy Sémantického webu UISK – PVI K02 54 ■syntaktické ■sémantické

55 Syntaktické standardy UISK – PVI K02 55 ISO 2709 :2008 (4. ed.) ČSN ISO 2709 ( ). Informace a dokumentace: Formát pro výměnu informací. 3. vyd. Praha: Český normalizační institut, s., příl. ISO 8879 :1986 ČSN EN ( ) Zpracování informací. Textové a kancelářské systémy. Standardní univerzální vyznačovací jazyk (SGML). Praha: Český normalizační institut, s.

56 Syntaktické standardy UISK – PVI K02 56

57 57 Sémantické standardy RDF Resource Description Framework formát metadat OWL Web Ontology Language jazyk pro vyjádření obsahu metadat UISK – PVI K02

58 58 Cíl sémantiky – srozumitelně označený prostor

59 59 Příklad – „nesémantická data“ Ontologie v znalostním managementu Jana Dobrovská Projekt Xanadu Pavel Souček Projekt MyLifeBits Projekt Wikipedia Věra Janková Karel Novák UISK – PVI K02

60 60 Příklad – „sémantická data“ srozumitelná jen lidem Ontologie v znalostním managementu Jana Dobrovská Projekt Xanadu Pavel Souček Projekt MyLifeBits Projekt Wikipedia Věra Janková Karel Novák UISK – PVI K02

61 61 Příklad – „sémantická data“ srozumitelná jen lidem SELECT * FROM Studie WHERE Volné_zadané =  Volné  UISK – PVI K02

62 62 Problém: sémantická interoperabilita Jak daleko je… ?

63 63UISK – PVI K02 Web dokumentů (1989)

64 64 Současnost WWW „web of documents“ narativní dokumenty sémanticky nestrukturovaná, kompaktní data, jimž rozumí jen lidé UISK – PVI K02

65 65 Sémantický web „web of data“ transakční dokumenty sémanticky strukturovaná data, jejichž obsahu rozumí počítačové programy (software agent) UISK – PVI K02

66 66UISK – PVI K02 Web dat Web dat (2011)

67 Systematické ani předmětové pořádání neřeší všechny problémy organizace znalostí ■sémantická síla (složená témata, multi- a interdisciplinární problémy, složité vztahy) ■nedokumentové zdroje znalostí ■procedurální znalosti ■interoperabilita ■automatizované vyhledávání / tvorba nových znalostí / řešení problémů založené na znalostech Řešení? a)poddat se chaosu b)ontologieontologie UISK – PVI K02 67

68 Informatická ontologie je: ■Thomas R. Gruber (1959) „Specifikace konceptualizace“ ■Thomas R. Gruber + Willem Nico Borst Formální explicitní specifikace sdílené konceptualizace skutečnosti ■Sdílitelná a opakovatelně použitelná pojmová reprezentace vymezené domény (univerza diskursu) UISK – PVI K02 68 skutečnostpojem znak konceptualizace specifikace

69 Informatické ontologie souvisí s obory: ■ umělá inteligence reprezentace znalostí ■ znalostní inženýrství expertní systémy, znalostní báze, získávání znalostí ■ logika predikátová, deskripční ■ softwarové inženýrství UISK – PVI K02 69

70 Oblasti využití ontologií 1)organizace znalostí 2)komunikace znalostí 3)opakované využití znalostí 4)automatické odvozování (inference) nových znalostí UISK – PVI K02 70

71 Uživatelé ontologií 1)lidé 2)software (agenti) UISK – PVI K02 71

72 Komponenty ontologií Ontologie = pojmy (konceptualizace) + axiomy + ontologické závazky + software 1)Třída 2)Instance / individuum 3)Vlastnost třídy 4)Vztah 5)Axiom (výrok, tvrzení) 6)Ontologický závazek (pravidlo) UISK – PVI K02 72 Znalostní báze

73 Komponenty ontologií 1)Třída 2)Instance / individuum UISK – PVI K02 73 FRBR

74 Komponenty ontologií 1)Třída 2)Instance / individuum UISK – PVI K02 74 FRBR

75 Komponenty ontologií 3) Vlastnost třídy – např. název 4) Vztah – např. vztah odpovědnosti UISK – PVI K02 75 MARC21 FRBR

76 Komponenty ontologií 5)Axiom / pravidlo 6)Ontologický závazek UISK – PVI K02 76 AACR2

77 Přínos ontologií 1)Bohatší sémantika (pojmů, vztahů i procesů) 2)Orientace na využití ICT / závislost na ICT 3)Možnost synergie zkušeností knihovníků a IT profesionálů UISK – PVI K02 77


Stáhnout ppt "Dnešní témata UISK – PVI K02 1 Technologie pořádání informací a znalostí v 21. století ■dokumenty → data ■data → znalosti ■ontologie ■vizualizace znalostní."

Podobné prezentace


Reklamy Google