Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Dnešní témata Technologie pořádání informací a znalostí v 21. století

Podobné prezentace


Prezentace na téma: "Dnešní témata Technologie pořádání informací a znalostí v 21. století"— Transkript prezentace:

1 Dnešní témata Technologie pořádání informací a znalostí v 21. století
dokumenty → data data → znalosti ontologie vizualizace znalostní (informační) systém sémantika (umělá) inteligence UISK – PVI K02

2 Vizualizace – notace UML
UISK – PVI K02

3 Znalostní (informační) systém

4 Informační systémy podle typu řešených úloh
databázové (informační) znalostní, expertní (AI, BI) uchování a vyhledání elementárních dat (faktů) a mechanická manipulace s nimi uchování a využívání explicitních znalostí, tj. „návodů“ pro vyvozování nových faktů z faktů známých výsledek zpracování materiál pro rozhodování již známá informace rozhodnutí nová informace UISK – PVI K02

5 Znalostní systém v širším pojetí
aplikace umělé inteligence expertní systémy business intelligence big data – objemná data sémantický web 5

6 Znalostní (informační) systém
umělá inteligence znalostní management UISK – PVI K02

7 Znalost Schopnost člověka nebo jakéhokoli jiného inteligentního systému uchovávat, komunikovat a zpracovávat informace do systematicky a hierarchicky uspořádaných znalostních struktur. Znalost je charakterizována schopností abstrakce a generalizace dat a informací. [TDKIV] UISK – PVI K02

8 Přístupy k chápání znalosti
Znalost jako vědění, případně moudrost zkoumá filozofie, teorie poznání (gnozeologie, epistemologie, noetika), psychologie, kognitivní vědy Klíčová otázka: Co je to znalost? (Platón: Theiaitétos) Znalost jako použitelná informace zkoumá informační věda (znalosti ve společnosti), umělá inteligence (znalosti v počítači) a znalostní management (znalosti lidí v podniku) Klíčová otázka: Jak zpracovat / komunikovat / využívat znalost? UISK – PVI K02 8

9 UISK – PVI K02 Tento „koloběh“ data – informace – znalosti může být:
 a) intelektuální tj. realizovaný myšlenkovými procesy  b) technologický tj. realizovaný či podporovaný ICT – hardwarově a/nebo softwarově business intelligence (knowledge discovery in databases, data mining, data warehousing, reporting): získávání znalostí z nashromážděných informací / dat expertní systémy UISK – PVI K02

10 SECI – Ikujiro Nonaka, 1994 NONAKA, Ikujiro. A dynamic theory of organizational knowledge creation. In: Organization science. February 1994, 5(1), ISSN NONAKA, Ikujiro. A dynamic theory of organizational knowledge creation. In: Organization science. February 1994, 5(1), ISSN

11 Znalosti – obsah Bohumil Hrabal vydal v roce 1964 ve vydavatelství Mladá Fronta knihu Pábitelé, která patří do žánrové kategorie "české povídky" a obsahuje povídku Jarmilka. V roce 2009 vydalo nakladatelství Albatros Povídky Malostranské Jana Nerudy. Kniha je v NK ČR zařazená do kategorie "české povídky" se signaturou 54 F "České povídky" a "české novely" jsou podkategorií kategorie "česká próza", která je podkategorií kategorie "česká literatura". UISK – PVI K02

12 Znalosti – formát Hrabal, Bohumil. Pábitelé: Povídky. 1. vyd. Praha: Mladá fronta, , [3] s. Boje; Sv URL Neruda, Jan. Povídky malostranské. V této podobě 1. vyd. Praha: Albatros, s. ISBN URL česká literatura česká próza české novely české povídky UISK – PVI K02

13 Znalosti – model obsahu podle ISO 690
Implementace modelu obsahu podle ISO 690

14 Znalosti – model obsahu podle FRBR
entity a atributy: DÍLO.název díla DÍLO.forma díla VYJÁDŘENÍ.forma vyjádření PROVEDENÍ.datum vydání PROVEDENÍ.nakladatel PROVEDENÍ.údaje o odpovědnosti JEDNOTKA.identifikátor jednotky OSOBA.jméno osoby KORPORACE.jméno korporace asociace: OSOBA,KORPORACE vytváří DÍLO OSOBA,KORPORACE realizuje VYJÁDŘENÍ OSOBA,KORPORACE vyrábí PROVEDENÍ OSOBA,KORPORACE vlastní JEDNOTKU DÍLO je realizováno pomocí VYJÁDŘENÍ VYJÁDŘENÍ je ztělesněno v PROVEDENÍ PROVEDENÍ je ilustrováno JEDNOTKOU

15 Znalosti – implementace pojmového modelu obsahu podle FRBR
výroky: DÍLO.název díla = Pábitelé: Povídky DÍLO.forma díla = české povídky VYJÁDŘENÍ.forma vyjádření = kniha PROVEDENÍ.datum vydání = 1964 PROVEDENÍ.nakladatel = Mladá Fronta PROVEDENÍ.údaje o odpovědnosti = Bohumil Hrabal JEDNOTKA.identifikátor jednotky = 54 F OSOBA.jméno osoby = Bohumil Hrabal KORPORACE.jméno korporace = Mladá Fronta OSOBA,KORPORACE vytváří DÍLO OSOBA,KORPORACE realizuje VYJÁDŘENÍ OSOBA,KORPORACE vyrábí PROVEDENÍ OSOBA,KORPORACE vlastní JEDNOTKU DÍLO je realizováno pomocí VYJÁDŘENÍ VYJÁDŘENÍ je ztělesněno v PROVEDENÍ PROVEDENÍ je ilustrováno JEDNOTKOU UISK – PVI K02

16 Vliv typu znalostí na způsob jejich organizace
každodenní znalost commonsense, naїve physics, běžné chápání skutečnosti, všeobecné znalosti, „zdravý rozum“ UISK – PVI K02

17 Znalost (poznatek) je, když víme:
deklarativní Co to je? Co to znamená? Jak to probíhá? Jak to funguje? Jak se to dělá? abychom věděli… poznání, vědění, moudrost procedurální Deklarativní: má formu výroku, tvrzení – lze určit, zda je pravdivá Procedurální: často má formu metody či metodiky – otázka po pravdivosti nemá smysl abychom mohli… činnost, akce / metoda UISK – PVI K02

18 Karel Čapek: Jak se zakládají zahrádky
Zahrádky je možno zakládati několikerým způsobem; nejlepší je ten, že se na to vezme zahradník. Zahradník vám tam nasází všelijaké hůlky, proutí a košťátka, o kterých tvrdí, že jsou to javory, hlohy, bezy, vysokokmeny, polokmeny a jiné přírodní druhy; potom se ryje v hlíně, zobrací ji naruby a zase ji uplácá, udělá ze škvárů cestičky, nastrká tu a tam do země jakési zvadlé lupení, o němž prohlašuje, že to jsou pereny, naseje na příští trávník semínko, jež nazývá anglickým jílkem a psinečkem, psárkou, poháňkou a bojínkem, a potom odejde, nechávaje za sebou zahrádku hnědou a holou, jako byla dne prvého o stvoření světa; jen vám klade na srdce, abyste tu všechnu hlínu země denně pečlivě kropili, a až vzejde tráva, abyste si nechali přivézt na cestičky písek. Nu dobře. UISK – PVI K02

19 Co je to inteligence? The reason that computers have found such widespread use is that they perform well in areas where humans perform poorly (and vice versa). Chisnall, David. Is computer science dying? InformIT Manželka posílá programátora nakoupit. Kup deset rohlíků a když budou mít vejce, kup jich 30. Programátor přijde do obchodu a povídá: „Máte vejce?“ „Ano, máme“ odpoví prodavačka. „30 rohlíků, prosím.“ UISK – PVI K02 19

20 Implicitní – explicitní
1) Implicitní znalost Není vyjádřená a dostupná přímo a je zahrnuta v jednání, způsobu řešení úloh, souboru dat apod. 2) Explicitní znalost Logicky zformulovaná a abstraktně vyjádřená, zaznamenaná v určitém jazyce a dostupná přímo v nějakém formálním zdroji (dokument, záznam v databázi). Implicitní – explicitní: komunikace člověk – člověk Reprezentace znalostí: komunikace člověk – počítač UISK – PVI K02 20

21 Vliv typu znalostí na způsob jejich organizace
UISK – PVI K02

22 Sémantický rozměr znalosti
 informace / data J znak (jazykový výraz) – lexikální jednotka ? označení (denotace) vyjádření Dvojí reference: slova zastupují pojmy, pojmy zastupují realitu Cesta od skutečnosti k myšlení (odraz, pochopení) a k vyjádření. 1 pojem – více objektů – abstrakce, zobecnění 1 pojem – více znaků – synonymie 1 znak – více pojmů - homonymie  znalost smysl S (koncept, pojem) D denotát (skutečnost, objekt) odraz UISK – PVI K02 22

23 Knowledge discovery in databases, KDD
Technika automatizovaného získávání implicitních znalostí z rozsáhlých databází a datových skladů pro využití v rozhodovacích procesech nebo v expertním systému. Řešené úlohy deskripční neboli popisné (nalézání struktur a vztahů) klasifikační/predikční (umožňují automatizovanou klasifikaci nových případů) technologické jádro: data mining UISK – PVI K02

24 Data mining (dolování v datech)
Technologie vyhledávání, modelování a prezentace předem neznámých informací, příp. znalostí a vztahů mezi daty v rozsáhlých databázích. Analýzy se odvozují přímo z obsahu dat, nikoliv na základě hypotéz či dotazů uživatele. používané techniky: umělá inteligence (neuronové sítě, rozpoznávání, samoučící se algoritmy) statistické a matematické modelování (klasifikační pravidla nebo stromy, regrese, shluková analýza) OLAP UISK – PVI K02

25 Umělá inteligence artificial intelligence, AI
„Počítač není inteligentní. Jen si to o sobě myslí.“ Anonym Marvin Minsky: „Věda o vytváření strojů, které vykonávají věci, jež by v případě vykonávání lidmi vyžadovaly inteligenci.“ „The science of making machines do things that would require intelligence if done by men.“ Russel – Norvig: „Věda o (inteligentních) agentech, kteří dostávají vjemy z okolí a vykonávají akce.“ „We define AI as the study of agents that receive percepts from the environment and perform actions.“

26 MAŘÍK, Vladimír, LAŽANSKÝ, Jiří a ŠTĚPÁNKOVÁ, Olga
Umělá inteligence 1. Praha: Academia, s. Umělá inteligence 2. Praha: Academia, s. Umělá inteligence 3. Praha: Academia, s. Umělá inteligence 4. Praha: Academia, s. Umělá inteligence 5. Praha: Academia, s. VOŠIS - ZIZ 16

27 Klíčová úloha znalostních systémů
Reprezentace znalostí Inference znalostí UISK – PVI K02

28 Reprezentace znalostí knowledge representation
Proces, který zajišťuje, aby informace byla dostupná tomu, kdo ji má používat. předmět zkoumání metody a techniky vyjádření znalostí a jejich vztahů především pro využití v bázích znalostí expertních systémů Implicitní – explicitní: komunikace člověk – člověk Reprezentace znalostí: komunikace člověk – počítač, event. počítač - počítač reprezentace UISK – PVI K02 28

29 Reprezentace znalostí – pokus o typologii
Obtížná typologie reprezentace znalostí: při jakémkoli pokusu o fasetovou klasifikaci „vyskakují“ mezifasetové asociace – fasety nejsou disjunktní UISK – PVI K02

30 Reprezentace znalostí
procedurální vyjádření znalostí ve formě pravidel b) neprocedurální či deklarativní vyjádření znalostí ve formě poznatků (ontologie) nejčastěji používané typy jazyků: predikátová logika 1. řádu, produkční systémy, sémantické (asociativní) sítě a rámce UISK – PVI K02

31 Reprezentace znalostí ve formě pravidel
UISK – PVI K02

32 Reprezentace znalostí podle přístupu k řešení neurčitosti 1) symbolická
explicitní vyjádření prostřednictvím jednoznačných symbolů (konceptualizace) sémantické sítě: vizualizace sémantických vztahů ve formě grafu specifické aplikace: rámce, mapy námětů (topic maps) nebo datové modely (ERA diagramy nebo UML diagramy tříd) (produkční) pravidla: reprezentace procedurálních znalostí typu předpoklad – závěr (if – then) Obvykle reprezentuje deklarativní znalosti UISK – PVI K02

33 Rámce frames kombinace deklarativní a procedurální reprezentace objektů prostřednictvím položek (slots), sloužících k popisu jejich vlastností a vzájemných vztahů předchůdce objektově orientovaného přístupu + hodnoty atributů + vztah k ostatním třídám UISK – PVI K02

34 Rámce frames UISK – PVI K02

35 Reprezentace znalostí podle přístupu k řešení neurčitosti 2) komputační
alternativní názvy: výpočetní, distribuovaná, statistická, pravděpodobnostní, konekcionistická, fuzzy reprezentace; soft computing, soft programming zpracování neurčité informace pomocí statistických a pravděpodobnostních metod funkcionální simulace lidských myšlenkových procesů v počítači specifické aplikace: neuronové sítě genetické algoritmy reprezentace neurčitých znalostí    UISK – PVI K02

36 Neuronová síť neural network
Počítačová aplikace využívající k řešení úloh model funkcí biologického neuronu (tzv. procesor). Procesor má více vstupů, které dokáže klasifikovat a na jejich základě generovat výstup. Procesory jsou navzájem propojeny do sítí ohodnocenými vazbami, což umožňuje nealgoritmické a paralelní zpracování složitých úloh. Činnost sítě je založena na procesu učení, tj. adaptace na konkrétní úlohu za pomoci vnějšího činitele (síť s učitelem) nebo na základě stimulů (samoorganizující se síť). UISK – PVI K02

37 Neuronová síť neural network
Zdroj obrázku: UISK – PVI K02 37

38 Reprezentace znalostí podle techniky odvozování
odvozování / inference: jakýkoli způsob, jak získat (odvodit) nové výrazy ze starých Používané techniky odvozování: indukce – dedukce dědičnost (generalizace, ISA, „inference by inheritance“) logická pravidla (IF – THEN, rezoluční metoda odvozování – „inference by resolution“) sylogismus ekvivalence (např. synonyma, antonyma) koordinace (členství ve stejné kategorii) celek – část UISK – PVI K02

39 Pojmové schéma Systém organizace znalostí jako metadatové schéma
tezaurus deskriptory články UISK – PVI K02

40 Typy systémů (modelů) organizace znalostí
1) Šipka jde ve směru vzrůstající sémantické síly 2) Bez ohledu na typ systému organizace informací/znalostí jde vždy o systém založený na jazyce UISK – PVI K02

41 Pojmový model / schéma = schéma vytvořené z pojmů komponenty:
pojmy reprezentující realitu a vztahy mezi nimi D skutečnost S pojem J znak UISK – PVI K02

42 Pojmový model systému organizace znalostí
model tezauru Pojmový model systému organizace znalostí tezaurus deskriptory články UISK – PVI K02

43 Zdroj: http://www.niso.org/schemas/iso25964/Model_2011-06-02.jpg
UISK – PVI K02

44 Znalostní (informační) systém
UISK – PVI K02

45 Znalostní (informační) systém
UISK – PVI K02

46 Jazyky pro reprezentaci znalostí
RDF – resource description framework formát metadat RDFS – RDF schema OWL – Web ontology language obsah metadat SKOS Topic maps – mapy námětů (ISO 13250) ERA – entity relationship attribute UML – unified modeling language (ISO 19501) UISK – PVI K02

47 Znalostní (informační) systém
UISK – PVI K02

48 Znalostní (informační) systém
UISK – PVI K02

49 Znalostní (informační) systém
UISK – PVI K02

50 Znalostní (informační) systém
UISK – PVI K02

51 Znalostní (informační) systém
UISK – PVI K02

52 Sémantický web 3 stadia standardizace (unifikace) WWW: protokol http
HTML, URI sémantika UISK – PVI K02

53 Technologie Sémantického webu
UISK – PVI K02

54 Standardy Sémantického webu
syntaktické sémantické UISK – PVI K02

55 Syntaktické standardy
ISO 2709:2008 (4. ed.) ČSN ISO 2709 ( ). Informace a dokumentace: Formát pro výměnu informací. 3. vyd. Praha: Český normalizační institut, s., příl. ISO 8879:1986 ČSN EN ( ) Zpracování informací. Textové a kancelářské systémy. Standardní univerzální vyznačovací jazyk (SGML). Praha: Český normalizační institut, s. CCF/B, CCF/F UISK – PVI K02

56 Syntaktické standardy
CCF/B, CCF/F UISK – PVI K02

57 Sémantické standardy RDF Resource Description Framework formát metadat
OWL Web Ontology Language jazyk pro vyjádření obsahu metadat UISK – PVI K02

58 Cíl sémantiky – srozumitelně označený prostor
Podstata sémantiky – značky označující objekty (např. VELICHOVKY) z hlediska jejich obsahu. Potřebujeme nejen značky, ale musíme jim i rozumět.

59 Příklad – „nesémantická data“
<li>Ontologie v znalostním managementu</li> <p><em>Jana Dobrovská</em></p> <li>Projekt Xanadu</li> <p><em>Pavel Souček</em></p> <li>Projekt MyLifeBits</li> <li><img src="../obrazky/zadano.gif" alt="zadano">Projekt Wikipedia</li> <p><em>Věra Janková<br> Karel Novák</em></p> UISK – PVI K02

60 Příklad – „sémantická data“ srozumitelná jen lidem
<volné téma> Ontologie v znalostním managementu <student/ka>Jana Dobrovská</student/ka> </volné téma> <volné téma>Projekt Xanadu <student/ka>Pavel Souček</student/ka> </volné téma> <volné téma>Projekt MyLifeBits</volné téma> <zadané téma>Projekt Wikipedia <student/ka>Věra Janková</student/ka> <student/ka>Karel Novák</student/ka> </zadané téma> UISK – PVI K02

61 Příklad – „sémantická data“ srozumitelná jen lidem
SELECT * FROM Studie WHERE Volné_zadané = Volné UISK – PVI K02

62 Problém: sémantická interoperabilita
Jak daleko je… ? Potřebujeme nejen stejné značky, ale musíme jim i stejně rozumět.

63 Web dokumentů (1989) UISK – PVI K02
Zdroj: a UISK – PVI K02

64 Současnost WWW „web of documents“ narativní dokumenty
sémanticky nestrukturovaná, kompaktní data, jimž rozumí jen lidé UISK – PVI K02

65 Sémantický web „web of data“ transakční dokumenty
sémanticky strukturovaná data, jejichž obsahu rozumí počítačové programy (software agent) UISK – PVI K02

66 Web dat (2011) Zdroj: UISK – PVI K02

67 Systematické ani předmětové pořádání neřeší všechny problémy organizace znalostí
sémantická síla (složená témata, multi- a interdisciplinární problémy, složité vztahy) nedokumentové zdroje znalostí procedurální znalosti interoperabilita automatizované vyhledávání / tvorba nových znalostí / řešení problémů založené na znalostech Řešení? poddat se chaosu ontologie UISK – PVI K02

68 Informatická ontologie je:
Thomas R. Gruber (1959) „Specifikace konceptualizace“ Thomas R. Gruber + Willem Nico Borst Formální explicitní specifikace sdílené konceptualizace skutečnosti Sdílitelná a opakovatelně použitelná pojmová reprezentace vymezené domény (univerza diskursu) skutečnost pojem znak specifikace UISK – PVI K02 konceptualizace

69 Informatické ontologie souvisí s obory:
umělá inteligence reprezentace znalostí znalostní inženýrství expertní systémy, znalostní báze, získávání znalostí logika predikátová, deskripční softwarové inženýrství UISK – PVI K02

70 Oblasti využití ontologií
organizace znalostí komunikace znalostí opakované využití znalostí automatické odvozování (inference) nových znalostí UISK – PVI K02

71 Uživatelé ontologií lidé software (agenti) UISK – PVI K02

72 Komponenty ontologií Ontologie = pojmy (konceptualizace) + axiomy + ontologické závazky + software Třída Instance / individuum Vlastnost třídy Vztah Axiom (výrok, tvrzení) Ontologický závazek (pravidlo) Znalostní báze UISK – PVI K02

73 Komponenty ontologií Třída Instance / individuum FRBR UISK – PVI K02

74 Komponenty ontologií Třída Instance / individuum FRBR UISK – PVI K02

75 Komponenty ontologií 3) Vlastnost třídy – např. název MARC21
4) Vztah – např. vztah odpovědnosti MARC21 FRBR UISK – PVI K02

76 Komponenty ontologií Axiom / pravidlo Ontologický závazek AACR2
UISK – PVI K02

77 Přínos ontologií Bohatší sémantika (pojmů, vztahů i procesů)
Orientace na využití ICT / závislost na ICT Možnost synergie zkušeností knihovníků a IT profesionálů UISK – PVI K02


Stáhnout ppt "Dnešní témata Technologie pořádání informací a znalostí v 21. století"

Podobné prezentace


Reklamy Google