Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Pořádání a vyhledávání informací Helena Kučerová UISK – PVI 011 PVI Obsah kurzu: ■teoretické principy ■procesy ■metody, techniky, pravidla.

Podobné prezentace


Prezentace na téma: "Pořádání a vyhledávání informací Helena Kučerová UISK – PVI 011 PVI Obsah kurzu: ■teoretické principy ■procesy ■metody, techniky, pravidla."— Transkript prezentace:

1 Pořádání a vyhledávání informací Helena Kučerová kucerova@sks.cz UISK – PVI 011 PVI Obsah kurzu: ■teoretické principy ■procesy ■metody, techniky, pravidla ■standardy ■systémy

2 2 Proč pořádat informace a znalosti? Více než 20 % pracovní doby znalostních pracovníků je věnováno vyhledávání informací. 62 % z nich je nespokojeno s výsledky vyhledávání. Zdroj: Studie Delphi Group, 2004 UISK – PVI 01

3 3 Pořádání a vyhledávání informací a znalostí aneb… Organizace informací / znalostí (knowledge organization) Reprezentace znalostí (knowledge representation) Konceptuální (pojmové) modely Indexování, klasifikace, taxonomie Systémy organizace informací / znalostí (knowledge organization systems – KOS) Selekční jazyky Informační architektura Ontologie Search – retrieval Paradox: Terminologie organizace znalostí je málo „organizovaná“ UISK – PVI 01

4 4 Pořádání znalostí a 3 světy K. R. Poppera svět 2svět 3 širší (sociální) pojetí svět 1 užší pojetí (dokumenty) identifikační popis věcné pořádání ČNB1 ČNB2 Wikipedie UISK – PVI 01

5 5 Jsou „knihovnické“ znalosti v éře Googlu relevantní? folksonomie

6 UISK – PVI 01 6

7 7

8 8 Rekapitulace Základní principy organizace Organizace = pořádek místo chaosu (entropie) Princip pořádku = ekvivalence Organizace = analyticko–syntetický proces: oddělení rozdílného, spojení stejného (kategorizace, klasifikace) UISK – PVI 01

9 9 Důležité pojmy kategorie kritérium členění ekvivalence UISK – PVI 01

10 podobné (stejné, ekvivalentní) věci se seskupují, rozdílné věci se oddělují Ekvivalence? 10 Základní princip organizace - ekvivalence UISK – PVI 01 ekvivalence  identita

11 11 Které věci jsou ekvivalentní? ty, které jsou složeny ze stejných částí ty, které mají stejnou sadu atributů ty, jejichž atributy mají stejné hodnoty ty, mezi jejichž atributy panují stejné vztahy ale i ty, které se stejně jmenují ty, které za ekvivalentní považujeme UISK – PVI 01 obsah forma objektivní subjektivní

12 12 Kategorie též: třída, typ, taxon, pojem, entita, množina, klastr, topik (námět, topic ), klasifikátor (classifier) skupina materiálních nebo abstraktních objektů, procesů či událostí, jež považujeme z určitého pohledu nebo pro daný účel za ekvivalentní kognitivní a lingvistický model umožňující využít existující znalosti v nových situacích a rozpoznat instance nebo události UISK – PVI 01

13 13 Kategorizace (třídění, klasifikace) jedna z forem analýzy rozdělení předmětů a jevů do skupin a podskupin podle jejich vzájemné shody a odlišnosti kritérium členění (principium divisionis, order principle, filing criterion / principle, criterion of distinction) atribut, na základě jehož hodnot se třídí UISK – PVI 01

14 14 Typy kategorizace (určování ekvivalence) 1) „zevnitř“, objektivně, analýzou obsahu, (vnitřní) struktury (co jsme zjistili) atributy a jejich hodnoty náročné na inteligenci 2) „zvenčí“, subjektivně, podle „povrchu“, formy (co vidíme) názvy, metadata lze automatizovat (svěřit počítači)

15 15 Jak označit kategorie? 1)Název 2)Symbol (např. obrázek, zvukový signál) 3)Definice Název / symbol, který „zastřešuje“ obsažené prvkyzastřešuje Název / symbol typického reprezentanta obsažených prvkůreprezentanta Účel obsažených prvků (úloha, kterou mají pomoci řešit / otázka, na kterou mají dát odpověď) Účel Pojmenování typického uživatele obsažených prvkůuživatele UISK – PVI 01

16 16 Organizace je… UISK – PVI 01 1)Činnost (proces) 2)Produkt (struktura + metadata)metadata

17 17 Základní principy organizace informací Zpracování informací přináší následující efekty „ospravedlňující“ náklady na zpracovatelský proces: zvýšení hodnoty umožnění komunikace (v čase, v prostoru) usnadnění přístupu k nim UISK – PVI 01 Organizace = (nepovinný) zpracovatelský proces Cíl: přizpůsobit informaci uživateli Výstup: transformovaná (změněná) informace

18 18 Základní principy organizace informací Usnadnění přístupu = nalezitelnost, srozumitelnost, využitelnost Nalezitelnost (findability) = klíčový důvod pro organizaci informací UISK – PVI 01

19 19UISK – PVI 01 Organizované a neorganizované informace

20 20 Procesy přístupu k informaci UISK – PVI 01

21 21 Procesy přístupu k informaci UISK – PVI 01

22 22 Procesy přístupu k informaci Čím více úsilí věnujeme organizaci informací, tím méně ho budeme muset vynaložit při jejich vyhledávání – a naopak. UISK – PVI 01

23 23 Procesy přístupu k informaci – sociální a citační sítě UISK – PVI 01

24 24 Vyhledávání – od hledání známého po objevování neznámého:  search  browse  discover

25 UISK – PVI 01 25 ■The right thing, or known item seeking (search) ■Exploratory search (browse) ■Exhaustive research (search and browse) ■I’ve seen you before, or re-finding Zdroj: MORVILLE, Peter a ROSENFELD, Louis. Information architecture for the World Wide Web: designing large-scale web sites. 3. ed. Sebastopol: O'Reilly, 2006, s. 35. Způsoby vyhledávání podle Morvilla a Rosenfelda

26 UISK – PVI 01 26

27 27 Podstata organizace informací UISK – PVI 01

28 28 Podstata organizace informací UISK – PVI 01

29 29 Podstata organizace informací UISK – PVI 01

30 30 Tvůrci metadat autoři dokumentů (autorské resumé, META tag, TEI header...) jiné subjekty (zprostředkovatelé) správci souborů (katalogizátoři) ostatní (specializované instituce) čtenáři, (koncoví) uživatelé počítačové programy UISK – PVI 01 30

31 tvůrci metadatvýhodynevýhody lidé autoři informací rychlost nezvyšují se náklady subjektivita nejednotnost koncoví uživatelé /čtenáři nezvyšují se náklady časový odstup od publikování subjektivita nejednotnost zprostředkovatelé / agenti objektivita jednotnost časový odstup od publikování vyšší náklady počítačové programy rychlost objektivita jednotnost obtížnost algoritmizace tvorby metadat UISK – PVI 0131

32 Uživatelé metadat koncový uživatel zprostředkovatel (agent) člověk počítačový program UISK – PVI 01 32

33 33 Systémy organizace informací UISK – PVI 01

34 34 Systémy organizace informací UISK – PVI 01

35 35 Ekvivalenci vyjádříme: 1)umístěním 2)označením (pojmenováním)

36 UISK – PVI 01 36 Ekvivalence (1) umístěním a (2) označením 1984 ORWELL, George. 1984. 1. vyd. Praha: Naše vojsko, 1991. 268 s. ISBN 80-206-0256-9 (1) (2)

37 UISK – PVI 01 37

38 UISK – PVI 01 38

39 39 Organizace informací a znalostí v životním cyklu informace UISK – PVI 01

40 40 Archivy, knihovny a muzea

41 UISK – PVI 01 41

42 UISK – PVI 01 42

43 UISK – PVI 01 43

44 UISK – PVI 01 44

45 Ekvivalence obsahu prvky mají stejný význam synonymie formy prvky mají stejný vzhled nebo stejnou strukturu homonymie 45UISK – PVI 01

46 Jaká ekvivalence? Příklad: srovnávání cen zboží v e-shopech 46 UISK – PVI 01 34 5 6 7 8 9

47 Typologie atributů vnitřní (vlastní, přirozený, intrinsic ) vnější (zevní, cizí, přidělený, extrinsic ) statický (neměnný v čase) dynamický (proměnlivý v čase) popisný (forma) obsahový kontextový (vztah) podstatný nepodstatný 47UISK – PVI 01

48 48 Rekapitulace Pořádání znalostí a 3 světy K. R. Poppera svět 2svět 3 širší (sociální) pojetí svět 1 užší pojetí (dokumenty) identifikační popis věcné pořádání

49 UISK – PVI 02 49 Jsou „knihovnické“ znalosti v éře Googlu relevantní? folksonomie

50 50 Organizace je… UISK – PVI 02 1)Činnost (proces) 2)Produkt (struktura + metadata)metadata

51 51 Základní principy organizace informací Zpracování informací přináší následující efekty „ospravedlňující“ náklady na zpracovatelský proces: zvýšení hodnoty umožnění komunikace (v čase, v prostoru) usnadnění přístupu k nim UISK – PVI 02 Organizace = (nepovinný) zpracovatelský proces Cíl: přizpůsobit informaci uživateli Výstup: transformovaná (změněná) informace

52 52 Základní principy organizace informací Usnadnění přístupu = nalezitelnost, srozumitelnost, využitelnost Nalezitelnost (findability) = klíčový důvod pro organizaci informací UISK – PVI 02

53 53UISK – PVI 02 Organizované a neorganizované informace

54 54 Procesy přístupu k informaci UISK – PVI 02

55 55 Procesy přístupu k informaci UISK – PVI 02

56 56 Procesy přístupu k informaci Čím více úsilí věnujeme organizaci informací, tím méně ho budeme muset vynaložit při jejich vyhledávání – a naopak. UISK – PVI 02

57 57 Procesy přístupu k informaci – sociální a citační sítě UISK – PVI 02

58 58 Vyhledávání – od hledání známého po objevování neznámého:  search  browse  discover

59 UISK – PVI 02 59 ■The right thing, or known item seeking (search) ■Exploratory search (browse) ■Exhaustive research (search and browse) ■I’ve seen you before, or re-finding Zdroj: MORVILLE, Peter a ROSENFELD, Louis. Information architecture for the World Wide Web: designing large-scale web sites. 3. ed. Sebastopol: O'Reilly, 2006, s. 35. Způsoby vyhledávání podle Morvilla a Rosenfelda

60 UISK – PVI 02 60

61 61 Podstata organizace informací UISK – PVI 02

62 62 Podstata organizace informací UISK – PVI 02

63 63 Podstata organizace informací UISK – PVI 02

64 64 Tvůrci metadat autoři dokumentů (autorské resumé, META tag, TEI header...) čtenáři, (koncoví) uživatelé jiné subjekty (zprostředkovatelé) správci souborů (katalogizátoři) ostatní (specializované instituce) počítačové programy UISK – PVI 02 64

65 tvůrci metadatvýhodynevýhody lidé autoři informací rychlost nezvyšují se náklady subjektivita nejednotnost koncoví uživatelé /čtenáři nezvyšují se náklady časový odstup od publikování subjektivita nejednotnost zprostředkovatelé / agenti objektivita jednotnost časový odstup od publikování vyšší náklady počítačové programy rychlost objektivita jednotnost obtížnost algoritmizace tvorby metadat UISK – PVI 0265

66 Uživatelé metadat koncový uživatel zprostředkovatel (agent) člověk počítačový program UISK – PVI 02 66

67 67 Systémy organizace informací UISK – PVI 02

68 68 Systémy organizace informací UISK – PVI 02

69 69 Ekvivalenci vyjádříme: 1)umístěním 2)označením (pojmenováním)

70 UISK – PVI 02 70 Ekvivalence (1) umístěním a (2) označením 1984 ORWELL, George. 1984. 1. vyd. Praha: Naše vojsko, 1991. 268 s. ISBN 80-206-0256-9 (1) (2)

71 UISK – PVI 02 71

72 UISK – PVI 02 72

73 73 Organizace informací a znalostí v životním cyklu informace UISK – PVI 02

74 74 Archivy, knihovny a muzea

75 UISK – PVI 02 75

76 UISK – PVI 02 76

77 UISK – PVI 02 77

78 UISK – PVI 02 78

79 Paradigmata organizace znalostí 79UISK – PVI 02 19.–20. století21. století 1 industriální ekonomikaznalostní ekonomika idea národního státuglobalizace, multikulturalismus 2 lineární komunikace v informačním systému síťový model komunikace v datových, dokumentových a sociálních sítích tištěné dokumentyelektronické dokumenty statické dokumenty / záznamy jednotlivá fakta (linked data) 3 uchování, ochrana dokumentů přístup k dokumentům /informacím (dostupnost) výběr kvality (filtrování) informační zahlcení, problém důvěryhodnosti technologický přístup (know-how) vědecký přístup (know-why) hledání jednoho „dokonalého“ systému organizace propojení (interoperabilita) stávajících systémů 4 paměťové instituce (knihovny, archivy, muzea) všechny typy institucí, orientace na nejširší veřejnost (laicizace, crowdsourcing, folksonomie)

80 Ekvivalence obsahu prvky mají stejný význam synonymie formy prvky mají stejný vzhled nebo stejnou strukturu homonymie 80UISK – PVI 02

81 Jaká ekvivalence? Příklad: srovnávání cen zboží v e-shopech 81 UISK – PVI 02 34 5 6 7 8 9

82 Typologie atributů vnitřní (vlastní, přirozený, intrinsic ) vnější (zevní, cizí, přidělený, extrinsic ) statický (neměnný v čase) dynamický (proměnlivý v čase) popisný (forma) obsahový kontextový (vztah) podstatný nepodstatný 82UISK – PVI 02

83 83 Co se organizuje? UISK – VPIZ 03 Informace o věci o informaci analogovédigitální Věci

84 84 Jednotka organizace informací / znalostí UISK – VPIZ 03

85 85 Úrovně organizace informací a znalostí UISK – VPIZ 03 mikroúroveň makroúroveň

86 Přístupy k organizaci znalostí top–down klasifikace hierarchické Aristoteles Jan Amos Komenský Carl von Linné Francouzští encyklopedisté Dimitrij Ivanovič Mendělejev Melvil Dewey Mezinárodní desetinné třídění bottom–up kategorizace síťové Wikipedia Open Directory Project (dmoz) folksonomie YouTube Flicker.com del.icio.us Facebook sémantický web

87 Principy organizace 1)Závislost času a prostoru: uspořádáním věcí v prostoru určujeme čas, potřebný k přístupu k nim. 2)Reciproční vztah organizace / vyhledávání 3)Nalezitelnost věcí podporují metadata. 4)Ekvivalenci věcí lze vyjádřit kolokací nebo označením (pojmenováním). 5)Jeden soubor (množinu) věcí lze uspořádat různými způsoby: ■podle různých kritérií členění ■s uplatněním různé míry granularity (podrobnosti členění). UISK – VPIZ 0387

88 Metafory uspořádání věcí v prostoru: seznam, kartotéka, index 88 UISK – VPIZ 03 seznamkartotéka

89 Metafory uspořádání věcí v prostoru: seznam, kartotéka, index 89 UISK – VPIZ 03 seznam kartotéka index

90 Index 90UISK – VPIZ 03

91 91 Neorganizovaná data 1.Co má půjčené který čtenář? 2.Které knihy jsou půjčené a komu? 3.Které výpůjčky byly realizovány v určitém dni?

92 UISK – VPIZ 0392 Kartotéky evidence výpůjček v knihovně Řešení vícehlediskového přístupu duplikací celých souborů 1.2.3.

93 UISK – VPIZ 0393 Kartotéky a indexy výpůjček v knihovně Řešení vícehlediskového přístupu pomocí indexů 1. 2.3.

94 94 Problémy spojené s organizací informací a znalostí 1) Obtížné určování efektivnosti 2) Subjektivnost v chápání obsahu/potřeby informace 3) Proměnlivost obsahu/potřeby informace v čase 4) Závislost na (přirozeném) jazyce 5) Závislost na kulturním kontextu 6) Pragmatický aspekt organizace versus teoretické principy UISK – VPIZ 03 7) Znalostní ekonomika 8) Přechod od „papírových“ dokumentů k elektronickým 9) Informační zahlcení 10) Důvěryhodnost

95 Problémy kolokace a označování / pojmenování Fyzické omezení prostoru: 1) Stejné věci („jedna věc“) jsou na jednom místě. 2) Na jednom místě může být v jednom časovém okamžiku vždy jen jedna věc. Sémantické problémy označování: 1) Pro jednu věc může být více označení 2) Jedno označení může být použito pro více věcí UISK – VPIZ 0395

96 Reprezentace informací v počítači Znak (character) ■jakýkoli symbol reprezentující písmeno abecedy, číslici nebo jiný znak, včetně interpunkce, mezer a diakritických znamének LATINSKÉ MALÉ PÍSMENO C S HÁČKEM (LATIN SMALL LETTER C WITH CARON) – 14/08 – U+010D – E8U+010D glyf, font ■vizuální reprezentace grafického znaku ch 96 UISK – VPIZ 03

97 Fasetová kategorizace / klasifikace = multikriteriální přístup faseta (facet) : jedno konkrétní použité kritérium členění 97

98 Fasetová kategorizace / klasifikace 1 téma členěné podle více hledisek více kategorizací / klasifikací pro 1 téma účelmateriál UISK – VPIZ 03 98

99 Fasety v rozvrhu VOŠIS UISK – VPIZ 03 99

100 UISK – VPIZ 03 SWOT analýza − vícekriteriální přístup strengths silné stránky opportunities příležitosti weaknesses slabé stránky threats hrozby 100

101 UISK – VPIZ 03 SWOT analýza − vícekriteriální přístup vnitřní faktoryvnější faktory strengths silné stránky opportunities příležitosti weaknesses slabé stránky threats hrozby faseta „vnější – vnitřní“ 101

102 UISK – VPIZ 03 SWOT analýza − vícekriteriální přístup vnitřní faktoryvnější faktory + strengths silné stránky opportunities příležitosti − weaknesses slabé stránky threats hrozby faseta „vnější – vnitřní“ faseta „kladný – záporný“ 102

103 103 Harold Dwight Lasswell 1902 – 1978 fasetový pohled na sociální komunikaci: „Kdo říká co komu jak s jakým výsledkem?“ KdoCoKomuJakVýsledek UISK – VPIZ 03

104 A znovu fasety  104 M ultidimensional M anagement and D evelopment of I nformation S ystems 1) fáze rozvoje IS podniku ■ globální podniková strategie (GST) ■ informační strategie (IST) ■ úvodní studie (US) ■ globální analýza a návrh (GAN) ■ detailní analýza a návrh (DAN) ■ implementace (IM) ■ zavádění systému (ZA) ■ provoz a údržba (PU) ■ vyřazení systému (VY) 2) obsahové dimenze ■funkce/procesy (PRO) ■data/informace (INF) ■organizační a legislativní aspekty (ORG) ■pracovní, sociální a etické aspekty – aspekty lidských zdrojů (PRA) ■software (SW) ■hardware (HW) ■uživatelské rozhraní (UR) ■bezpečnost (BE) ■ekonomické a finanční aspekty (EKO) UISK – VPIZ 03

105 Fasetová klasifikace složených témat 105 1) bez faset navzájem nezávislá složená témata 2) s fasetami tzv. semantic factoring (sémantický rozklad, analýza) faseta objektůfaseta činnosti historie automobiluautomobilhistorie údržba automobilumotocyklúdržba výroba automobiluvýroba historie motocyklu údržba motocyklu výroba motocyklu

106 106 Co se organizuje? UISK – VPIZ 03 hmotné věci nehmotné věci

107 Analogové a digitální věci merchandising 107

108 Analogové a digitální věci 108 UISK – VPIZ 03 108 merchandising knihovnictví

109 Analogové a digitální informace 109

110 Analogová a digitální metadata UISK – VPIZ 03 110 7,5 x 12,5 cm Metadata v knihkupectví Amazon

111 Kde vzít pravidla pro organizaci digitálních informací / znalostí? 111 UISK – VPIZ 03 ■ „svět 1“ – organizace fyzických věcí ■ „svět 2“ – organizace znalostí v mysli ■ „svět 3“ – organizace „nehmotných“ věcí v minulosti  klasifikace věd  logika, teorie množin  lingvistika  informační věda /archivnictví / muzeologie ■softwarové inženýrství Příklad

112 Vztahy 112 UISK – VPIZ 03 ekvivalence obsahu formy hierarchie generická (rod – druh) partitivní (celek – část) třída – instance (obecné – individuální) asociace sekvenční (prostor, čas) příčinná …

113 UML Unified modeling language 113 UISK – VPIZ 03 Třída (kategorie)Instance (prvek)

114 114 Rekapitulace Které věci jsou ekvivalentní? ty, které jsou složeny ze stejných částí ty, které mají stejnou sadu atributů ty, jejichž atributy mají stejné hodnoty ty, mezi jejichž atributy panují stejné vztahy ale i ty, které se stejně jmenují ty, které za ekvivalentní považujeme UISK – VPIZ 03 obsah forma objektivní subjektivní

115 Jaký typ ekvivalence? 115 UISK – VPIZ 03 (1) Studenti ÚISK (2) Tramvaje pražské MHD (3) Zboží na regále „v akci“ kniha – časopis – webová stránka – email (zpráva) – webové sídlo  části  atributy  názvy

116 Ekvivalence obsahu / formy 116 UISK – VPIZ 03 (1)(2)(3)

117 (Generická) hierarchie 117 UISK – VPIZ 03 generalizace, abstrakce, zobecnění druh (species) rod (genus) specializace, taxonomie

118 (Partitivní) hierarchie 118 UISK – VPIZ 03 část celek agregace, kompozice

119 Asociace 119 UISK – VPIZ 03 Obecný sémantický vztah


Stáhnout ppt "Pořádání a vyhledávání informací Helena Kučerová UISK – PVI 011 PVI Obsah kurzu: ■teoretické principy ■procesy ■metody, techniky, pravidla."

Podobné prezentace


Reklamy Google