Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Lucia Falbová, Jana Šubová

Podobné prezentace


Prezentace na téma: "Lucia Falbová, Jana Šubová"— Transkript prezentace:

1 Lucia Falbová, Jana Šubová
Metadáta (nielen) pre popis digitálnych objektov pridala som tam slovíčko (nielen) – metadáta môžu slúžiť aj pre popis „obyčajných“ dokumentov, ale ich najväčší význam sa prejavuje práve v kombinácii s digitálnymi objektami, pretože práve u týchto sa predpokladá komunikácia cez internet, siete a pod. Lucia Falbová, Jana Šubová

2 O čom budem hovoriť Čo sú to metadáta Na čo metadáta slúžia
Členenie, tvorba a práca s metadátami

3 Čo sú to metadáta metadáta = informácie o informáciách
alebo „počítačom spracovateľné štruktúrované informačné objekty popisujúce vlastnosti iných informačných objektov“ alebo „štruktúrované dáta o dátach“ alebo... niekoľko definícií – určite existuje aj viac – ale nechcelo sa mi hľadať – nech si každý za to alebo doplní vlastnú definíciu

4 Funkcie metadát POPIS bibliografický záznam SPRÁVA
INFORMAČNÝ OBJEKT SPRÁVA POPIS UCHOVÁVANIE PRÍSTUP „TECHNIKA“ bibliografický záznam inf. o získaní, ©... požiadavky pre uchovávanie podmienky prístupu k inf. technické požiadavky správa metadát inf. o metadátach metadáta sa dajú rozdeľovať podľa toho akú majú funkciu – keď si pozrieš čo s tým objektom chceš „robiť“ – podľa toho môžeš vytvoriť metadáta, ktoré ti tie činnosti uľahčia – v tých tmavých obĺžničkoch máš činnosti ktoré chceš s objektom robiť – a v tých tieňovaných obdĺžničkoch je to, čo by mali metadáta obsahovať – vpravo je správa metadát, pretože aj metadáta musíš nejako „spravovať“ –

5 Klasifikácia metadát Podľa určenia:
popisné metadáta (vyhľadávanie, identifikácia...) administratívne metadáta (štruktúra, uloženie...) štrukturálne metadáta (riadenie prístupu, archivácia...) Podľa štruktúry, formátu: jednoduché metadáta štruktúrované metadáta „bohaté“ metadáta Podľa aplikačnej oblasti: metadáta pre oblasť vzdelávania geopriestorové metadáta niekoľko prístupov ku klasifikácii metadát –

6 Význam metadát M používatelia E T A D informácie Á
informačné objekty (dokumenty) informačné systémy to je ten môj slávny náčrtok – metadáta ako rozhranie a prístupový bod používateľov a informačných systémov ku objektom – informačný systém ani používateľ vlastne nikdy „nepracuje“ primo s tým objektom – vždy sa dozvedá len nejaké metadáta o ňom – je to najviac vidieť pri vyhľadávaní – môžeš vyhľadávať síce fultextom, ale zvyčajne hľadáš podľa autora, ktorý je zapísaný na zvláštnom mieste, podľa názvu a pod. metadáta môžu znamenať aj prístupový bod používateľov k informáciám a informačným objektom

7 Metadáta vs. bibliografický popis
Popisné metadáta určené na popis zdrojov s možnosťou vyhľadávania Dublin Core metadátový štandard, ktorý má byť dosť jednoduchý pre „nekvalifikovaných“ používateľov a zároveň dostatočne komplexný pre výmenu informácií Formáty MARC štandardy pre reprezentáciu a komunikáciu bibliografických informácií v strojom čitateľnej forme tak a tu začína úvaha aký je vzťah medzi metadátami a bibliografickým popisom - čo sú to popisné metadáta – môže to byť teda napríklad dublin core, ale aj formát marc

8 Metadáta vs. bibliografický popis
= metadáta ... čím teda môže byť téma metadát pre nás nová? bibliografický popis je vlastne formou metadát – no a tým by sme mohli skončiť pretože keď vytvárame bibliografický popis vytvárame medatáta a čo by sme sa o tom ešte mali baviť ďalšiu ¾ hodinu, ale...

9 Metadáta – širšie súvislosti
hľadisko tvorby štandardy popisu (AACR, FRBR...) metadátové schémy (UNIMARC, Dublin Core) technologické hľ. štruktúra dát a súborov XML ISO 2709 HTML RDF ... protokoly HTTP OAI-PMH Z39.50 ZING implementácia UNIMARC so štruktúrou ISO UNIMARC so štruktúrou XML (BiblioML) MARC so štruktúrou XML (MARCXML)... hľ. výmeny informácií súbor našej_knižnice.iso súbor vašej_knižnice.xml... hľadisko služieb OPAC založený na HTTP/HTML vyhľadávanie založené na Z metadáta majú aj širšie súvislosti – to je prekreslený obrázok z tej jednej štúdie (myslím, že originál obrázok som ti už v nejakom súbore poslala – je to obr. toho Borbinha – takže o metadátach môžeme hovoriť z hľadiska tvorby – jednak hovoríme o nejakých štandardoch popisu a nejakých schémach, kto ktorých sa údaje zapisujú – k tomu sa pridáva technologické hľadisko – teda nejaké štruktúry súborov – a implementáciou na štandardy popisu a schémy získame súbory vo formáte napr. iso s údajmi v unimarc, alebo súbory xml s údajmi v unimarc (na to je projekt BiblioML) alebo marc21 so štruktúrou XML (na to je projekt Marcxml) no a z hľadiska výmeny nás začína trápiť, že ja mám svoj súbor s údajmi, ty máš svoj súbor s údajmi a ako to dáme dokopy – jednoducho – sú tu protokoly. a na záver nesmieme zabudnúť na hľadisko služieb – metadáta sa dajú využívať aj pri poskytovaní služieb – ipac, opac... a pod. – v tom už máš zahrnuté prakticky všetko – štandardy popisu, štruktúru súborov, protokoly, moje, tvoje údaje – a používateľ to vidí v jednom výstupe – nech žijú metadáta!!! 

10 Hľadisko tvorby Dublin Core (DC) – štruktúra:
súbor metadátových prvkov (názov, tvorca, predmet, popis, vydavateľ, prispievateľ, dátum, typ, formát, identifikátor, zdroj, jazyk, vzťah, pokrytie, práva) kvalifikátory (spresňujú prvky a určujú použité pravidlá pre zápis údajov) názov môže mať kvalifikátor „alternatívny“ dátum môže mať kvalifikátor „vytvorený“, „platný“, „vydaný“,... predmet môže mať kvalifikátor „LCSH“, „MeSH“, „DDC“,... tak späť k hľadisku tvorby – o marcu si hovoriť nemusíme – radšej poďme na DC – je to niečo zaujímavé pre knihovníkov – ten pokec okolo si vieš vymyslieť - že DC je vymyslené najmä pre komunikáciu v prostredí DC tvoria metadátové prvky – každý prvok môže mať kvalifikátory – existuje verzia DC bez kvalifikátorov a verzia s kvalifikátormi (t.j. prepracovanejšia) DC nie je normatívne – teda sa očakáva, že si tvorcovia kvalifikátory pridajú podľa potreby – viac v samostatnom súbore

11 Hľadisko tvorby Dublin Core (DC) – základné charakteristiky:
jednoduchosť sémantická interoperabilita medzinárodný konsenzus rozšíriteľnosť modularita metadát na webe modifikovateľnosť Dublin Core (DC) vytváranie DC nad rámec „bežného“ bibliografického popisu vytváranie DC z existujúcich údajov – konverzia UNIMARC do štruktúry DC originálny text z internetu máš v samostatnom súbore – sú to tie oslavné texty o DC tak ako môžeme dostať DC do bg. popisu - ako to s tou našou bežnou katalogizáciou spojiť – môžu existovať 2 možnosti – alebo budeme DC vytvárať nad rámec bežného popisu – čiže najprv dok. popíšem a potom krvopotne vyprodukujem DC – no to určite – lepšia je druhá možnosť – DC jednoducho vygenerujem u normálneho unimarcu – super! mimochodom ešte sa tam niekde hodí ukážka generátora DC pre tých „samopopisovateľov“

12 Hľadisko tvorby Dublin Core UNIMARC názov 200 $a názov 200 $e podnázov
510 $a súbežný názov 517 $a ďaľšie varianty názvu tvorca 700 $a osobné meno – hlavná zodpovednosť 701 $a osobné meno – spoluautor 710 $a korporácia – hlavná zodpovednosť 711 $a korporácia – spoluautor predmet 610 $a kľúčové slová 606 predmetové heslá 675 MDT 676 DDC 680 LCC 686 iné klasifikačné systémy príklad „konverznej“ tabuľky – aké polia sa zapisujú do prvkov DC – pre marc21 existuje prepracovanejšia tabuľka aj s kvalifikátormi DC – ale to je už príliš zložité nejakú ukážku nástroja na konverziu som nenašla 

13 Príklad – Dublin Core

14 Technologické hľadisko
XML – prečo? XML nie je limitujúce XML je „človekom čitateľné“ XML sa dá jednoducho vytvoriť (aj pomocou textového editora) a jednoducho overiť (pomocou tzv. parserov) XML má relatívne presnú syntax XML podporuje tvorbu hierarchických vzťahov XML môže obsahovať aj informácie o spôsobe prezentácie dát XML „spolupracuje“ s www prostredním

15 Technologické hľadisko
XML – čo to je: vyvinutý konzorciom W3C patrí do skupiny značkovacích jazykov XML - eXtensible Markup Language – rozšírený alebo rozšíriteľný značkovací jazyk formát pre ukladanie štruktúrovaného textu má logickú a fyzickú štruktúru; logická štruktúra rozdeľuje dokument do pojmových jednotiek a podjednotiek, fyzická štruktúra umožňuje pomenovať a uložiť samostatné časti dokumentu základné info o xml – ten je z tých formátov zatiaľ najzaujímavejší – prečo... – to ešte doplním – alebo keď máš k tomu ty niečo

16 Technologické hľadisko
XML umožňuje definovať nielen spracovanie informácie – formát, ale aj jej sémantickú úroveň – obsah popisuje nielen to, čo dáta sú a ako ich spracovávať, ale aj čo znamenajú, t. j. umožňujú automatizované logické myslenie je prenosný medzi systémami, pretože používa SGML ako centrálnu technológiu základné info o xml – ten je z tých formátov zatiaľ najzaujímavejší – prečo... – to ešte doplním – alebo keď máš k tomu ty niečo

17 Technologické hľadisko
XML – význam: štandardný formát pre výmenu dát medzi aplikáciami a pre publikovanie dokumentov medzinárodná podpora – umožňuje používať znaky všetkých jazykov (kódovanie je presne určené), používa štandard ISO (tiež UNICODE) vysoký informačný obsah – presne vyznačené jednotlivé časti dokumentu ľahká konverzia do iných formátov automatická kontrola štruktúry dokumentu hypertext a odkazy základné info o xml – ten je z tých formátov zatiaľ najzaujímavejší – prečo... – to ešte doplním – alebo keď máš k tomu ty niečo

18 Technologické hľadisko
dokumentov informácií získavanie spracovanie uchovávanie sprístupňovanie podpora elektronického obchodu konverzia do rôznych formátov vhodný pre www aplikácie lepší systém vyhľadávania prostredie pre prácu s heterogénnymi IZ formát elektronických dokumentov nezávislý na rôznych platformách základné info o xml – ten je z tých formátov zatiaľ najzaujímavejší – prečo... – to ešte doplním – alebo keď máš k tomu ty niečo

19 Technologické hľadisko
Čo je potrebné pre využitie XML pri bibliografickom popise DTD alebo XML schéma – popis štruktúry XML dokumentu nástroj, ktorý umožní ukladanie dát v štruktúre XML – prípadne nástroj na konverziu dát do štruktúry XML to ešte dopracujem

20 Príklad – BiblioML

21 Príklad – MARCXML

22 Ďakujem za pozornosť! Lucia Falbová, Jana Šubová www.cosmotron.cz


Stáhnout ppt "Lucia Falbová, Jana Šubová"

Podobné prezentace


Reklamy Google