Rekapitulace Úrovně organizace informací a znalostí

Slides:



Advertisements
Podobné prezentace
Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Advertisements

Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
VISK 7 J. Polišenský. Historie ochrany knihovních fondů v NK ČR •1994 vznik odboru ochrany knihovních fondů •1995 dokončení Centrálního depozitáře v Hostivaři.
Tvorba webových stránek
Tvorba WWW stránek ÚVOD
ZÁKLADY HTML Číslo DUM: VY_32_INOVACE_04_11 Autor: Mgr. Ivana Matyášková Datum vytvoření: duben 2013 Ročník: tercie Vzdělávací obor: informační technologie.
Mgr. Vlastislav Kučera přednáška č. 2.  Struktura stránky  hlavička  meta tagy  titulek stránky  připojení stylů,...  CSS.
Elektronická podoba GP a ZPMZ
VY_32_INOVACE_4.3.IV1.02/Ku Html dokument a jeho struktura Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Pavla Kubínková CZ.1.07/1.5.00/
Aktuální informace o vyšetřování c-erb-2 genu v referenční laboratoři a návrh změny v indikačních kritériích Hajdúch M., Petráková K., Kolář Z., Trojanec.
TVORBA WEBOVÝCH STRÁNEK
Návrh a tvorba WWW Cvičení 2 CSS 3. Cascading Style Sheet Cascading Style Sheet (kaskádové styly) je stylový jazyk, který se používá pro popis vzhledu.
Tomáš NETERDA 1961 Sportovní kariéra : plavecké třídy ZŠ Komenského gymnázium Dašická plavecká škola
Výzkumy volebních preferencí za ČR a kraje od
NÁSOBENÍ ČÍSLEM 10 ZÁVĚREČNÉ SHRNUTÍ
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Jak měřit transparentnost NNO?
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
VY_32_INOVACE_4.3.IVT1.11/Oc Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Jaroslav Ochodek CZ.1.07/1.5.00/ Tvorba webových.
Zábavná matematika.
V rámci všech serverů společnosti Aliaweb, spol. s r.o. oslovíte přes uživatelů Kurzy.cz finanční portál pro laiky i odborníky, tj. investice a.
Letokruhy Projekt žáků Střední lesnické školy a střední odborné školy sociální ve Šluknově.
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
ODČÍTÁNÍ DO 100 S PŘECHODEM DESÍTKY
Únorové počítání.
Kaskádové styly Cascading Style Sheets. Využití CSS jde o jazyk pro popis způsobu zobrazení stránek napsaných v jazycích HTML, XHTML nebo XML umožňuje.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Náhoda, generátory náhodných čísel
SČÍTÁNÍ A ODČÍTÁNÍ V OBORU DO 100
Hrubá - prostá incidence nádorů kolorekta u mužů 1. Maďarsko 88,29 2. Česká Republika 86,73 3. Japonsko 77,74 4. Německo 75,39 5. Nový Zéland71,77 6. Austrálie.
Tvorba WWW stránek HTML - XHTML Každá Internetová stránka (WWW stránka) je vytvořena pomocí programovacího jazyka HTML (Hypertext Markup Language). Každá.
Návrh a tvorba WWW Přednáška 1
Gymnázium, Obchodní akademie a Jazyková škola s právem státní jazykové zkoušky Hodonín Tvorba webu Úvod do CSS 1.
Co jsou to multimédia Bohumil Bareš.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Informatika pro ekonomy II přednáška 10
Aplikační programy, programovací jazyky, formáty datových souborů
Maturitní okruh 22: Úvod do HTML. Značkovací a klasické jazyky Klasické: převládá strukturovaný text (programovací kód), skripty jsou prováděny na straně.
Návrh a tvorba WWW Cvičení 4
CSS styly Kaskádové styly (CSS – Cascading Style Sheets) jsou prostředkem, který zajišťuje jednotný vzhled publikovaných stránek. Technologii CSS podporují.
Dokumentace objektů a zveřejnění funkcí
XML Schema Irena Mlýnková. Obsah XML – úvod, příklad, základní pojmy DTD – přehled XML Schema – podrobně.
ZÁKLADNÍ ŠKOLA OLOMOUC příspěvková organizace MOZARTOVA 48, OLOMOUC tel.: , ; fax:
DTD DTD (Document Type Definition) je jinými slovy návod pro prohlížeč zpracovávající dokument. DTD (Document Type Definition) je jinými slovy návod pro.
KONTROLNÍ PRÁCE.
Metadata a metainformační systémy (seminář)
Porovnání výroby a prodejů vozidel ve světě
Počítačová grafika a prezentace
VY_32_INOVACE_4.3.IVT1.05/Ku Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Pavla Kubínková CZ.1.07/1.5.00/ CSS.
Databázové modelování
Referát č.8 Daniela Venusová.
Otevřené datové formáty a standardy
XML a metainformační systémy (pro geoinformace) Ing. Jan Růžička Institut ekonomiky a systémů řízení, odd.GIS VŠB-TU Ostrava, HGF tř. 17.listopadu
Tvorba efektních www stránek pro každého Od historie až po současnost… Úvod Porovnání Validace Prohlížeče Závěr.
Vít Profant Obhajoba bakalářské práce
Jazyk XML v geoinformatice
Kaskádové styly Cascading Style Sheets. Využití CSS jde o jazyk pro popis způsobu zobrazení stránek napsaných v jazycích HTML, XHTML nebo XML umožňuje.
PHP Programy pro tvorbu WWW stránek - 01
Petr Šmíd Obsah prezentace Co je to XML ?
Úvod do XML S využitím materiálů z Zdeněk Žabokrtský.
Tvorba metainformačního systému pro prostorová data s využitím Internetových technologií Zpracovatel: Tomáš Duchoslav Vedoucí: Dr. Ing. Bronislava Horáková.
Tvorba WWW stránek. Hyperlink Odkaz, bývá označený jinou barvou a podtržený Odkaz, bývá označený jinou barvou a podtržený Reaguje na událost myši – Reaguje.
Zahradnická fakulta v Lednici S4U – Seminář o Univerzitním informačním systému 23. – 25. dubna 2008 S 4 U – Seminář o Univerzitním informačním systému.
TEXTOVÝ EDITOR Karin Tylšerová. Textový editor je software, kterým je možné editovat prostý text. Neobsahuje žádné informace o formátování, jako je použití.
Typologie dokumentů Vymezení a typy. Prameny aj.  Pramen  Dokument  Zdroj iz421 opink 2.
XML a datový standard Zdeněk Jirkovec Softwarové Aplikace a systémy.
Textový Editor.
Zpracování textů efektivně
Informatika pro ekonomy přednáška 8
Transkript prezentace:

Rekapitulace Úrovně organizace informací a znalostí makroúroveň mikroúroveň VOŠIS – OIZ 08

Publikování informací dříve ZIZ06 ZIZ 6 Publikování informací dříve VOŠIS – OIZ 08 3 3

Publikování informací nyní ZIZ06 ZIZ 6 Publikování informací nyní VOŠIS – OIZ 08 4 4

Cíl: Najít formát (strukturu, architekturu) použitelnou pro co největší počet typů elektronických dokumentů nezávislou na použitém HW a SW srozumitelnou lidem i počítačovým programům Otevřená (obecná, generická) struktura VOŠIS – OIZ 08

Realita: Formáty elektronických dokumentů ZIZ06 Realita: Formáty elektronických dokumentů text obraz (image) zvuk (audio) video ASCII, TXT PostScript PDF DOC, DOCX, RTF SGML, HTML, XML ODT JPEG GIF TIFF PNG BMP SVG MP3 RAM WMA AAC MPEG MOV WMV AVI PDF – ISO 19005 (PDF/A-1) ODT – ISO/IEC 26300 VOŠIS – OIZ 08

Odlišnost struktur dokumentů působí: obsah kvalita funkce (účel) forma (údajů, nosiče, přenosu – v čase, v prostoru) rozsah, úplnost retrospektiva frekvence aktualizace stupeň odbornosti míra zveřejnění dostupnost typ poskytovaných informací (primární – sekundární) autor (jednotlivec – kolektiv – instituce) VOŠIS – OIZ 08

Kritéria pro volbu typu formátu Typ obsažených informací (text, grafika, audio, video, multimédia) Způsob užití / prezentace dokumentu Možnost editace Možnost vyhledávání Obtížnost (pracnost) tvorby dokumentu Nároky na zdroje, cena vybavení Uživatelé dokumentu Typ dokumentu VOŠIS – OIZ 08

Sandro Botticelli (1445-1510) je malíř italské renesance. Rekapitulace Dokumenty podle funkce "transakční" dokument "narativní" dokument Sandro Botticelli (1445-1510) je malíř italské renesance. V jisté podzemní noře bydlel jeden hobit. Nebyla to žádná ošklivá, špinavá, vlhká díra, plná konečků žížal a páchnoucí slizem, ani vyschlá, holá písčitá jáma, kde by se nedalo na nic sednout a ničeho se najíst: byla to hobití nora, a to znamená komfort. VOŠIS – OIZ 08

„procedurální“ dokument – doklad „deklarativní“ dokument – poznatek Rekapitulace Dokumenty podle obsahu „procedurální“ dokument – doklad „deklarativní“ dokument – poznatek Obsah = potvrzení platnosti (důkaz, svědectví, evidence): události transakce oprávnění vlastnictví Účel: abychom mohli (realizovat nějakou činnost) Obsah = znalost (poznatek) abychom věděli (něco) VOŠIS – OIZ 08 10

Rekapitulace Příklad – informace o osobě Božena Němcová: Babička. Dostupné z: http://www.mlp.cz/koweb/00/02/81/10/67/babicka.pdf VOŠIS – OIZ 08 11

Historie vyznačování struktury dokumentů ZIZ06 Historie vyznačování struktury dokumentů Bez vyznačení – starověká písma Velká písmena Mezery mezi slovy, iniciály, interpunkce Příprava rukopisů pro sazbu Typografické značky Korekturní znaménka Značky v textových editorech Jazyky pro popis stránky Databázové programy Značkovací jazyky Bílé – tradiční dokumenty Žluté – elektronické dokumenty VOŠIS – OIZ 08 12

Historie vyznačování struktury dokumentů VOŠIS – OIZ 08

Historie vyznačování struktury dokumentů VOŠIS – OIZ 08 14

Typografické značky VOŠIS – OIZ 08 15

Korekturní znaménka VOŠIS – OIZ 08 16

Možné způsoby formátování elektronických dokumentů 1. „nestrukturované“ např. image (obraz digitalizovaného dokumentu), tzv. binární formáty aj. 2. strukturovaná informace 3. hybridní (semistrukturovaná) informace např. strukturované záhlaví, nestrukturované tělo v emailu VOŠIS – OIZ 08 17

Vyznačování struktury elektronických dokumentů ZIZ06 Vyznačování struktury elektronických dokumentů Současné elektronické dokumenty ve svém vzhledu napodobují tradiční dokumenty VOŠIS – OIZ 08 18

Dokument bez struktury ZIZ06 ZIZ 7ZIZ 7 ZIZ 7 7.4.2017 Dokument bez struktury na tři týdny Čtenář4 signatura Koutecký 2010 A1586 Vladimír ”” TajnýdeníkLaury 21. září Palmerové () z Prahy si půjčil Sdělení je nesrozumitelné, protože není strukturované Jak to, že tvrdíme, že není strukturované? Kde pro nás „začíná“ struktura? VOŠIS – OIZ 08 19 19 19

Struktura publikovaných informací VOŠIS – OIZ 08 20

Dokument „bez struktury“ ZIZ06 ZIZ 7ZIZ 7 ZIZ 7 7.4.2017 Dokument „bez struktury“ Jeho struktura je implicitní, nesdělitelná počítačovému programu – srozumitelná pouze pro lidi VOŠIS – OIZ 08 21 21 21 21

Typy strukturování elektronických dokumentů obsahové – formální homogenní – nehomogenní editovatelné – needitovatelné proprietární – otevřené procedurální – neprocedurální lineární – hierarchické – síťové – relační VOŠIS – OIZ 08 22 22

Rekapitulace Obsah a forma informace ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 Rekapitulace Obsah a forma informace Informace = data, která mají smysl 2) Informace = znalosti, které jsou sdělitelné obsah content komunikace – formát container, carrier VOŠIS – OIZ 08 23 23 23 23

Formální strukturování VOŠIS – OIZ 08 24

Obsahové strukturování VOŠIS – OIZ 08 25

Samoobsluha v Kalifornii Allen Ginsberg 1926 – 1997 Jak jsem na tebe myslel dnes večer, Walte Whitmane, když jsem kráčel postranními uličkami pod stromy, bolela mě hlava a plaše jsem hleděl na měsíc v úplňku. Utahaný a hladový, chtěl jsem nakoupit obrazy, a tak jsem vešel do neónové samoobsluhy s ovocem a snil o tvých enumeracích! Jaké broskve a jaké odstíny! Celé rodiny nakupující v noci! Uličky plné manželů! Ženy u avocados, děti v rajčatech! – A ty, Garcío Lorco, co tys tam hledal mezi melouny? Přeložil Jan Zábrana VOŠIS – OIZ 08

a) textové editory – TXT, DOC, RTF, ODT, WPD, TEX ZIZ06 ZIZ 7ZIZ 7 ZIZ 7 7.4.2017 a) textové editory – TXT, DOC, RTF, ODT, WPD, TEX editovatelný VOŠIS – OIZ 08 27 27 27 27

b) jazyky pro popis stránky ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 b) jazyky pro popis stránky PostScript vektorový popis grafické informace procedurální VOŠIS – OIZ 08 28 28 28 28

Portable document format – PDF podmnožina jazyka PostScript Adobe Acrobat, Adobe Reader ISO 19005:2005 VOŠIS – OIZ 08 29

c) databázové programy databáze – obsah (instance) ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 c) databázové programy databáze – obsah (instance) homogenní VOŠIS - ZIZ 6 VOŠIS – OIZ 08 30 30 30 30

databáze – definice struktury ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 databáze – definice struktury Deskriptivní - neprocedurální VOŠIS - ZIZ 6 VOŠIS – OIZ 08 31 31 31 31

databáze – formulář (styl) VOŠIS - ZIZ 6 VOŠIS – OIZ 08 32

Typy dokumentů podle datové struktury ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 ZIZ08ZIZ 7ZIZ 7 7.4.2017 7.4.2017 Typy dokumentů podle datové struktury lineární hierarchické síťové relační 7.4.2017 VOŠIS – OIZ 08 33 33 33 33 33 33

Fakta lineární struktura srozumitelná lidem Čtenář Vladimír Koutecký z Prahy 4 si 21. září 2010 půjčil na tři týdny knihu „Tajný deník Laury Palmerové“ (signatura A1586) VOŠIS – OIZ 08 34 34

Lineární (sekvenční) struktura VOŠIS – OIZ 08 35 35

Lineární (sekvenční) struktura ZIZ06 ZIZ 7ZIZ 7 ZIZ08ZIZ 7ZIZ 7 7.4.2017 Lineární (sekvenční) struktura Lineární struktura srozumitelná počítačovému programu VOŠIS - ZIZ 6 VOŠIS - ZIZ 7 VOŠIS – OIZ 08 36 36 36 36

Lineární (sekvenční) struktura oblasti užití: zálohy dat (sekvenční ukládání na magnetickou pásku) fulltextové systémy (doplněné indexovými soubory) standardy: ISO 2709 – výměnný formát pro bibliografické záznamy VOŠIS – OIZ 08 37 37

Stromová (hierarchická) struktura VOŠIS – OIZ 08 38 38

Stromová (hierarchická) struktura VOŠIS – OIZ 08 39 39

Stromová (hierarchická) struktura oblasti užití: indexové soubory HTML a XML dokumenty objektově orientovaná technologie standardy: ISO 8879 – SGML VOŠIS – OIZ 08 40 40

Síťová struktura VOŠIS – OIZ 08 41 41

ZIZ08ZIZ 7ZIZ 7 ZIZ06 Síťová struktura VOŠIS – OIZ 08 42 42 42

Síťová struktura oblasti užití: hypertext World Wide Web standardy: CODASYL XML VOŠIS – OIZ 08 43 43

Relační struktura VOŠIS – OIZ 08 VOŠIS - ZIZ 6 VOŠIS - ZIZ 7 44 44

Relační struktura oblasti užití: transakční (relační) databáze standardy: ISO/IEC 9075 – SQL VOŠIS – OIZ 08 45 45

Základní současné technologie publikování informací ZIZ06 ZIZ 6 Základní současné technologie publikování informací 1) tisk na papír (knihy, časopisy) uzavřená vývojová etapa 2) elektronické publikování perspektivní, stále ve vývoji přenos energií (vysílání) / elektronické (digitální) dokumenty online / offline push / pull Výhoda tradičních technologií: už se neočekávají další významné změny paradigmatu – mohli bychom se o tom učit bez rizika, že se něco v budoucnu změní Nevýhoda elektronických technologií: to, co se budeme učit letos, bude za rok jiné VOŠIS – OIZ 08 46 46

Procesy publikování editace vytváření a změna struktury a/nebo obsahu dokumentu prezentace interpretování dokumentu ve smyslově vnímatelné podobě (formátování na prezentačním médiu) výměna přenášení dokumentu od původce k příjemci VOŠIS – OIZ 08

Co potřebujeme k publikování elektronických dokumentů? know how hardware software (program k vytvoření struktury obsahu a struktury vzhledu) prostředky pro přenos VOŠIS – OIZ 08

Elektronické publikování ZIZ06 ZIZ 6 7.4.2017 Elektronické publikování výhody problémy hypertext, multimédia interaktivita vyhledávání a navigace absence časových a prostorových bariér archivace finanční úspory nadprodukce informací grafomanství duplikace ochrana osobních dat autorská práva interaktivita: online elektronické publikace povzbuzují čtenáře k reakcím více než klasické tištěné zdroje VOŠIS – OIZ 08 49 49 49

Typy elektronického publikování publikování na Internetu (online, offline) publikování na CD-ROM / DVD online databáze VOŠIS – OIZ 08 50

Vztah elektronických a „klasických“ publikací kopie tištěných předloh doplněk nebo rozšíření tištěné publikace dokumenty existující pouze v elektronické verzi VOŠIS – OIZ 08

Elektronické dokumenty podle způsobu vytvoření (editace) 1. prvotním pořizováním 2. konverzí z externího zdroje 3. generováním z jiných zdrojů / dat podíl ruční práce, obtížnost: 1 − nejvyšší, 3 − nejnižší možnost ovlivnit obsah: 1 − ano, 2 − ne, 3 − zpravidla ne VOŠIS – OIZ 08 52

Elektronické dokumenty podle způsobu vytvoření / uložení statické dynamické, interaktivní VOŠIS – OIZ 08 53

Formáty elektronických dokumentů podle způsobu užití k prohlížení na obrazovce k vytištění k přenosu (komunikativní formát) k archivaci (komprese) VOŠIS – OIZ 08 54

elektronicképublikování ZIZ 6 ZIZ06 tvorba (editace) struktura obsahu formát / struktura / architektura elektronicképublikování = struktura stylu prezentace Tvorba (editace) – vždy Prezentace – realizuje se jen tehdy, pokud bude příjemcem dokumentu uživatel – člověk (není zajímavé pro počítačové aplikace) Výměna – zajímavé jen tehdy, bude-li se dokument předávat mezi dvěma (či více) různými systémy (tj. musí-li v průběhu výměny dojít k překódování, resp. k přeformátování) výměna (komunikace) VOŠIS – OIZ 08 55 55

Informační procesy vyžadující znalost struktury dokumentu Publikování Zpracování – dokumenty, které získáme, musíme umět dále zpracovat (např. vytisknout) Vyhledávání – při znalosti struktury dokumentu můžeme při vyhledávání zamířit přímo do určitých informačně významných částí (např. obsah, název, anotace); dokumenty se třídí podle hodnot strukturních prvků Popisování a odkazování – popis a odkaz „připojujeme“ k rozpoznané strukturní části dokumentu VOŠIS – OIZ 08

Granularita hloubka (podrobnost) analýzy jemnost (hrubost) struktury ZIZ06 Granularita hloubka (podrobnost) analýzy jemnost (hrubost) struktury míra detailu Tentýž objekt se může při určité hloubce analýzy jevit jako strukturovaný a jindy jako nestrukturovaný VOŠIS – OIZ 08

Téma dnešní a příští / minulé přednášky ZIZ06 Téma dnešní a příští / minulé přednášky Publikování informací Struktura publikovaných informací Typy struktur elektronických dokumentů Standardizace strukturování (formátů) elektronických dokumentů VOŠIS – OIZ 08

Příklad – obchodní dokumenty VOŠIS – OIZ 08

Robert Glushko: Document Engineering Document type spectrum DMS, CMS databáze VOŠIS – OIZ 08

DTD EDI ODF W3C HTML SGML OASIS ISO XML UN (OSN) ODA XHTML DSDL VOŠIS – OIZ 08

Řešení nekompatibility formátu ZIZ 7 ZIZ06 ZIZ 7ZIZ 7 7.4.2017 7.4.2017 Řešení nekompatibility formátu konverze formátu dokumentu: konverzní programy (export – import), reformátování, komunikativní (výměnné) formáty problém: ztráta informace (šum) přizpůsobení programu pracujícího s dokumentem (nastavení browseru, driver v databázi / tiskárně) VOŠIS – OIZ 08 62 62 62

Konverze formátu znamená… ZIZ06 ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 7.4.2017 Konverze formátu znamená… nativní formát migrace DOC PDF TXT WPD Migrace: změna technologické platformy, nikoli formátu ODT VOŠIS – OIZ 08 63 63 63

Konverze s komunikativním (výměnným) formátem ZIZ06 ZIZ 7ZIZ 7 ZIZ 7 7.4.2017 7.4.2017 Konverze s komunikativním (výměnným) formátem RTF XML UNIMARC DOC PDF TXT WPD komunikativní formát ODT VOŠIS – OIZ 08 64 64 64

Najít formát (strukturu, architekturu) Rekapitulace č. 1 Cíl: Najít formát (strukturu, architekturu) použitelnou pro co největší počet typů elektronických dokumentů nezávislou na použitém HW a SW srozumitelnou lidem i počítačovým programům Otevřená (obecná, generická) struktura VOŠIS – OIZ 08

Cíl „open“ formátů elektronických dokumentů ZIZ06 ZIZ 7ZIZ 7 ZIZ08ZIZ 7ZIZ 7 7.4.2017 Cíl „open“ formátů elektronických dokumentů umožnit: distribuované informační zdroje platformovou nezávislost heterogenitu VOŠIS – OIZ 08 66 66 66

Principy otevřených formátů ZIZ 7 ZIZ06 ZIZ08ZIZ 7ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 7.4.2017 Principy otevřených formátů oddělení tří komponent dokumentu 1) obsah co to znamená 2) struktura obsahu kde to je jak je to organizované nebo seskupené 3) prezentace obsahu (struktura stylu) jak to vypadá jak je to zobrazené jedinečné pro každý dokument opakovatelné pro více dokumentů I když to mnohdy nejde oddělit „fyzicky“, je vhodné o těchto třech komponentách odděleně přemýšlet, tj. oddělit je „abstraktně“. VOŠIS – OIZ 08 67 67 67 67 67

model / schéma / typ / profil / architektura dokumentu ZIZ 7 ZIZ06 ZIZ08ZIZ 7ZIZ 7 ZIZ 7ZIZ 7 7.4.2017 7.4.2017 Rekapitulace č. 5 model / schéma / typ / profil / architektura dokumentu zjednodušená a zobecněná (abstraktní) reprezentace struktury dokumentu generická (obecná) struktura instance: konkrétní obsah dokumentu s danou strukturou (message − sdělení, zpráva) specifická struktura 1 : N Vztah model - instance 1:N (tj. možnost znovupoužití jednou vypracovaného modelu) VOŠIS – OIZ 08 68 68 68 68 68

Modely – UML diagram tříd (class diagram) VOŠIS - ZIZ 7 VOŠIS – OIZ 08 69

UML diagram tříd – textový zápis /* Module: Kniha.cs * Purpose: Definition of the Class Kniha/ public class Kniha{ public string get_název(){return název;} public void getnázev(string newNázev) {this.název = newNázev;} public string get_signatura(){return signatura;} public void getsignatura(string newSignatura) {this.signatura = newSignatura;} private string název; private string signatura; VOŠIS – OIZ 08

Modely – ERA diagram VOŠIS – OIZ 08 71

ERA model – textový zápis E: ČTENÁŘ (Jméno, Adresa) KNIHA (Signatura, Název) R: VÝPŮJČKA (Datum, Lhůta) VOŠIS – OIZ 08 72

Modely – DTD VOŠIS – OIZ 08 73

Využití znalostí o struktuře dokumentů v informační praxi Strukturování (formátování) dokumentů se realizovalo i v „předpočítačové“ době Proč potřebujeme v současnosti přesnější pravidla pro strukturování dokumentů: stále častěji dochází k jejich zpracování (někdy i generování) počítačovým programem, který potřebuje přesné instrukce volba struktury dokumentu ovlivňuje efektivnost operací s ním VOŠIS – OIZ 08

DTD – textový zápis <?xml version="1.0" encoding="UTF-8" ?> <!ELEMENT Záznam výpůjčky (Čtenář,Kniha,Výpůjčka)> <!ELEMENT Čtenář (jméno,adresa)> <!ELEMENT jméno (#PCDATA)> <!ELEMENT adresa (#PCDATA)> <!ELEMENT Kniha (název)> <!ATTLIST Kniha signatura CDATA> <!ELEMENT název (#PCDATA)> <!ELEMENT Výpůjčka (#PCDATA)> <!ATTLIST Výpůjčka Datum výpůjčky CDATA Lhůta CDATA> VOŠIS – OIZ 08

CSS – model vzhledu <STYLE type="text/css"> body {color: red; background: aqua; margin-left: 5%; font-family: Arial, sans-serif;} h1 {color: white;} h2 {color: navy;} h3 {color: yellow;} em {color: silver;} table {bgcolor: red;} a:link {color: white;} a:hover {color: blue;} li {color: green; list-style-type: square;} </STYLE> VOŠIS – OIZ 08

Úrovně standardizace otevřených formátů obecné konkrétní 1. Principy (architektura) struktury 2. (Meta)jazyk pro popis struktury 3. Jazyk pro popis struktury VOŠIS – OIZ 08 77

Standardy pro otevřené systémy 1. Principy (architektura) struktury EDI – Electronic Data Interchange architektura pro výměnu elektronických dokumentů (struktura obsahu) ODA – Open Document Architecture architektura elektronických dokumentů (struktura obsahu + struktura vzhledu) OAIS – Open Archival Information Systems Reference Model otevřený model architektury pro digitální úložiště (repozitoře) VOŠIS – OIZ 08 78

EDI – Electronic Data Interchange ZIZ 7 ZIZ 7ZIZ 7 ZIZ06 ZIZ08ZIZ 7ZIZ 7 7.4.2017 7.4.2017 EDI – Electronic Data Interchange pravidla strukturování dávkových a interaktivních zpráv vyměňovaných v otevřeném prostředí mezi systémy počítačových aplikací využití: obchodní transakce, e-byznys, B2B implementace: UN/EDIFACT − Elektronická výměna dat pro správu, obchod a dopravu. ISO 9735:2002 ANSI X12 GS1 (EANCOM) Nezajímá se o prezentaci. Určeno převážně pro transakční dokumenty obdobný princip: web services VOŠIS – OIZ 08 79 79 79 79 79

ODA Open Document Architecture ISO/IEC 8613:1994 dvě struktury dokumentu: logická (obsahová) a vzhledová hierarchická struktura dokumentu informace o uspořádání (struktura, profil) a obsah (instance) dokumentu uloženy zvlášť VOŠIS – OIZ 08 80

3 základní prvky architektury dokumentu dle ODA 1. vlastní obsah (instance) profil: 2. definice logické struktury (obsah) 3. definice struktury vzhledu (styl, formát) VOŠIS – OIZ 08 81

Standardy pro otevřené systémy 2. (Meta)jazyk pro popis struktury Pouze syntaxe (gramatika, pravidla) SGML – Standard Generalized Markup Language ISO 8879:1986 DSDL – Document Schema Definition Languages ISO/IEC 19757:2003 XML – W3C Recommendation 1.0 (1998) VOŠIS – OIZ 08 82

Standardy pro otevřené systémy 3. Jazyk pro popis struktury Syntaxe definovaná metajazykem + slovník Jazyky pro popis obsahu ebXML, SMIL, MathML Jazyky pro popis stylu CSS, XSL VOŠIS – OIZ 08 83

OASIS − Organization for the Advancement of Structured Information Standards založeno v r. 1993 mezinárodní konsorcium 600 firem působících v oblasti publikování a zpracování elektronických dokumentů pro e-byznys významné produkty: ebXML DocBook ODF − OpenDocument Format for Office Applications (ISO/IEC 26300) VOŠIS – OIZ 08

SGML – Standard Generalized Markup Language Charles F. Goldfarb obecný jazyk určující syntaxi značkovacích jazyků (metajazyk) hierarchicky orientovaný VOŠIS – OIZ 08

Jazyky v ICT značkovací (vyznačovací) jazyk (markup language) − popis dat deklarativní = SGML, HTML  programovací jazyk − popis operací s daty procedurální = Pascal, Java, C++, CSS, XSL  VOŠIS – OIZ 08

Názvy dokumentů: publikace kniha dílo (work) záznam spis (file) archiválie materiál text evidence soubor (file) doklad kniha písemnost dopis dílo (work) stránka rukopis (manuskript) listina záznam formulář tiskovina originál (předloha) – kopie monografie práce (např. seminární) VOŠIS – OIZ 08

Terminologie značkovacích jazyků markup tag parser validace document type (typ dokumentu) DTD VOŠIS – OIZ 08

markup označování, značkování, vyznačování text, který je přidán k datům dokumentu, aby o nich poskytl informaci VOŠIS – OIZ 08

tag příznak, popisné vyznačení, značka visačka, štítek, etiketa, cedulka, jmenovka, přízvisko, pojmenování, přívlastek, přezdívka, označení, též ozdobná klička na konci podpisu < > </ > <p> </p> VOŠIS – OIZ 08

parser syntaktický analyzátor, procesor program, který rozpoznává značky v dokumentech (např. SGML, XML nebo HTML tagy) VOŠIS – OIZ 08

validace ověření shody vyznačeného dokumentu s příslušným modelem struktury (schématem) VOŠIS – OIZ 08

Typ dokumentu (document type) třída dokumentů, které mají podobné charakteristiky časopis, článek, dopis, faktura… DTD – document type definition slovník, kterým jsou popisovány dokumenty daného typu VOŠIS – OIZ 08

Samoobsluha v Kalifornii Allen Ginsberg 1926 – 1997 Příklad typu dokumentu – báseň: Samoobsluha v Kalifornii Allen Ginsberg 1926 – 1997 Jak jsem na tebe myslel dnes večer, Walte Whitmane, když jsem kráčel postranními uličkami pod stromy, bolela mě hlava a plaše jsem hleděl na měsíc v úplňku. Utahaný a hladový, chtěl jsem nakoupit obrazy, a tak jsem vešel do neónové samoobsluhy s ovocem a snil o tvých enumeracích! Jaké broskve a jaké odstíny! Celé rodiny nakupující v noci! Uličky plné manželů! Ženy u avocados, děti v rajčatech! – A ty, Garcío Lorco, co tys tam hledal mezi melouny? Přeložil Jan Zábrana VOŠIS – OIZ 08

Co definuje DTD elementy – název, obsah, atributy vztahy mezi elementy nadřazenost – podřazenost pořadí elementů výskyt elementu v dokumentu povinnost výskytu možnost vícenásobného (opakovaného) výskytu VOŠIS – OIZ 08

Co definuje DTD elementy vztahy mezi elementy výskyt elementu v dokumentu VOŠIS – OIZ 08 VOŠIS - ZIZ 7 96

Příklady prvků DTD báseň (název, autor, sloka) báseň tvoří název, jméno autora a sloky (přesně v tomto pořadí) báseň (název & autor & sloka) báseň tvoří název, jméno autora a sloky (v libovolném pořadí) autor (foto | kresba | video) u autora se uvádí buď fotografie, nebo kresba nebo video název? dokument může mít jen 1 název, nemusí mít žádný název (#PCDATA) obsah elementu název je tvořen textem VOŠIS – OIZ 08

Timothy Berners-Lee (8. 6. 1955) Tvůrce koncepce sítě World Wide Web Autor specifikací URI, HTTP, tvůrce jazyka HTML Ředitel W3C VOŠIS – OIZ 08 98

VOŠIS – OIZ 08

HTML Hypertext Markup Language jazyk (DTD) pro strukturování a formátování WWW dokumentů typ dokumentu HTML: web page (document), tj. jednotka informace přístupná v síti WWW hypertextové vazby na jiné dokumenty v síti WWW <a href=" "> </a> složené dokumenty <img src=" "> VOŠIS – OIZ 08 100

Struktura HTML dokumentu !DOCTYPE = deklarace typu dokumentu (zpravidla ve formě odkazu na externí DTD) HTML = instance dokumentu HEAD = záhlaví (informace pro browser) META = informace o dokumentu, která není určená pro zobrazení browserem BODY = tělo (informace pro uživatele) VOŠIS – OIZ 08 VOŠIS - ZIZ 7 101

HTML – historie verzí HTML 2.0 Další vývoj: HTML 3.2 HTML 5 HTML 4.0 XHTML 1.0 XHTML 1.1 ČSN ISO/IEC 15445 (36 9831) Informační technologie – Jazyky pro popis dokumentů a jejich zpracování – Hypertextový vyznačovací jazyk (HTML). Praha : Český normalizační institut, 2002. tzv. ISO HTML – definuje podmnožinu HTML 4.01 Další vývoj: HTML 5 XHTML 2 VOŠIS – OIZ 08 102

HTML dokument (stránka) HTML konvertor, generátor ZIZ06 HTML technologie validátor HTML editor HTML prohlížeč parser render browser DTD HTML dokument (stránka) HTML konvertor, generátor bílé šipky: kontrola validátorem Oranžové šipky: uložení na serveru, zpřístupnění (zaslání kopie dokumentu za serveru klientovi) CSS VOŠIS – OIZ 08 VOŠIS – ZIZ 6 103 103

Principy otevřených formátů – implementace v HTML obsah instance struktura obsahu DTD struktura stylu CSS data metadata VOŠIS – OIZ 08 104

XML – eXtensible Markup Language rozšiřitelný vyznačovací metajazyk využitelný v prostředí Internetu podmnožina SGML – zjednodušení některých příliš složitých a vývojem překonaných pravidel objektově orientovaný SGML XML VOŠIS – OIZ 08

Jiří Kosek http://www.kosek.cz zástupce ČR v ISO/IEC JTC1/SC34/WG1 – Document Description and Processing Languages člen OASIS DocBook TC (Technical Committee) http://www.kosek.cz VOŠIS – OIZ 08

SGML – HTML – XML v čase vznik ISO standardizace SGML 1974 1986 HTML 1989 2000 XML 1997 --- VOŠIS – OIZ 08

Vztah HTML a XHTML SGML XML syntaxe HTML XHTML slovník s danou syntaxí XHTML = HTML slovník v syntaxi XML VOŠIS – OIZ 08

Definice stylu style sheet formátovací sada, příloha stylu, šablona stylu, tabulka stylu souhrn stylů uložený v souboru nebo mimo něj určuje úpravu dokumentů, k nimž je připojen layout grafická úprava, vzhled sazby, tvar stránky, grafický návrh VOŠIS – OIZ 08

Standardy pro definice stylu DSSSL – Document style semantics specification language jazyk pro specifikaci a sémantiku stylu SGML dokumentů CSS – Cascading Style Sheets Language kaskádové definice stylu pro HTML XSL – Extensible Style Language definice stylu pro dokumenty strukturované v XML VOŠIS – OIZ 08

CSS – Cascading Style Sheets Language kaskádové definice stylu pro HTML šablona pro prezentaci „osamostatnění“ informace o vzhledu dokumentu, možnost využít pro více instancí VOŠIS – OIZ 08