1 PRG036 – Technologie XML Přednáší: Irena Mlýnková Martin Nečaský

Slides:



Advertisements
Podobné prezentace
PLAYBOY Kalendar 2007.
Advertisements

Stodůlky 1977 a 2007 foto Václav Vančura, 1977 foto Jan Vančura, 2007.
Města ČR – orientace na mapě
Vlastní skript může být umístěn: v hlavičce stránky v těle stránky
Štěpán Šípal Gymnázium Čakovice. Dnešní témata  Vznik XHTML a předchůdci  Základní prvky XHTML dokumentu  Tagy a atributy  Elementy a jejich druhy.
Tvorba WWW stránek ÚVOD
*Zdroj: Průzkum spotřebitelů Komise EU, ukazatel GfK. Ekonomická očekávání v Evropě Březen.
Základní struktura, metainformace
Jazyk HTML Název školyZákladní škola a Mateřská škola Tatenice Číslo projektuCZ Název šablony klíčové aktivity Inovace a zkvalitnění výuky pomocí.
Úvod do HTML. Co je HTML  zkratka pro HyperText Markup Language  značkovací jazyk pro hypertext  umožňuje publikaci dokumentů na internetu.
Serialization (převod) Úvod 1 SGML W3C HTML 1.x. HTML4.0 xHTML 1.0. xHTML 2.x HTML 5 (xHTML 5) HTML 4.0 xml (xHTML 1.0) xHTML je dobřé zformovaný (well-formed)
David Pejčoch XML (Extensible Markup Language) Semistrukturovaná data Obecný značkovací jazyk Vyvinut a standardizován konzorciem W3C Zjednodušená.
Internetové publikování Doc. Ing. Petr Zámostný, Ph.D. místnost: A-72a tel.: 4222, 4167 (sekretariát ústavu 111)
Téma 3 ODM, analýza prutové soustavy, řešení nosníků
Násobíme . 4 = = . 4 = = . 4 = = . 2 = 9 .
XHTML Tvorba webových stránek. Vývoj značkovacích jazyků HTML – HyperText Markup Language  Značkovací jazyk pro vytváření www stránek. Pomocí značek.
Výzkumy volebních preferencí za ČR a kraje od
Téma: SČÍTÁNÍ A ODČÍTÁNÍ CELÝCH ČÍSEL 2
Vizualizace projektu větrného parku Stříbro porovnání variant 13 VTE a menšího parku.
Vzdělávací materiál / DUMVY_32_INOVACE_02B14 Příkazový řádek: obsah souborů PŘÍKLADY AutorIng. Petr Haman Období vytvořeníLeden 2013 Ročník / věková kategorie3.
VY_32_INOVACE_INF_RO_12 Digitální učební materiál
Animace Demo Animace - Úvodní animace 1. celé najednou.
Lineární rovnice Běloun 91/1 a
MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA reg. č.: CZ.1.07/1.4.00/ Základní škola, Šlapanice, okres Brno-venkov, příspěvková organizace Masarykovo nám.
VY_32_INOVACE_ 14_ sčítání a odčítání do 100 (SADA ČÍSLO 5)
Zábavná matematika.
Dělení se zbytkem 6 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Dělení se zbytkem 5 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
KASKÁDOVÉ STYLY 4.
Jazyk vývojových diagramů
Čtení myšlenek Je to až neuvěřitelné, ale skutečně je to tak. Dokážu číst myšlenky.Pokud mne chceš vyzkoušet – prosím.
52_INOVACE_ZBO2_1364HO Výukový materiál v rámci projektu OPVK 1.5 Peníze středním školám Číslo projektu:CZ.1.07/1.5.00/ Název projektu:Rozvoj vzdělanosti.
Dělení se zbytkem 8 MODERNÍ A KONKURENCESCHOPNÁ ŠKOLA
Zásady pozorování a vyjednávání Soustředění – zaznamenat (podívat se) – udržet (zobrazit) v povědomí – představit si – (opakovat, pokud se nezdaří /doma/)
TRUHLÁŘ II.ročník Výrobní zařízení Střední škola stavební Teplice
Tvorba WWW stránek HTML - XHTML Každá Internetová stránka (WWW stránka) je vytvořena pomocí programovacího jazyka HTML (Hypertext Markup Language). Každá.
DĚLENÍ ČÍSLEM 7 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ
1 5. přednáška XML Slajdy převzaty z Mlýnková, Nečaský : Technologie XML (DBI026, MFF UK) Úvod do databázových systémů B RNDr. Jan Lánský, Ph.D.
MS PowerPoint Příloha - šablony.
1 Celostátní konference ředitelů gymnázií ČR AŘG ČR P ř e r o v Mezikrajová komparace ekonomiky gymnázií.
Technické kreslení.
Úkoly nejen pro holky.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Maturitní okruh 22: Úvod do HTML. Značkovací a klasické jazyky Klasické: převládá strukturovaný text (programovací kód), skripty jsou prováděny na straně.
END 1.Přítelem 2.Druhem 3.Milencem 4.Bratrem 5.Otcem 6.Učitelem 7.Vychovatelem 8.Kuchařem 9.Elektrikářem 10.Instalatérem 11.Mechanikem 12.Návrhářem 13.Stylistou.
Návrh a tvorba WWW Cvičení 4
Přednost početních operací
DĚLENÍ ČÍSLEM 5 HLAVOLAM DOPLŇOVAČKA PROCVIČOVÁNÍ Zpracovala: Mgr. Jana Francová, výukový materiál EU-OP VK-III/2 ICT DUM 50.
XML Schema Irena Mlýnková. Obsah XML – úvod, příklad, základní pojmy DTD – přehled XML Schema – podrobně.
DTD DTD (Document Type Definition) je jinými slovy návod pro prohlížeč zpracovávající dokument. DTD (Document Type Definition) je jinými slovy návod pro.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
ELearning Snímek 1 eLearning Tomáš Kubálek
Jazyk XML Jazyk pro tvorbu strukturovaných dokumentů Syntaxí velmi podobný HTML Hlavní cíle návrhu: Snadná editace - jazyk je textový Snadné strojové zpracování.
Copyright (C) 1999 VEMA počítače a projektování, spol. s r.o.1 Lucián Piller Intranet HR.
XML a metainformační systémy (pro geoinformace) Ing. Jan Růžička Institut ekonomiky a systémů řízení, odd.GIS VŠB-TU Ostrava, HGF tř. 17.listopadu
Tvorba efektních www stránek pro každého Od historie až po současnost… Úvod Porovnání Validace Prohlížeče Závěr.
Vít Profant Obhajoba bakalářské práce
XML eXtensible Markup Language Adolf Knoll Národní knihovna ČR
Jazyk XML v geoinformatice
Petr Šmíd Obsah prezentace Co je to XML ?
Úvod do XML S využitím materiálů z Zdeněk Žabokrtský.
Perzistence XML dat Kamil Toman
Základy XML – struktura dokumentu (včetně testových otázek) Otakar Čerba Oddělení geomatiky Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita.
Inf Webová stránka, princip HTML a CSS. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
XML a datový standard Zdeněk Jirkovec Softwarové Aplikace a systémy.
WWW a HTML Základní pojmy Ivo Peterka.
XML Validace.
Značkovací jazyky Začínáme.
Algoritmizace a datové struktury (14ASD)
Transkript prezentace:

1 PRG036 – Technologie XML Přednáší: Irena Mlýnková Martin Nečaský LS Stránka přednášky: prg036 /

2 Organizace přednášky, cvičení, zkoušky prg036 /

3 Osnova předmětu  Úvod do principů formátu XML, přehled XML technologií, jazyk DTD  Datové modely XML, rozhraní DOM a SAX  Úvod do jazyka XPath  Úvod do jazyka XSLT  XPath 2.0, XSLT 2.0  Úvod do jazyka XML Schema  Pokročilé rysy jazyka XML Schema  Přehled standardních XML formátů  Úvod do jazyka XQuery  Pokročilé rysy jazyka XQuery, XQuery Update  Úvod do XML databází, nativní XML databáze, číslovací schémata, structural join  Relační databáze s XML rozšířením, SQL/XML

4 Úvod do principů formátu XML

5 Motivace Chceme přenést informaci Místo A Místo B

6 Např.: chceme přenést zprávu Jan Amos, Karel Hynek Ahoj! Pozdrav z říše divů! Alenka P.S. Napište mi!

7 Jako „nestrukturovaný“ text? Jan Amos, Karel Hynek Ahoj! Pozdrav z říše divů

8 Jako „nestrukturovaný“ text? Karel Hynek Ahoj! Pozdrav z říše divů! Alenka P

9 Jako „nestrukturovaný“ text? Ahoj! Pozdrav z říše divů! Alenka P.S. Napište

10 Jako „nestrukturovaný“ text? Pozdrav z říše divů! Alenka P.S. Napište mi!

11 Jako „nestrukturovaný“ text? Alenka P.S. Napište mi!

12 Jako „nestrukturovaný“ text? Alenka P.S. Napište mi! Jak ale (automatizovaně) zjistit, kdo nám to vlastně píše?

13 Zavedeme konstrukci „ značka” (tag) tělo Koncová značka – zavírací závorka (end tag) Počáteční značka – otevírací závorka (start tag)

14 Jednotlivé složky zprávy označíme Jan Amos Karel Hynek Ahoj! Pozdrav z říše divů! Alenka Napište mi!

15 A zabalíme do závorek Jan Amos Karel Hynek Ahoj! Pozdrav z říše divů! Alenka Napište mi!

16 Pro zobrazení správného textu prohlížečem to ještě nestačí Jan Amos Karel Hynek Ahoj! Pozdrav z říše divů! Alenka Napište mi!

17 Musí se přidat informace o kódování  Implicitně je dokument v kódu ISO (Unicode)Unicode  P ro komunikaci se světem se používá  UTF-8 K ompatibilní s ASCII D alší znaky kódovány na 2 až 6-ti bytech O bsahuje všechny znaky všech abeced  P ro češtinu lze použít ISO nebo Windows- 1250

18 Lepší, ale stále to ještě není ono – nepopsali jsme způsob zobrazení dokumentu

19 Např. transformujeme do HTML Zpráva od: Alenka Jan Amos Karel Hynek Ahoj! Pozdrav z říše divů! Alenka Napište mi!

20 Prohlížeč teď „ví“ co s daty

21 O co nám jde?  Samotná data se těžko zpracovávají  Potřebujeme: Zajistit aby příslušný program datům rozuměl = doplnit význam jednotlivých částí  Př. HTML – popis vizualizace dat pro HTML prohlížeč Problém 1: Co když nás nezajímá jen vizualizace? Problém 2: HTML má volnou strukturu  Komplikuje zpracování  Řešení: XML

22 XML  XML (eXtensible Markup Language) je formát pro přenos a výměnu obecných dokumentů Extensible Markup Language (XML) 1.0 (Fifth Edition)  XML je podmnožina (aplikace) SGML (Standard Generalized Markup Language - ISO 8879) U možňuj e přenos dokumentu spolu s popisem jeho struktury (syntaxe)  XML se nezabývá způsobem prezentace dokumentů – je to syntaktický nástroj

23 XML dokument  XML dokument je správně formovaný / dobře vytvořený (well-formed), když : Má úvodní XML deklaraci (prolog) J e dobře uzávorkován  Každý element obsahuje počáteční i koncový tag/závorku  Odpovídající závorky mají stejné jméno (case sensitivity)  Dvojice závorek se nekříží  Celý dokument je uzavřen v jediném kořenovém elementu

24 Prolog  Informace pro SW, že se jedná o XML dokument Musí obsahovat deklaraci verze XML  Máme 1.0 a 1.1 Může osahovat informací o kódování a samostatnosti dokumentu  Deklarace verze:  Pokud není v UTF-8:  Pokud je bez odkazů mimo dokument : vždy malá písmena

25 Elementy Jan Amos Severní 12 Ahoj! Pozdrav z říše divů ! Alenka Element s textovým obsahem Prázdný element Element s elementovým obsahem Kořenový element Element se smíšeným obsahem

26 Atributy Jan Amos Severní 12 Ahoj! Pozdrav z říše divů ! Alenka Hodnota atributu Název atributu Element s atributy

27 Další prvky XML dokumentu Jan Amos <![CDATA[ for (i=0; i < 10; $++) { document.writeln(" Ahoj "); } ]]> Alenka Komentář Instrukce pro zpracování Sekce CDATA

28 Jazyk DTD

29 DTD  Problém: Správná strukturovanost nestačí Potřebujeme omezit sadu značek a jejich obsah  Definice typu dokumentu (Document Type Definition – DTD) popisuje strukturu (gramatiku) dokumentu Pomocí regulárních výrazů  Validní XML dokument = správně strukturovaný dokument odpovídající dané gramatice Existují i další jazyky – XML Schema, Schematron, RELAX NG, …

30 Struktura validního dokumentu <!DOCTYPE kořenový-element [... ]>... Deklarace typu dokumentu  Může být interní (gramatika je přímo uvnitř DOCTYPE) nebo externí (pouze odkaz na gramatiku uvedenou v externím souboru) Interní nemá moc význam Obojí současně je přípustné  Lokální deklarace mají přednost před externími

31 Příklad: externí a interní DTD Hello, world! <!DOCTYPE pozdrav [ ]> Hello, world! … PUBLIC "veřejný identifikátor" "URI"

32 Základní značky DTD  D eklarace typu dokumentu  D eklarace typu elementu  D eklarace seznamu atributů  D eklarace entity  D eklarace notace vše velkými písmeny

33 Deklarace typu elementu  Název elementu + deklarace přípustného obsahu Prázdný, libovolný, textový, smíšený, elementový...

34 Deklarace typu elementu  Prázdný obsah  Libovolný obsah  Textový obsah  Smíšený obsah  Elementový obsah,… sekvence |… selekce ?… iterace (0 nebo 1) + … iterace (1 a více) *… iterace (0 a více) (nazev, (autor|editor)?, p*, (nadpis,p+)*)

35 Deklarace atributu  A tributy elementu osoba  A tribut cislo je unikátní identifikace ( ID ) a je povinný ( #REQUIRED )  A tribut zamestnan obsahuje text ( CDATA ), je konstantní ( #FIXED ) a má implicitní neměnnou hodnotu ( ano )  A tribut typ je výčet ( ano nebo ne ), implicitní hodnota je ne <!ATTLIST osoba cislo ID #REQUIRED zamestnan CDATA #FIXED "ano" dovolena (ano|ne) "ne"> Pořadí v dokumentu je libovolné

36 Datové typy atributů  CDATA – libovolný řetězec znaků  V ýčtový typ  ID – jednoznačný identifikátor (v rámci dokumentu), musí to být řetězec písmen, cifer a znaků „-“, „_“, „:“, „.“, nejlépe v ASCII, musí začínat písmenem, nebo znakem „_“  IDREF – odkaz na ID jiného elementu v rámci dokumentu  IDREFS – seznam odkazů oddělených mezerami  NMTOKEN – hodnota, tj. řetězec podobný jako ID, který ale může začínat cifrou a není jednoznačný  NMTOKENS – hodnoty  ENTITY – odkaz na externí entit u  ENTIT IES – seznam odkazů viz dále

37 Požadavky na hodnoty atributů  #REQUIRED – povinný atribut  #IMPLIED – nepovinný atribut  #FIXED – pevná hodnota atributu

38 Deklarace entity  Prakticky se využívají pouze triviální případy  Asociace názvu a hodnoty, kterou lze opakovaně využívat  Dělení 1: Parsované = text, kterým je nahrazen odkaz na entitu a stává se součástí XML dokumentu  Odkazujeme referencemi Neparsované = zdroj, jehož obsahem může být cokoli (např. binární data)  Odkazujeme atributem typu ENTITY/ENTITIES  Musí s ní asociována notace  Dělení 2: Obecné – v XML dokumentech Parametrické – v DTD  Dělení 3: Interní vs. externí viz dále

39  Možnost vložení libovolného znaku s daným kódem Hexadecimální nebo decimální  Předdefinované entity pro speciální znaky Znakové entity &… amp < … lt >… gt ‘… apos “… quot Vyřešte nerovnost 3x < 5 Vyřešte nerovnost 3x < 5

40  Interní entita Použití: Opakující se části XML dokumentů Obecné entity Současný stav dokumentu je &stav;  Externí parsovaná entita Použití: Modularizace XML dokumentů

41  Externí neparsovaná entita Použití: Odkaz na ne-XML data Obecné entity <!DOCTYPE zprava [ <!NOTATION avi SYSTEM "C:/Program Files/Video Player/Player.exe"> ]> Přikládám video z dovolené. Deklarace notace nebo PUBLIC

42 Parametrické entity  Interní entita P oužití: Opakující se části DTD <!ENTITY % atributy "barva (modra|bila|cerna) #REQUIRED rychlost (velka|mala) #IMPLIED" >

43 Parametrické entity  Externí entita Použití: Modularizace DTD... %ISOLat2;...

44 Podmíněné sekce <![%draft;[ ]]> <![%final;[ ]]>

45 DTD – větší příklad

46 Přehled XML technologií

47 Technologie XML  XML = eXtensible Markup Language  Technologie XML = sada souvisejících technologií Rozhraní pro práci s XML daty – DOM, SAX Popis struktury XML dokumentů – DTD, XML Schema Dotazováni nad XML daty – XPath, XQuery Aktualizace XML dat – XQuery Update Transformace XML dat – XSLT

48 Související problematika  Standardní XML formáty XHTML, OpenOffice, MathML, SVG, …  Persistence XML dat Nativní XML databáze Relační databáze s XML SQL/XML

49 Konec