Perzistence XML dat Kamil Toman

Slides:



Advertisements
Podobné prezentace
OZD: Hašování RNDr. Michal Žemlička.
Advertisements

Zpracování SQL Lubomír Andrle 5. přednáška
Základy databázových systémů
Serialization (převod) Úvod 1 SGML W3C HTML 1.x. HTML4.0 xHTML 1.0. xHTML 2.x HTML 5 (xHTML 5) HTML 4.0 xml (xHTML 1.0) xHTML je dobřé zformovaný (well-formed)
Aplikační a programové vybavení
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Semestrální práce KIV/PT Martin Kales Hana Hůlová.
Architektury a techniky DS Tvorba efektivních příkazů I Přednáška č. 3 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
PRÉCIS OD NESTRUKTUROVANÝCH KLÍČOVÝCH SLOV JAKO DOTAZŮ K STRUKTUROVANÝM DATABÁZÍM JAKO ODPOVĚDÍM Martin Lacina.
ADT Strom.
Úvod do databází Databáze.
Martin Kirschbaum 4.A,  určitá uspořádaná množina informací (dat) uložená na paměťovém médiu  Databázový program - umožňuje tvořit, editovat,
1IT Relační datový model
Databáze Jiří Kalousek.
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
1IT S ÍŤOVÝ DATOVÝ MODEL Ing. Jiří Šilhán. S ÍŤOVÝ DATOVÝ MODEL Je historicky nejstarším datovým modelem. Jeho základem jsou vzájemně propojené množiny.
D ATOVÉ MODELY Ing. Jiří Šilhán. D ATABÁZOVÉ SYSTÉMY Patří vedle textových editorů a tabulkových kalkulátorů k nejrozšířenějším představitelům programového.
DATOVÉ MODELY (c) Tralvex Yeap. All Rights Reserved.
Základy informatiky část 5. 5 Databáze Databáze – historie Nejprve děrné štítky Hollerith – sčítání lidu USA Univac Zdroj: Wikipedia.
Uložení a analýza bodového mračna bodů v Oracle Spatial Fakulta aplikovaných věd / Katedra matematiky Západočeská univerzita v Plzni Bc. Michal.
Sémantická analýza Jakub Yaghob
Relační databáze.
Základy informatiky část 5
Databázové systémy. Práce s daty Ukládání dat Aktualizace dat Vyhledávání dat Třídění dat Výpočty a agregace.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Databázové systémy II Přednáška č. X Ing. Tomáš Váňa, Ing. Jiří Zechmeister Fakulta elektrotechniky a informatiky
XML Schema Irena Mlýnková. Obsah XML – úvod, příklad, základní pojmy DTD – přehled XML Schema – podrobně.
Datové typy a struktury
Jazyk XML Jazyk pro tvorbu strukturovaných dokumentů Syntaxí velmi podobný HTML Hlavní cíle návrhu: Snadná editace - jazyk je textový Snadné strojové zpracování.
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Databáze.
Aplikační a programové vybavení
Ukládání heterogenních dat pomocí rozvolněných objektů Michal Žemlička.
uložené procedury (stored procedures) triggery, sekvence, pohledy, funkce, parametrické dotazy (prepared statements) komplexní agregace a SQL dotazy jiné.
DATABÁZOVÉ SYSTÉMY. 2 DATABÁZOVÝ SYSTÉM SYSTÉM ŘÍZENÍ BÁZE DAT (SŘBD) PROGRAM KTERÝ ORGANIZUJE A UDRŽUJE NASHROMÁŽDĚNÉ INFORMACE DATABÁZOVÁ APLIKACE PROGRAM.
Databázové modelování
Využití XML v DB aplikacích Michal Kopecký Výběr ze slajdů k 7. přednášce předmětu Databázové Aplikace (DBI026) na MFF UK.
RDF a RQL Roman Krejčík. RDF a RQL RDF – Resource Description Framework –Jazyk pro ukládání informací v XML –RDF Schema RQL – RDF Query Language –Dotazování.
Databázové systémy Informatika pro ekonomy, př. 18.
XQuery Dotazovací jazyk XML Daniel Privalenkov. O čem bude prezentace Nutnost dotazovacího jazyku v XML Rychlý přehled XQuery Několik příkladů.
Union & Find Dáno N objektů rozdělených do disjunktních množin. Úlohy: 1.Zjistěte, zda 2 objekty jsou ve stejné množině 2.Spojte 2 množiny Dotazů i objektů.
Infrastruktura pro dotazování nad sémantickými daty Jiří Dokulil, Jakub Yaghob, Filip Zavoral Katedra softwarového inženýrství, MFF UK Praha
XML data na disku jako databáze Kamil Toman
Aplikační a programové vybavení
Databázové systémy Přednáška č. 5 Datové typy a Fyzická organizace dat.
DBXplorer Systém pro vyhledávání nad relačními databází podle klíčových slov. zpracovala Margarita Vishnyakova.
Vícerozměrný přístup pro indexování XML dat
Prostorové datové struktury
Databázové systémy Datové modely.
Ověření Možnosti Využití Jazyka XML a Formátu SVG Pro Potřeby Metainformačního Systému CAGI Zpracovatel:tomáš duchoslav Vedoucí: ing. Jan růžička.
Úvod do XML S využitím materiálů z Zdeněk Žabokrtský.
Geografické informační systémy pojetí, definice, součásti
DATABÁZE.
Objektově relační mapování - ORM. Obsah Co je to ORM Využití ORM Dědičnost –jednoduchý příklad –metody jak dědičnost popsat pomocí relační databáze Vztahy.
● Databaze je soubor dat,slouží pro popis reálného světa(např.evidence čkolní knihovny..) ● Relační databaze je databáze založená na relačním modelu.
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
Databáze ● úložiště dat s definovaným přístupem ● typy struktury – strom, sekvence, tabulka ● sestává z uspořádaných záznamů ● databáze – struktura – záznam.
Databázové systémy Roman Danel Institut ekonomiky a systémů řízení 2016.
XML a datový standard Zdeněk Jirkovec Softwarové Aplikace a systémy.
Datové typy MS Access (3). Projekt: CZ.1.07/1.5.00/ OAJL - inovace výuky Příjemce: Obchodní akademie, odborná škola a praktická škola pro tělesně.
Databáze MS ACCESS 2010.
Ukládání dat biodiverzity a jejich vizualizace
Geografické informační systémy
Databázové systémy a SQL
Šablonování a indexování
Geografické informační systémy
Relační model databáze
Databázové systémy a SQL
Transkript prezentace:

Perzistence XML dat Kamil Toman

Základní možnosti uložení ● Uložení v systému souborů ● Uložení v relační databázi ● Uložení v objektově orientovaném systému ● Uložení v objektově-relačním databázovém systému ● Nativní XML úložiště

Uložení v systému souborů ● Uložení XML v textové formě do souboru na disku ● Při nahrání se konstruují DOM stromy ● Nevýhody: – Nutnost držet celý dokument v paměti v průběhu zpracování – Nutnost analyzovat celý text

Uložení v systému souborů (2) ● Vylepšení: index pozic značek (pozice otce, značka) -> (pozice syna) (pozice syna) -> (pozice otce) ● Stačí analyzovat jen tu část dokumentu, kterou se prochází při vyhodnocení ● Není třeba držet v paměti všechno ● Faktická nemožnost aktualizace ● Zbytečně složité

Uložení v relační databázi ● Dnes spíše využití relačních databázi pro uložení XML, dotazování bývá řešeno SQL nebo překladem dotazů do SQL ● Obvyklé je také ukládání XML jako BLOB objektů

Uložení v relační databázi (2) ● Příklad: ● Novák AIL010 AIL020 Dvořák

Uložení v relační databázi (3)

Uložení v relační databázi (4) ● Uložení hran stromu – Id uzlu získané preorder průchodem – Hrana: pětice (výchozí ID, cílové ID, značka, pořadí, vložený obsah) ● Elementy se smíšeným obsahem jsou modelovány jako stromy s více textovými elementy ● Nula ve sloupci cílového ID značí, že uzel je atribut ● Doporučuje se index: (značka, data), (výchozí ID, ordinál), (ID cíle)

Uložení v RDBS – reprezentace hran

Uložení v relační databázi (5) ● Uložení pomocí hran je poměrně neúporné ● Možnost zrušení sloupce se značkou a rozdělení do více relačních tabulek – Zbavíme se tím ale možnosti ukládat libovolná XML data – Se stovkami relačních tabulek se RDBMS hůře vypořádá

Uložení v relační databázi (6) ● Odvození schématu z DTD

Uložení v relační databázi (7) ● Tabulky se generují od kořene DTD ● Každé n-tici je přiřazen unikátní identifikátor a vyplněn sloupec identifikující rodičovský element ● Elementy bez vícenásobného výskytu jsou vloženy přímo jako další sloupce do tabulky rodičovského elementu

Uložení v relační databázi (8)

Uložení v relační databázi (9) ● Problém: zkoumání vztah předek-potomek – Mnoho operací join – Problém s dokumenty s cyklickým DTD – hluboké hnízdění SQL dotazů, případně potřeba nějakého (např. procedurálního) rozšíření dotazovacího jazyka ● Netriviální převod XQuery -> SQL

Uložení v objektově-relační databázi ● Využívá ADT, abstraktní datové typy ● Obvykle je vyžadováno DTD ● Podobné strukturálnímu uložení do RDBMS

Uložení v objektově-relační databázi ● Podobné uložení do RDBMS ● Problém s rekurzivními strukturami, smíšenými elementy, problematické složitější modelové skupiny DTD

Nativní uložení ● Zcela přizpůsobeno stromové struktuře XML dat ● Výhody – Rychlost, flexibilita – Snadné a efektivní XML dotazování ● Nevýhody – Nutnost vybudování zcela nových datových struktur a metod pro vyhodnocení dotazů