Metody ukládání časoprostorových dat pro multirelační dolování Martin Večeřa Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita Brno.

Slides:



Advertisements
Podobné prezentace
Číslo DUM: VY_32_INOVACE_04_01 Autor: Mgr. Ivana Matyášková
Advertisements

Přednáška č. 1 Úvod, Historie zpracování dat, Základní pojmy
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
SAS Jan Blaťák Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita, Brno
Úvod Formát SVG Aplikace sSVGui Ukázka aplikace Závěr.
Průvodce pro prostorové dotazy v systému PostGIS (plugin pro OpenJUMP) Vedoucí: Ing. Jan Růžička.Ph.D. Konzultant: Ing. Aleš Daněk Diplomová práce.
YELLOWTONSKÝ NÁRODNÍ PARK Interaktivní webová mapa ve formátu SVG Zdeněk HYNEK, Masarykova univerzita
Analytické nástroje GIS
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
SQL Lukáš Masopust Historie  Předchůdcem databází byly papírové kartotéky  děrný štítek  1959 konference  1960 – vytvořen jazyk COBOL.
Grafické formáty.
Open source GIS Přehled GIS nástrojů s otevřeným zdrojovým kódem Ing. Jiří Fejfar, Ph.D.
Uložení a analýza bodového mračna bodů v Oracle Spatial Fakulta aplikovaných věd / Katedra matematiky Západočeská univerzita v Plzni Bc. Michal.
Relační databáze.
Metainformační systém založený na XML Autor: Josef Mikloš Vedoucí práce: Ing. Jan Růžička, Ph.D. V/2004.
Metadata a metainformační systémy (seminář)
Architektury a techniky DS Cvičení č. 9 RNDr. David Žák, Ph.D. Fakulta elektrotechniky a informatiky
Srovnání standardů CEN, FGDC a ISO pro metadata Ing. Jan Růžička Institut ekonomiky a systémů řízení, odd.GIS VŠB-TU Ostrava, HGF tř. 17.listopadu
Geoinformační technologie Geografické informační systémy (GIS) Výukový materiál pro gymnázia a ostatní střední školy © Gymnázium, Praha 6, Nad Alejí 1952.
Ukládání heterogenních dat pomocí rozvolněných objektů Michal Žemlička.
Výkresové soubory Přednáška č.6. Témata přednášky Typy výkresových souborů –*.dwt, *.dwc, *.dwg, *.dxf DXF formát Ochrana souborů před poškozením Export.
doc. RNDr. František STANĚK, Ph.D.
Databázové modelování
Technické řešení Mapových služeb Portálu veřejné správy Jiří Kvapil.
Vektorová grafika.
FLASH. O čem to bude? Co je to Flash Co umí Flash – příklady Prostředí Macromedia FlashMX Nástroje a kreslení, vrstvy (Layers) Práce se symboly – Button,
Název akce: Seminář softskills pro oblast VaV a spolupráce (inovační management) Datum a místo konání: Prezentující: Bc. Filip Valder Téma:
MAPOVÝ SERVER PRO MĚSTO VAMBERK Vedoucí práce: Ing. Jan Růžička Ph.D. Řešitel: Jaroslav Poláček.
YELLOWTONSKÝ NÁRODNÍ PARK Interaktivní webová mapa ve formátu SVG Zdeněk HYNEK, Masarykova univerzita
GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY
InstantAtlas dynamické webové interaktivní atlasy.
Datový sklad pro DOPRAVOPROJEKT, s.r.o.
Geografické informační systémy. Digitální mapy Rastrové obrázky (například Vektorové obrázky Geografické databáze.
AVT - projekt Tvorba rozhraní pro WMS server. GIS informační systém pro získávání, ukládání, analýzu a vizualizaci prostorových dat součásti: – Hardware.
Prostorové dotazy.
INFORMATIKA 7 Jak má vypadat textový dokument III2 - I7- 16.
Vícerozměrný přístup pro indexování XML dat
1 Mapy s dopravními informacemi pro WAP Bc. Aleš Daněk – G269 Vedoucí projektu Ing. Jan Růžička Ph.D. Zadavatel firma CAD programy – Ing. Jan Vlčinský.
Geografické informační systémy. Digitální mapy Rastrové obrázky (například Vektorové obrázky Geografické databáze.
Lišta nástrojů Standard otevření, uložení a další manipulace se soubory (tj. projekty) načítání dat (mapových vrstev) „žluté plus“ změna měřítka odkaz.
Kartografie v ArcGIS.
Analýza možností SŘBD PostgreSQL / PostGIS pro vytvoření datového skladu v prostředí GIS Jaromír Kamler Vedoucí: Antonín Orlík.
Lišta nástrojů Standard otevření, uložení a další manipulace se soubory (tj. projekty) načítání dat (mapových vrstev) „žluté plus“ odkaz na další lišty.
Prezentace diplomové práce
Open Source GIS: Transformace mezi jednotlivými
Jan Růžička, Leden /01/05 Proč pro prezentaci prostorových dat využívat nástrojů WWW Nízké náklady na vybavení klientského počítače Snadné zvýšení.
Tvorba metainformačního systému pro prostorová data s využitím Internetových technologií Zpracovatel: Tomáš Duchoslav Vedoucí: Dr. Ing. Bronislava Horáková.
Návrh a implementace algoritmů pro údržbu,
GIS prostoru haldy a.s. NH Ostrava
Webové služby Cíl  Popis základního konceptu technologie webových služeb.
Geografické informační systémy. Digitální mapy Rastrové obrázky (například Vektorové obrázky Geografické databáze.
Publikujeme s Autodesk MapGuide v.5.0 Ing. Jan Růžička, Dr. Ing. Jiří Horák VŠB-Technická univerzita Ostrava
Úvod do PostGIS Jan Ježek.
Databázové systémy Úvod, Základní pojmy. Úvod S rozvojem lidského poznání roste prudce množství informací. Jsou kladeny vysoké požadavky na ukládání,
Geografické informační systémy pojetí, definice, součásti
Klient pro správu databází MySQL 1 Klient pro správu databází MySQL Zbyněk Munzar České vysoké učení technické v Praze Fakulta elektrotechnická.
Pit – CAD Podporované platformy  AutoCAD  AutoCAD Architecture  AutoCAD MEP  Pro verze 2015 & /64bit  BricsCAD V15 32/64bit.
GIS – základní pojmy. Geomatika aplikace metod pro řešení specifických problémů s důrazem na geografickou polohu objektů někdy je rozšířena na společný.
ORSOFT RADNICE OPEN – ÚVODNÍ SEZNÁMENÍ Petra Hoffmanová.
České vysoké učení technické v Praze Fakulta dopravní Ústav dopravní telematiky Geografické informační systémy Doc. Ing. Pavel Hrubeš, Ph.D.
Geografické informační systémy. Atributová tabulka Otevření atributové tabulky Řádky v tabulce = jednotlivé záznamy (objekty) Sloupce v tabulce = atributy.
Kapitola 5: Úvod do analytických technologií Webu Vítězslav Šimon (SIM0047) Adaptivní webové systémy (AWS)
Databáze MS ACCESS 2010.
Interoperabilita Interoperabilita na úrovni dat
Geografické informační systémy
Výpočetní technika Akademický rok 2008/2009 Letní semestr
Elektronické informační zdroje (VIKBA25)
Geografické informační systémy
Geografické informační systémy
Geografické informační systémy
Transkript prezentace:

Metody ukládání časoprostorových dat pro multirelační dolování Martin Večeřa Laboratoř vyhledávání znalostí Fakulta informatiky Masarykova Univerzita Brno

2 Časoprostorová data ● zachycení části 2D/3D prostoru s odkazem na časový údaj ● spektrální – jediný časový okamžik (př. druh porostu) ● enviromentální data – dlouhodobý souhrn (př. srážky) ● rastrová vs. vektorová ● vše je možné kombinovat

3 Prostorová složka dat ● geometrická primitiva – bod, čára – množina bodů, lomená čára – polygon, množina lomených čar – množina polygonů – množina geometrických objektů ● souřadnicový systém (S-JTSK, WGS84...) ● doplňující vlastnosti objektů – místní název, plocha, druh...

4 Časová složka dat ● odkaz z prostorového objektu na časový okamžik/období ● čas uložen jako další dimenze – obtížně řešitelné, stávající systémy nepřipraveny ● čas uložen jako doplňující vlastnost objektu – objekt měnící se v čase se překrývá – při výběru nutné zvolit jen daný časový úsek t

5 Multirelační dolování ● klasické dolovácí algoritmy – data v jedné tabulce ● multirelační dolování – více objektů různých typů – vztahy mezi objekty – řešení: více tabulek ● ILP – predikátová logika prvního řádu – ~ přirozený jazyk pro vyjádření faktů a vztahů

6 Predikátová logika – příklad obec('Cikháj', 49°38'44.798"N, 15°57'58.339"E). obec('Světnov', 49°37'11.384"N, 15°57'14.624"E). silnice(350, [[12, 3], [14, 8], [13, 11], [18, 12],..., [37, 63]]). obec_na_silnici('Cikháj', 350). obec_na_silnici('Světnov', 350). vzdálenost_po_silnici(Silnice, Obec 1, Obec 2, Vzdálenost) :- obec(Obec 1, Poz 1 ), obec(Obec 2, Poz 2 ), obec_na_silnici(Obec 1, Silnice), obec_na_silnici(Obec 2, Silnice), silnice(Silnice, Geom), délka_od_do(Vzdálenost, Poz 1, Poz 2, Geom).

7 Datové formáty ● požadujeme – snadnou úprava dat – možnost ukládání doprovodných informací – geometrické funkce (průnik, posun, vzdálenost) – podporu různých souřadnicových systémů – export do predikátové logiky ● GML, KML, SpatialML, TimeML ● SDTS, DGN, DWG, ESRI Shapefile ● Oracle Spatial, PostGIS

8 Datové formáty nad XML ● XML je moderní, hezké, všem se líbí ● Geography Markup Language (GML) – Open Geospatial Consorcium – libovolná geografická data – reference, rozšiřující atributy – obtížně zpracovatelné (je to „jen“ textový soubor) <gml:LineString gml:id="p21" srsName="urn:ogc:def:crs:EPSG:6.6:4326"> 45.67, ,89.44

9 Datové formáty nad XML ● Keyhole Markup Language (KML) – Google Maps & Earth – jazyk pro vizualizaci geografických objektů (~HTML) – úzké zaměření (např. podpora jen WGS84) Roll over this icon 0 #exampleStyleMap ,37.422,0 stars.png

10 Datové formáty nad XML ● SpatialML + TimeML – značkování částí textu nesoucích prostorovou nebo časovou informaci – možnost propojení s GML a KML – referenece na objekty v databázi – vhodné spíše pro dolování v textech I visited many trattorias in [Rome], [Italy] Rome Italy

11 Datové formáty pro soubory ● Spatial Data Transfer Standard (SDTS) – vyvinut za účelem sjednotit formáty (~2001) – podpora od ESRI a omezeného množství SW ● DGN, DWG – další více či méně rozšířené formáty – v 99% existuje možnost exportu do Shapefile

12 Datové formáty pro soubory ● ESRI 1 Shapefile – well-known text/binary format (WKT, WKB) – víceméně otevřená specifikace – velmi populární, řada nástrojů, časem prověřený – nově také podpora 3D dat – jen jedna vrstva – několik souborů, doprovodné atributy – snadná konverze – import do PostGISu ● nevýhoda – soubory spolu nejsou v relaci 1) Environmental Systems Research Institute

13 Datové formáty pro databáze ● Oracle Spatial – Oracle nemůže zůstat mimo – pro nekomerční použití zdarma (omezení velikosti) – kanón na vrabce ● PostGIS – rozšíření PostgreSQL – open source řešení – DB vhodná i pro produkční prostředí – podpora knihoven pro práci s geometrií

14 PostGIS ● nativní podpora ESRI Shapefile (WKT, WKB) ● extended WKT/WKB (3D) ● možnost sloučit různé souřadnicové systémy – i uživatelsky definované ● všechna základní geometrická primitiva ● snadné úpravy v QuantumGIS ● inteligentní indexace dat

15 PostGIS v PostgreSQL ● veškerá funkcionalita PostgreSQL zachována ● nový datový typ GEOMETRY ● nové operátory – && průnik kompletně obsažen ● nové funkce – Distance, Area, Intersection ● nový typ indexu GiST ● nové tabulky – geometry_columns, spatial_ref_sys

16 ● snadný export pomocí textové reprezentace: SELECT id, jmeno, AsText(geom) FROM body; id | jmeno | astext | Bod c. 1 | POINT( ) ● najdi mi všechny hospody, ze kterých to není do nemocnice dále než 250m: SELECT h.name, p.name FROM hospitals h, pubs p WHERE Distance(h.the_geom, p.the_geom) < 250; PostGIS – příklad

17 Závěr ● hlavní zájem o multirelační dolování ve vektorových časoprostorových datech ● textový popis dat a nehomogenní soustava souborů skýtá řadu problémů a rizik ● v databázích se data snadno udržují a zpracovávají ● máme rádí snadná, ale účinná řešení ● máme rádi open source ● PostGIS hravě poráží své soupeře

18 Děkuji za pozornost.