Autor : Marián Marcinčák Geodatabáza Marek Doršic, ArcGEO (marek.dorsic@arcgeo.sk) FMFI UK, 15.11.2011 Moderné informačné technológie Autor : Marián Marcinčák FMFI UK, Bratislava
Čo je geodatabáza? Objektovo-relačný dátový model obsahujúci geografické informácie Personálna geodatabáza Viacužívateľská geodatabáza vs. File Based geographic data: shapefile, coverage, grid, TIN, images, CAD files, tables, ...
Základné formáty geodatabáza coverage shapefile CAD features tabuľky TIN rastre vrstvy mapové dokumenty XML (exporty, metadáta)
Geodatabázy - porovnanie personálna MS Jet Engine (Access) single-user editing max. veľkosť 2 GB bez verzionovania Viacužívateľská Oracle (aj Spatial), SQL Server, DB2, Informix multi-user editing verzionovanie neobmedzená veľkosť, DBMS nástroje a konfigurácia C/Java API
Vektorové dáta (1)
Vektorové dáta (2)
Rastrové dáta
Typy údajov v GDB
Štruktúra údajov v ArcSDE GDB (1) ArcSDE – nadstavba nad relačným DBMS firmy Esri ukladajú sa do DBMS využitím dátových typov DBMS ArcSDE len využíva schopnosti DMBS (nenahrádza ich) Všetky údaje v DBMS sú uložené v tabuľkách obsahujúcich riadky a stĺpce, navzájom poprepájaných pomocou primárnych a cudzích kľúčov. dopyty na tabuľky cez SQL ArcSDE rozširuje možnosti SQL o prácu práve s priestorovými prvkami
Trieda prvkov (feature class) obsahuje geometrie vektorových geografických prvkov jedného typu (bod, čiara, plocha) doplnené o atribútové informácie v tabuľke (napr. názov obce)
Trieda prvkov – uloženie v ArcSDE (1) prvky sa ukladajú do: business tabuľky – obsahuje atribútové informácie rozšírené o priestorový stĺpec (cudzí kľúč k F tabuľke) F tabuľka (feature) – ukladá geometriu prvkov doplnenú o dodatočné informácie (dĺžka, plocha, typ, obálka) S tabuľka (spatial index) – ukladá priestorové indexy (vo forme mriežky) pre verzionované triedy naviac: A tabuľka (add) - pridané prvky D tabuľka (delete) – zmazané prvky
Trieda prvkov – uloženie v ArcSDE (2)
Možnosti ukladania geometrie
Priestorový index urýchľuje prístup k priestorovým údajom urýchľuje priestorové dotazy Contains, Crosses, Intersects, Overlaps, Touches, Within... realizácia pomocou Grid (Oracle, DB2) R-strom (IBM Informix, PostgreSQL) B-strom (MS SQL) – s pomocou hierarchického uniformného dekomponovania priestoru Podobné k indexu v mapách a atlasoch
R-strom založený na minimálnom ohraničujúcom obdĺžniku obdĺžniky sa môžu prekrývať podobný B-stromu balansovaný každý list obsahuje medzi m a M (m≤M/2) indexových záznamov ... tvar závisí od poradia vkladania/mazania objektov rozšírenia R*-strom, R+-strom, Hilbertov R-strom
Grid delí priestor do mriežky zväčša viacúrovňový (1, 2, 3) zachovávajúcej uhly (konštantná uhlová veľkosť) zachovávajúcej plochu zväčša viacúrovňový (1, 2, 3) každá úroveň má definovanú veľkosť gridu povinná prvá úroveň má najmenšiu ďalšie úrovne aspoň 3x väčšie prvok je uložený do úrovne, v ktorej neprekrýva viac ako 4 bunky
Určenie veľkosti gridu veľkosť má vplyv na veľkosť tabuľky a teda výkon nutné zvážiť počet úrovní optimizátor prechádza každú úroveň častokrát jedna úroveň je najlepšia pre bodové triedy prvkov stačí jedna úroveň s relatívne riedkou mriežkou priestorové dotazy pracujú rýchlejšie na bodoch veľkosť treba určovať podľa typu aplikácie dobrý začiatok je 3x priemerná veľkosť rozsahu jednotlivých prvkov automatické nástroje
Atribútové domény (1) Pravidlá na definíciu povolených hodnôt atribútov Intervalová doména (range domain) špecifikuje platný rozsah hodnôt pre číselný atribút Kódová doména (coded value domain) špecifikuje sadu platných hodnôt atribútov aj s ich popisom (ktorý je možné zobraziť miesto hodnôt/kódov)
Atribútové domény (2) Možnosť validovať správnosť zadaných hodnôt Možnosť kontrolovať správanie atribútov s doménou pri spájaní alebo rozdeľovaní prvku merge policy – default value, sum values, geometry weighted split policy – default value, duplicate, geometry ratio
Topológia model na popis vzťahov medzi prvkami topologické pravidlá ranks (váhy) cluster tolerance dirty areas validácia – označenie výnimiek, oprava len triedy prvkov vo feature datasete
Topologické pravidlá
Topológia - Cluster Tolerance
Topológia - Ranks
Topológia - Dirty areas vznikajú pri: vytváraní alebo mazaní prvku pri modifikácii geometrie prvku ak sa zmení subtyp prvku keď sa porovnávajú a spájajú (reconcile) dve verzie geodatabázy pri zmenách vlastností topológie fyzicky sa ukladajú
Topológia - Chyby a výnimky fyzicky sa ukladajú
Geometrická sieť (1) poskytuje možnosť sieťových analýz zabezpečuje líniovú topológiu umožňuje definovať typy prvkov, ktoré sa môžu navzájom spájať sieť uzlov (junctions) a hrán (edges)
Geometrická sieť (2) 2 pohľady na sieť
Geometrická sieť (3) jednoduché sieťové prvky komplexné sieťové prvky
Geometrická sieť - váhy váhy určujú náklady spojené s pohybom cez element logickej siete môžu byť počítané počíta sa podľa atribútu prvku (napr. dĺžka) sieťové analýzy využívajú váhy napr. na vyhľadanie najkratšej cesty (Find Path)
Geometrická sieť - prvky source (zdroj), sink (výpust) – určujú tok stav prvkov v logickej sieti: aktívny, blokovaný pri vytváraní bariér sú prvky nastavené na blokovaný
Geometrická sieť – sieťové analýzy Trace Downstream – hľadá v smere toku Trace Upstream - hľadá proti smeru toku Find Common Ancestors – nájde spoločných predkov Find Connected – nájde elementy spojené s flagom Find Loops – nájde slučky spojené s flagom Find Upstream Accumulation - nájde elementy proti smeru od flagu a stanoví celkové náklady Find Path – cesta medzi flagmi s najmenšou váhou (ak nie je definovaná, najmenší počet elementov)
Anotácie (1) geograficky umiestnený grafický objekt – najčastejšie text (obdĺžnik, šípka, ...) na rozdiel od popisu má fyzickú reprezentáciu non-feature linked annotation nie je asociovaná s prvkami GDB (názov pohoria, ...) feature linked annotation zviazaná so špecifickým prvkom v inej triede prvkov kompozitná relácia s prvkom – anotácia je cieľová trieda (vytvorená/zmazaná s prvkom, aktualizovaný text)
Anotácie (2)
Raster Raster reprezentuje geografické javy nie pomocou vektorov, ale pomocou pravidelnej siete buniek, pričom bunky môžu obsahovať atribútovú informáciu. Raster dataset Raster catalog – spojená množina rastrov
Rastre - pyramídovanie Na rýchlejšie zobrazenie dát Každá vrstva predstavuje istý stupeň resamplovania najspodnejšia má najlepšie rozlíšenie viacero možnosti resamplovania algoritmov (nearest neighbour, bilineárna interpolácia, cubic convolution)
Rastre – nastavenia (1) Veľkosť dlaždice (tile size) Kompresia počet pixelov uložených v každom BLOB poli (def. je 128x128) Kompresia voliteľná, odporúčaná zvyšuje rýchlosť zobrazovania rastrov metódy kompresie: žiadna, LZ77, JPEG Veľkosť dlaždice (tile size) Veľkosť dlaždice kontroluje počet pixelov ktoré chce užívateľ uložiť v každom BLOB poli. to je definované ako počet pixelov v smere x a v smere y. Východzia (default) hodnota je 128x128, čo je vhodné vo viacerých prípadoch. Malá veľkosť dlaždice (100x100) môže spôsobiť väčší počet záznamov v databázových tabuľkách čo môže spomaliť prehliadanie. Príliš veľká hodnota (300x300) bude viacej zaťažovať pamäť hoci bude menej záznamov v databáze. Preto by si mal užívateľ aj pokusne vyskúšať pre neho ideálnu veľkosť dlaždice. Kompresia Kompresia rastrov je voliteľná, teda nemusíte ju použiť, ale odporúča sa Využitie kopmresie spočíva v zmenšení kapacity rastra, čo sa priaznivo prejavuje v rýchlosti zobrazovania rastrových údajov. Kompresné metódy Žiadna LZ77 – je to bezstratová kompresia, t.j. jedinečné hodnoty rastra sa môžu obnoviť, obdobne ako je to pri súborovej ZIP kompresii. JPEG – s vysokým kompresným pomerom, nie je bezstratová, čo značí, že hodnoty jednotlivých buniek rastra sa môžu zľahka meniť. Užívateľ si môže stanoviť hodnotu kompresie od 5 do 95, pričom 95 predstavuje najvyššiu kvalitu. Mozaikovanie Mozaikovanie (resp.pridávanie rastra k už existujúcemu) vytvára jeden bezošvý raster. Prekryvové časti sú riešené tak, že sa dotyčná časť nahradí novým rastrom t.j. nevykonáva sa žiadny edge-matching (k dispozícii iba v ArcGIS Desktop). Štatistika ArcSDE môže uchovať vo svojich tabuľkách aj informáciu o štatistike pásma (RGB) ako aj histogram. Vytvorenie štatistiky takmer vždy značne zrýchľuje zobrazovanie rastrovej vrstvy v aplikáciách.
Rastre – nastavenia (2) Mozaikovanie Štatistika Vytvára jeden bezošvý raster, pričom prekryvové časti sú riešené tak, že sa dotyčná časť nahradí novým rastrom Štatistika ArcSDE môže uchovať vo svojich tabuľkách aj informáciu o štatistike pásma (RGB) ako aj histogram. Vytvorenie štatistiky takmer vždy značne zrýchľuje zobrazovanie rastrovej vrstvy v aplikáciách Veľkosť dlaždice (tile size) Veľkosť dlaždice kontroluje počet pixelov ktoré chce užívateľ uložiť v každom BLOB poli. to je definované ako počet pixelov v smere x a v smere y. Východzia (default) hodnota je 128x128, čo je vhodné vo viacerých prípadoch. Malá veľkosť dlaždice (100x100) môže spôsobiť väčší počet záznamov v databázových tabuľkách čo môže spomaliť prehliadanie. Príliš veľká hodnota (300x300) bude viacej zaťažovať pamäť hoci bude menej záznamov v databáze. Preto by si mal užívateľ aj pokusne vyskúšať pre neho ideálnu veľkosť dlaždice. Kompresia Kompresia rastrov je voliteľná, teda nemusíte ju použiť, ale odporúča sa Využitie kopmresie spočíva v zmenšení kapacity rastra, čo sa priaznivo prejavuje v rýchlosti zobrazovania rastrových údajov. Kompresné metódy Žiadna LZ77 – je to bezstratová kompresia, t.j. jedinečné hodnoty rastra sa môžu obnoviť, obdobne ako je to pri súborovej ZIP kompresii. JPEG – s vysokým kompresným pomerom, nie je bezstratová, čo značí, že hodnoty jednotlivých buniek rastra sa môžu zľahka meniť. Užívateľ si môže stanoviť hodnotu kompresie od 5 do 95, pričom 95 predstavuje najvyššiu kvalitu. Mozaikovanie Mozaikovanie (resp.pridávanie rastra k už existujúcemu) vytvára jeden bezošvý raster. Prekryvové časti sú riešené tak, že sa dotyčná časť nahradí novým rastrom t.j. nevykonáva sa žiadny edge-matching (k dispozícii iba v ArcGIS Desktop). Štatistika ArcSDE môže uchovať vo svojich tabuľkách aj informáciu o štatistike pásma (RGB) ako aj histogram. Vytvorenie štatistiky takmer vždy značne zrýchľuje zobrazovanie rastrovej vrstvy v aplikáciách.
Dáta v geodatabáze, editácia a replikácia Jednosmerná alebo obojsmerná replikácia Dáta v geodatabáze, editácia a replikácia Viacužívateľská editácia Replikácia – odpojené editovanie Odpojené editovanie
Odpojené editovanie Replikácia – odpojené editovanie Viacužívateľská editácia Replikácia – odpojené editovanie Odpojené editovanie - ArcPad ArcSDE Personálna geodatabáza Replikácia – odpojené editovanie Replikácia – spätné načítanie zmien Mobilný klient Import editácií z mobilného klienta Export pre mobilného klienta
Obojsmerná replikácia Viacužívateľská editácia Jednosmerná alebo obojsmerná replikácia Replikácia ArcSDE ArcSDE Editácie Databázy synchronizované
Jednosmerná replikácia v disconnected prostredí Viacužívateľská editácia Jednosmerná alebo obojsmerná replikácia v odpojenom prostredí ArcSDE Replikácia disconnected prenosom dát ArcSDE Editácie Potvrdenie o obdržaní zmien (editácií) Databázy synchronizované
Replikácia Replikovať je možné Celú databázu Vybrané triedy prvkov Vybrané prvky z triedy prvkov Určité územie