Podobnost trajektorií Jiří Jakl 17.11.2006. Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce.

Slides:



Advertisements
Podobné prezentace
Optimalizace bez omezení (unconstraint)
Advertisements

Fakulta životního prostředí Katedra informatiky a geoinformatiky
MECHANICKÝ POHYB Podmínky používání prezentace
Mechanika Dělení mechaniky Kinematika a dynamika
Diagnostika pacientů s Parkinsonovou chorobou Jan Doležel Vedoucí práce: Ing. Miroslav Skrbek Ph.D.
Sylabus V rámci PNV budeme řešit konkrétní úlohy a to z následujících oblastí: Nelineární úlohy Řešení nelineárních rovnic Numerická integrace Lineární.
směr kinematických veličin - rychlosti a zrychlení,
Křivočarý pohyb bodu. křivočarý pohyb bodu,
KEE/POE 8. přednáška Numerický výpočet derivace a integrálu
Model dopravní mikrooblasti pro popis a řízení délek kolon v křižovatkách pomocí světelné signalizace.
TMF045 letní semestr 2005/2006 II Časová propagace vlnové funkce na mřížce I. (práce s momentovou reprezentací) (Lekce II)
Matematické základy geoinformatiky
3. KINEMATIKA (hmotný bod, vztažná soustava, polohový vektor, trajektorie, rychlost, zrychlení, druhy pohybů těles, pohyby rovnoměrné a rovnoměrně proměnné,
Rovinné útvary.
Analytická geometrie pro gymnázia
Popis časového vývoje Pohyb hmotného bodu je plně popsán závislostí polohy na čase. Otázkou je, jak zjistit vektorovou funkci času ~r (t), která pohyb.
Harmonická analýza Součet periodických funkcí s periodami T, T/2, T/3,... je periodická funkce s periodu T má periodu T perioda základní frekvence vyšší.
IGrid index Roman Krejčík. Obsah Motivace Prokletí dimenze Míry podobnosti IGrid, IGrid+ Experimentální porovnání.
Fyzika 7. ročník Pohyb tělesa Anotace
Shluková analýza.
Funkce více proměnných.
Lineární zobrazení.
Čištění dat Cleaning. Vstup: Množina geometrických objektů Výstup: Mapová vrstva s topologií.
CorelDraw – čárové objekty
polohový vektor, posunutí, rychlost
Realtime identifikace osob podle hlasu
Vektorová grafika.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Rozhodovací stromy.
Diferenciální počet funkcí více proměnných
Vedení tepla Viktor Sláma SI – I 23. Zadání Vhodné uložení vyhořelého jaderného paliva je úkol pro současnou generaci. Zaměřme se na jednu nepatrnou část.
KIV/PRO Cvičení Nejkratší cesta Vstup – N měst – Mezi některými dvojicemi měst vedou obousměrné silnice, zadány délky cest Výstup – Nejkratší.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Rozpoznávání v řetězcích
Způsoby uložení grafické informace
Diferenciální geometrie křivek
Počítačová chemie (5. přednáška)
Kvadratická rovnice s parametrem
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 4. Mapování a redukce dimenze 1. část – úvod + mapování vektorových sad.
8. Prostorové vytyčovací sítě - Běžně se polohová a výšková složka určuje odděleně (obzvláště při vyšších požadavcích na přesnost). -Souřadnicový systém.
Vektorová grafika. Vektorové entity Úsečka Kružnice, elipsa, kruhový oblouk,… Složitější křivky, splajny, Bézierovy křivky, … Plochy Tělesa Modely.
Gymnázium Jiřího Ortena KUTNÁ HORA
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
Vyhledávání vzorů (template matching)
Fakulta stavební VŠB-TU Ostrava Miroslav Mynarz, Jiří Brožovský
Posunutí.
ROVNOMĚRNÝ PŘÍMOČARÝ POHYB  Rovnoměrný pohyb je pohyb, při kterém hmotný bod urazí ve zvolených stejných časových intervalech stejné dráhy.
Operace s vektory Autor: RNDr. Jiří Kocourek.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Repetitorium z fyziky I
Typické operace v GIS. Manipulace s daty Ztotožnění okrajů (angl. edge matching) ztotožnění okrajů (angl. edge matching) spojení oddělených mapových.
Ověření modelů a modelování Kateřina Růžičková. Posouzení kvality modelu Ověření (verifikace) ● kvalitativní hodnocení správnosti modelu ● zda model přijatelně.
Výškopis ● Vrstevnice -Vrstevnice je čára o stejné nadmořské výšce zobrazená na mapě. – Interval i = M / 5000 – Hlavní, vedlejší.
směr kinematických veličin - rychlosti a zrychlení,
Harmonická analýza Součet periodických funkcí s periodami T, T/2, T/3,... je periodická funkce s periodu T má periodu T perioda základní frekvence vyšší.
Osnova Matematika pro porozumění i praxi I a II – stručná charakteristika Matematika pro porozumění i praxi III – komentovaný obsah Podrobněji k problematice.
Ing. Milan Houška KOSA PEF ČZU v Praze
Polární soustava souřadnic
Fergusonova kubika a spline křivky
ANALÝZA A KLASIFIKACE DAT
1 Lineární (vektorová) algebra
Funkce více proměnných.
Vektorová grafika.
ANALÝZA A KLASIFIKACE DAT
Způsoby uložení grafické informace
Grafy kvadratických funkcí
Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Upravila R.Baštářová.
8. Prostorové vytyčovací sítě
ANALÝZA A KLASIFIKACE DAT
Analytická geometrie kvadratických útvarů
Transkript prezentace:

Podobnost trajektorií Jiří Jakl

Úvod - využití Rozpoznáváni ručně psaných textů GPS navigace Analýza pohybu pracovníku v budovách Predikce polohy Tréninkové programy sportovců …

Trajektorie Analyticky: Def.: Obraz spojitého zobrazení λ C uzavřeného intervalu I=[t 1,t n ] do R n, kde [t 1,t n ] vyjadřuje čas. Def.: Délku křivky lze obecně vyjádřit mnoha způsoby (nebudeme se zabývat supremem přes aproximace lomenou čárou). Kartézská soust. souřadnicVektorová funkcePolární soust. souřadnic Pro trajektorii v 2D, parametrizované časem, tedy dostaneme: Integrál jedničky přes křivku.

Trajektorie – pokrač. Diskrétně: Def.: Diskrétní zobrazení λ D z množiny {t 1,.., t n } do R n, kde t 1,.., t n vyjadřují čas. Fakt: Trajektorie je orientovaná křivka, ale diskrétní trajektorie je n-rozměrný vektor. Def.: Lineární aproximace po částech je zobrazení λ PC uzavřeného intervalu I=[t 1,t n ] do R n takové, že { λ PC (t)= Což je vlastně myšlenka, ze které vychází Lagrangeova interpolace polynomů.

Trajektorie – pokrač. Def.: Délku lineární aproximace po částech λ PC lze pak prostě spočíst jako součet délek úseček mezi dělícími body.

Trajektorie – pokrač. Spojitá křivkaDiskrétní zadání Fakt: Orientace kóduje „směr“ plynutí času. Fakt: Pro ekvidistantní vzorkování je reprezentace (n+1) rozměrným vektorem plýtvání. Pozn.: Pokud zaznamenáme pouze jeden časový údaj, musíme vědět, zda je to start, či cíl.

Podobnost Trajektorie má jak časovou, tak prostorovou složku. Dají se tedy uvažovat v zásadě tři druhy podobnosti: Prostorově-časová v R n x T, uvažujeme všechny složky Prostorová v R n, uvažujeme pouze prostorovou složku Časová v R x T, uvažujeme trajektorii jako časovou řadu

Vzdálenost Def.: L 2 vzdálenost vektorů u, v: –Časová řada –Zobecnění pro vyšší dimenze Což je obyčejná Euklidovská vzdálenost.

Rozsahový dotaz Hledání „nejpodobnější“ podsekvence délky shodné s vstupní posloupností. Vstup: Posloupnost Výstup: Množina všech částí uložených trajektorií, které splňují kritérium podobnosti. V našem případě prahovou vzdálenost vzhledem ke zvolené metrice. 1.Vyberme jednu uloženou trajektorii 2.Prozkoumáme všechny její podsekvence na podobnost 3.Postup opakujeme pro všechny uložené trajektorie

Rozsahový dotaz – alg. Prostá aplikace definic z předchozího slajdu. Vyhledáme podmnožinu vektorů délky l, které splňují kriterium na vzdálenost od vektoru dotazu. Hledáme „nejpodobnější“ podsekvenci délky l.

Časová normalizace Problém: Různé intervaly vzorkování. Řešení: Normalizace. Def.: Časově normalizovaná trajektorie je diskrétní trajektorie s ekvidistantním vzorkováním. Re-sampling lze provést takto: Přičemž takto volená míra dává lepší výsledky při dotazech na podobnost „tvaru,“ než míry zmíněné výš.

Prostorová normalizace Def.: Prostorově normalizovaná trajektorie je diskrétní trajektorie s ekvidistantním prostorovým vzorkováním. Re-sampling lze provést takto: Tedy všechny úseky mají stejnou délku.

Normalizace – přehled Původní data Lineární aproximace po částech Časová normalizace Prostorová normalizace Pokud nejsou data, použijeme aproximaci a doplníme body. Všechny úseky stejně dlouhé. Intervaly mezi vzorky stejně dlouhé. Došlo k „přesunu“ bodu

Hledání podsekvence Problém: Hledáme podobné podsekvence, ale to má časovou složitost úměrnou délce zkoumané podsek- vence. Pro délku dotazu m a délky uložených trajektorií n dojdeme ke složitosti O(m*n) na porovnání s jednou uloženou trajektorií (i když se jedná o dosti hrubý odhad). Maximálně může dojít k ½*n*n počítáním podobnosti. A záleží, zda v případě kvadratické složitosti ve většině dotazů, je dobře navržena dimenze. Řešení: Redukce dimenze. Snížením „délek“ vektorů z n na k, kde k<n. K tomu lze použít například metodu PAA.

PAA (piecewise aggregation approximation) Technika redukce dimenze s faktorem k Princip: i-tá složka je průměrem k složek původního vektoru. Převod: Platí: Důležitá nerovnost Složka redukovaného vektoru

Podobnost - revize a)Trajektorie a její PAA b)Podobnost trajektorií je zde vlastně obsah jimi opsaného regionu (se spojením krajních bodů). c)Podobnost po použití PAA. Pozorování: a) + b) + c) Platí nerovnost z předchozího slajdu:

Prostorové zobecnění PAA Pro vyšší dimenze lze PAA provést po složkách (se stejným faktorem k). Def.: 2D-PAA Pro prostorově normalizovanou trajektorii a faktor k přepočtem její vektor po složkách následovně: Trajektorie jako vektor: Vektor 2D bodů v nD vs. 2 vektory 1D bodů v nD: Přepočet souřadnic:

Prostorové zobecnění PAA 1.Na vstupu je trajektorie 2.Dekomponujeme po souřadnicích 3.Provedeme PAA 4.Získali jsme diskrétní trajektorii s redu- kovanou dimenzí

Indexace PAA pomocí R + -stromu Aproximace s redukovanou dimenzí Indexace R + -stromem, lze klást klasické intervalové dotazy, které odpovídají nale- zení podsekvence dané délky. Takto jsou zaindexovány všechny uložené trajektorie a také se takto zpracovává trajektorie dotazu.

Prostorové zobecnění PAA Celkově pak proces indexace vypadá takto.

Podobnost - problém a)Původní sekvence b)Posunutí c)Otočení d)Škálování (změna velikosti) e)b) + c) + d) + Deformace

Transformace – algebraické okénko Škálování (zmenšení/zvětšení): Otočení (rotace): Posunutí: Použijeme homogenní souřadnice. Afinní transformace – zachovává rovnoběžnost. Transformace (resp. transformační matice) lze skládat násobením (a inverzní matice odpovídá opačné). Princip by neměl být vázán na dimenzi prostoru. Takto se dají řešit i další transformace (např. zkosení), a pokud uvažujeme i neafinní transformace, můžeme vyjádřit třeba i projekce. Kolem osy x Kolem osy y Kolem osy z

Podobnost – problém pokrač. Potřebujeme invariantnost vůči transformacím: Posunutí Škálování Otočení Toho dosáhneme přechodem do polární soustavy souřadnic, normalizací a teprve pak zkoumáním podobnosti posloupností. Pokud bychom chtěli invariantnosti dosáhnout změnou metriky, mohlo by dojít k neúnosnému nárůstu časové složitosti, proto přejdeme do prostoru polárních souřadnic kde se toto dá efektivně řešit.

Polární souřadnice Dá se nalézt pod názvem AAL prostor (Angle/Arc-length). Převod: Vektor mezi sousedními body: Referenční vektor: jednotkový vektor podle osy x. Jak ostrý úhel svírá vektor V t s V ref : Znaménko nám umožňuje rozlišit nejedno- značnost směru rotace.

Polární souřadnice - znaménko Znaménko má jednoduchou vektorovou interpretaci jako směr normály v poslední souřadnici. Jako je vidět na následujících obrázcích:

Polární souřadnice - sekvence Z původní posloupnosti: P=[P1,.., Pn]=[(p x,0,p y,0 ),.., (p x,n-1,p y,n-1 )] Jsme získali novou: Invariantnost vůči škálování pak lze dosáhnout takto: Dělíme délky úseků (vektorů posunu) celkovou délkou trajektorie.

Polární souřadnice – referenční vektory Další úpravy lze učinit jinou volbou referenčního vektoru: Relativní změna: Problém: Změny úhlu se skládají. Těžiště: Problém: Složitější výpočet. Přesný úhel: Náš V ref, jednotkový vektor podle osy x.

Podobnost - problém rotace Původní 2D trajektorie si jsou „dostatečně“ podobné pokud tmavší pootočíme ve směru hodinových ručiček o 70°. Na grafu v polárních souřadnicích je pak vidět, že se „liší“ vertikálním posunutím (v závislosti na orientaci). K dosažení nezávislosti na otočení provedeme normalizaci. Dvě 2D trajektorie Po převodu do polárních souřadnic. Přechodem mezi prostory jsme zaměnili způsob reprezentace dané vlastnosti.

Obyčejná normalizace Odečteme průměrnou hodnotu sekvence. Vidíme, že výsledek co jsme dostali je mnohem lepší, ale jak uvidíme dál, ještě se to dá výrazně zlepšit. Přetékáme interval

Iterativní modulo normalizace 1.Odečteme průměrnou hodnotu sekvence. 2.Počítáme modulo, abychom se vešli do vertikálního intervalu [π,- π]. 3.Krok 1. a 2. opakujeme tolikrát, kolikrát je třeba, nebo dokud se výsledek neustálí. Vidíme, že výsledek co jsme dostali je již „dost“ podobný. Počítáme opravdu modulo

Iterativní modulo normalizace – alg. Zde máme pouze algoritmicky zapsáno to, co jsme si řekli. Test stability Max. k opakování Počítání modulo

Podobnost Nově získané posloupnosti lze zkoumat na podobnost tak, jak jsme si ukázali výš (viz PAA). Dále ukážeme další techniky. Tento přístup je mnohem efektivnější než normalizace trajektorie vzhledem k původním kartézským souřadnicím. Tedy posun, rotace vzhledem k referenčnímu vektoru a změny velikosti.

DTW (dynamic time warping) Časová složitost O(n 2 ). Sekvence dotazu: Funkce vracející hlavu seznam bez posledního členu: Rekurzivně hledáme nejmenší kumulovanou vzdálenost po namapování posledních členů a minima DTW sekvencí: 1.Zkrácených obou 2.Zkráceného jen dotazu 3.Zkrácené jen uložené Vzdálenost posledních členů Princip: 0.

DTW - algoritmus int DTWDistance(char s[1..n], char t[1..m], int d[1..n,1..m]) { declare int DTW[0..n,0..m] declare int i, j, cost for i := 1 to m DTW[0,i] := infinity for i := 1 to n DTW[i,0] := infinity DTW[0,0] := 0 for i := 1 to n for j := 1 to m cost:= d[s[i],t[j]] // distance (0) DTW[i,j] := minimum(DTW[i-1,j ] + cost, // insertion (2) DTW[i,j-1] + cost, // deletion (3) DTW[i-1,j-1] + cost) // match (1) return DTW[n,m] } Jde to tedy samozřejmě i bez rekurze.

Aproximace DTW Problém: Původní DTW má kvadratickou složitost. Řešení: Pouze DTW aproximujeme shodou v nějakém δ-okolí bodů trajektorie. Tedy výhled DWT (resp. insert/delete) se provede pouze do vzdálenosti δ. Tím lze dosáhnout časové složitosti O(δn). δ se volí 20%-30% n.

LB-PAA (lower bound – PAA aka LB-Koegh) Minimální δ-ohraničení (MBE – minimal bounding envelope): Rozšíření křivky do oblasti Redukce dimenze (jako obyčejné PAA): Získáme minimální ohraničující obdélníky.

LB-PAA Princip: 1.Pro dotaz zjistíme jeho posloupnost MBR 2.Totéž pro každou uloženou trajektorii (lze volit L i =U i potom MBE(T)~T). 3.Spočteme kumulovanou vzdálenost MBR obou posloupností MBR posloupnosti dotazu MBR posloupnosti uložené trajektorie Nenulové vzdáleností členů MBR posloupností Počítáme vzdálenost distance(MBR(MBE(Q),MBR(T)).

LB-Zhu (Zhu & Sasha) Princip: Podobně jako u LB-PAA 1.Pro dotaz Q spočteme MBE(Q). 2.U, L pro Q aproximujeme pomocí PAA 3.Uloženou trajektorii T aproximujeme pomocí PAA 4.Spočteme vzdálenost distance(PAA(MBE(Q)),PAA(T))

MBE přístup Výhoda: Snadný a rychlý výpočet. Problém: Dlouhé posloupnosti znamenají velké δ. –Široké obalení křivky. V mezním případě pruh. Řešení: Minimalizovat dopad δ použitím pouze aproximace původní posloupnosti. Počítáme vzdálenost distance(MBR(Q),PAA(T)). –Problém: Jak definovat vzdálenost MBR mezi PAA?

Vzdálenost MBR i (Q) a PAA j (T) Princip: počítáme „obsah rovnoběžníku.“ Omezující obdélník:Člen aproximace PAA: Nově definovaná vzdálenost: Libovolná metrika Padne mezi Faktor redukce D seq se použije jako míra v DTW.

LB-Warp Princip: 1.Pro dotaz Q spočteme MBR(Q). 2.Uloženou trajektorii T aproximujeme pomocí PAA 3.Spočteme vzdálenost distance(MBR(Q),PAA(T)) „obsah rovnoběžníku“ Počítáme s faktorem k, se musí změnit na. Časová složitost je.

Lower bound lemma Jsou dány trajektorie Q a T s délkou n a δ a jejich aproximace s faktorem k, MBR(Q) a PAA(T). Platí následující nerovnost: LB-warp (MBR(Q), PAA(T)) ≤ DTW (Q,T)

Skutečná měření Podmnožina dat získaných z tabletu. (reálná data) Rotace vzorků, každý 3 kopie otočení o [-90°, 90°]. (syntetická data)

Skutečná měření 40 ručně psaných vorků a jejich podobnost modelovaná do 2D pomocí ISOMAP.

Skutečná měření Metoda přesného úhlu i těžiště, jako volba referenčního vektoru si vedou v obou případech dobře. Metoda relativního úhlu se naproti tomu osvědčila pouze v syntetickém testu.

Síla prořezávání Pro všechny sady vyšel LB-warp nejlépe. Před LB-Zhu a poslední skončil LB-Koegh. Ze základu reálných dat autoři pro další testy vygenerovali sady velikosti 1000,2000,4000 a 8000 vzorků pro testování rozšiřitelnosti a schopnosti prořezávání LB-warp. Testoval se dotaz 1NN. Průměr přes 50 dotazů. Posloupnosti v pořadí jak byly na disku.

Rychlost Kumulativní časová složitost pro 50 dotazů z testu. Pořadí algoritmů je LB-warp, LB-Zhu a poslední skončil LB-Koegh.

Zdroje Shape-based Similarity Query for Trajectory of Mobile Objects Yutaka Yanagisawa, Jun-ichi Akahani, Tetsuji Satoh Rotation Invariant Distance Measures for Trajectories Michail Vlachos, D. Gunopulos, Gautam Das Planetmath ( WolframMathworld ( Wikipedia (