Trademarking retrieval Jana Maláčová. Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

Počítačová grafika Nám umožňuje:
Zpracování informací a znalostí Další přístupy k vyhledávání textových dokumentů Doc. RNDr. Jan Rauch, CSc. Katedra informačního a znalostního inženýrství.
Úvod do databázových systémů
VYŘIZOVÁNÍ OBJEDNÁVEK
Microsoft Office Access
Business intelligence
MS Malování II. VY_32_INOVACE_58_MS_Malovani_II.
 Informací se data a vztahy mezi nimi stávají vhodnou interpretací pro uživatele, která odhaluje uspořádání, vztahy, tendence a trendy  Existuje celá.
Diskrétní matematika Opakování - příklady.
Problematika a metody zpracování biomed. dat z pohledu jejich klasifikace Marcel Jiřina.
Genetické algoritmy [GA]
Technologie pro CI. Od technologií pro CI vyžadujeme především funkce vyhledávání v rozsáhlých databázích na základě libovolných dotazů, propojování a.
DOK.
Informace – vyhledávání informací
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Dlouhodobá maturitní práce studentů Tomáše Kurce & Jana Kuželky
Hana Kotinová Struktura a cíl práce Metody předzpracování dat Systémy předzpracování dat Historie vývoje DPT Jak program pracuje Budoucnost.
Microsoft Access Prezentace základních uživatelských nástrojů
DalšíPředchozíTÉMA: M. K a d l e c o v á M. K a d l e c o v á.
Architektura databází Ing. Dagmar Vítková. Centrální architektura V této architektuře jsou data i SŘBD v centrálním počítači. Tato architektura je typická.
Vyhledávání podobností v datech s využitím singulárního rozkladu
Relační databáze.
MS ACCESS parametrický dotaz
Kreslíme rastrovou grafikou I. v programu MALOVÁNÍ
Bc. Martin Dostal. Co to je sémantické vyhledávání? Vyhledávání s využitím "umělé inteligence" Vyhledávání v množině dat na stejné téma katastrofy sport.
IGrid index Roman Krejčík. Obsah Motivace Prokletí dimenze Míry podobnosti IGrid, IGrid+ Experimentální porovnání.
Číslo šablony: III/2 VY_32_INOVACE_P4_3.6 Tematická oblast: Aplikační software pro práci s informacemi II. Databáze - formulář Typ: DUM - kombinovaný Předmět:
ZÁKLADNÍ SOUBOR Základní soubor (populace) je většinou myšlenková konstrukce, která obsahuje veškerá data, se kterými pracujeme a není vždy snadné jej.
Klasifikace klasifikace: matematická metoda, kdy vstupní objekty X(i) jsou rozřazovány do tříd podle podobnosti metody klasifikace bez učitele: podoba.
Databázové modelování
Jedna z největších světových firem v oblasti logistiky 20 leté zkušenosti po celém světě Konzultantské služby.
Databáze velké množství dat pevně dané struktury
Definice fraktální (vnitřní) dimenze a její aplikace v databázích
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK 4. Mapování a redukce dimenze 1. část – úvod + mapování vektorových sad.
př. 6 výsledek postup řešení
Monte Carlo simulace Experimentální fyzika I/3. Princip metody Problémy které nelze řešit analyticky je možné modelovat na základě statistického chování.
Vzdálenost rovnoběžných rovin
Základy pedagogické metodologie
Základy pedagogické metodologie
Vyhledávání v multimediálních databázích Tomáš Skopal KSI MFF UK
Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Mgr. Jan Kryšpín. Obchodní akademie a Střední odborná škola logistická, Opava, příspěvková.
Teorie ES a jejich aplikace Biskup Jiří, Fakulta stavební, ČVUT Praha, Květen 2004.
Vyhledávání vzorů (template matching)
IEC 61850: Soubor norem pro komunikaci v energetice
Vytvoření dokumentu bylo financováno ze zdrojů Evropského sociálního fondu a státního rozpočtu ČR. Registrační číslo projektu: CZ.1.07/1.1.32/ Počítačová.
© Institut biostatistiky a analýz INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc.
Vítejte na hodině Marketingu
Inferenční statistika - úvod
Vícerozměrné statistické metody Vícerozměrné statistické rozdělení a testy, operace s vektory a maticemi Jiří Jarkovský, Simona Littnerová.
Neuronové sítě.
Geografické informační systémy pojetí, definice, součásti
Úvod do databází zkrácená verze.
Tisky parametry tisku tisk z modelu tisk z rozvržení.
Univerzitní informační systém II., Lednice 2003 Zadávání a kontrola přihlášek Tomáš Klein
Bezpečnostní technologie I
VÍCEKRITERIÁLNÍ ROZHODOVÁNÍ I.
Geografické informační systémy
KIV/ZD cvičení 5 Tomáš Potužák.
Induktivní statistika
Výpočetní technika Akademický rok 2008/2009 Letní semestr
Induktivní statistika
Konstrukce trojúhelníku
Spojitá a kategoriální data Základní popisné statistiky
Datové referáty Apstr4.
Počítačová grafika.
ANALÝZA A KLASIFIKACE DAT
Induktivní statistika
Konstrukce trojúhelníku
SVG vektorová grafika Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Ing. Jitka Vlčková. Dostupné z Metodického portálu ISSN.
Transkript prezentace:

Trademarking retrieval Jana Maláčová

Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro reprezentaci tvarů Projekt Davida Liu Systémy využívající genetické algoritmy Použitá literatura

Co je to trademark Trademark, neboli obchodní známka je označení, kterým firma nebo jedinec identifikují samy sebe, své výrobky nebo služby. Pomocí trademarku je zákazníci odlišují od jiných firem Dnes je počet trademarků v řádu miliónů a stále tento počet stoupá U nás má ochranné známky na starost …

Motivace Trademarky hrají důležitou roli v poskytování unikátní identity v oblasti marketingu Nových trademarků neustále přibývá Systémy pro klasifikaci trademarků být schopné zajistit, že existující trademarky jsou navzájem odlišné, musí se vyhnout kolizím Systémy musí být dostatečně rychlé

Obecné systémy Oddělení systémů pro vyhledávání trademarků a obyčejných obrázků Různé druhy indexace a jejich výhody a nevýhody Indexace trademarků Ruční Automatická Indexace Textová Visuální Dnešní trademark retrieval systémy

Projekt Davida Liu – popis systému Databáze trademarků obsahuje naskenované trademarky Dotaz může být buď naskenovaný obrázek nebo nakreslený Systém je založen na porovnávání vzoru (dotazu) se všemi trademarky v databázi

Projekt Davida Liu – popis systému

Fáze přípravy dotazu - filtrování Filtrování šumu Při naskenování se dostává do obrázku šum. V obrázku se vyskytují tečky nebo prázdné díry, které by v obrázku neměli být. Ty jsou označeny za vady Na vstupu je více obrázků a z těchto se pak do další fáze zkombinuje jediný, ve kterém je již šum odstraněn

Příklady odstraňování šumu

Fáze přípravy dotazu - extrakce Extrakce kostry versus extrakce obrysu Vyfiltrovaný obrázek je rozdělen do několika regionů Každý region je buď převeden na kostru nebo obrys, rozhoduje se podle charakteru daného regionu Rozhodování, zda zvolit kostru nebo obrys Podíváme se na každý pixel kostry a sledujeme, vzdálenost tohoto pixelu od nejbližšího pixelu obrysu. Pokud je tato vzdálenost „malá“ a navíc pro každý pixel kostry je vzdálenost k nejbližšímu obrysovému pixelu přibližně stejná, pak volíme reprezentaci kostrou. V opačném případě volíme obrys

Fáze přípravy dotazu – extrakce - příklad

Fáze přípravy dotazu – extrakce charakteristických znaků a výpočet podobnosti Charakteristické vlastnosti trademarku jsou získávány z každého tahu ze tří základních charakteristik každého tahu: střed daného tahu, konvexnost tahu a celková délka tahu. Ostatní charakteristiky jsou odvozeny z těchto základních. Tyto charakteristiky jsou pak použity systémem pro odhadování tvarů, který vypočítává podobnost daného tahu ke třem základním tvarům: přímka, kružnice, polygon Tyto podobnosti jsou pak základními charakteristikami pro každý obrázek Z se počítá podobnost mezi jednotlivými obrázky

Extrakce charakteristických znaků - příklad Podobnost kruhu (a) (b) (c) Podobnost polygonu (a) (b) (c) 0

Extrakce charakteristických znaků - příklad Podobnost přímce (a) (b) (c) 0

Výpočet podobnosti mezi dotazem a trademarkem z DB Vzorec pro výpočet podobnosti dvou tahů, kde S Qi je i-tý tah z dotazu, S Dj je j-tý tah z trademarku z DB, p je jeden ze základních tvarů, c p (s) je podobnost k tomuto základnímu tvaru, f p,k (s) je k-tá vlastnost tvaru p tahu s, a G(f 1,f 2 ) je podobnost mezi vlastnostmi 1 a 2 Vzorec pro výpočet podobnosti dvou obrázků, kde S Qi je i-tý tah z dotazu, S Dj je j-tý tah z trademarku z DB

Příklad

Srovnání použití různých reprezentací tvarů

Druhy trademark retrieval systémů QBIC(query by image content) – slouží jako databázový filter obrázků, který umožňuje dotazy založené na obsahu obrázku jako podíl barev obrázku, rozložení barev a struktur, systém musí být dobře natrénovaný, aby dobře pracoval STAR(systém for trademark archival and retrieval) systém pracující na základě charakteristik R, G a B barevných komponent, invariantních momentů a Fourierových deskriptorech extrahovaných z manuálně vybraných objektů Obecně si vybíráme některé vlastnosti obrázků pro jejich reprezentaci a na jejichž základě rozhodujeme o jejich vzájemné podobnosti

Systémy využívající genetické algoritmy Existuje mnoho vizuálně význačných charakteristických znaků pro každý obrázek (např. obrys, kruhovitost, …). Každá z těchto charakteristik má vliv na to, jak obrázek vypadá, každá má ale také jinou váhu v celkovém vzhledu. Snahou tohoto systému je najít vizuálně významné charakteristiky a přiřadit jim patřičnou váhu, která odpovídá vizuální důležitosti tohoto znaku. Pak je obrázek chápán jako soubor těchto význačných znaků s jejich váhou.

Systémy využívající genetické algoritmy – popis systému Definujeme si DB trademarků jako množinu obrázků {I i }, pro každý obrázek definujeme zobrazení f:IxV->R d, kde V je množina charakteristických znaků, R je d-dimenzionální vektor reálných hodnot charakteristik DB pak trénujeme na trénovací množině, což je množina párů T p =(I T,I S ), kde I T je cílový obrázek dotazu a I S je uživatelem definovaný nejlepší obrázek. Takových trénovacích párů máme n. Mějme funkci D T (I i,I j ), která počítá podobnost mezi obrázky I i a I j, kde D fi je Euklidovská vzdálenost mezi vektory charakteristických znaků obrázku i a j TC(w) je definován jako počet korektních hitů daných funkcí D T pracující s množinou vah w

Systémy využívající genetické algoritmy – popis systému Abychom mohli spočítat ideální rozložení vah pro dané charakteristické znaky obrázku, použijeme genetické algoritmy Jako chromozom si vezmeme vektror vah c i = (w 1, …, w n ) Populace P je dána množinou vektorů c i, kde každý c i je chromozom představující vektor vah Pomocí genetického algoritmu se z populace vybere vektor ideálních vah pro charakteristické vlastnosi Počáteční generace byla vygenerována náhodně

Systémy využívající genetické algoritmy – výsledky Pomocí genetického algoritmu bylo vybráno pět charakteristických znaků obrázku, kterým byly přiděleny váhy. Tyto vlastnosti jsou: Fourierovy deskriptory, aproximované hranice, sedm invariantních momentů, mimostřednost, kruhovitost a Eulerovo číslo Tento výběr zároveň umožňuje, že může mít trademark i více komponent Ke každému obrázku v DB jsou pak uloženy extrahované hodnoty těchto charakteristických znaků Při zadání dotazu, jsou první z dotazu extrahovány charakteristické znaky a pak je počítána ke každému obrázku počítána D T funkce. Výsledky jsou pak seřazeny podle podobnosti.

Systémy využívající genetické algoritmy – popis systému

Systémy využívající genetické algoritmy – příklad výsledků

Trocha z reálného života Systém založený na kombinovaném vyhledávání Pracuje nad reálnou databází o velikosti trademarků z US Patent and Trademark office Ke každému obrázku je asociováno několik textových položek (obsahuje kód obrázku (označuje kategorii obrázku), zboží a služby asociované s obrázkem, sériové číslo trademarku, krátký popisný text, registrační číslo obrázku, datum registrace, vlastníka, …) Obrázky v DB jsou normalizované, převedeny na černobílé a jejich velikost je redukována na jednotnou velikost v celé DB Každý obrázek je rozdělen na 4 stejné části a každá z nich je reprezentována příslušnými histogramy

Vyhledávání Vyhledávání: nejdříve se vyhledává podle některé nebo všech textových položek Výsledkem vyhledávání je množina obrázků Uživatel si vybere některé ze zobrazených a dále může kombinovat vyhledávání podle textu a obsahu obrázku Pokud se provádí vyhledávání pouze na základě obrázku, porovnává se histogram zadaného obrázku se všemi histogramy obrázků v DB

Příklad

Použitá literatura a.pdf 99a.pdf markRetrieval/