Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Trademarking retrieval Jana Maláčová. Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro.

Podobné prezentace


Prezentace na téma: "Trademarking retrieval Jana Maláčová. Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro."— Transkript prezentace:

1 Trademarking retrieval Jana Maláčová

2 Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro reprezentaci tvarů Projekt Davida Liu Systémy využívající genetické algoritmy Použitá literatura

3 Co je to trademark Trademark, neboli obchodní známka je označení, kterým firma nebo jedinec identifikují samy sebe, své výrobky nebo služby. Pomocí trademarku je zákazníci odlišují od jiných firem Dnes je počet trademarků v řádu miliónů a stále tento počet stoupá U nás má ochranné známky na starost …

4 Motivace Trademarky hrají důležitou roli v poskytování unikátní identity v oblasti marketingu Nových trademarků neustále přibývá Systémy pro klasifikaci trademarků být schopné zajistit, že existující trademarky jsou navzájem odlišné, musí se vyhnout kolizím Systémy musí být dostatečně rychlé

5 Obecné systémy Oddělení systémů pro vyhledávání trademarků a obyčejných obrázků Různé druhy indexace a jejich výhody a nevýhody Indexace trademarků Ruční Automatická Indexace Textová Visuální Dnešní trademark retrieval systémy

6 Projekt Davida Liu – popis systému Databáze trademarků obsahuje naskenované trademarky Dotaz může být buď naskenovaný obrázek nebo nakreslený Systém je založen na porovnávání vzoru (dotazu) se všemi trademarky v databázi

7 Projekt Davida Liu – popis systému

8 Fáze přípravy dotazu - filtrování Filtrování šumu Při naskenování se dostává do obrázku šum. V obrázku se vyskytují tečky nebo prázdné díry, které by v obrázku neměli být. Ty jsou označeny za vady Na vstupu je více obrázků a z těchto se pak do další fáze zkombinuje jediný, ve kterém je již šum odstraněn

9 Příklady odstraňování šumu

10 Fáze přípravy dotazu - extrakce Extrakce kostry versus extrakce obrysu Vyfiltrovaný obrázek je rozdělen do několika regionů Každý region je buď převeden na kostru nebo obrys, rozhoduje se podle charakteru daného regionu Rozhodování, zda zvolit kostru nebo obrys Podíváme se na každý pixel kostry a sledujeme, vzdálenost tohoto pixelu od nejbližšího pixelu obrysu. Pokud je tato vzdálenost „malá“ a navíc pro každý pixel kostry je vzdálenost k nejbližšímu obrysovému pixelu přibližně stejná, pak volíme reprezentaci kostrou. V opačném případě volíme obrys

11 Fáze přípravy dotazu – extrakce - příklad

12 Fáze přípravy dotazu – extrakce charakteristických znaků a výpočet podobnosti Charakteristické vlastnosti trademarku jsou získávány z každého tahu ze tří základních charakteristik každého tahu: střed daného tahu, konvexnost tahu a celková délka tahu. Ostatní charakteristiky jsou odvozeny z těchto základních. Tyto charakteristiky jsou pak použity systémem pro odhadování tvarů, který vypočítává podobnost daného tahu ke třem základním tvarům: přímka, kružnice, polygon Tyto podobnosti jsou pak základními charakteristikami pro každý obrázek Z se počítá podobnost mezi jednotlivými obrázky

13 Extrakce charakteristických znaků - příklad Podobnost kruhu (a) (b) (c) Podobnost polygonu (a) (b) (c) 0

14 Extrakce charakteristických znaků - příklad Podobnost přímce (a) (b) (c) 0

15 Výpočet podobnosti mezi dotazem a trademarkem z DB Vzorec pro výpočet podobnosti dvou tahů, kde S Qi je i-tý tah z dotazu, S Dj je j-tý tah z trademarku z DB, p je jeden ze základních tvarů, c p (s) je podobnost k tomuto základnímu tvaru, f p,k (s) je k-tá vlastnost tvaru p tahu s, a G(f 1,f 2 ) je podobnost mezi vlastnostmi 1 a 2 Vzorec pro výpočet podobnosti dvou obrázků, kde S Qi je i-tý tah z dotazu, S Dj je j-tý tah z trademarku z DB

16 Příklad

17 Srovnání použití různých reprezentací tvarů

18 Druhy trademark retrieval systémů QBIC(query by image content) – slouží jako databázový filter obrázků, který umožňuje dotazy založené na obsahu obrázku jako podíl barev obrázku, rozložení barev a struktur, systém musí být dobře natrénovaný, aby dobře pracoval STAR(systém for trademark archival and retrieval) systém pracující na základě charakteristik R, G a B barevných komponent, invariantních momentů a Fourierových deskriptorech extrahovaných z manuálně vybraných objektů Obecně si vybíráme některé vlastnosti obrázků pro jejich reprezentaci a na jejichž základě rozhodujeme o jejich vzájemné podobnosti

19 Systémy využívající genetické algoritmy Existuje mnoho vizuálně význačných charakteristických znaků pro každý obrázek (např. obrys, kruhovitost, …). Každá z těchto charakteristik má vliv na to, jak obrázek vypadá, každá má ale také jinou váhu v celkovém vzhledu. Snahou tohoto systému je najít vizuálně významné charakteristiky a přiřadit jim patřičnou váhu, která odpovídá vizuální důležitosti tohoto znaku. Pak je obrázek chápán jako soubor těchto význačných znaků s jejich váhou.

20 Systémy využívající genetické algoritmy – popis systému Definujeme si DB trademarků jako množinu obrázků {I i }, pro každý obrázek definujeme zobrazení f:IxV->R d, kde V je množina charakteristických znaků, R je d-dimenzionální vektor reálných hodnot charakteristik DB pak trénujeme na trénovací množině, což je množina párů T p =(I T,I S ), kde I T je cílový obrázek dotazu a I S je uživatelem definovaný nejlepší obrázek. Takových trénovacích párů máme n. Mějme funkci D T (I i,I j ), která počítá podobnost mezi obrázky I i a I j, kde D fi je Euklidovská vzdálenost mezi vektory charakteristických znaků obrázku i a j TC(w) je definován jako počet korektních hitů daných funkcí D T pracující s množinou vah w

21 Systémy využívající genetické algoritmy – popis systému Abychom mohli spočítat ideální rozložení vah pro dané charakteristické znaky obrázku, použijeme genetické algoritmy Jako chromozom si vezmeme vektror vah c i = (w 1, …, w n ) Populace P je dána množinou vektorů c i, kde každý c i je chromozom představující vektor vah Pomocí genetického algoritmu se z populace vybere vektor ideálních vah pro charakteristické vlastnosi Počáteční generace byla vygenerována náhodně

22 Systémy využívající genetické algoritmy – výsledky Pomocí genetického algoritmu bylo vybráno pět charakteristických znaků obrázku, kterým byly přiděleny váhy. Tyto vlastnosti jsou: Fourierovy deskriptory, aproximované hranice, sedm invariantních momentů, mimostřednost, kruhovitost a Eulerovo číslo Tento výběr zároveň umožňuje, že může mít trademark i více komponent Ke každému obrázku v DB jsou pak uloženy extrahované hodnoty těchto charakteristických znaků Při zadání dotazu, jsou první z dotazu extrahovány charakteristické znaky a pak je počítána ke každému obrázku počítána D T funkce. Výsledky jsou pak seřazeny podle podobnosti.

23 Systémy využívající genetické algoritmy – popis systému

24 Systémy využívající genetické algoritmy – příklad výsledků

25

26 Trocha z reálného života Systém založený na kombinovaném vyhledávání Pracuje nad reálnou databází o velikosti trademarků z US Patent and Trademark office Ke každému obrázku je asociováno několik textových položek (obsahuje kód obrázku (označuje kategorii obrázku), zboží a služby asociované s obrázkem, sériové číslo trademarku, krátký popisný text, registrační číslo obrázku, datum registrace, vlastníka, …) Obrázky v DB jsou normalizované, převedeny na černobílé a jejich velikost je redukována na jednotnou velikost v celé DB Každý obrázek je rozdělen na 4 stejné části a každá z nich je reprezentována příslušnými histogramy

27 Vyhledávání Vyhledávání: nejdříve se vyhledává podle některé nebo všech textových položek Výsledkem vyhledávání je množina obrázků Uživatel si vybere některé ze zobrazených a dále může kombinovat vyhledávání podle textu a obsahu obrázku Pokud se provádí vyhledávání pouze na základě obrázku, porovnává se histogram zadaného obrázku se všemi histogramy obrázků v DB

28 Příklad

29

30 Použitá literatura 99a.pdf 99a.pdf markRetrieval/


Stáhnout ppt "Trademarking retrieval Jana Maláčová. Obsah Co je to trademark a trademarking retrieval Motivace pro trademarking retrieval Obecné systémy Metody pro."

Podobné prezentace


Reklamy Google