Zpracování obrazu Počítače & grafika Přednáška č. 7 Autoři: David Škaroupka, Jiří Liška, Miroslav Cepl, Michal Pokorný, Ivo Bílek
Obsah základní a typické úpravy snímků, obvyklé funkce v bitmapových editorech, možnosti filtrace obrazu, detekce objektů a principy OCR
Základní úpravy Geometrické úpravy: Natočení o +/-90° a 180° Srovnání svislic/horizontu Korekce zkreslení typu "flaška"
Základní úpravy Korekce barevné teploty: Vyvážení bílé barvy u digitálních fotoaparátů a kamer již bývá automatické, jde o kompenzaci bílého bodu analýzou nejsvětlejších oblastí ve snímku Ručně: nejčastěji výběrem záchytného bodu, který odpovídá buď bílé nebo šedé v daném osvětlení (bílé oblečení, ubrus, zeď, šedý beton...) Úprava fotografie která je jakoby bez sytých barev
Základní úpravy Ekvalizace = způsob zvýraznění struktury ( přemapování úrovní v bitmapě dle požadavků operátora) Obvykle se expanduje kontrast v histogramu ( a..b → %) Barevnost je možné oživit expanzí x-y gamutu (pozor na přetečení a šum) Korekcí kumulatitvní křivky je možné prosvětlit stíny a přemapovat gradaci.
Bitmapové editory Operace s bitmapovým obrazem v režimu RGB, CMYK a nebo Lab: základní 2D operace (body, obdélníky, výplně, štětce/sprajty, text...), práce na úrovni barevných kanálů (ekvalizace,...); Operace nad celým obrazem nebo nad jeho vybranou částí: 2D transformace (translace, rotace, velikost, ořez, průhlednost), bitmapové filtry (konvoluční, fourierovské, uživatelské/pluginy,...); Práce s hladinami: obraz je možné skládat pomocí nezávislých „průsvitek“ (průhlednosti, operace jen nad objekty v dané hladině,...); Práce s objekty: vektorové, textové, bitmapové; Skriptování: automatizace často opakovaných operací.
Fitry Konvoluční filtry Nelineární, aplikují se postupně na všechny body obrazu používají váženého součtu hodnot z okolí daného bodu, váhy v součtu jsou určeny maticí filtru (aplikují matici na sousední pixely) Fourierovské k odstranění nežádoucích frekvencí v obraze snadno vytváří falešné struktury Pluginy
Detekce objektů Vektorizace bitmapových předloh pro vektorové editory Detekce polohy objektů v průmyslové automatizaci často jen ČB obraz hledají se těžiště, hranice a vrcholy objektů: detekce hranic na principu rozdílu úrovní jasu, rozlišení ploch podle frekvenční charakteristiky textury „Policejní“ aplikace detekce pohybu automatizované sledování a rozpoznání papilárních linií (daktyloskopie) obrazu sítnice a duhovky („retina scan“) rysů obličeje (strojová „Bertilonáž“ obličeje detekce SPZ (+ následné OCR) Problémy: vysoké výpočetní nároky+nezanedbatelná cena HW, často jde spíš jen o „efektní“ než o efektivní aplikace.
OCR OCR = Optical Character Recognition Rozpoznávání tištěného písma: od 50. let (Pošta: telegramy a PSČ, embosované kreditkarty), „Latinka“ se považuje za prozkoumanou, řeší se východní znakové sady. Psané písmo: Omezení na specificky psané znaky, vyšší chybovost současná řešení jsou orientovaná spíš na „americké“ psané písmo. Obvyklý postup: Identifikace odstavců, objektů a narovnání linek, normalizace; Detekce jednotl. znaků a slitků (včetně nalezení těžiště) vyhledání nejbližšího vzorku k FFT daného znaku ve slovníku (schopnost učení)