Komprese obrazu Adolf Knoll Národní knihovna České republiky
Obecná schémata pro aplikaci komprese Schémata jsou přizpůsobena charakteru reprezentovaných objektů: Bitonální obraz (1-bit, černobílý) Barevný fotorealistický obraz Smíšený dokument (obě výše uvedené komponenty)
Trendy Bitonální od CCITT Fax Gr. 3 a 4 k variantám JBIG Fotorealistický Bezeztrátová komprese: PNG, TIFF/LZW Ztrátová: od JPEG DCT k wavelet Smíšený dokument Aplikace obého (Mixed Raster Content – Smíšený rastrový obsah – obvykle vertikálně)
Jak jsou kompresní schémata zabudována do formátů? Snahou je obvykle ISO TIFF (v něm jsou možné dokonce JPEG, LZW nebo PNG) – ale to nestačí, protože mohou chybět nástroje na konverze a zobrazení Proto jsou používány jiné vhodnější formáty, například JPEG nebo PNG Z tohoto důvodu jsme též svědky velkého rozvoje v oblasti smíšených formátů, přestože tyto si nekladou za cíl bát normou ISO
Relevantní směry Bitonální obraz JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; existují i odvozené aktivity (například bitonální kompresor v DjVu) Fotorealistický obraz wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF, IW44, SID, Imagepower IW, …) Smíšený obsah DjVu, LDF a další řešení LuraTech, v minulosti Imagepower MRC
Cíle Archivace obrazu standardizovaný archivní formát (TIFF, JPEG, PNG, …) Dodávání obrazů Účinnější moderní formát (JB2, MrSID, DjVu, LDF, …) Jak se vyrovnat s těmito dvěma cíli? Klíč je v zaměření projektu.
Komprese… Předzpracování obrazu Komprese Zakódování do obrazového formátu Dekódování z formátu Dekomprese Zobrazení - Tisk
Předzpracování bitonálního obrazu - I Účinná schémata jsou stavěna na možnostech aplikace slovníků pixelových shluků: Např. text je obraz, který může být interpretován jako velké množství obrázků jednotlivých písmen, zatím co opakovaný výskyt každého písmene může být vyjádřen souřadnicemi (x,y) a odkazem na slovník, ve kterém je pouze jedna reprezentace podobných písmen (digitalizována jen jednou jako bitmapa) Např. text je obraz, který může být interpretován jako velké množství obrázků jednotlivých písmen, zatím co opakovaný výskyt každého písmene může být vyjádřen souřadnicemi (x,y) a odkazem na slovník, ve kterém je pouze jedna reprezentace podobných písmen (digitalizována jen jednou jako bitmapa) Tato metoda se nazývá PATTERN MATCHING (porovnávání se vzorem), ale… Tato metoda se nazývá PATTERN MATCHING (porovnávání se vzorem), ale…
Předzpracování bitonálního obrazu - II Naskenované texty obsahují však spoustu informačního šumu ve shlucích pixelů, představujících jedno písmeno v textu, i mimo ně Proto je vhodné omezit odchylky mezi identicky identifikovatelnými shluky vyhlazování obracení pixelů odstranění šumu
Vyhlazování a obracení pixelů
Problémy v pattern matching Česká republika Originál nebo sken nízké kvality + špatné zpracování
Soft pattern matching Lepší práce se slovníky; náhrada jen tam, kde je jistota, že nebude překročen kritický práh vedoucí k nežádoucí záměně shluků Kdyby to hrozilo, je uložena další malá bitmapa Vyladění těchto mechanismů je klíčem k úspěšné aplikaci ztrátové komprese bitonálního obrazu.
Jak to zjistit… Knihovny mají dokumenty různé kvality vč. té velmi špatné Tyto dokumenty se obtížněji zpracovávají než kvalitní vzorky prezentované softwarovými firmami Je třeba testovat na typických materiálech, které chceme digitalizovat v knihovnách
Bitonální komprese Bezeztrátová (LZW, PNG, …, CCITT Fax Group 3 and 4, JB2, JBIG, JBIG2, Algo Vision/Luratech Moderní ztrátová schémata: AT&T (Lizardtech) (JB2) – soft pattern matching ImagePower Inc. JBIG2 (JB2) – v minulosti - pouze pattern matching Summus Inc. (Lightning Strike),...
GIF by byl mírně horší než PNG
Květy české – 19. století
Vliv kvality digitalizovaných originálů na výkonnost kompresních schémat
JB2 Nejvýkonnějším kompresním schémat je JB2 z formátu DjVu (AT&T/Lizardtech). Umožňuje kompresi: bezeztrátovou ztrátovou agresivní – nastavitelná; zachovává vysokou čitelnost originálu Zkuste si komprimovat do DjVu on-line:
JB2 jako komponenta formátu DjVu Více souborů může být sloučeno a uloženo v jednom (jako v PDF) – mají společný slovník, takže jejich celkový objem bude menší než součet objemů individuálních souborů Více souborů může být sloučeno virtuálně (na webu jsou volány dle potřeb uživatele) Více výhod: display, odkazy, OCR, … (DjVu plug-in) Drahý kódující software + řada řešení zdarma
Vzorky a résumé Je třeba monitorovat a testovat nové způsoby zpracování obrazu Nové přístupy mohou být velmi vhodné pro systémy dodávání dokumentů Obrazové servery Naskenovaný obsah Klikněte, pokud máte zájem si přečíst speciální studii Klikněte
Které formáty jsou vhodné pro bitonální obraz? Jestliže chcete nejjednodušší řešení: GIF Jestliže chcete menší soubory, používejte PNG Oba formáty jsou doporučeny pro web Úspornějším řešením je však TIFF/CCITT Fax Gr. 4 Používejte DjVu/JB2, pokud chcete velmi malé soubory
Problémy Zavedený software pro práci s obrazem obvykle neobsahuje podporu pro TIFF s kódováním CCITT Fax Gr. 4 Na druhé straně je uvedený TIFF dobře zobrazitelný elementárními nástroji Windows GIF a PNG podporují též větší barevnou hloubku (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se ukládání bitonálního obrazu ve větší barevné hloubce DjVu – je vždy nezbytné mít na paměti výrobu a příjem obrazu v tomto formátu
Ztrátová komprese – bitonální obraz
Komprese barevného obrazu Bezeztrátová LZW GIF (pouze 8 bitů) TIFF (od verze 5.0) PNG Wavelet JPEG2000 (JP2) … Ztrátová DCT (JPEG) Fraktální komprese Wavelet IW44 LWF, WI JPEG2000 (JP2) MrSID, … V podstatě ale jde o střet klasických přístupů s technologií wavelet.
Barevný obraz DCT wavelet
Účinnost komprese – bitonální obraz
Účinnost komprese – barevný obraz Referenční vzorek
Jak aplikovat kompresi? Záleží na charakteru objektů v obraze: Fotorealistický obraz (JPEG, wavelet) Text a jednoduchá černobílá grafika (Fax Group 4, JB2, …) Barevná grafiky (problém ztrátové komprese; je lépe bezeztrátově v PNG nebo GIF – aplikační oblast vektorové grafiky - SVG) Smíšený obsah (složená řešení: DjVu, LDF, …)
Nejúčinnější řešení Segmentace obrazu do dvou nebo více skupin objektů: 1.Objekty vhodné pro bitonální konverzi 2.Objekty vhodné pro barevnou reprezentaci Komprimovat každou skupinu zvlášť a potom je sloučit v jednom formátu.
Horizontální segmentace/zónování - Text - Grafika - Fotografie Imagepower Inc.
Vertikální segmentace/zónování popředí pozadí Lizardtech Inc. (AT&T) Luratech GmBH DjVu, LDF
Bitonální versus složený obraz
Šedá škála
Další vlastnosti DjVu Více obrazů v jednom souboru: jako TIFF, PDF, LDF, …, s použitím společného slovníku pixelových shluků virtuálně: stránky zůstanou na serveru a dodána je jen ta strana, která je volána Příklad virtuálního DjVu Příklad virtuálního DjVu
Obrazový soubor s několika rozlišeními MrSID V jednom souboru je (až 9) obrazů v různých rozlišeních Účinné ve spojení s obrazovým serverem Příklad MrSID Příklad MrSIDPříklad MrSID Příklad MrSID (bez obrazového serveru)