Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Komprese obrazu Adolf Knoll Národní knihovna České republiky.

Podobné prezentace


Prezentace na téma: "Komprese obrazu Adolf Knoll Národní knihovna České republiky."— Transkript prezentace:

1 Komprese obrazu Adolf Knoll Národní knihovna České republiky

2 Obecná schémata pro aplikaci komprese Schémata jsou přizpůsobena charakteru reprezentovaných objektů:  Bitonální obraz (1-bit, černobílý)  Barevný fotorealistický obraz  Smíšený dokument (obě výše uvedené komponenty)

3

4

5

6 Trendy  Bitonální  od CCITT Fax Gr. 3 a 4 k variantám JBIG  Fotorealistický  Bezeztrátová komprese: PNG, TIFF/LZW  Ztrátová: od JPEG DCT k wavelet  Smíšený dokument  Aplikace obého (Mixed Raster Content – Smíšený rastrový obsah – obvykle vertikálně)

7 Jak jsou kompresní schémata zabudována do formátů?  Snahou je obvykle ISO TIFF (v něm jsou možné dokonce JPEG, LZW nebo PNG) – ale to nestačí, protože mohou chybět nástroje na konverze a zobrazení  Proto jsou používány jiné vhodnější formáty, například JPEG nebo PNG  Z tohoto důvodu jsme též svědky velkého rozvoje v oblasti smíšených formátů, přestože tyto si nekladou za cíl bát normou ISO

8 Relevantní směry  Bitonální obraz  JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; existují i odvozené aktivity (například bitonální kompresor v DjVu)  Fotorealistický obraz  wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF, IW44, SID, Imagepower IW, …)  Smíšený obsah  DjVu, LDF a další řešení LuraTech, v minulosti Imagepower MRC

9 Cíle Archivace obrazu  standardizovaný archivní formát (TIFF, JPEG, PNG, …) Dodávání obrazů  Účinnější moderní formát (JB2, MrSID, DjVu, LDF, …) Jak se vyrovnat s těmito dvěma cíli? Klíč je v zaměření projektu.

10 Komprese…  Předzpracování obrazu  Komprese  Zakódování do obrazového formátu  Dekódování z formátu  Dekomprese  Zobrazení - Tisk

11 Předzpracování bitonálního obrazu - I  Účinná schémata jsou stavěna na možnostech aplikace slovníků pixelových shluků: Např. text je obraz, který může být interpretován jako velké množství obrázků jednotlivých písmen, zatím co opakovaný výskyt každého písmene může být vyjádřen souřadnicemi (x,y) a odkazem na slovník, ve kterém je pouze jedna reprezentace podobných písmen (digitalizována jen jednou jako bitmapa) Např. text je obraz, který může být interpretován jako velké množství obrázků jednotlivých písmen, zatím co opakovaný výskyt každého písmene může být vyjádřen souřadnicemi (x,y) a odkazem na slovník, ve kterém je pouze jedna reprezentace podobných písmen (digitalizována jen jednou jako bitmapa) Tato metoda se nazývá PATTERN MATCHING (porovnávání se vzorem), ale… Tato metoda se nazývá PATTERN MATCHING (porovnávání se vzorem), ale…

12 Předzpracování bitonálního obrazu - II Naskenované texty obsahují však spoustu informačního šumu ve shlucích pixelů, představujících jedno písmeno v textu, i mimo ně Proto je vhodné omezit odchylky mezi identicky identifikovatelnými shluky  vyhlazování  obracení pixelů  odstranění šumu

13 Vyhlazování a obracení pixelů

14 Problémy v pattern matching Česká republika Originál nebo sken nízké kvality + špatné zpracování

15 Soft pattern matching  Lepší práce se slovníky; náhrada jen tam, kde je jistota, že nebude překročen kritický práh vedoucí k nežádoucí záměně shluků  Kdyby to hrozilo, je uložena další malá bitmapa  Vyladění těchto mechanismů je klíčem k úspěšné aplikaci ztrátové komprese bitonálního obrazu.

16 Jak to zjistit…  Knihovny mají dokumenty různé kvality vč. té velmi špatné  Tyto dokumenty se obtížněji zpracovávají než kvalitní vzorky prezentované softwarovými firmami  Je třeba testovat na typických materiálech, které chceme digitalizovat v knihovnách

17 Bitonální komprese  Bezeztrátová (LZW, PNG, …, CCITT Fax Group 3 and 4, JB2, JBIG, JBIG2, Algo Vision/Luratech  Moderní ztrátová schémata:  AT&T (Lizardtech) (JB2) – soft pattern matching  ImagePower Inc. JBIG2 (JB2) – v minulosti - pouze pattern matching  Summus Inc. (Lightning Strike),...

18 GIF by byl mírně horší než PNG

19 Květy české – 19. století

20

21 Vliv kvality digitalizovaných originálů na výkonnost kompresních schémat

22 JB2  Nejvýkonnějším kompresním schémat je JB2 z formátu DjVu (AT&T/Lizardtech).  Umožňuje kompresi:  bezeztrátovou  ztrátovou  agresivní – nastavitelná; zachovává vysokou čitelnost originálu  Zkuste si komprimovat do DjVu on-line: http://any2djvu.djvuzone.org/ http://any2djvu.djvuzone.org/

23 JB2 jako komponenta formátu DjVu  Více souborů může být sloučeno a uloženo v jednom (jako v PDF) – mají společný slovník, takže jejich celkový objem bude menší než součet objemů individuálních souborů  Více souborů může být sloučeno virtuálně (na webu jsou volány dle potřeb uživatele)  Více výhod: display, odkazy, OCR, … (DjVu plug-in)  Drahý kódující software + řada řešení zdarma

24 Vzorky a résumé  Je třeba monitorovat a testovat nové způsoby zpracování obrazu  Nové přístupy mohou být velmi vhodné pro systémy dodávání dokumentů  Obrazové servery  Naskenovaný obsah  Klikněte, pokud máte zájem si přečíst speciální studii Klikněte

25 Které formáty jsou vhodné pro bitonální obraz?  Jestliže chcete nejjednodušší řešení:  GIF  Jestliže chcete menší soubory, používejte PNG  Oba formáty jsou doporučeny pro web  Úspornějším řešením je však TIFF/CCITT Fax Gr. 4  Používejte DjVu/JB2, pokud chcete velmi malé soubory

26 Problémy  Zavedený software pro práci s obrazem obvykle neobsahuje podporu pro TIFF s kódováním CCITT Fax Gr. 4  Na druhé straně je uvedený TIFF dobře zobrazitelný elementárními nástroji Windows  GIF a PNG podporují též větší barevnou hloubku (GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se ukládání bitonálního obrazu ve větší barevné hloubce  DjVu – je vždy nezbytné mít na paměti výrobu a příjem obrazu v tomto formátu

27 Ztrátová komprese – bitonální obraz

28 Komprese barevného obrazu Bezeztrátová  LZW  GIF (pouze 8 bitů)  TIFF (od verze 5.0)  PNG  Wavelet  JPEG2000 (JP2)  … Ztrátová  DCT (JPEG)  Fraktální komprese  Wavelet  IW44  LWF, WI  JPEG2000 (JP2)  MrSID, … V podstatě ale jde o střet klasických přístupů s technologií wavelet.

29

30 Barevný obraz DCT wavelet

31 Účinnost komprese – bitonální obraz

32 Účinnost komprese – barevný obraz Referenční vzorek

33 Jak aplikovat kompresi? Záleží na charakteru objektů v obraze:  Fotorealistický obraz (JPEG, wavelet)  Text a jednoduchá černobílá grafika (Fax Group 4, JB2, …)  Barevná grafiky (problém ztrátové komprese; je lépe bezeztrátově v PNG nebo GIF – aplikační oblast vektorové grafiky - SVG)  Smíšený obsah (složená řešení: DjVu, LDF, …)

34 Nejúčinnější řešení Segmentace obrazu do dvou nebo více skupin objektů: 1.Objekty vhodné pro bitonální konverzi 2.Objekty vhodné pro barevnou reprezentaci Komprimovat každou skupinu zvlášť a potom je sloučit v jednom formátu.

35 Horizontální segmentace/zónování - Text - Grafika - Fotografie Imagepower Inc.

36 Vertikální segmentace/zónování  popředí  pozadí Lizardtech Inc. (AT&T) Luratech GmBH DjVu, LDF

37 Bitonální versus složený obraz

38 Šedá škála

39 Další vlastnosti DjVu Více obrazů v jednom souboru:  jako TIFF, PDF, LDF, …, s použitím společného slovníku pixelových shluků  virtuálně: stránky zůstanou na serveru a dodána je jen ta strana, která je volána Příklad virtuálního DjVu Příklad virtuálního DjVu

40 Obrazový soubor s několika rozlišeními MrSID  V jednom souboru je (až 9) obrazů v různých rozlišeních  Účinné ve spojení s obrazovým serverem Příklad MrSID Příklad MrSIDPříklad MrSID Příklad MrSID (bez obrazového serveru)


Stáhnout ppt "Komprese obrazu Adolf Knoll Národní knihovna České republiky."

Podobné prezentace


Reklamy Google