Teorie komprese dat Veronika Srbová, 4.Z
Obsah: Význam komprese Komprese a dekomprese Komprimační programy Metoda opakování znaku Kompresní metoda Druhy zálohování Použitá literatura
Význam komprese Komprese nebo také komprimace (zhušťování) dat se objevila spolu s rostoucím množstvím ukládání a přenášení informace Komprese je tedy proces, který se používá pro zredukování fyzické velikosti bloku informací Snahou komprese dat je uložit informaci v kratší podobě s tím, že musíme být schopni informaci kdykoliv převést do původní podoby, nesmí tedy docházet ke ztrátě informací.
Komprese a dekomprese Datové soubory můžeme zmenšovat, zmenšené přenášet a v místě příjemce je opět vrátit do původní podoby… Komprese = krácení času, po který je využíván přenosový kanál (neboť je velmi drahý) = zmenšení kapacity paměťových médií Dekomprese = navrácení komprim. souboru do původní podoby
Komprimační programy: Tyto programy umožňují, aby se důležitá data dala zálohovat na disketu nebo jiné médium Většina těchto programů při zálohování data komprimuje (zmenšuje jejich velikost) Zkomprimovaná data zabírají na zálohovacím médiu mnohem méně místa, než když se pouze zkopírují Mezi nejběžnější programy patří např. PKZIP, RAR, M602, BackUp, Windows 95,98…
K nejrozšířenějším programům patří: WIN ZIP jedná se o komprimační program, který pracuje v operačním systému Windows tento program se snadno ovládá a při vytváření a rozbalování archivů poskytuje značný komfort k těmto úkonům využívá buď vnitřní ZIP a UNZIP programy nebo programy ARJ, PKZIP, LHA a ARC
ARCHIV je to soubor s příponou vypovídající o typu archivu. Např. přípona ARJ znamená, že archiv byl vytvořen v programu ARJ archiv je tedy jeden soubor, který obsahuje zálohové soubory v komprimovaném tvaru rozbalení archivu znamená opačný proces než je vytvoření archivu, tj. rozbalení souboru se rovná dekomprimaci souborů uložených v archivu
Metoda opakování znaku Je historicky prvním a dosud nejjednodušším postupem komprese dat Při rozboru především grafické informace (obrázku) bylo zjištěno, že se v nich často vyskytují skupiny stejných znaků, u obrázků jsou to např. plochy stejné barvy. Výrazné úspory dosáhneme, jestliže dokážeme takovou skupinu vyjádřit bez nutnosti zápisu všech opakujících se znaků. Nejčastěji takovou skupinu nahrazujeme trojicí znaků: Zarážka, počítadlo, opakující se znak
Zarážka Je libovolný znak, který se v textu vyskytuje co nejméně, neboť jeho každý výskyt v původním souboru je zapsán pomocí trojice: zarážka, #01, zarážka Počítadlo Udává počet stejných znaků ležících bezprostředně vedle sebe v jednom bloku. Nejčastěji je použito počítadlo 8bitové.
Opakovací znak Je znak, který tvoří blok opakujících se znaků. Obvykle pracujeme se soubory znaku ASCII, tedy znaky délky 8 bitů. Na základě zjištění, že většina skupin opakujících se znaků je spíše kratší délky, vznikla modifikovaná metoda, která se nazývá Run – lenght komprese. Je používaná v grafickém formátu PCX, který používá např. grafický program Painbrush.
Kompresní metoda: Skoro každý formát podporuje některou kompresní metodu Používá se pouze omezen počet schémat Kompresní metoda Zkratka Ztrátovost Příklad formátu Run – lenght RLE Ne PCX Lempel-Zip-Welch LZW ne GIF, PNG, ZIP, ARJ Diskrétní kosinová transformace DCT JPEG Huffamnovo kódování CCITT Ano TIFF Fraktální komprese FIT
Druhy zálohování Plné zálohování Do této operace jsou zahrnuty pouze soubory s nastaveným atributem, který se po ukončení operace u zálohovaných souborů zruší. Přírůstkové zálohování Zde jsou zahrnuty pouze soubory s nastaveným atributem, který se po skončení operace u zálohovaných souborů zruší. Tak se soubory označí jako zálohované a při příštím zálohování již nebudou do operace zahrnuty.
Rozdílové zálohování Při tomto zálohování jsou do operace zahrnuty pouze soubory s nastaveným archivním atributem, který není po skončení operace u zálohovaných souborů zrušen. To znamená, že jsou zálohovány všechny soubory aktualizovaně od posledního zálohování. Ukládá se tedy rozdíl změn od poslední zálohy. Chceme-li obnovit všechny soubory, potom stačí plná záloha a poslední rozdílová záloha. Naopak při přírůstkovém zálohování potřebujeme všechny přírůst. zálohy, které proběhly od poslední úplné zálohy.
Použitá literatura: http://www.fs.vsb.cz Jelínek, J: Komprese dat. PC World, 1992