Komprimace dat a kryptologie.  Myšlenka: Jak zakódovat vstupní data do jediného čísla?  Data se zakódují do zlomku n, 0 ≤ n < 1, n ∊ R  Bezztrátová.

Slides:



Advertisements
Podobné prezentace
Půlbajtová komprimace
Advertisements

SHA-1 Secure Hash Algorithm Martin Raichl. HASH  Hašovací funkce jsou silným nástrojem moderní kryptologie. Jsou jednou z klíčových kryptologických myšlenek.
Programování funkcí v Excelu
Kompresní algoritmy.
Seminární práce číslo: 7 Zpracoval : Vladimír KORDÍK T-4.C
Jiří Šafr jiri.safr(zavináč)seznam.cz
POPULAČNÍ GENETIKA 3 Pravděpodobnost v genetice populací
Komprese textových, video a audio dat.  Komprese   JPEG: 
- X>=-4 + Program, který po zadání n čísel určí počet čísel, která jsou v intervalu
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
Základy informatiky přednášky Efektivní kódy.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Adaptivní Huffmanův kód.
Analýza způsobilosti procesů a výrobních zařízení
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Statistické metody komprese dat a Shannon-Fanův kód.
REDUKCE DAT Díváme-li se na soubory jako na text, pak je tento text redundantní. Redundance vyplývá z:  některé fráze nebo slova se opakují  existuje.
INFORMATIKA 9 Komprimace dat
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
Diskový manažer Total Commander
Šifrátor 1.0 (zatím) Projekt do předmětu Komprimace dat a kryptologie , Brno Martin Chodúr.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Úvod.
Poskytuje daný generátor opravdu posloupnost náhodných čísel?
Testy náhodnosti, metody transformace náh. čísel na hodnoty náh
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Aritmetické kódování.
Analýza kvantitativních dat II. / Praktikum Vícenásobné výběrové otázky (Multiple response) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace.
Systém rizikové analýzy při statickém návrhu podzemního díla Jan Pruška.
ZÁZNAM A KÓDOVÁNÍ INFORMACÍ
Radim Farana Podklady pro výuku
Lineární lomená funkce
DIGITALIZACE Datové formáty. Nekomprimované formáty původní algoritmy záznamu datových souborů umožnily pouze jejich převod do digitální podoby:  formát.
Studium struktury amorfních látek
GRAFIKA.
Vybraná rozdělení spojité náhodné veličiny
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_222 Název školyGymnázium, Tachov, Pionýrská 1370 AutorMgr. Petr Křížek PředmětChemie.
Základy informatiky. 4 DATA – uchování – ochrana.
Z ÁLOHOVÁNÍ. Jediná data, která není potřeba zálohovat jsou ta, o která už jste přišli. Více než 87% počítačů v České republice není dostatečně zálohováno.
Příprava na čtvrtletní písemnou práci
2.
Autor: Mgr. Tomáš Hasík Určení: Septima, III.G
Základy HTML 1 Vložení obrázku. 2 Grafické formáty První předpoklad pro vložení obrázku do stránky je jeho uložení ve vhodném formátu. Prohlížeče podporují.
Počátky kvantové mechaniky
Generování náhodných čísel
Datové formáty Název školyGymnázium Zlín - Lesní čtvrť Číslo projektuCZ.1.07/1.5.00/ Název projektuRozvoj žákovských kompetencí.
BMP – bitová mapa bez komprese Dnes se už nepoužívá TIFF – bezztrátový formát Používá se, když je potřeba uložit celý obrázek v maximální velikosti (publikace)
Molekulová fyzika 3. přednáška „Statistický přístup jako jediná funkční strategie kinetické teorie“
Statistické odhady (inference) Výběr Nepotřebujeme sníst celého vola jenom proto, abychom poznali, že to jde ztuha. Samuel Johnson (anglický básník a.
Hmotnostní zlomek Mgr. Helena Roubalová
Grafické formáty Mgr. Petra Toboříková. Barevná hloubka barevné odstíny jsou dány kombinací barev barevná hloubka = určuje kolik bitů je potřeba k popisu.
Inf Ztrátová a bezztrátová komprese zvuku. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím.
Autor : Mgr. Terezie Nohýnková Vzdělávací oblast : Člověk a příroda Obor : Přírodopis Téma : Soustavy orgánů člověka Název : Těhotenství 2. Anotace : Seznámení.
Zálohování dat. Zálohování dat (podle CHIP) důvody zálohování – problémy HW, SFTW, viry, chyby uživatele, viry, hackeři, přírodní katastrofy, krádeže.
ZŠ Brno, Řehořova 3 S počítačem snadno a rychle Informatika 7. ročník III
Hmota se skládá z malých, dále nedělitelných částic – atomů (atómós = nedělitelný) Tvar atomů – podle živlů Myšlenky - ověřeny za2500let.
Ústav lékařské informatiky, 2. LF UK 2008 STATISTIKA II.
Komprese (komprimace) dat  komprese = zmenšení objemu dat  používá se hlavně při archivaci nebo přenosu dat  slangové alternativní termíny: (za)zipování,
Inf Mutlimédia. Výukový materiál Číslo projektu: CZ.1.07/1.5.00/ Šablona: III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Číslo materiálu:
Některá rozdělení náhodných veličin
FUNKCE 15. Nepřímá úměrnost
Ověřování první sbírky
Elektronový obal.
Graf a vlastnosti funkce
Základní škola Čelákovice
Mgr. Radka POspíchalová
Barvy v počítačové grafice
Výuka matematiky v 21. století na středních školách technického směru
Rozdělení pravděpodobnosti
Poissonovo rozdělení diskrétní náhodné veličiny
Výpočet a interpretace ukazatelů asociace v epidemiologických studiích
M. Telingerová Komprimace dat.
Princip max. věrohodnosti - odhad parametrů
Transkript prezentace:

Komprimace dat a kryptologie

 Myšlenka: Jak zakódovat vstupní data do jediného čísla?  Data se zakódují do zlomku n, 0 ≤ n < 1, n ∊ R  Bezztrátová komprese

 Podle pravděpodobnosti výskytu znaku je každému znaku přiřazena poměrná část intervalu <0,1). To je interval rozdělení znaků. SymbolPravděpodobnostInterval a 0.30<0.00, 0.30) b 0.15<0.30, 0.45) ……… z0.10<0.9,1.00)

 Potom postupně upřesňujeme počáteční interval <0,1), dokud není vyprázdněn vstup. Číslo n leží ve vypočítaném intervalu.  Zavedeme symboliku:  Horní hodnota intervalu … high  Spodní hodnota intervalu … low  Rozpětí intervalu … range

 Výpočet nových hranic intervalu pro jednotlivé znaky:  high = low + range * horní hodnota intervalu znaku  low = low + range * spodní hodnota intervalu znaku  Výpočet probíhá pro všechny symboly na vstupu.

 Číslo, které kóduje vstupní řetězec může být libovolné číslo z výsledného intervalu.  Obvykle se bere to, které má nejkratší binární zápis.

 Chceme zakódovat řetězec „ace“.  Máme např. abecedu se znaky a,b,c,d,e.  Provedeme rozdělení pravděpodobnosti výskytu znaků do intervalu znaků <0,1). SymbolPravděpodobnostInterval a 0.30<0.00, 0.30) b 0.15<0.30, 0.45) c 0.25<0.45, 0.70) d 0.10<0.70, 0.80) e 0.20<0.80, 1.00)

 Výpočet nových hranic intervalu pro každý znak.  Výsledný interval: <0.195,0.210)  Jako výslednou hodnotu vybereme např. n=0.20 KrokSymbolPředchozí range lowhigh 001 1a c e

 Při dekódování není potřeba předávat výsledný interval, stačí jen zvolené číslo n.  Musíme mít ale k dispozici pravděpodobnosti výskytu znaků abecedy.  Číslo n postupně upravujeme a při každém kroku k němu najdeme příslušný znak podle intervalu, ve kterém právě leží n.  Nová hodnota n se vypočítá podle vztahu:  n = (n – low) / range  low, high … hodnoty intervalu, do kterého patří n  Opakujeme tak dlouho, dokud není celý řetězec dekódován.

 n = 0.20  Stanovíme jednotlivé znaky:  Výsledný řetězec: „ace“ nlowhighrangeSymbol a c e

 Problém: nekonečně dlouhý řetězec povede na interval s nekonečně velkou přesností.  Je potřeba nekonečně mnoho bitů pro uložení.  Řešení:  V proměnných low a high se ukádá jen několik posledních desetinných míst, zbytek je zapsán na výstupu.  V době kdy se rovnají MSB (nejvýznamnější bity) horní i dolní hranice intervalu, vypíšeme hotnotu na výstup a posuneme vlevo obě proměnné o jeden bit.

 Pokud se MSB nerovnají, může nastat další další problém – podtečení.  V situaci, kdy jsou hranice intervalu velmi blízko a stále nemají stejný MSB, mění se dále už jen ostatní bity, nikoli MSB – nedojde k posunu bitů vlevo a přesnost se ztratí.  Podtečení nastává v případě, že dva MSB v low a se liší od jejich protějšků v high.

 Řešení:  Posun bitů vlevo od druhého bitu.  Např.:  low = high =  podtečení posun: low = high =

begin spočti četnosti zdrojových jednotek output(četnosti) interval I := nový interval 0..1 rozděl I podle četnosti jednotek readSymbol(X) while (X!=EOF) do begin if (MSB(low) == MSB(high)) then begin output(MSB) případné zahozené číslice na výstup shift left high i low end else begin if (nebezpečí podtečení) then begin shift left high i low od druhé pozice end spočti nové low a high readSymbol(X) end output(zbytek) end

 Srovnatelné s Huffmanovým kódováním  Komprese trvá déle, ale má lepší kompresní poměr.  JPEG  JBIG2