15.3.2001SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace.

Slides:

Advertisements

Podobné prezentace

Lineární klasifikátor

Advertisements

ARITMETICKÁ POSLOUPNOST

Neurčitý integrál. Příklad.

Lineární model posteriorní hustota pravděpodobnosti lineární model:

Algoritmy I Cvičení č. 2. Cíl hodiny Datové typy a přetypování (int, float, double, bool, char, long, short) Konstanty – Celočíselné Desítkové – 15, 0,

Základy informatiky přednášky Kódování.

Vznik a vývoj teorie informace

Komprese textových, video a audio dat.  Komprese   JPEG: 

3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI

Informatika pro ekonomy II přednáška 1

Teoretické Základy Informatiky

Základy informatiky přednášky Pojem informace.

Základní číselné množiny

Deterministické modely zásob Model s optimální velikostí objednávky

Základy informatiky přednášky Efektivní kódy.

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Adaptivní Huffmanův kód.

Pravděpodobnost a statistika opakování základních pojmů

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

5. Přednáška funkce BRVKA Johann P.G.L. Dirichlet (1805 – 1859)

Informatika pro ekonomy II přednáška 2

Základy informatiky přednášky Entropie.

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Statistické metody komprese dat a Shannon-Fanův kód.

REDUKCE DAT Díváme-li se na soubory jako na text, pak je tento text redundantní. Redundance vyplývá z:  některé fráze nebo slova se opakují  existuje.

Radim Farana Podklady pro výuku pro akademický rok 2013/2014

Matematický aparát v teorii informace Základy teorie pravděpodobnosti

Základy informatiky přednášky Bezpečnostní kódy.

Nechť (, , P) je pravděpodobnostní prostor:

Úvod do klasických a moderních metod šifrování

Číselné soustavy david rozlílek ME4B

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Úvod.

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Aritmetické kódování.

Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.

Predikátová logika.

Perfektní kódy.

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Kontextové metody.

Aplikační a programové vybavení

Uložení čísel v počítači Informatika pro ekonomy II doplněk.

SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII

ZÁKLADY TEORIE PRAVDĚPODOBNOSTI

Základy zpracování geologických dat

FUNKCE. Závislost délky vegetační sezóny na nadmořské výšce

Úvod do teorie konečných automatů

Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.

Časová analýza stochastických sítí - PERT

Radim Farana Podklady pro výuku

2. Vybrané základní pojmy matematické statistiky

Náhodný vektor Litschmannová, 2007.

Výroková logika.

Algoritmy komprese dat

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a … báli jste se zeptat (1. část) (pro potřeby přednášky Úvod do strojového.

(Popis náhodné veličiny)

Radim Farana Podklady pro výuku

Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.

Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a … báli jste se zeptat (1. část) (pro potřeby přednášky Úvod do strojového.

Funkce. Funkce - definice Funkce je zobrazení, které každému číslu z podmnožiny množiny reálných čísel R přiřazuje právě jedno reálné číslo. Funkci značíme.

Pravděpodobnost a matematická statistika I.

Základy statistické indukce

Základy zpracování geologických dat Rozdělení pravděpodobnosti

Informatika pro ekonomy přednáška 3

Teorie informace z latiny, už 1stol. př. n. l.

Spojitá a kategoriální data Základní popisné statistiky

Informatika pro ekonomy přednáška 3

Pravděpodobnost a matematická statistika I.

Poissonovo rozdělení diskrétní náhodné veličiny

Ukázky aplikací matematiky

Definiční obory. Množiny řešení. Intervaly.

Základy statistiky.

Transkript prezentace:

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace

SWI072 Algoritmy komprese dat2 Teorie informace u Informace obsažená ve zprávě z - nejmenší počet otázek typu ANO/NE, kterými lze odhalit obsah zprávy. u Hartleyho vzorec (1928) Je-li neznámá x prvkem N prvkové množiny, pak informace, kterou x nese, má hodnotu log 2 N bitů.  |H|=N, (x 1,…, x k )  H k , buď S k nejmenší počet otázek, nutný k určení všech x i. log 2 N k  S k  log 2 N k +1 log 2 N  S k / k  log 2 N + 1/k S k / k - počet otázek, potřebný k určení jednoho prvku v průměrném případě.

SWI072 Algoritmy komprese dat3 Shannonův vzorec u Věta (Fadějev): Následující axiomy určují entropii jednoznačně až na mutiplikativní konstantu: –H 2 (p,1-p) je spojitá v oboru 0  p  1 a kladná alespoň v jednom bodě –H n je symetrická funkce svých proměnných (n = 2,3,...) –H n+1 (p 1,...,p n-1,q 1,q 2 ) = H n (p 1,...,p n )+ p n H n (q 1 /p n, q 2 /p n ), kde p n =q 1 +q 2 >0, p i  0, p p n = 1. u Buď X diskrétní náhodná veličina s oborem hodnot H a pravděpodobnostní funkcí p(x) = P(X=x) pro x  H. u Claude Shanon (1948): Entropie H(X) –analogie ze statistické mechaniky (Boltzmann) –axiomatický přístup –souvislost s kódováním

SWI072 Algoritmy komprese dat4 Definice u Kód C pro diskrétní náhodnou veličinu X s oborem hodnot H je zobrazení C: H  {0,1} * pravděpodobnostní funkcí p(x) = P(X=x) pro x  H. Definujme C * : H *  {0,1} * takto: C * (x 1...x k ) = C(x 1 )...(x k ). Kód C je jednoznačně dekódovatelný, pokud u,v  H *, C * (u)=C * (v)  u=v. u Pro x  H bude l(x) značit délku kódového slova C(x). u Průměrná délka L(C) kódu C pro diskrétní náhodnou veličinu X s pravděpodobnostní funkcí p(x) L(C)=  x  H p(x)l(x)

SWI072 Algoritmy komprese dat5 Kraft-McMillanova nerovnost u Věta: Délky l 1,l 2, … kódových slov jednoznačně dekódovatelného kódu C splňují  i 2 -l i  1. Naopak, pokud přirozená čísla l 1,l 2, … splňují nerovnost, pak existuje prefixový kód s kódovými slovy o těchto délkách. u Ověřte, zda je následující kód jednoznačně dekódovatelný, případně najděte prefixový kód se slovy stejné délky u Kolik znaků musí mít abeceda k zakódování všech 26 písmen (bez háčků), když kódová slova mají mít délku nejvýše 2 a pro samohlásky dokonce 1?

SWI072 Algoritmy komprese dat6 Horní a dolní odhady u Buď C jednoznačně dekódovatelný kód pro náhodnou veličinu X. Pak H(X)  L(C). u Pro libovolný optimální prefixový kód C pro náhodnou veličinu X platí H(X)  L(C) < H(X) + 1.  Pro průměrnou délku kódového slova L Huffmanova kódu platí H  L   Je-li p max maximální pravděpodobnost výskytu znaku, pak l  p max je-li p max < 0.5  l  p max je-li p max  0.5

SWI072 Algoritmy komprese dat7 Příklad

SWI072 Algoritmy komprese dat8 Huffmannův kód nad rozšířenou abecedou  Pro průměrnou délku kódového slova L Huffmanova kódu nad abecedou rozšířenou na bloky n znaků platí H  L  1/n

SWI072 Algoritmy komprese dat9 Horní a dolní odhady - aritmetické kódování  Pro průměrnou délku kódového slova L pro aritmetické kódování platí H  L  m kde m je délka vstupního řetězce.