15.3.2001SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace.

Slides:



Advertisements
Podobné prezentace
Lineární klasifikátor
Advertisements

ARITMETICKÁ POSLOUPNOST
Neurčitý integrál. Příklad.
Lineární model posteriorní hustota pravděpodobnosti lineární model:
Algoritmy I Cvičení č. 2. Cíl hodiny Datové typy a přetypování (int, float, double, bool, char, long, short) Konstanty – Celočíselné Desítkové – 15, 0,
Základy informatiky přednášky Kódování.
Vznik a vývoj teorie informace
Komprese textových, video a audio dat.  Komprese   JPEG: 
3. PRINCIP MAXIMÁLNÍ VĚROHODNOSTI
Informatika pro ekonomy II přednáška 1
Teoretické Základy Informatiky
Základy informatiky přednášky Pojem informace.
Základní číselné množiny
Deterministické modely zásob Model s optimální velikostí objednávky
Základy informatiky přednášky Efektivní kódy.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Adaptivní Huffmanův kód.
Pravděpodobnost a statistika opakování základních pojmů
Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti
5. Přednáška funkce BRVKA Johann P.G.L. Dirichlet (1805 – 1859)
Informatika pro ekonomy II přednáška 2
Základy informatiky přednášky Entropie.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Statistické metody komprese dat a Shannon-Fanův kód.
REDUKCE DAT Díváme-li se na soubory jako na text, pak je tento text redundantní. Redundance vyplývá z:  některé fráze nebo slova se opakují  existuje.
Radim Farana Podklady pro výuku pro akademický rok 2013/2014
Matematický aparát v teorii informace Základy teorie pravděpodobnosti
F U N K C E.
Základy informatiky přednášky Bezpečnostní kódy.
Nechť (, , P) je pravděpodobnostní prostor:
Úvod do klasických a moderních metod šifrování
Číselné soustavy david rozlílek ME4B
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Úvod.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Aritmetické kódování.
Náhodný jev A E na statistickém experimentu E - je určen vybranou množinou výsledků experimentu: výsledku experimentu lze přiřadit číslo, náhodnou proměnnou.
Predikátová logika.
Perfektní kódy.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Kontextové metody.
Aplikační a programové vybavení
Uložení čísel v počítači Informatika pro ekonomy II doplněk.
SIGNÁLY A SOUSTAVY V MATEMATICKÉ BIOLOGII
ZÁKLADY TEORIE PRAVDĚPODOBNOSTI
Základy zpracování geologických dat
FUNKCE. Závislost délky vegetační sezóny na nadmořské výšce
Množiny.
Úvod do teorie konečných automatů
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Časová analýza stochastických sítí - PERT
Radim Farana Podklady pro výuku
2. Vybrané základní pojmy matematické statistiky
Náhodný vektor Litschmannová, 2007.
Výroková logika.
Algoritmy komprese dat
Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a … báli jste se zeptat (1. část) (pro potřeby přednášky Úvod do strojového.
(Popis náhodné veličiny)
Radim Farana Podklady pro výuku
Úvod do praktické fyziky Seminář pro I.ročník F J. Englich, ZS 2003/04.
Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor:
Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a … báli jste se zeptat (1. část) (pro potřeby přednášky Úvod do strojového.
Funkce. Funkce - definice Funkce je zobrazení, které každému číslu z podmnožiny množiny reálných čísel R přiřazuje právě jedno reálné číslo. Funkci značíme.
Pravděpodobnost a matematická statistika I.
Základy statistické indukce
Základy zpracování geologických dat Rozdělení pravděpodobnosti
Informatika pro ekonomy přednáška 3
Teorie informace z latiny, už 1stol. př. n. l.
Spojitá a kategoriální data Základní popisné statistiky
Informatika pro ekonomy přednáška 3
Pravděpodobnost a matematická statistika I.
Poissonovo rozdělení diskrétní náhodné veličiny
Ukázky aplikací matematiky
Definiční obory. Množiny řešení. Intervaly.
Základy statistiky.
Transkript prezentace:

SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace

SWI072 Algoritmy komprese dat2 Teorie informace u Informace obsažená ve zprávě z - nejmenší počet otázek typu ANO/NE, kterými lze odhalit obsah zprávy. u Hartleyho vzorec (1928) Je-li neznámá x prvkem N prvkové množiny, pak informace, kterou x nese, má hodnotu log 2 N bitů.  |H|=N, (x 1,…, x k )  H k , buď S k nejmenší počet otázek, nutný k určení všech x i. log 2 N k  S k  log 2 N k +1 log 2 N  S k / k  log 2 N + 1/k S k / k - počet otázek, potřebný k určení jednoho prvku v průměrném případě.

SWI072 Algoritmy komprese dat3 Shannonův vzorec u Věta (Fadějev): Následující axiomy určují entropii jednoznačně až na mutiplikativní konstantu: –H 2 (p,1-p) je spojitá v oboru 0  p  1 a kladná alespoň v jednom bodě –H n je symetrická funkce svých proměnných (n = 2,3,...) –H n+1 (p 1,...,p n-1,q 1,q 2 ) = H n (p 1,...,p n )+ p n H n (q 1 /p n, q 2 /p n ), kde p n =q 1 +q 2 >0, p i  0, p p n = 1. u Buď X diskrétní náhodná veličina s oborem hodnot H a pravděpodobnostní funkcí p(x) = P(X=x) pro x  H. u Claude Shanon (1948): Entropie H(X) –analogie ze statistické mechaniky (Boltzmann) –axiomatický přístup –souvislost s kódováním

SWI072 Algoritmy komprese dat4 Definice u Kód C pro diskrétní náhodnou veličinu X s oborem hodnot H je zobrazení C: H  {0,1} * pravděpodobnostní funkcí p(x) = P(X=x) pro x  H. Definujme C * : H *  {0,1} * takto: C * (x 1...x k ) = C(x 1 )...(x k ). Kód C je jednoznačně dekódovatelný, pokud u,v  H *, C * (u)=C * (v)  u=v. u Pro x  H bude l(x) značit délku kódového slova C(x). u Průměrná délka L(C) kódu C pro diskrétní náhodnou veličinu X s pravděpodobnostní funkcí p(x) L(C)=  x  H p(x)l(x)

SWI072 Algoritmy komprese dat5 Kraft-McMillanova nerovnost u Věta: Délky l 1,l 2, … kódových slov jednoznačně dekódovatelného kódu C splňují  i 2 -l i  1. Naopak, pokud přirozená čísla l 1,l 2, … splňují nerovnost, pak existuje prefixový kód s kódovými slovy o těchto délkách. u Ověřte, zda je následující kód jednoznačně dekódovatelný, případně najděte prefixový kód se slovy stejné délky u Kolik znaků musí mít abeceda k zakódování všech 26 písmen (bez háčků), když kódová slova mají mít délku nejvýše 2 a pro samohlásky dokonce 1?

SWI072 Algoritmy komprese dat6 Horní a dolní odhady u Buď C jednoznačně dekódovatelný kód pro náhodnou veličinu X. Pak H(X)  L(C). u Pro libovolný optimální prefixový kód C pro náhodnou veličinu X platí H(X)  L(C) < H(X) + 1.  Pro průměrnou délku kódového slova L Huffmanova kódu platí H  L   Je-li p max maximální pravděpodobnost výskytu znaku, pak l  p max je-li p max < 0.5  l  p max je-li p max  0.5

SWI072 Algoritmy komprese dat7 Příklad

SWI072 Algoritmy komprese dat8 Huffmannův kód nad rozšířenou abecedou  Pro průměrnou délku kódového slova L Huffmanova kódu nad abecedou rozšířenou na bloky n znaků platí H  L  1/n

SWI072 Algoritmy komprese dat9 Horní a dolní odhady - aritmetické kódování  Pro průměrnou délku kódového slova L pro aritmetické kódování platí H  L  m kde m je délka vstupního řetězce.