Entrópia, redundancia a sci-fi príklad.

Slides:



Advertisements
Podobné prezentace
Základy informatiky přednášky Kódování.
Advertisements

Mgr. Bc. Peter Adamko, PhD. NAT a Proxy.
PROMILE - ‰ Mgr. Z. Burzová.
Sčítanie troch binárnych jednobitových čísel
POMER.PRIAMA A NEPRIAMA ÚMERNOSŤ – 2. časť
Domáce spotrebiče Elektrický príkon Elektrický odpor Vincent Cigánik.
Percentá.
Úpravy algebrických výrazov
Úpravy algebrických výrazov
Lineárna funkcia a jej vlastnosti
Vonkajšie pamäťové média
Základy spracovania grafických informácií
Súmernosti 7.ročník ZŠ Mgr. Zuzana Blašková ZŠ Staničná 13, Košice.
Digitalizácia zvuku.
Stredná odborná škola automobilová Moldavská cesta 2, Košice
F8 Elektrický obvod Elektrický príkon Téma 12.
Matematická olympiáda
Počítačové siete, Internet, Vírusy a antivírusové programy
Pavol Nečas Gymnázium L. N. Senica Šk. rok 2008/2009 III.A
Reprezentácia údajov v počítači Písmo – forma kódovania
FUNKCIE A ICH ZÁKLADNÉ VLASTNOSTI
Seminárna práca z matematiky
Priama úmernosť ISCED 2.
Zásuvky, vidlice a spínače
TECHNICKÉ KRESLENIE KÓTOVANIE Ing. Mária Gachová.
Stredná priemyselná škola dopravná,Sokolská 911/94, Zvolen
Pamäťové zariadenia Adam Lech Tomáš Kožurko I.A.
Analytická časť práce.
Úvod. Porovnávanie celých čísel.
Čo je informatika? Je všeobecne veda o informáciách.
Dvojica Síl Lukáš Beňo 1.G.
Pamäte Registre Zbernice.
(Digitálny prezentačný materiál)
ŠTATISTIKA.
Grafické formáty.
Pamäťové média Mgr. Gabriela Zbojeková.
Základná schéma počítača
Zákon zachovania hmotnosti
Nepriama úmernosť ISCED 2.
Dominika Vidovičová IX.B
Informácia – definícia a výpočet
Bit a Byte Mb kb Pokračuj b Bit - skratka "b"
Informácie okolo nás Základné pojmy.
Typy pamäťových zariadení
Informácie okolo nás Šifrovanie.
Bloková schéma procesora
Počítačové siete Miroslav Šoltés 3.A.
IP adresovanie vytvorené pre vnútornú potrebu MCST, a.s.
Informácie okolo nás Kódovanie znakov.
Microsoft Office PowerPoint 2010
Grafické riešenie lineárnej rovnice
Ing. Zlatica Molčanová Košice
Podmienená pravdepodobnosť
Počtové operácie s celými číslami: sčítanie a odčítanie
Von Neumannova architektúra počítača
Blackova – Scholesova analýza
Informatika, údaj, informácia, jednotka informácie, digitalizácia
KVINTAKORDY Rachel Dudová.
PaedDr. Jozef Beňuška
MIESTO, KTORÉ MÁM RaDa BIANKA LACKOVÁ 7.ROČ.
Základné parametre obrazu II.
Žiadosť o finančný príspevok FORMULÁR
ZNALOSTNÉ SYSTÉMY prednáška č. 4
ZNALOSTNÉ SYSTÉMY prednáška č. 4
autor: Mgr. Marta Vozárová
IP adresovanie Ing. Branislav Müller.
alebo ako vytvoriť dobrú databázu (rečou normálneho človeka)
Analytická geometria kvadratických útvarov
V ä z b y Chemická väzba.
Hromadná korešpondencia
Transkript prezentace:

Entrópia, redundancia a sci-fi príklad

Celková a priemerná hodnota informácie V predchádzajúcej kapitole sme si povedali niečo o celkovej hodnote informácie, ktorá sa vypočíta ako súčet jednotlivých hodnôt informácií na základe pravdepodobnosti javov V informatike sa používa aj takzvaná priemerná hodnota informácie, ktorú nazývame slovom entrópia

Entrópia Entrópia je teda strednou hodnotou informácie Majme i rôznych možností a , každá možnosť sa vyskytuje s pravdepodobnosťou pi, potom pod strednou hodnotou informácie rozumieme číslo:

H(p)=-[p*log2(p)+(1-p)*log2(1-p)] Príklad Najjednoduchší prípad sú dva možné, spolu súvisiace javy Ak má jeden jav pravdepodobnosť výskytu p (a vieme, že pravdepodobnosť má max. hodnotu 1), tak druhý jav bude mať túto pravdepodobnosť 1-p Entrópiu teda vypočítame: H(p)=-[p*log2(p)+(1-p)*log2(1-p)]

Graf Z predchádzajúcej funkcie po dosadení p od 0 po 1 dostaneme nasledujúci graf funkcie Z neho je jasné, že maximálnu informáciu získame, ak je pravdepodobnosť javov 0,5 a z minulej hodiny vieme, že takáto informácia má hodnotu jedného bitu

Záver z tohto príkladu ak prenášané symboly nemajú rovnakú pravdepodobnosť tak nevyužívame prenosový kanál optimálne nakoľko prenesená informácia je vždy menšia ako teoreticky maximálne možná

Bity V počítačoch využívame rôzne pamäte, ktorých veľkosť určujeme v bitoch (a ich násobkoch) Každá pamäť je zložená z tranzistorov (alebo iných prvkov), ktoré sú schopné uchovávať jeden z dvoch stavov (0 a 1) Postupnosť týchto jednotiek a núl tvorí nejaké dáta Podľa tzv. šírky zbernice (množstva údajov, ktoré môže naraz počítač preniesť) sa počítače delia na 4,8,16,32 a 64 bitové

LSB a MSB Dáta v pamäti sú podľa šírky zbernice zoskupené do skupín po 4,8,16,32 a 64 bitov Najľavejší bit tejto skupiny má označenie MSB (most significant bit) pretože je to bit, ktorého zmenou sa najvýraznejšie zmení výsledný údaj Najpravejší bit tejto skupiny má označenie LSB (least significant bit) pretože jeho zmenou sa zmení údaj len minimálne Ukážeme si to na príklade

V dekadickej sústave je to číslo 214 V dekadickej sústave je to číslo 214 1 Zmenou MSB dostaneme číslo 86 1 Zmenou LSB dostaneme číslo 215

Redundancia Redundancia obecne označuje taký stav alebo vlastnosť, kedy je použité väčšie množstvo prvkov než je obvyklé alebo nutné. Označenie môže byť použité v negatívnom slova zmysle ako zbytočnosť alebo nadbytočnosť i v pozitívnom zmysle ako označenie viacnásobného použitia kvôli väčšej stabilite systému a odolnosti voči chybám (RAID polia, záložné systémy napr. v raketopláne).

Redundancia Pri bežnom spôsobe reprezentácie dát neplatí že symboly sa vyskytujú s rovnakou pravdepodobnosťou Znamená to že správa nie je zaznamenaná s maximálnou informačnou hodnotou, ale obsahuje nadbytočnosť To je na jednej strane nepríjemné pretože by sme mohli správu ukladať či prenášať úspornejšie Na druhej strane to dovoľuje zrekonštruovať správu v prípade poškodenia pri uložení či prenose

Príklad Na jednom ostrove uprostred atlantického oceánu sa našli pozostatky dávnej civilizácie. Bližšie archeologické vykopávky ukázali že pôvodne ostrov obývali inteligentné bytosti dvoch príbuzných druhov. Inteligencia spočívala vo vysoko rozvinutej schopnosti komunikácie medzi príslušníkmi vlastného druhu. Z pozostatkov pergamenov sa dochovala abeceda používaná jednotlivými druhmi. Oba druhy používali abecedu ktorá mala 4 symboly. Keďže oba druhy mali iba jeden prst kódovali tieto symboly pomocou dvoch znakov tak ako to ukazujú nasledovné tabuľky.

Pravdepodobnosť výskytu Pravdepodobnosť výskytu Druh A používal takto kódované symboly: Druh B používal takto kódované symboly: Symbol Pravdepodobnosť výskytu 00 0,3 01 10 0,25 11 0,15 Symbol Pravdepodobnosť výskytu 0,8 10 0,1 101 0,05 110

Ako sa oba druhy vyvíjali nadobúdali nové a nové poznatky stúpala potreba pergamenu. Zdrojom pergamenu bola koža zvierat. Oba druhy preto lovili a lovili až zabili posledné zviera na ostrove. Potom sa obrátili proti sebe. Samozrejme že zvíťazili tí, ktorí zaznamenávali informáciu úspornejšie. Tu sa ale archeológovia nemôžu zhodnúť, či zvíťazil druh A alebo druh B. Skúsime im pomôcť:

Predpokladajme že zapíšeme správu dĺžky 100 symbolov, druh A nato potrebuje 200 znakov, druh B iba 130 znakov. Je to preto lebo druh A má všetky symboly zložené z dvoch znakov 2*100=200. Druh B má 80% symbolov z jedného znaku, 10% z dvoch znakov a 10% z troch znakov a teda 80*1+10*2+10*3=80+20+30=130.

Ešte ale nie je nič jasné odpoveď sa dozvieme až keď budeme poznať strednú hodnotu informácie pre abecedu druhu A a druhu B. Keď pozorne počítate zistíte že entrópia pre abecedu druhu A je 1,95 bit a druhu B je 1,02 bit. Záznamom 100 symbolov druh A uloží 195 bitov, a druh B iba 102 bitov. Ak teraz zistíme koľko informácie pripadá na jeden znak vyjde nám pre druh A 195/200=0,97 bit a pre druh B 102/130=0,78 bit. Druh A teda zapisuje informáciu úspornejšie.