Informatika pro ekonomy II přednáška 4 Uložení dat v počítači Informatika pro ekonomy II přednáška 4
Data v počítači Data — formálně vyjádřená skutečnost (symbolicky vyjádřené údaje a hodnoty). v počítači — vše vyjádřeno dvojkovými hodnotami (důvod: technologie výroby počítačů) stanovení kódu — nekonečně mnoho možností údaje mají množinu povolených hodnot a operací — datový typ
Výběr možností uložení ze všech teoretických možností lze vybrat způsoby s vhodnými vlastnostmi uložení čísel — dvojková soustava se zarovnáním na rozměr paměťových míst, přirozená, celá, racionální čísla (viz předmět VTA) uložení textu — posloupnost znaků kódovaných podle znakového kódu, ASCII, národní znaky ostatní datové typy — většinou lze reprezentovat čísly nebo znaky nebo kombinací
Znakový kód Znaky — řídicí a zobrazitelné. Řídicí znaky — jsou určeny pro ovládání přídavných zařízení (nebo programu). Zobrazitelné znaky — jsou určeny pro zobrazení textu. Národní znaky — jsou určeny pro zobrazení textů v jiných jazycích než v angličtině.
Kódování národních znaků Žádný znakový kód nebyl původně navržen pro zobrazování národních znaků. Znakový kód ASCII (ISO 646) — jen 128 hodnot, sedmý bit určen pro zabezpečení při přenosech. Nejsnadnější varianta — využití zbylých 128 pozic; 1 znak = 1 byte Způsob využití — zcela nejednotný. Příklady: Kamenických, PC Latin 1 a 2 (CP 852), ISO 8859 (16 částí, CS=2), KOI, Windows CP 1250
Kódování národních znaků 256 pozic je málo — hledají se další možnosti ISO 10 646 — univerzální prostor 4 B, tj. přes 4 miliardy znaků; UCS — Universal character set Univerzální způsob je zbytečně neúsporný, UTF — UCS Transformation Format UTF-8, UTF-16 — jedna z možností zmenšení potřebného prostoru (1—2 B) Unicode — vždy 2 B
Vyjádření hodnot datového typu Definice způsobu uložení jednotlivých hodnot = datový formát Příklad 1: věk osoby — 27 let a) převod čísla do dvojkové soustavy 11011 00011011 1b b) zápis čísla pomocí znaků (znakový kód — ASCII?) 110010 110111 00110010 00110111 32 37
Vyjádření hodnot datového typu Příklad 2: příjmení osoby — Cimrman a) s určením délky 7 'C' 'i' 'm' 'r' 'a' 'n' 07 43 69 6d 72 61 6e 00 43 69 6d 72 61 6e b) s oddělovači 20 43 69 6d 72 61 6e 0d 43 69 6d 72 61 6e 0a ' ' 'C' 'i' 'm' 'r' 'a' 'n'
Porovnání způsobů uložení a) tvar použitý v operační paměti 1b 00 43 69 6d 72 61 6e b) tvar použitelný pro vstup nebo výstup 32 37 20 43 69 6d 72 61 6e '2' '7' ' ' 'C' 'i' 'm' 'r' 'a' 'n'
Formát dat V operační paměti jsou obvykle data ve tvaru vhodném pro zpracování (výpočty, řazení...) Viditelný tvar (tiskárna, displej, klávesnice...) musí být složen výhradně z čitelných (zobrazitelných) znaků Formát dat = způsob (tvar) uložení dat v jakékoliv paměti počítače.
Popis formátu Popis formátu, tj. přesný význam jednotlivých bitů (bytů) dat = formátová specifikace Příklad formátové specifikace: Jeden byte — délka L 2. Řetězec ISO 8859-2 (příjmení), L bytů 3. Jeden byte věk, bin. 07 43 69 6d 72 61 6e 1b 03 4b 6f e8 ed 21 10 ... atd.
Druh formátu Jsou-li všechny prvky formátu složeny výhradně ze zobrazitelných znaků, mezi nimiž jsou použity jako oddělovače nejvýše konce řádků (na konci dat nejvýše 1 znak konce souboru), pak se jedná o textový formát. Jsou-li alespoň některé prvky formátu řešeny jiným způsobem (řídicími znaky), jedná se o formát netextový, tj. binární.
Vlastnosti formátů Textový formát: data jsou přímo čitelná člověkem pro zpracování obvykle nutná změna vyjádření zpracovatelný velkým množstvím programů odolnost vůči porušení (ztrátě) informací nenapadnutelné virem většinou nižší úspornost zobrazení
Vlastnosti formátů Binární formát: data nejsou přímo čitelná člověkem vhodný pro přímé zpracování nízká přenositelnost, závisí na určitém programu snadná ztráta všech informací při porušení napadnutelné virem, lze ukrýt mnoho informací někdy maximálně úsporný (ale i naopak!)
Souborový formát Specifikace tvaru dat uložených v souboru Podle druhu dat lze soubory rozdělit na textové a binární. Datové soubory programů určitého zaměření mohou být v obojím formátu — mají rozdílné vlastnosti a možnosti použití. To má z hlediska využití daného vybavení zásadní význam.