Aplikační a programové vybavení

Slides:



Advertisements
Podobné prezentace
Základy ukládání dat v počítači
Advertisements

Standardní knihovní funkce pro práci s textovými řetězci
VISUAL BASIC Práce s řetězci Použitá literatura: Kvoch: Visual Basic 4.
HTML (XHTML) 3. 2 META INFORMACE V závěru se opět vracím k hlavičce dokumentu, kde se definují tzv. META informace. Zapisují se jako nepárová značka s.
Základní struktura, metainformace
Internetové publikování Doc. Ing. Petr Zámostný, Ph.D. místnost: A-72a tel.: 4222, 4167 (sekretariát ústavu 111)
Základy informatiky úvod
Lehký úvod do světa počítačů
Algoritmizace a programování Datové typy v Delphi - 05
Formáty grafických souborů
Základy informatiky přednášky Kódování.
CZ.1.07/1.4.00/ VY_32_INOVACE_133_IT7 Výukový materiál zpracovaný v rámci projektu Vzdělávací oblast: Informační a komunikační technologie Předmět:Informatika.
Základy informatiky úvod
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Materiály k přednášce Úvod do programování Ondřej Čepek.
Informační a komunikační technologie
Informatika pro ekonomy II přednáška 4
Základy informatiky přednášky Efektivní kódy.
Instrukční soubor PIC16Fxxx osnova: Charakteristika instrukčního souboru Rozdělení instrukcí Časové průběhy (zpracování instrukcí)
OSNOVA: a) Řetězce v C b) Funkce stdio.h pro řetězce c) Funkce string.h pro řetězce d) Příklad Jiří Šebesta Ústav radioelektroniky, FEKT VUT v Brně Počítače.
Tento výukový materiál vznikl v rámci Operačního programu Vzdělávání pro konkurenceschopnost 1. KŠPA Kladno, s. r. o., Holandská 2531, Kladno,
ZÁKLADNÍ DATOVÉ TYPY.
Vnější paměť Ukládání dat pouze do operační paměti by při práci s počítačem nestačilo. Pro uchování vytvořených dat mají počítače ještě další, tzv. diskové.
REDUKCE DAT Díváme-li se na soubory jako na text, pak je tento text redundantní. Redundance vyplývá z:  některé fráze nebo slova se opakují  existuje.
SWI072 Algoritmy komprese dat1 Algoritmy komprese dat Teorie informace.
A1PRG - Programování – Seminář Ing. Michal Operátory (2. část) 4 Verze
© ing. Rosmanpřednáška kIPE_ přednáška FaME Zlín 16. září přednáška FaME Zlín 16. září 2004.
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Základy číslicové techniky
Základy číslicové techniky
Dominik Šutera ME4B.  desítková nejpoužívanější  binární (dvojková) počítače (mají jen dva stavy)  šestnáctková (hexadecimální) ◦ Používají jej programátoři.
Mgr. Miroslava Černá ZŠ Volgogradská 6B, Ostrava-Zábřeh
Číselné soustavy david rozlílek ME4B
Data Přednáška z předmětu Počítače I Dana Nejedlová Katedra informatiky EF TUL 1.
Radim Farana Podklady pro výuku
Alg91 Textové soubory Na rozdíl od jiných typů souborů jsou textové soubory určené pro gramotné lidské oko. Textový soubor je posloupnost znaků členěná.
Název Digitální reprezentace dat Předmět, ročník ICT, sekunda
Brno Jan Mach Radka Tichá Jak na převody do pdf Jan Mach, VŠE Radka Tichá, ZČÚ.
Maturitní okruh 22: Úvod do HTML. Značkovací a klasické jazyky Klasické: převládá strukturovaný text (programovací kód), skripty jsou prováděny na straně.
Radim Farana Podklady pro výuku
Datové typy a struktury
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Digitální výukový materiál zpracovaný v rámci projektu „EU peníze školám“ Projekt:CZ.1.07/1.5.00/ „SŠHL Frýdlant.moderní školy“ Škola:Střední škola.
Aplikační a programové vybavení
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Uložení čísel v počítači Informatika pro ekonomy II doplněk.
Informace a počítače Informatika 8. ročník bit byte
Orbis pictus 21. století Tato prezentace byla vytvořena v rámci projektu.
Informační systémy v personálním řízení RNDr. Jan Žufan, Ph.D., MBA
Fyzikální veličiny.
Informatika pro ekonomy II přednáška 5
Uložení dat v počítači.
Ukazatele, řetězce Přednáška č. 3. Ukazatele  Ukazatel (pointer) – typ o velikosti 4 bajty (v 32bit. systémech) pro uložení adresy objektu na který ukazuje.
4. Typ pole 4.1 Jednorozměrná pole
Kódování Radim Farana Podklady pro výuku. Obsah Cyklické kódy.
Radim Farana Podklady pro výuku
Číselné soustavy VII ASCII kódování Jana Bobčíková.
Z latinského „informatio“ = vtištění formy či tvaru, utváření. Informace = srozumitelná a pochopitelná část údajů Metainformace = informace o informaci.
Diskový oddíl. Diskové oddíly (partition) slouží k rozdělení fyzického disku na logické oddíly, se kterými je možné nezávisle manipulovat jeden disk se.
Reprezentace dat v počítači. základní pojmy  BIT označení b nejmenší jednotka informace v paměti počítače název vznikl z angl. BINARY DIGIT (dvojkové.
AUTOMATIZAČNÍ TECHNIKA Kódy
Výukový materiál zpracován v rámci projektu
Textové vstupy UIS Jiří Rybička
Co je to informace ? zpráva sdělení údaj poznání odpověď na otázku.
Financováno z ESF a státního rozpočtu ČR.
Ukládání dat v paměti počítače
Algoritmizace a datové struktury (14ASD)
Informácie okolo nás Kódovanie znakov.
Číselné soustavy a kódy
Informatika pro ekonomy přednáška 2
Transkript prezentace:

Aplikační a programové vybavení Znakové sady

Základní pojmy Znak – symbol Kódování ≈ znaková sada = kódová stránka (encoding ≈ character set (charset) = code page) Je systém přiřazování číselných kódů znakům. Je reprezentováno tabulkou (mapování). Cílem je možnost ukládat symboly ve formě čísel. Kódové slovo – kód přiřazený symbolu Kódová jednotka – elementární část kódu

Jedno-bytové kódování Délka kódu je maximálně jeden byte (single-byte) Znaková sada ASCII (základní) délka kódu: 7 bitů → 128 znaků Obsahuje znaky anglické abecedy, čísla, základní interpunkční znaménka a řídící (netisknutelné) znaky (control characters) NULL, CR, LF, TAB, ... Rozšířená sada ASCII = „Národní znakové sady“ délka kódu: 8 bitů → 256 znaků Různé varianty obsahují různé specifické národní znaky. Výhodou je snadné zpracování a rychlost. Nevýhodou je nedostatečný rozsah sady (čínština má tisíce znaků).

Tabulka znakové sady Win-1250

Více-bytové kódování Délka kódu je jeden a více bajtů (multi-byte) Kódovou jednotkou je jeden byte. Rozsah znakové sady závisí na počtu kódových jednotek. Dvě základní varianty: Všechny znaky jsou kódované stejným počtem bytů. Každý znak může být kódován různým počtem bytů podle potřeby (operace s řetězci jsou náročnější).

Národní znakové sady Základní znaková sada ASCII obsahuje pouze znaky anglické abecedy – jedno-bytové kódování. Neobsahuje žádné znaky národních abeced. V 80. letech vzniklo množství národních znakových sad. Pro češtinu existují: ISO-8859-2 (ISO Latin 2) windows-1250 (CP1250) CP852 (PC Latin 2) a další: KEYBCS2 (kódování bratrů Kamenických, CP859), East8, ICL, Cork Klíčovým problémem je nedostatek pozic pro různé národních znaky - jednotlivé znaky se překrývají.

Unicode Současně se vznikem národních kódování začala vznikat univerzální znaková sada – více-bytové kódování. Dvě iniciativy – Unicode Consortium a ISO. V roce 1991 se již dříve kompatibilní standardy sloučily do Unicode. Všechny verze standardu Unicode vychází souběžně jako ISO standardy. Jednotlivé verze standardu jsou vzájemně kompatibilní. Poslední verze Unicode 6.0 vyšla v roce 2010 http://www.unicode.org

Unicode Znaková sada Unicode definuje několik kódování: UTF-7, UTF-8, UTF-16 a UTF-32. Kromě kódování Unicode (UTF-n) se používají ještě starší kódování ISO: UCS-2, UCS-4. Velikost kódové jednotky je 1, 2 nebo 4 byty. Pokud je kódová jednotka větší jak 1 byte, tak je nutné určit pořadí bytů. Big Endian (výchozí pořadí) nebo Little Endian Pořadí bytů se určuje značkou BOM (Byte Order Mark) na začátku souboru/dat.

Unicode kódování UTF-8 UTF-16 UTF-32 UCS-2 UCS-4 Min. počet bytů 1 2 4 Max. počet bytů Velikost kódové jednotky 8 bitů 16 bitů 32 bitů Unicode má nyní 98,884 tisknutelných znaků. Více jak 800000 dalších pozic je volných. Kromě toho umožňuje i definice vlastních znaků.

Unicode kódování – srovnání UTF-8 UTF-16 UTF-32 UCS-2 UCS-4 Všechny znaky ano ne Proměnná délka znaku Režie malá střední velká Kompatibilní s ASCII Závisí na pořadí bytů Doporučeno k používání

function utf8_strlen($str) { $count = 0; for ($i = 0; $i < strlen($str); $i++) { //pres vsechny znaky $value = ord($str[$i]); if ($value > 127) { if ($value >= 192 && $value <= 223) { $i++; } elseif ($value >= 224 && $value <= 239) { $i = $i + 2; } elseif($value >= 240 && $value <= 247) { $i = $i + 3; } else { echo ‘Not a UTF-8 compatible string ' } } $count++; return $count;

Unicode – shrnutí UTF-8 řeší naprostou většinu všech problémů s kódováním. Aplikace může pracovat s daty v libovolném jazyce. Podpora ze strany aplikací je stále ještě špatná. Pro reprezentaci dat uvnitř aplikace může být někdy výhodnější využít kódování s konstantním počtem bytů na jeden znak. Příliš žluťoučký kůň pěl ďábelské ódy.

http://kantorek.webzdarma.cz/