Digitalizácia
Čo je to digitalizácia? Je to prevod analógovej (spojitej) informácie (zvuk, svetlo, teplo) na informáciu digitálnu (číselnú, nespojitú) Je to teda priradenie číselných hodnôt (kombinácie bitov) k hodnotám spojitej veličiny Prevod do digitálnej formy musí byť taký, aby bolo možné previesť informáciu späť na analógový tvar s dostatočnou presnosťou
Prečo digitalizujeme? Digitalizáciou docielime: Možnosť spracovania dát v počítačoch Zmenšenie nárokov na objem (množstvo) prenášaných dát
Ako delíme digitalizáciu? Primárna digitalizácia spočíva v priamom zbere analógovej veličiny snímaním a jej prevod na digitálnu (snímanie obrazu kamerou a pod.) Sekundárna digitalizácia je proces, pri ktorom digitalizujeme už určitým spôsobom spracované informácie (napr. skenovanie máp)
Čo digitalizujeme najčastejšie? Text – znaky rôznych abecied prevádzame z obrazovej formy do digitálnej formy Grafiku – obrazy a symboly digitalizujeme do stacionárnych obrázkov alebo pohyblivých sekvencií Zvuk – zvukové vlny spracúvame pomocou periférií do digitálnej formy vhodnej pre úpravu alebo výskum, prípadne prevod do textovej formy
Digitalizácia textu Pre digitalizáciu tlačeného textu používame ručné, alebo stolné skenery, ktoré nepotrebujú snímať s veľkým rozlíšením a postačuje im čiernobiele snímanie obrazu Po zosnímaní obrazu sa obraz použije ako vstup pre OCR softvér (optical character recognition), ktorý pomocou rôznych algoritmov rozpozná znaky a prevedie ich do textovej podoby
OCR Softvér pre OCR rozpoznáva znaky buď automaticky, alebo sa pri prvých prevodoch musí naučiť, ktorý znak grafickej predlohy prislúcha znaku v danej kódovej tabuľke (ASCII, Unicode a pod.) V súčasnosti sa pri rozpoznávaní znakov používajú prvky umelej inteligencie a to konkrétne neurónové siete Rozpoznávať nemusíme len štandardné znaky ale niektoré OCR dokážu rozpoznávať napr. aj brailovo písmo
Vhodnosť použitia OCR OCR má najlepšie výsledky pri práci s obrazom o rozlíšení aspoň 150dpi, z kvalitnej predlohy vytlačenej na laserovej, atramentovej alebo termosublimačnej tlačiarni, či z knižných predlôh Horšie výsledky je možné očakávať pri rozpoznávaní predlôh vytlačených na menej kvalitných ihličkových tlačiarňach Po každom prevode textu je však potrebné prekontrolovať správnosť prevodu a prípadné chyby vzniknuté pri rozpoznávaní dodatočne v texte opraviť
Kódovanie textu Text sa kóduje pomocou rôznych znakových sád a abecied, ktoré určitým číselným kódom písmen priradzujú ich grafickú reprezentáciu V minulosti sa používali kódové stránky ASCII (7bit), EASCII (8bit) a ich modifikácie V súčasnosti sa vo veľkej miere využíva kódovanie Unicode, ktoré je schopné zakódovať viac ako milión znakov
Digitalizácia obrazu Obrazy môžeme digitalizovať z grafických predlôh, napríklad skenovaním farebných obrázkov alebo priamym spracovaním napr. snímaním obrazu digitálnym fotoaparátom alebo kamerou V súčasnosti už existuje možnosť snímať aj trojrozmerné predlohy prostredníctvom špeciálnych 3D skenerov
Čo sníma obraz? Obraz je vo všetkých zariadeniach na to určených snímaný prostredníctvom CCD snímačov CCD snímač je zložený z množstva fotocitlivých polovodičových súčastí, ktoré sú schopné snímať intenzitu a farbu svetla, ktoré na nich dopadá Vyrábajú sa v lineárnom vyhotovení (snímajú čiarové kódy) alebo v plošnom vyhotovení (snímajú celé plochy – fotoaparáty, kamery)
Čo so zosnímaným obrazom? CCD snímač zosníma obraz a jeho výstupom je potom tzv. surová forma obrazu (RAW) Tento zosnímaný obraz sa potom prevádza buď ako rastrová grafika (bmp, jpg, gif) alebo ako vektorová grafika (cdr, svg) Z obrazov sa môžu vytvárať aj sekvencie, teda animácie alebo filmy
Rastrová grafika Rastrová grafika je v podstate obraz, rozdelený na malé grafické elementy – body (štvorčeky, pixely) usporiadané do matice Každý bod má v matici určenú presnú polohu, farbu, prípadne priehľadnosť Podľa počtu farieb používaných v obrázku je potom použité určité množstvo dát-bitov pre popísanie farby jedného pixelu Typickým znakom rastrových obráz- kov je, že sa ich zväčšovaním (pribli- žovaním) zhoršuje kvalita zobrazenia
Vektorová grafika Vektorová grafika popisuje jednotlivé časti obrazu ako geometrické útvary (bod, úsečka, kružnica, mnohouholník) pomocou vzťahov používaných v analytickej geometrii Pre popísanie kruhu teda stačí popísať len súradnice jeho stredu, polomer, farbu okraja a farbu výplne, čím sa dramaticky zníži množstvo údajov potrebných pre popis celého obrázku Pri zmene rozmerov vektorových obrázkov sa neprejavuje efekt zhoršenia kvality, pretože meníme len súradnice a nie celé „kusy“ obrazu
Farby Farby sa v počítačovej grafike reprezentujú pomocou rôznych farebných modelov v závislosti od potrebného počtu použitých farieb Najrozšírenejšie modely počítačovej grafiky sú aditívny model RGB a substraktívny model CMYK
RGB model RGB model je aditívny model, teda založený na pridávaní RGB svetiel na tmavú (nesvietiacu) podložku (klasický monitor či televízor). Pridaním všetkých svetiel naplno sa vytvorí biela.
CMYK model CMYK model je substraktívny model, teda založený na odčítaní RGB farieb pri odraze bieleho svetla od atramentu Pridaním všetkých atramentov naplno sa vytvorí čierna farba, resp. všetko svetlo bude pohltené.
Digitalizácia zvuku Pri digitalizácii zvuku dochádza k snímaniu zvuku pomocou mikrofónu a jeho následný prevod do digitálnej formy prostredníctvom analógovo-digitálneho (A/D) prevodníka Digitalizácia je proces zložený z troch častí a to: vzorkovanie, kvantovanie, kódovanie
Vzorkovanie Vzorkovanie je proces, pri ktorom sa v určitých časových intervaloch (pri vzorkovacej frekvencii) snímajú hodnoty analógového vstupu Je to teda rozdelenie spojitého signálu na malé časové úseky Čím kratší je časový interval vzorkovania (vyššia frekvencia), tým kvalitnejšie bude zvuk zaznamenaný, ale nároky na pamäťový priestor sa zvyšujú
Kvantovanie Kvantovanie je proces, pri ktorom sa hodnota snímanej veličiny „zaokrúhli“ na najbližšiu hodnotu digitálnej veličiny Pri kvantovaní teda jednotlivým časovým úsekom, ktoré sme získali pri vzorkovaní, priradíme hodnotu amplitúdy Aj tu platí, že čím viac kvánt (úrovní) máme, tým je signál kvalitnejší, no nároky na pamäť sa zvyšujú
Kódovanie Kódovaním zabezpečíme uloženie spracovaných dát do podoby vhodnej pre počítač Je to vlastne prepis kvantovaných úrovní do číselnej reprezentácie Od toho, koľko bitov použijeme na reprezentáciu kvantovej úrovne, závisí kvalita zvuku
Vzorkovacia frekvencia Rozlíšenie (kódovanie) Tabuľka Kvalita záznamu Vzorkovacia frekvencia Rozlíšenie (kódovanie) Kanály Telefónna 11 025 Hz 8 bit Mono Rozhlasová 22 050 Hz CD 44 100 Hz 16 bit Stereo DVD 192 000 Hz 24 bit 5.1
Kompresia Pre zmenšenie veľkosti digitalizovanej informácie pri zachovaní určitej úrovne kvality sa používa kompresia Kompresné algoritmy sú schopné odstrániť z digitalizovanej informácie nepotrebné časti (napr. nepočuteľné zvuky nad 20kHz alebo pod 20Hz) a zároveň môžu použiť princípy zmenšovania množstva údajov pomocou postupov známych pri „zipovaní“ bežných súborov