Prezentace se nahrává, počkejte prosím

Prezentace se nahrává, počkejte prosím

Výukový prezentační program Komprimace MPEG – 2 Zpracováno studenty 02B Jakub Rypar a Petr Švihel Střední průmyslová škola sdělovací techniky 110 00 Praha.

Podobné prezentace


Prezentace na téma: "Výukový prezentační program Komprimace MPEG – 2 Zpracováno studenty 02B Jakub Rypar a Petr Švihel Střední průmyslová škola sdělovací techniky 110 00 Praha."— Transkript prezentace:

1 Výukový prezentační program Komprimace MPEG – 2 Zpracováno studenty 02B Jakub Rypar a Petr Švihel Střední průmyslová škola sdělovací techniky 110 00 Praha 1, Panská 856/3 tel:221 002 111 fax:221 002 666

2 Kapitoly 1. Úvodem o MPEG – 2 2. DVB - zdrojové a kanálové kódování 3. DVB - Zdrojové kódování obrazu MPEG – 2 4. Systémová specifikace standardu MPEG – 2 5. Zdrojové kódování zvuku 6. Princip Psychoakustického maskovacího jevu 7. Skladba multiplexu MPEG – 2 8. Diskrétní kosinová transformace 9. Opakování 10. Odlišnost jednotlivých kompersních formátů 11. Literatura

3 Úvodem o MPEG – 2 Co to je MPEG – 2? Jak MPEG – 2 obecně pracuje? MPEG – 2 v počítači Variantnost MPEG – 2 MPEG – 1 Budoucnost MPEG – 2 Zpět >>

4 1. ÚVOD DO MPEG – 2 Co to je MPEG – 2? Zkratka MPEG (Motion Picture Expert Group) označuje standard pro digitální kompresi, ukládání a přenos pohyblivých obrázků (videa). Všichni určitě zaznamenaly existenci několika úrovních (verzí) a profilů standardu MPEG. MPEG – 1 hojně využíván v multimediálních CD - ROMech prezentacích nebo jako datový formát Video CD - ROM disků. MPEG – 1 standard ovšem dosahuje rozlišení (kvality obrazu) srovnatelného pouze s VHS video nahrávkou (kolem 220 horizontálních řádek při výstupu na televizní monitor). Daleko lépe s rozlišením je na tom mladší bratr MPEG – 1 standardu - MPEG – 2, který již dosahuje vysílací (broadcast) obrazové kvality nebo přesněji řečeno jeho horizontální rozlišení při výstupu na televizní monitor přesahuje 500 řádků. Proto je také tento datový video standard využíván pro digitální satelitní vysílání (DVB nebo také D-BOX), v tomto datovém standardu jsou vyráběny DVD video disky jež můžete prohlížet i na vašem PC, v profesionální oblasti na principu MPEG – 2 komprese pracuje záznamové video systém Betacam SX a na spotřební trh digitálních záznamových video systémů vstoupil MPEG – 2 standard v podobě Digital VHS (D – VHS) videorekordérů.

5 1. ÚVOD DO MPEG – 2 Jak MPEG – 2 obecně pracuje? Při přepisu se neukládá všech 25 snímku (což je standartní počet, abychom rychle promítající obrázky mohli označit jako video) za sekundu, ale jenom 2 až 3, a ze zbylých se uloží jen informace o změně obsahu: mezisnímky. Tento algoritmus ale není pevný, a tak při dynamických scénách (střih, rychlé střídání obrázku) se může interval mezi kompletními snímky zkrátit. MPEG – 2 účinně snižuje datový tok tak, aby se zachovala vysoká kvalita obrazu. (Dvojnásobek maximálního rozlišení VHS).

6 1. ÚVOD DO MPEG2

7 1. ÚVOD DO MPEG – 2 MPEG – 2 v počítači MPEG – 2 datový tok je softwarově schopen PC systém vybavený procesorem Pentium II s taktem alespoň 300 Mhz, grafickou kartou AGP a zvukovou kartou. Kromě toho existují PC karty nebo AGP videokarty obsahující MPEG – 2 hardwarovou podporu. Jinak pro identifikaci MPEG – 2 datového souboru na DVD video disku se používá přípona souborů *.VOB, pro MPEG – 2 data stream *.M2P.

8 1. ÚVOD DO MPEG – 2 Variantnost MPEG – 2 MPEG – 2 obsahuje různé profily a úrovně. Kombinací různých parametrů jako je např. rozlišení znamenající počet řádků a pixelů (bod na monitoru), vzorkovací frekvence, různé úrovně, profily a počet snímků/s. MPEG – 2 pokrývá všechny aplikace v broadcast sektoru od postprodukce, distribuce až k vysílání. Data dle MPEG – 2 standardu lze jednoduše přehrát jakýmkoli MPEG – 2 dekodérem a to jak softwarovým, tak hardwarovým. MPEG – 2 navíc dává výrobcům volnost v kódování obrazu a zvuku za předpokladu, že výsledná data odpovídají standardu, a jsou tudíž zobrazitelná na jakémkoli MPEG – 2 dekódovacím (zobrazovacím) systému. Při MPEG – 2 kódováním se každý výrobce snaží pomocí vlastních filtrů a algoritmů co nejefektivněji zkomprimovat obraz při zachování maximální obrazové kvality. To znamená, že různé MPEG – 2 systémy mohou vykazovat ( a skutečně vykazují) znatelné rozdíly v kvalitě obrazu.

9 1. ÚVOD DO MPEG – 2 MPEG – 1 MPEG je zkratkou pro Motion Pictures Experts Group. Cílem práce této skupiny bylo standardizovat metody komprese videosignálu a vytvořit otevřenou a efektivní kompresi. Formát MPEG – 1 byl dokončen v roce 1991 a jako norma přijat roku 1992 - ISO/IEC-11172. Byl navržen pro práci s videem o rozlišení 352x288 bodu a 25 snímku/s při datovém toku 1500kbit/s. Parametry komprese MPEG – 1 jsou srovnávány s analogovým formátem VHS. Formát MPEG – 1 se stal součástí tzv. White Book, což je definováno jako norma pro záznam pohyblivého obrazu na CD (74 minut videa). Výhody vysoká podpora přehrávačů softwarových i hardwarových, kompresor i dekompresor je zdarma používá se pro Video CD vhodný i pro stream videa Nevýhody nepodporuje prokládané snímky nízká kvalita při nízkém datovém toku jen konstantní datový tok nevhodný pro střih

10 1. ÚVOD DO MPEG – 2 Budoucnost MPEG – 2 Budoucí vývoj MPEG – 2 standardu lze jen těžko odhadovat. Po technologické stránce se tento standard jeví jako velice výhodnou a univerzální platformou pro záznam a distribuci velmi kvalitního videosignálu ať již pocházejícího z DVD disku, DVB satelitního vysílání nebo z vaší digitální videokamery. Již nyní jsou k dispozici hardwarové MPEG – 2 kodeky (PC karty) pro převod videosignálu na MPEG – 2 datový tok ovšem se zaměřením spíše na tzv. DVD mastering nebo lze zakoupit i celé MPEG – 2 systémy (dosti drahé a určené pro profesionální oblast) postavené na PC platformě. Masivně bude využívaný pro digitální televizi (DVB)

11 2. DVB - zdrojové a kanálové kódování Co je to DVB? Účel zdrojové kódování Kanálové kódování Zpět >>

12 2. DVB - zdrojové a kanálové kódování Co je to DVB? Digitál video broadcasting – digitálně šířené video neboli digitální televize. Počátky projektu DVB se datují od začátku 90. let. Projekt DVB byl oficiálně zahájen v roce 1993 a od té doby přijal řadu doporučení, která umožnila překvapivě rychlý rozvoj digitální televize v Evropě. Podle projektu DVB se digitální televize z hlediska kódování skládá: A) ze zdrojového kódování B) z kanálového kódování

13 2. DVB - zdrojové a kanálové kódování Účel zdrojové kódování Zdrojové kódování má za úkol komprimovat videosignál z původní bitové rychlosti až 270 Mbit/s na hodnotu asi 8 Mbit/s. Základem tohoto kódování je kompresní formát MPEG – 2.

14 2. DVB - zdrojové a kanálové kódování Kanálové kódování Kanálové kódování musí zabezpečit přenos signálu příslušným kanálem. Skládá se z ochranného kódování a modulace. Podle způsobu přenosu signálu přenosovým kanálem rozlišujeme tři hlavní varianty systému. A)DVB - S pro satelitní přenos B)DVB - C kabelový přenos C)DVB - T pozemní přenos D)DVB - H Mobilní přenos

15 3.DVB - Zdrojové kódování MPEG – 2 Úvod Digitalizace obrazu Komprese obrazové informace Redukce relevance a prostorové redundance Zpět >>

16 3.DVB - Zdrojové kódování MPEG – 2 Standart MPEG – 2 je určen pro kódování signálu v digitální televizi. Práce na něm začaly v roce 1990 s tím, že jeho úkolem bude komprese videosignálu na formát 4:2:0 a předpokládaný datový tok pod 10Mbit. V roce 1994 byl dokončen a přijat jako mezinárodní standart. V roce 1996 byl doplněn o profil 4:2:2, který je určen především pro studiové aplikace. Představuje nadstavbu standardu MPEG – 1, který je rozšířen především o prokládané řádkování a hierarchickou strukturu kódování.

17 3.DVB - Zdrojové kódování MPEG – 2 Digitalizace obrazu Základní signály R, G, B se transformují pro přenos na jasový signál Y a dva rozdílové chrominanční signály Cb, Cr (někdy označované jako U a V). Způsob této transformace ( formát přenosu chrominanční informace) je rozdílný a je dán požadovanou kvalitou obrazového signálu.

18 3.DVB - Zdrojové kódování MPEG – 2 Na obrázku jsou nejužívanější chrominanční formáty. Distribuční kvalita, pro kterou je standard MPEG – 2 především určen, předpokládá rozlišení 720 x 576 obrazových bodů, hloubku kvantizace 8 bitů a formát 4:2:0. Současná studiová kvalita videosignálu pracuje s rozlišením 720 x 576 obrazových bodů, hloubkou kvantizace 10 bitů a formátem 4:2:2. Formáty přenosu chrominanční informace

19 3.DVB - Zdrojové kódování MPEG – 2 Komprese obrazové informace MPEG-2 je ztrátový kompresní standard pro digitální televizi. Princip komprese obrazového signálu podle standardu MPEG – 2 je možné rozdělit na: redukci prostorové redundance a irelevance snímku pomocí diskrétní kosinové transformace (intra-frame coding) kosinové transformace bezdrátovou redukci časové redundance pomocí pohybově kompenzované mezisnímkové predikce (inter-frame coding)

20 3.DVB - Zdrojové kódování MPEG – 2 Redukce relevance a prostorové redundance Redukce irelevance a prostorové redundance je založena na transformačním kódování jednotlivých obrazových bloků, následovaném entropickým kódováním. Sestává se z následujících kroků:

21 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: a )Rozdělení obrazu na bloky První krok kódování spočívá v rozdělení obrazu na bloku 8x8 obrazových bodů. Toto rozdělení je výhodné jak z hlediska výpočetní náročnosti následující informace, tak z hlediska statistických vlastností obrazového bloku ( jeho hodnoty jsou většinou silně korelované).

22 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: b) Diskrétní kosinová transformace Diskrétní kosinová transformace je reverzibilní proces, který převádí blok obrazu do roviny prostorových kmitočtů podle vztahu. Kde: x,y jsou Indexy (souřadnice) jednotlivých prvků obraz. bloku u,v jsou indexy spektrálních koeficientů f (x,y) jsou amplitudy prvků obrazového bloku Kde F(u,v) jsou amplitudy spektrálních koeficientů a C(u), C(v)-normalizační konstanty Transformací získáme matici 8 x 8 spektrálních koeficientů, přičemž koeficient F (0,0) představuje stejnosměrnou složku ( průměrnou hodnotu, DC koeficient) obrazového bloku a ostatní koeficienty jednotlivé harmonické ( střídavé složky, AC koeficienty). Uvedená transformace sama osobě nijak nezmenšuje počet bitů nutných pro popis bloků. Právě naopak, spektrální koeficienty je nutno uchovat s kvantizační hloubkou alespoň 11 bitů. Její zásadní význam však spočívá v dekorelaci signálu, neboť koncentruje převážnou část energie do stejnosměrné složky a nízkofrekvenčních koeficientů.

23 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: c) Kvantizace koeficientů Každý spektrální koeficient je nyní kvantován s jinou kvantizační hloubkou podle vztahu: kde Q(u,v) představuje matici číslice 8 x 8 kvantizačních koeficientů. Kvantizace spektrálních koeficientů představuje místo, kde dochází k zásadní redukci objemu dat.Protože většina spektrálních koeficientů (především vyšších harmonických) je malá, vhodnou volbou kvantizačních tabulek je možné dosáhnout jejich vynulování. Nicméně je nutné připomenout, že tato redukce dat je redukce irelevance, nikoliv redundance obrazu a tudíž zde ( a jedině zde) také dochází ke ztrátě kvality obrazu.

24 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: d) Čtení „cik-cak“ Kvantové spektrální koeficienty budou nyní seřazeny do sériové posloupnosti. Efektivnější kódování získáme, přečteme-li napřed nenulové koeficienty. Koeficienty proto čteme v pořadí stoupající pravděpodobnosti jejich nulové amplitudy, tedy v pořadí stoupajícího prostorového kmitočtu. Ve snímkovém módu jsou koeficienty čteny metodou označovanou jako čtení „cik-cak“, zatímco v půlsnímkovém modu je při čtení respektován rychleji stoupající vertikální kmitočet. Stejnosměrné složky jsou navíc zakódovány pomocí DPCM. obrázek - čtení spektrálních koeficientů

25 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: e) Proudové kódování (run-length Encoding,RLE) Proudové kódování představuje první ze dvou způsobů entropického kódování. Protože sériová posloupnost kvantových spektrálních složek obrazu obsahuje řadu za sebou jdoucích nulových hodnot je kódování RLE modifikováno následujícím způsobem.  1. DC koeficient není kódován metodou RLE  2. Před každý nenulový AC koeficient je umístěná hodnota, která udává počet předcházejících nulových koeficientů.  3. je-li počet předcházejících nulových koeficientů větší než 16, zakóduje se proudovým číslem Fh (111), jako proudová hodnota se zapíše 0,od aktuálního počtu nul se odečte číslice 16 a dále se postupuje od bodu dvě.  4. Pokud do konce bloku zbývají dvě nuly, použije se speciální kód EOB

26 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: f) Kódování s proměnnou délkou slova (VLC) Po kódování běhu následuje kódování s proměnnou délkou slova, která přiřadí často se vyskytujícím hodnotám kratší kódovaná slova a méně často se vyskytujícím hodnotám slova delší. Při použití Huffmanova kódování je převod mezi vstupními a výstupními hodnotami dán Huffmanovými tabulkami, které jsou odlišné pro DC a AC koeficienty. Huffmanovo kódování  První obrázek znázorňuje změnu polohy automobilu, z obrázku N do obrázku N+1.Pozadí obrázku se nezměnilo.Realizaci této změny v MPEG2 se říká "motion estimation", volně by se to dalo přeložit jako"změna polohy objektu".Je možné říci, že kupé změnilo polohu ze souřadnic [x1,y1] na [x2,y2].V praxi ale není příliš jednoduché popsat změnu tak složitého objektu jako je např.automobil.Proto se obrázek rozděluje do tzv. makrobloků o velikosti 8x8 nebo 16x16 bodů,které jsou zpracovávány odděleně.

27 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: Huffmanovo kódování - začátek Nejprve se provede rozdíl mezi obrázky N a N+1 a dále se hledá relace mezi makrobloky N a N+1. Požadavek na paměť je tím menší, čím je rozdíl mezijednotlivými obrázky menší. Pak je možné dokonce vynechat zakódování rozdílu. Vždy ale musí existovat výchozí obrázek.Proto jsou obrázky rozděleny do tzv. sekvence I – B – P. Snímek (frame) "I" (intra coded image) je obyčejný obrázek JPEG.Oproti tomu snímky "P" (predicted image) jsou vytvořeny predikcíz předcházejícího snímku "I". Nejuniversálnější jsou snímky "B"(bi- directionally interpolated), které jsou interpolovány buď z předcházejícího nebo následujícího snímku "I" nebo "P". Následující obrázek ukazuje sled těchto snímků.

28 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: Huffmanovo kódování - obrázek

29 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: Huffmanovo kódování – konec Aby se dosáhlo co největšího stupně komprese, jsou obrázky ještě navíc kódovány diskrétní kosinovou transformací (DCT). Je založena na Fourierově transformaci, která převádí signál z časové oblasti do frekvenční jako součet funkce sinus různého argumentu a velikosti amplitudy. Dá se říci, že funkce sinus s malým argumentem reprezentuje velké plochy a funkce sinus s velkým argumentem oblasti s více detaily. Např. makroblok 8x8 bodů je překodovándo 64 různých argumentů, které mají na sebe jistou návaznost a možné je uchovat pouze jako změnu v jejich velikosti.První koeficient je tzv. stejnosměrná složka, která určuje základní charakteristiku makrobloku. Vyšší koeficienty jsou většinou blízké nule a proto se zanedbávají. Počet zanedbaných koeficientů udává následně kvalitu výsledného obrazu a tedy i stupeň komprese.Dalším zjednodušením je sloučení sousedních částí obrazu, která jsou shodné, jsou to např. velké stejnobarevné plochy. Čítač tohoto počtu ale také zabírá místo, proto se většinou používá až od počtu 3. Tomuto principu se říká "run length encoding"(RLE). Dalším stupněm koprese je použití tzv. Huffmanova kódu. Části obrazu, které se opakují nejčastěji jsou označeny malým počtem bitů, ostatní více bity. Výsledná kvalita obrazu je dána více faktory. V prvé řadě je to kvalita originálního videa. Zašumění originálu má za následek zvýšení chyb při DCT. Dalším faktorem, ovlivňujícím kvalitu je stupeň "motion estimation".Složitějších algotimy hledání dokáží najít pohyb objektů daleko přesněji, jiné hledají pouze jednoduchým způsobem a kvalita videa se tak zhoršuje.

30 3.DVB - Zdrojové kódování MPEG – 2 kroky redutance: g)Vyrovnávací paměť Konstantní bitová rychlost vstupního video signálu je právě popsanými kódovacími metodami změněna na proměnnou. Bitová rychlost velice silně závisí na obsahu obrazu a jeho časových změnách. Protože přenosový kanál má konstantní přenosovou kapacitu, je nyní zapotřebí změnit tuto proměnnou bitovou rychlost s 5 na konstantní. Tuto operaci zajišťuje výstupní vyrovnávací paměť, která podle svého zapojení řídí výběr kvantizační tabulky a tím se mění počet vynulovaných kvantizačních koeficientů, nebo jejich kvantizační hloubku. Výsledné blokové schéma části kodéru, který redukuje prostorovou redundanci a irelevanci signálu je na (obrázek Scan5). Toto schéma odpovídá přibližně kódovací metodě označované jako M – JPEG respektive kodéru JPEG pro kódování statických snímků ( bez výstupní vyrovnávací paměti). Klíčovou částí kodéru MPEG – 2 je však redukce časové redundance pomocí pohybově kompenzované mezisnímkové predikace.

31 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance a) Mezisnímková predikce Redukce časové redundance obrazového signálu předpokládá dekorelaci jednotlivých snímků pohyblivého obrazu. Dekorelace je realizována pomocí DPCM tak,že se kódují pouze odchylky od predikovaných hodnot.Na obrázku je znázorněno základní schéma diferenčního predikčního kodéru. Tento kodér kóduje pouze rozdíl mezi aktuálním snímkem a snímkem předcházejícím,tedy za predikovaný snímek se považuje snímek předcházející. Je zde nutné připomenout,že v důsledku ztrátového kódování spektrálních koeficientů obrazového bloku není možné za predikovanou hodnotu považovat originální zdrojový snímek,neboť ten není v dekodéru k dispozici.Kodér tedy musí obsahovat lokální dekodér.

32 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: b )Pohybově kompenzovaná mezisnímková predikce Dokonalejší predikční metodu představuje predikční Metoda,která umožňuje kompenzaci pohybu ve scéně. Pohyb má většinou charakter posunutí,které je možné při určování predikce respektovat zavedením pohybových vektorů. Pohybový vektor vyjadřuje směr a velikost posunutí příslušné části obrazu a predikční odchylka se počítá vzhledem k tomuto posunutí, čímž se významným způsobem minimalizuje. Obrázek: Pohybově kompenzovaná predikce

33 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Obousměrná predikce Ještě dokonalejší metodou může být obousměrná predikce, která určuje predikční odchylku nejen vzhledem k minulému snímku, ale i vzhledem ke snímku následujícímu.Zatímco redukce prostorové redundance pomocí DTC je založena na bloku o velikosti 8x8 obrazových bodů,je redukce časové redundance pomocí pohybově kompenzované mezisnímkové predikce založena na bloku o rozměrech 16x16 obrazových bodů,který se nazývá makroblok.jeho velikost je dána kompromisem mezi složitostí výpočtu a minimalizací predikační chyby.

34 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: c) Predikční módy MPEG definuje dopřednou predikci, zpětnou predikci a obousměrnou predikci. Oba půlsnímky jednoho snímku mohou být predikovány nezávisle (půlsnímkovém predikční kódování) nebo použitím společného pohybového vektoru(snímkové predikční kódování),což je výhodnější v případě pomalých translačních pohybů ve scéně. Tyto základní módy, aplikované na makroblok,jsou doplněny dvěma dalšími módy. První používá dva vektory pohybu pro jeden makroblok,jeden pro horních 16 x8bodů a druhý pro spodní 16x8 obrazových bodů.Tento mód je však dovolen pouze v případě půlsnímkovém predikce. Druhý mód je dovolen pouze pro dopředně predikovaný obraz,mezi jímž a jeho referenčním snímkem není žádný obousměrně predikovaný obraz.V tomto módu jsou odvozeny dva pohybové vektory ze dvou referenčních půlsnímků.Tento mód,označovaný jako „dual prime mode“,může být použit jako alternativa obousměrné predikce v případech,kdy není přípustné velké zpoždění,neboť nevyžaduje změnu pořadí vysílaných půlsnímků.

35 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: d) Typy skupiny obrazů Podle způsobů predikce tedy MPEG – 2 definuje celkem 3 typy obrazů Vnitřně kódované obrazy(Intra Codet Picture, snímky typu I)  Tyto obrazy jsou komprimovány samostatně bez závislosti na ostatních snímcích a umožňuji vstup do kódované obrazové sekvence. Dopředně predikované obrazy(Predicted Picture, snímky typu P)  Tyto obrazy jsou kódovány s využítím pohybově kompenzované,dopředné predikce z předcházejícího nebo P snímku.  Tyto snímky mohou být také použity jako referenční pro další predikci. Obousměrně predikované obrazy(Bi-directionally predicted Picture, snímky typu B)  Tyto obrazy pro predikci využívají jako referenční, jak předcházející tak i následující I nebo P obrazy.  Využití obousměrné predikce však představuje potřebu změnit pořadí vysílaných snímků tak, aby dekodér vždy dostal dříve referenční obrazy než obrazy,které jsou z nich predikovány.

36 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Typy skupiny obrazů

37 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Typy skupiny obrazů: Různé typy obrazů se sdružují do skupin (Group of picture - GOP). Skupina obrazů obsahuje vždy pouze jeden obraz typu I a bývá popsána pomocí počtu obrazů ve skupině. Pro danou obrazovou kvalitu je možné výsledný bitový tok výrazně ovlivnit vhodnou volbou predikovaných a obousměrně predikovaných snímků. Snímek typu P zaujímá typicky asi třetinu bitu proti snímku I,snímek typu B asi polovinu bitů proti velké P. Nicméně rozšíření obrazů ve skupině vede ke komplikovanějšímu a tedy časově náročnějšímu dekódování. Znesnadňuje se tak vstup do obrazové sekvence a u přímých přenosů vytváří větší časové zpoždění mezi snímaným a reprodukovaným obrazem. Výsledné blokové schéma kodéru MPEG – 2 je na následujících snímcích.

38 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Blokové schéma kodéru MPEG – 2

39 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Druhé blokové schéma kodéru MPEG – 2

40 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: e) Profily a úrovně Standard MPEG – 2 představuje poměrně komplikovaný způsob kódování, který však podporuje široký rozsah aplikací a je vhodný pro široké spektrum statistických vlastností obrazu. Jeho plná syntaxe zahrnuje v současné době 7 různých profilů, které definují různý způsob kódování a 3 úrovně, které definují podporované rozlišení a tudíž i bitový tok. Úrovně:  Nízká úroveň (low level) Odpovídá standardu SIF a je určena pro televizi s nízkým rozlišením LDTV (low definition TV)  Hlavní úroveň Odpovídá standardní televize (SDTV)  Vysoká úroveň Je určena pro HDTV, respektive širokoúhlovou HDTV. Širokoúhlý formát 16:9 však umožňují obecně všechny úrovně a profily

41 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Profily: Jednoduchý profil (Simple Profile)  Tento profil nepoužívá snímky typu B Hlavní profil (Main Profile)  Je základním profilem v projektu DVB.  Poskytuje rozlišením 720x576, kvantizační hloubkou 8 bitů, formát 4:2:0 s bitovou rychlostí do 15Mbit/s Profil 4:2:2  Od hlavního profilu se liší především formátem 4:2:2 a maximální bitovou rychlostí 50Mbit/s.  Je určen pro studiové aplikace, kde se využije možnosti kódovat pouze I snímky, které umožňují snadné režijní zpracování signálu. Nevýhodou je značný vzrůst bitové rychlosti oproti hlavnímu profilu. Šumově odstupňovaný profil (SNR scalable profile)  Tento profil umožňuje rozdělení datového toku do základní vrstvy (base layer), přídavné a vyšší vrstvy (enhanced layer).  Signál přídavné vrstvy se vytváří jako rozdíl mezi rekonstruovanými a originálními koeficienty, který se samostatně jemně kvantuje a přenáší ve vyšší vrstvě.

42 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Prostorově odstupňovaný profil (spatial scalable profile)  Rozdělení bitového toku do dvou vrstev podle prostorového rozlišení.  Základní vrstva nese informace se základním prostorovým rozlišením a je kódována nezávisel na druhé vrstvě. Vyšší vrstva nese informaci, která doplňuje prostorové rozlišení.  V šumově i prostorově odstupňovaného profilu platí, že nižší nese vždy data, která jsou pro přenos a kódování důležitější a je také lépe zabezpečena. Případný výpadek vyšší vrstvy způsobí jen ztrátu kvality obrazu. Vysoký profil (Hight profile)  Zahrnuje všechny předcházející možnosti, včetně příspěvkového formátu 4:2:2.  Jeho nevýhodou jsou však mimořádně vysoké nároky na přenosová i koncová zařízení.

43 3.DVB - Zdrojové kódování MPEG – 2 Redukce časové redundance: Profil „Multiview“(MVP)  Podporuje paralelní přenos několika na sobě závislých pohledů, což dovoluje efektivní kompresi např. stereoskopických snímků.  Jeho základem jsou dvě vrstvy, z nichž základní vrstva je přiřazena levému pohledu a má strukturu hlavního profilu. Stejnou strukturu má i vyšší vrstva s tím rozdílem, že snímky typu P a B v této vrstvě mohou používat jako referenční snímky nižší vrstvy. Vyšší vrstva odpovídá pohledu pravému.

44 Systémová specifikace standardu MPEG – 2 Úvod Popis datových paketů Členění obrazu v systému MPEG – 2 Zpět >>

45 4. Systémová specifikace standardu MPEG – 2 Komprimovaná elementární data, která vystupují z kompresní části obrazového a zvukového kodéru jsou nyní rozdělena do menších celků, tzv.paketů. Pakety jsou opatřeny záhlavím, ve kterém jsou umístěny identifikační a synchronizační údaje. Takto vzniklý paketový elementární tok(PES - packetized elementary stream) je svou flexibilitou vhodný pro další zpracování. Na výstupu zdrojového kodéru se z datového toku PES vytváří programový tok nebo transportní tok (obrázek na následujícím snímku). A) Programový tok  Programový tok je svou délkou i složením vhodný pro přenosy ve kterých se neočekává působení rušivých vlivů.  Jedná se tedy o přenosy ve studiovém provozu. Mezi studii a záznamovým pracovištěm apod. Programový tok nepotřebuje žádné zabezpečení. B) Transportní tok  Transportní tok je vhodný pro široké použití, kde nelze vyloučit působení rušivých signálů.  Používá se pro distribuci signálu.Krátké a stejně dlouhé pakety lze poměrně snadno zabezpečit použitím vhodných redundantních přídavných bitů.

46 4. Systémová specifikace standardu MPEG – 2

47 Vytvoření programového a transparentního toku

48 4. Systémová specifikace standardu MPEG – 2 Popis datových paketů: Popis datových paketů: a) Paketový elementární tok (PES) Paketový elementární datový tok nemá specifikovanou délku. Maximální délka je 65535 bajtů, z čehož 6 bajtů je vyhrazeno pro záhlaví a minimálně 3 bajty pro informační pole. Záhlaví obsahuje dohromady jednobajtovou informaci o obsahu paketu(PID). V prvních 2 bajtech informačního pole se přenáší 12 návěstí, specifikujících dekódování. Značka DTS udává, kdy má být v paměti paket dekódován, a značka PTS,kdy má být paket přečten. Dvě značky jsou zapotřebí v případě, že došlo ke změně pořadí vysílaných dat. Složení paketu elementárního toku

49 4. Systémová specifikace standardu MPEG – 2 Popis datových paketů: b) Programový tok Programový tok je určen pro další studiové zpracování nebo záznam Skládá se z několika paketů elementárního toku. Na začátku je záhlaví, za kterým následuje synchronizace (SCR) a údaj o přenosové rychlosti. Dále následuje systémové záhlaví a za ním jednotlivé pakety PES. Složení programového datového paketu

50 4. Systémová specifikace standardu MPEG – 2 Popis datových paketů: c) Transportní tok Transportní tok představuje rozhraní mezi zdrojovým a kanálovým kodérem. Transportní pakety mají délku 188 bajtů,skládají se ze záhlaví(4 bajty), adaptačního pole(0-182 bajtů), za kterým následují vlastní data. Záhlaví je složeno synchronizačním bajtem(47H), následuje bit, který informuje o neopravené chybě v TS (nastavuje kanálový dekodér). Ukazatel začátku skupiny udává, že součástí paketu je záhlaví elementárního toku nebo, že se přenášejí informační tabulky o programu(PAT). Identifikace paketu PID (13 bitů) je přiřazena každému elementárnímu toku. Některá PID jsou již předřazena(000 PAT,0001 CAT a pod.). Následuje dvoubitová informace o scramblování, 1.bit informuje o tom, zda je transportní nebo elementární tok scramblován, 2.o změně kódu. Další blok informuje přítomnosti, popř. velikosti informačního pole. Záhlaví končí informací o stavu čítače, který čítá pakety se stejným PID. Tento údaj může posloužit při případné ztrátě paketu. Adaptační pole se v toku objeví nejméně 1 za 0,1 s. Přináší referenční hodinové impulsy PCR(Program Clock Reference), které řídí systémové hodiny STC(Systém Clock Reference). Adaptační pole dále vyrovnává nesoudělný konec paketu PES s počtem bajtů transportního paketu. Transportní tok obvykle obsahuje několik programů, které jsou popsány v programové informaci PSI(Program Specific information). Každý transportní tok obsahuje programovou tabulku (PAT),stejně jako několik programových map (PMT-Program Map table), kde jsou popsány jednotlivé programy. Paket PES je vzhledem ke své délce obsažen v mnoha transportních paketech, jeho záhlaví vždy následuje po adaptačním poli transportního paketu.

51 4. Systémová specifikace standardu MPEG – 2 Popis datových paketů: Složení transportního datového paketu

52 4. Systémová specifikace standardu MPEG – 2 Členění obrazu v systému MPEG – 2 Kódování obrazu vychází z doporučení institutů, s rozkladem obrazu na 576 aktivních řádků, 720 aktivních obrazových prvků na řádku, 25 snímků/s s prokládaným nebo neprokládaným řádkováním a aktivním bitovým tokem 165 Mbit/s. Tento bitový tok je nutno prostředky zdrojového kódování zredukovat na 3 až 6 Mbit/s, tj. dosáhnout kompresních poměrů kolem 50:1, případně i vyšších. MPEG – 2 rozeznává tyto hierarchické struktury televizního obrazu: sekvence, skupina obrázků GOP (Group of Pictures), obrázek (picture), tj. snímek nebo půlsnímek, pruh makrobloků (slice), makroblok, blok, vzorek (sample). Vzorky jsou reprezentovány osmibitovými informacemi o jasu nebo chrominanci obrazových prvků. Skupina 8 x 8 jasových nebo chrominančních vzorků tvoří blok, čtyři jasové bloky spolu s odpovídajícími chrominančními bloky tvoří makroblok. Počet bloků v makrobloku závisí na způsobu vzorkování chrominančních informací. V nejběžnějším systému označovaném 4:2:0 je v makrobloku po jednom bloku CB a CR.

53 4. Systémová specifikace standardu MPEG – 2 Několik za sebou následujících makrobloků pokrývajících na obrazovce stejných 16 řádků tvoří pruh makrobloků. Při 720 aktivních vzorcích na řádku může pruh zabírat maximálně 45 makrobloků, pruh může být samozřejmě i kratší a jeho velikost se může v podstatě libovolně měnit. Nejkratší pruh tvoří jeden makroblok.Dalším stupněm je obrázek tvořený buď jedním televizním půlsnímkem, nebo snímkem. Na jeden snímek připadá maximálně 45 x 36 = 1620 makrobloků. Rozlišujeme obrázky typu I, P a B. Obrázek I je zásadně kódován vnitrosnímkově (intraframe) nebo vnitropůlsnímkově (intrafield), nemá tedy žádnou vazbu na předcházející a následující obrázky. Obr. - Makroblok 4:2:0 - celkem 6 bloků 8 x 8 hodnot

54 4. Systémová specifikace standardu MPEG – 2 Obrázek P (predicted) je kódován ve vztahu k předcházejícímu obrázku I nebo P na základě diferenční pulzně kódové modulace DPCM. Kódování probíhá po makroblocích (a blocích), přenášejí se pouze rozdíly signálu vzhledem k již přenesenému referenčnímu makrobloku z předcházejícího obrázku, přičemž polohu referenčního makrobloku v paměti udává tzv. pohybový vektor. Pohybové vektory se vytváří v kodéru podle složitých algoritmů analýzou všech makrobloků ve vyhledávací oblasti, do dekodérů jsou přenášeny spolu se signálem. Na základě souřadnic pohybového vektoru vyhledá dekodér ve své paměti již přenesený makroblok a přidá k němu přenášený rozdíl, a tak získá původní hodnoty právě kódovaného makrobloku. Obr. - Princip detekce a kompenzace pohybu, pohybový vektor (12, 4)

55 4. Systémová specifikace standardu MPEG – 2 Obrázek B (bidirectionally predicted) může používat jako referenci makrobloky jak z předcházejícího, tak i následujícího obrázku I nebo P. Aby dekodér v přijímači mohl používat i následující obrázky, mění kodér jejich pořadí při vysílání tak, že při přenosu obrázku B jsou příslušné referenční obrázky I nebo P již uloženy v paměti přijímače. Správné pořadí pro zobrazení zajišťuje dekodér Význam obrázků B spočívá v možnosti nalézt podobné bloky při odkrývání podrobností za pohybujícím se objektem v popředí, případně při pohybu kamery na okrajích obrazu. Tyto podrobnosti jsou pak obsaženy někdy pouze v předcházejícím a jindy pouze v následujícím obrázku. Referenční makrobloky jsou určeny dvojicí pohybových vektorů

56 4. Systémová specifikace standardu MPEG – 2 Skupina obrázků GOP je tvořena několika obrázky mezi dvěma obrázky typu I. Pro GOP je charakteristická jeho celková délka N a periodicita M udávající, jak se opakují obrázky typu P (včetně obrázků I). Těmito dvěma konstantami je stanoveno pořadí obrázků různých typů ve skupině GOP (mezery mezi obrázky I a P jsou vyplněny obrázky B). Sekvence je nejvyšší struktura při kódování obrazu ve standardu MPEG – 2, je tvořena skupinami GOP. V záhlaví sekvence se přenášejí údaje týkající se způsobu kódování celé sekvence. Podobně v záhlaví nižších obrazových složek (GOP, obrázek, pruh makrobloků, makroblok) se přenášejí společné údaje týkající se těchto složek. U makrobloku jsou to zejména adresa a typ makrobloku, způsob kvantizace a pohybové vektory. Obr. - Používané způsoby predikce ve skupině obrázků GOP,délka skupiny N, periodicita M (pro obrázky P I)

57 Zdrojové kódování zvuku Komprese zvukové informace Princip komprese zvukového signálu Zvukový standard MPEG – 1, úroveň 1 Zvukový standard MPEG – 2 Zpět >>

58 5) Zdrojové kódování zvuku Komprese zvukové informace: Přenosová bitová rychlost nekomprimovaného zvukového signálu pro vzorkovací kmitočet 32kHz, 16-ti bitovou kvantizační hloubku činí pro dva přenosové kanály 1,024 Mb/s. Tuto hodnotu již nelze vzhledem k bitové rychlosti komprimovaného video signálu zanedbat a proto MPEG zavádí i kompresy zvukového signálu.

59 5) Zdrojové kódování zvuku Princip komprese zvukového signálu Kompresní metody zvukového signálu jsou založeny na maskování signálu Maskovaný signál se pokládá za irelevantní a nepřenáší se. Zvukové spektrum rozdělíme do několika pásem.Na obrázku je znázorněno jedno frekvenční pásmo spolu s maskujícím tónem,který je umístěn na jeho okraji. Za předpokladu, že vyznačená křivka udává maskovací práh, všechny spektrální složky, umístěné pod touto křivkou nejsou slyšet a není je třeba přenášet. Zajímavá je oblast, kde v daném pásmu jsou všechny složky umístěny pod křivkou (oblast pod M min čarou). Tuto oblast nemusíme přenášet celou, čímž se v daném okamžiku sníží potřebný dynamický rozsah a tím i kvantizační hloubka v uvažovaném pásmu. Princip komprese zvuku

60 5) Zdrojové kódování zvuku Zvukový standard MPEG – 1, úroveň 1 Způsob komprese zvukové informace v MPEG – 1,úroveň 1 je patrný z obrázku. obrázku Zvukový signál je převedený na banku filtrů, která ho převede do frekvenční oblasti a rozdělí do 32 pásem. Pro tento účel se vstupní signál rozdělí na skupiny po 384 vzorcích, tzv.datové rámce. Každý rámec má při vzorkovacím kmitočtu 48 kHz a délku 8 ms. Spektrum se nyní podvzorkuje tak, že v každém pásmu získáme 121 spektrálních vzorků, z nichž podle vzorku s nejvyšší amplitudou je definován činitel měřítka(scale factor). Podle činitele měřítka se potom v psychoakustickém modelu stanoví akustické prahy v každém pásmu.psychoakustickém modelu Zbývající dynamický rozsah nad maskovacím prahem lze potom zakódovat menším počtem bitů.

61 5) Zdrojové kódování zvuku Zvukový standard MPEG – 2 Cílem zdokonalení MPEG – 1 je snížení bitové rychlosti slučitelného vícekanálového zvukového signálu(např.dolby surround). Při nízkých bitových rychlostech je u standardu MPEG – 1 slyšitelný kvantizační šum. K zamezení tohoto jevu jsou u standardu MPEG – 2 k dispozici poloviční vzorkovací kmitočty(16Hz ; 22,05kHz;24 kHz). -Omezení kmitočtového pásma je při nízkých přenosových rychlostech méně rušivé než kvantizační šum. Standard MPEG – 2 má zajistit také přenos pětikanálového zvuku dolby surround. Dosahuje toho maticováním vstupních signálů, při kterém se z 5 signálů vytvoří 2 slučitelné (stereofonní) signály a 3 přídavné signály.

62 5) Zdrojové kódování zvuku Princip zvukového kodéru MPEG

63 Princip Psychoakustického maskovacího jevu Zpět >>

64 6. Princip Psychoakustického maskovacího jevu Princip: Kódování zvuku MPEG – 2 je založeno na rozdělení zvukového signálu v kmitočtové oblasti do 32 subpásem a využití tzv. psychoakustického maskovacího jevu lidského sluchu v každém z těchto subpásem. Princip tohoto jevu je znázorněn na obr., kde čistý tón 1000 Hz vysoké intenzity maskuje (tj. zcela překrývá) slabší zvukové signály v blízkém okolí, nalézající se pod prahem maskování. V důsledku maskovacího jevu silnější zvukové signály potlačují vnímání slabších spektrálních složek v dané oblasti kmitočtů, které pak není nutno kódovat. V každém subpásmu lze zvolit optimální počet bitů na vzorek, při kterém je kvantovací šum ještě maskován a tedy nedochází ke slyšitelnému snížení kvality zvuku. Současně se signálem se přenášejí ještě tzv. měřítka závislá na skutečné velikosti signálu v daném subpásmu, aby kódování probíhalo účinně bez ohledu na okamžitou intenzitu kódovaného zvuku v daném subpásmu. Obr. - Princip psychoakustického maskovacího jevu

65 6. Princip Psychoakustického maskovacího jevu Jemnost kvantování (a tedy potřebný bitový tok) v každém kmitočtovém subpásmu se v kodéru stanoví výpočtem na základě psychoakustického modelu podle skutečné situace v daném časovém intervalu. Základem je rychlá Fourierova transformace FFT, stanovení výkonové úrovně signálu a výpočet dílčích maskovacích prahů v jednotlivých subpásmech. Výsledkem výpočtů je stanovení odstupu signálu od maskovacího prahu SMR (Signal to Mask Ratio) v každém subpásmu. Signály pod maskovacím prahem daného subpásma pak nejsou kvantovány, a tím dochází k úspoře bitového toku. Poté se vypočítají měřítka a zakódují informace o měřítkách ScFSI (Scale Factor Select Information). Po přidělení bitů se jednotlivé subpásmové vzorky kvantizují a kódují. Na výstupu je bitový tok ve formátu zvukového rámce MPEG. Standardy MPEG při kódování zvuku rozlišují tři úrovně (layer) komprese. Základní kompresní algoritmy používá úroveň 1, rozšířené algoritmy úroveň 2, která tak dosahuje při stejné kvalitě zvuku nižších bitových toků. Nejkvalitnější je úroveň 3. V digitální televizi DVB i v digitálním rozhlase DAB a v multimédiích se používá úroveň 2 (MPEG Audio Layer 2). Zvukové standardy MPEG – 1 a MPEG – 2 jsou v podstatě shodné, s tím, že kromě vzorkovacích kmitočtů 32 kHz, 44,1 kHz a 48 kHz zavedených v standardu MPEG – 1 připouští MPEG – 2 i vzorkovací kmitočty poloviční. Kromě toho umožňuje MPEG – 2 i kódování pětikanálového kruhového zvuku (surround audio). Pro kódování zvuku v digitální televizi DVB i v digitálním rozhlase DAB se používají pouze vzorkovací kmitočty 48 kHz, příp. 24 kHz. Přípustné užitečné bitové toky se při vzorkovacím kmitočtu 48 kHz pohybují v rozmezí od 32 do 384 kbit/s po stupních 16 a 32 kbit/s.Při vzorkovacím kmitočtu 24 kbit/s je rozmezí přípustných bitových toků 8 až 160 kbit/s se stupni 8 a 16 kbit/s. Z důvodů zpětné kompatibility s MPEG 1 používá systém MPEG – 2 i při vícekanálové modulaci dva základní stereofonní signály Lo, Ro získané maticováním z pěti zdrojových signálů kruhového zvuku. Vývojový diagram kodéru MPEG je na následujícím obrázku.

66 6. Princip Psychoakustického maskovacího jevu Obr. - Vývojový diagram zvukového kodéru MPEG Audio Layer 2

67 6. Princip Psychoakustického maskovacího jevu jak již bylo uvedeno, je běžný užitečný bitový tok stereofonního pár ve studiu 1,92 Mbit/s bitový tok potřebný pro jeden stereofonní program s kvalitou blízkou k CD je při současné úrovni techniky 192 kbit/s. Tomu odpovídá v tomto případě redukce dat 10:1, kterou zajišťuje zdrojové kódování. Zvukový dekodér MPEG neobsahuje psychoakustický model ani proceduru přidělování bitů pro jednotlivé vzorky v každém z 32 kmitočtových subpásem. Potřebné informace dostává v zakódovaném tvaru spolu s kódovaným signálem. Z těchto informací a z dekódovaných subpásmových vzorků obnoví jejich původní hodnoty. Po potřebných kmitočtových přesunech, sloučení signálů jednotlivých subpásem a převodu z paralelního na sériový tvar je na výstupu dekodéru opět digitální audiosignál ve tvaru jako na vstupu kodéru MPEG. Podobně jako obrazový dekodér MPEG je i zvukový dekodér podstatně jednodušší a levnější než kodér.

68 6. Princip Psychoakustického maskovacího jevu Na závěr této kapitoly poznamenejme, že do systému DVB – T byl v rámci požadavku Austrálie adaptován jako druhý i systém kódování zvuku AC-3 používaný v americkém systému digitální televize ATSC. Systém AC-3 byl vyvinut společností Dolby Laboratories a je známý také pod názvem Dolby Digital. V tomto systému jsou podobně jako u zvukového kódování MPEG povoleny vzorkovací frekvence 32 kHz, 44,1 kHz, 48 kHz, celá řada bitových toků od 32 až po 640 kbit/s a několik konfigurací pro jeden až pět reprodukčních kanálů.

69 Skladba multiplexu MPEG – 2 Zpět >>

70 7. Skladba multiplexu MPEG – 2 Skladba multiplexu MPEG – 2 Kódovaný bitový tok jedné programové složky (obraz, zvuk, data) tvoří elementární tok, který se po uspořádání do paketů nazývá paketizovaný elementární tok PES (Packetised Elementary Stream). Každý PES přenáší kromě vlastních dat důležité informace o obsahu paketu a synchronizační informace (tzv. časová razítka DTS a PTS) v hlavičce paketu. Délka paketu PES je typicky do 64 kbajtů, ale může být i větší. Časová razítka umožňují dekodéru správně dekódovat obrazový tok ze snímků I, P a B. Kódovaný videosignál jednoho televizního programu (multiplexovaný v programovém multiplexu) s odpovídajícími zvukovými a datovými signály tvoří programový tok. Několik programových toků (multiplexovaných v transportním multiplexu) tvoří transportní tok TS (Transport Stream). Transportní tok se přenáší po paketech délky 188 bajtů. Každý transportní paket začíná hlavičkou o minimální délce 4 bajty, první z nich má hexadecimální hodnotu 47 a slouží k synchronizaci. Velmi významnou roli hraje identifikace paketu PID (Packet Identification), což je číslo používané k identifikaci jednotlivých programů a také k identifikaci paketů každé dílčí programové složky. Hodnoty PID jednotlivých programů transportního toku se přenášejí v tabulce PAT (Program Association Table), jejíž paket má vždy hodnotu PID = 0. Každý PID z tabulky PAT identifikuje velmi důležitou tabulku PMT (Program Map Table), která se přenáší v jednom paketu a je referenční pro jeden program. V tabulce PMT jsou uvedeny hodnoty PID jednotlivých dílčích složek (obraz, zvuk, data) daného programu.

71 7. Skladba multiplexu MPEG – 2 Skladba transportního multiplexu podle standardu MPEG – 2 Na příkladu má program 1 hodnotu PID = 22 a program 2 hodnotu PID = 33. Hodnota PID = 22 definuje tabulku PMT pro program 1. V této tabulce jsou uvedeny hodnoty PID pro obrazový signál (PID = 54) a pro dva zvukové signály programu 1 (PID = 48, PID = 49). Podobně jsou v tabulce PMT programu 2 (PID = 33) definovány hodnoty PID pro obrazový a zvukové signály tohoto programu.

72 7. Skladba multiplexu MPEG – 2 Střídání jednotlivých paketů ve výsledném transportním toku je naznačeno ve spodní části předchozího obrázku. Konstantní hodnotu PID = 1 má důležitá tabulka podmíněného přístupu CAT (Conditional Access Table). Podmíněný přístup CAT hraje v digitální televizi důležitou roli a umožňuje příjem určitých programů jenom těm divákům, kteří je mají předplacené. Používají se dva způsoby předplacení: buď měsíčním předplatným na všechny pořady daného programu, nebo zaplacením vždy pouze vybraného pořadu (pay-per-view). Z hlediska standardizace se podmíněný přístup realizuje v oblasti multiplexu MPEG – 2, standardizován je ale na úrovni DVB. Výše popsaný způsob identifikace paketů transportního toku umožňuje v dekodéru oddělit, jak jednotlivé programy mutliplexu, tak i jejich dílčí složky.

73 7. Skladba multiplexu MPEG – 2 Komprese bitového toku v systému MPEG – 2 je založena na diskrétní kosinové transformaci DCT, pohybově kompenzované mezisnímkové predikci na principu DPCM, kvantizaci koeficientů DCT a jejich kódování kódem RLC a VLC. diskrétní kosinové transformaci Transformace DCT spolu s pohybově kompenzovanou DPCM se nazývá hybridní DCT. Obr. - Dvourozměrná diskrétní kosinová transformace pro N = 8

74 Diskrétní kosinová transformace Úvod Zpětná vazba Zpět >>

75 8. Diskrétní kosinová transformace Diskrétní kosinová transformace DCT nahrazuje hodnoty obrazových prvků jednotlivých bloků 8 x 8 spektrálními koeficienty DCT, které jsou opět uspořádány do bloků 8 x 8. Jedná se v podstatě o převod z oblasti signálových hodnot (jas a chrominance) do kmitočtové oblasti (spektrální koeficienty), analogicky. V digitální televizi DVB je DCT dvourozměrná a je omezena na 8 x 8 prvků. V důsledku velké závislosti mezi sousedními obrazovými prvky má ve většině případů největší hodnotu koeficient reprezentující stejnosměrnou složku daného bloku, umístěný v bloku vlevo nahoře. Velikosti dalších koeficientů směrem k vyšším prostorovým kmitočtům (směrem doprava se zvyšuje horizontální, směrem dolů vertikální prostorový kmitočet) obvykle velmi rychle klesají a velké množství koeficientů má hodnoty blízké nule.

76 8. Diskrétní kosinová transformace Příklad diskrétní kosinové transformace pro 4 x 4 prvky ukazuje obrázek. Jas šestnácti obrazových prvků (pixelů) se transformuje na 16 koeficientů DCT vyjadřujících amplitudy jednotlivých "harmonických". Každá z těchto harmonických má opět tvar čtvercové matice, přičemž její koeficient DCT udává, jak se tato harmonická podílí na hodnotách obrazových prvků daného bloku. Levý horní koeficient se označuje F(0,0) a udává dvojnásobek průměrného jasu celého bloku. Z příkladu je také zřejmé, že v tomto konkrétním případě je většina (celkem 9) koeficientů po zaokrouhlení nulových. Obecně platí, že čím větší je počet nulových koeficientů, tím je lepší komprese. Obr. - Příklad transformace DCT 4 x 4

77 8. Diskrétní kosinová transformace Poznamenejme ale, že pokud by se každý koeficient přenášel pomocí konstantního počtu bitů (tj. slovem konstantní délky), k žádné kompresi by nedošlo. Proto je nutno využít úsporného kódování řetězců nul. Po vynulování některých koeficientů a vytvoření jednorozměrné časové řady (snímáním koeficientů bloku z dvourozměrné matice podle předepsaných pravidel "cik-cak" nebo "prokládaně") lze pro kódování řetězce nul výhodně využít vlastností kódu RLC (Run- Lenght Coding), který dvojici čísel udává počet za sebou následujících nul a hodnotu prvního nenulového koeficientu. Tyto dvojice jsou pak kódovány kódem s proměnnou délkou slova VLC (Variable Lenght Coding), který přiděluje častějším kombinacím kratší kódová slova. Vychází přitom ze skutečnosti, že krátké série nul jsou pravděpodobnější než dlouhé a že malé hodnoty koeficientů jsou pravděpodobnější než velké. Hodnoty kódu VLC jsou určeny tabulkově. V případě, že se daná kombinace v tabulce nevyskytuje, zakóduje se pomocí speciálního znaku (escape code) s následujícím šestibitovým slovem udávajícím počet nulových koeficientů (až 64) a dalším slovem určujícím hodnotu prvního nenulového koeficientu. Transformace DCT se uvedeným způsobem aplikuje přímo na obrazové prvky bloků v obrázcích typu I a stupeň komprese závisí na charakteru obrázků i na způsobu kvantování koeficientů DCT. K tomu se používají tzv. kvantizační matice 8 x 8, v nichž jsou uvedena vždy na odpovídající pozici osmibitová čísla, jimiž se dělí příslušný koeficient DCT.

78 8. Diskrétní kosinová transformace Osmibitová čísla, jimiž se dělí příslušný koeficient DCT Tato čísla se obvykle zvětšují směrem k vyšším prostorovým kmitočtům v souladu se skutečností, že lidské oko je na ně méně citlivé a mohou tedy být kvantovány hruběji. Po uvedeném vážení koeficientů DCT kvantizační maticí se provádí konečná kvantizace (obvykle na základě lineární stupňovité křivky) s tím, že je možné rozšířit tzv. mrtvou zónu kolem nuly za účelem vynulování maximálního počtu koeficientů DCT. Protože malé odchylky kolem nuly jsou způsobovány také šumem, jejich potlačení obvykle zlepšuje subjektivní kvalitu obrazu. Standard MPEG – 2 používá dva typy standardních kvantizačních matic, v podstatě ale může kodér vytvořit libovolnou kvantizační matici a spolu se signálem ji přenést do dekodéru. Dekodér pak využívá tuto matici do doby, než dostane z kodéru matici jinou nebo příkaz k použití jedné ze dvou standardních kvantizačních matic. Při kódování obrázků P a B se nejdříve vytvoří rozdíl hodnot daného bloku a referenčního (predikovaného) bloku a až tento rozdíl se transformuje pomocí DCT. Při statickém obrazu a při malých změnách jsou rozdíly nepatrné a po transformaci dochází k vynulování velkého množství koeficientů DCT a tím k značné úspoře bitového toku. Aby bylo dosaženo úspory i při pohyblivých obrázcích, využívají se principy detekce a kompenzace pohybu, přičemž se stanoví vektory pohybu vždy pro celý makroblok. Jedna ze základních metod detekce pohybu spočívá v postupném porovnávání právě kódovaného makrobloku s různými makrobloky z předcházejícího obrázku v celé vyhledávací oblasti.  Ta může být např. 32 obrazových prvků ve vodorovném a 16 obrazových prvků ve svislém směru s přesností na polovinu obrazového prvku, která se dosahuje interpolací mezi sousedními prvky. V každé poloze se vytvoří absolutní hodnota rozdílu příslušných hodnot a tyto absolutní hodnoty se sečtou pro celý makroblok a uloží do paměti.

79 8. Diskrétní kosinová transformace Makroblok s nejmenším součtem se použije jako referenční, jeho relativní poloha v paměti je určena pohybovým vektorem. Uvedený způsob je velmi náročný na počet výpočetních operací v kodéru, pro dekodér je však jednoduchý, protože zde stačí na základě přeneseného pohybového vektoru vyhledat v paměti referenční makroblok a přičtením diferencí (po inverzní transformaci DCT) získat správné hodnoty právě dekódovaného bloku daného makrobloku. Je nutné si uvědomit, že kodér při kompenzaci pohybu vyhledává nejpodobnější makroblok, což nemusí být vždy původní, v důsledku pohybu posunutý makroblok. I když se nenajde příliš podobný referenční makroblok, nedochází k chybám přenosu, pouze úspora bitového toku je malá nebo žádná. Důležitou součástí každého kodéru a dekodéru je vyrovnávací paměť, která vyrovnává proměnný bitový tok v závislosti na charakteru obrazu i použitých kompresních prostředcích. Aby se zamezilo přetečení vyrovnávací paměti, je tato paměť trvale monitorována a pomocí zpětné vazby se zajišťuje přiměřené zaplnění paměti.

80 8. Diskrétní kosinová transformace Zpětná vazba Zpětná vazba obvykle ovládá jemnost kvantování koeficientů DCT (a jejich diferencí) a tím zmenšování bitového toku a snižování kvality při hrubším kvantování. Vzhledem k tomu, že se jedná o jemnost kvantování koeficientů DCT, má kvalita v rámci kódovaného bloku "globální" charakter. Rozdíl mezi bloky by se mohl projevit pouze v případě špatného kódování koeficientu F(0,0) odpovídajícího dvojnásobku průměrnému jasu bloku. Tento koeficient se proto kóduje vždy odděleně a s největším počtem bitů. Obrázky I se kódují pouze s využitím DCT. Tím je možno na začátku skupiny snímků GOP bezproblémově stříhat obrazové signály, protože vnitrosnímková DCT je nezávislá na předcházejících snímcích. Podobnost mezi časově sousedními televizními snímky se využívá u obrázků P, ale hlavně u obrázků B, které umožňují maximální kompresi signálu.

81 8. Diskrétní kosinová transformace Princip DCT

82 8. Diskrétní kosinová transformace Rozbor Obrázku: Na předchozím obrázku přichází vstupní obrazový signál po makroblocích na rozdílový obvod, kde se od něj odečítá referenční makroblok z obrazové paměti a tím se vytvoří rozdíl (predikční chyba), který se transformuje přímou DCT. Následuje kvantování rozdílových spektrálních koeficientů, přičemž se bere v úvahu i stav obsazení výstupní vyrovnávací paměti. Kvantované koeficienty DCT se po inverzní DCT (tedy opět ve tvaru obrazových diferencí) přidávají k pohybově kompenzovanému referenčnímu makrobloku na vstupu obrazové paměti, která tedy ukládá kompletní obrázek pro další predikce. Ve výstupní části kodéru se kvantované spektrální koeficienty kódují kódem VLC a po multiplexování s pohybovými vektory ukládají do výstupní vyrovnávací paměti, odkud postupují na výstup kodéru. V případě, že na vstupu je obrázek typu I, rozpojí se oba vypínače a na obrázek se aplikuje transformace DCT přímo, bez DPCM. Zpětná vazba z vyrovnávací paměti zajišťuje při naplnění hrubší kvantizaci spektrálních koeficientů, tím snížení bitového toku a postupné vyprazdňování paměti.

83 Opakování MPEG Struktura MPEG – 2 Sekvence obrázků Zpět >>

84 9.Opakování MPEG Zkratka MPEG (Motion Picture Expert Group) označuje standard pro digitální kompresi, ukládání a přenos pohyblivých obrázků (videa).

85 9.Opakování Za jednu vteřinu musí proběhnout 25 snímků (norma pro video) Snímek se rozdělí na 576 aktivních řádků a 720 aktivních obrazových prvků na řádku Vzorky jsou reprezentovány osmibitovými informacemi o jasu nebo chrominancí (barvy) obrazových prvků. Skupina 8 x 8 jasových nebo chrominančních vzorků tvoří blok, čtyři jasové bloky spolu s odpovídajícími chrominančními bloky tvoří makroblok. Obrázek

86 9.Opakování Struktura MPEG – 2: I-, P- a B- snímky V MPEG – 2 se videosekvence skládá z tzv. I -, B -, a P - snímků. I-snímky jsou indexové obrázky a základ pro kodování zbylých snímkků P a B. V MPEG – 2 datové sekvenci obsahují I- snímky všechna data potřebná pro dekompresi a zobrazení snímku. B-snímky jsou obousměrně zkomprimované obrázky. Obsahují pouze data popisující rozdíly mezi předchozím a následujícím snímkem. B - snímky obsahují mnohem méně dat nežli I - snímky. P-snímky jsou předpověděné obrázky. Jsou odhadnuty na základě sekvence snímků ve videu. Jsou dopočítávány a obsahují ještě méně informace než B - snímky.

87 9.Opakování Sekvence obrázků jako skupina obrázků MPEG – 2 standard popisuje sekvence I -, B -, a P -snímků jako skupiny obrázků (Group of Pictures - GOP). Každý výrobce systému si může vytvořit GOP jakékoliv délky a struktury za podmínky, že každá skupina obrázků (GOP) obsahuje alespoň jeden I-snímek. To zaručuje kompatibilitu MPEG – 2 datového toku s libovolným MPEG – 2 dekodérem (DVD přehrávač, PC systém vybavený softwarovou nebo hardwarovou podporou MPEG – 2, DVB satelit a další).

88 Odlišnost kompresních formátů Video Zvuk Zpět >>

89 10.Odlišnost kompresních formátů video Komprese videa: a) MJPEG  Kompresní kodek MJPEG (Motion JPEG) je založen na kompresi jednotlivých snímku použitím komprese JPEG. Tento kodek má většinou volitelný kompresní poměr v rozmezí 6:1 do 16:1. Při kompresním poměru 1:8 je kvalita obrazu stále ještě velmi dobrá a datový tok se pohybuje kolem 4 MB/s a dosahuje tak dobrého poměru kvalita/velikost. Velikou předností tohoto kodeku je, že každý snímek je komprimován samostatně a je tedy vždy klíčový. Proto je tento kodek velmi vhodný pro střih videa na počítači. Zároveň je implementován hardwarově – nenáročný na výkon Pc. Castou nevýhodou takto hardwarově implementovaného kodeku je nemožnost přehrát zachycené video na jiném počítači bez tohoto hardware. Softwarový kodek komprimující video kodekem MJPEG je například PICVideo MJPEG Codec Výhody  každý snímek je klíčový, ideální pro střih  bývá implementován hardwarově  podpora prokládaného obrazu  poměrně vysoká kvalita obrazu Nevýhody  vysoké zařízení CPU  velký datový tok

90 10.Odlišnost kompresních formátů video b) MPEG-1  MPEG je zkratkou pro Motion Pictures Experts Group. Cílem práce této skupiny bylo standardizovat metody komprese videosignálu a vytvořit otevřenou a efektivní kompresi. Formát MPEG – 1 byl dokončen v roce 1991 a jako norma přijat roku 1992. Byl navržen pro práci s videem o rozlišení 352x288 bodu a 25 snímku/s při datovém toku 1500kbit/s. Parametry komprese MPEG – 1 jsou srovnávány s analogovým formátem VHS. Formát MPEG – 1 se stal součástí tzv. White Book, což je definováno jako norma pro záznam pohyblivého obrazu na CD (74 minut videa).  Více-> Více-> Výhody  vysoká podpora přehrávačů softwarových i hardwarových.  vhodný i pro stream videa Nevýhody  nepodporuje prokládané snímky  nízká kvalita při nízkém datovém toku  jen konstantní datový tok  nevhodný pro střih

91 10.Odlišnost kompresních formátů video c) MPEG – 3  Pro HDTV (High Definition TV) měl být určen MPEG – 3. Jeho vývoj byl ale zastaven, protože pro HDTV plně postačuje formát MPEG-2. d) MPEG – 4  MPEG – 4 byl vyvinut opět společnosti Motion Picture Experts Group. Není to jíž přesná definice komprese a komprimačních algoritmu, nýbrž je to množina parametru a vlastností, které musí kompresor splňovat, aby byl MPEG – 4 kompatibilní. Známe tedy různé implementace MPEG – 4, které vybírají z definice MPEG – 4 vždy to, co je pro daný formát vhodnější. Kodeky využívající způsoby komprese MPEG – 4 jsou např.:  Microsoft MPEG – 4 v1, v2 a v3, DivX 4, DivX 5, XviD a dalsí e) ASF, WMV  Firma Microsoft si všimla úspěchu na poli streamovaného videa, kterých dosahovali společností Apple a RealNetworks svými formáty Quicktime, MOV a RM, a vyvinula vlastní formát ASF (Advanced Streaming Format), určený především pro stream videa. ASF je formát i komprese, vychází z formátu AVI a dovoluje použít pouze kompresi Microsoft MPEG4. Firma Microsoft uvedla formát WMV, který je novější verzí ASF. Komprese ASF částečne implementuje MPEG4, nepodporuje totiž B-snímky. Výhody  vhodný pro stream Nevýhody  uzavřenost formátu, nemožnost využití jinými programy než firmy Microsoft, zakázáno převádění do jiného formátu z formátu ASF  maximální rozlišení 352x288; kompresor zahazuje snímky aby dodržel datový tok; formát doplnuje soubor ASF o nadbytečné data, aby udržoval konstantní datový tok proudu, čímž se zvětšuje velikost celkového souboru az o 25% oproti přímé kopii video proudu

92 10.Odlišnost kompresních formátů video f) Quicktime Quicktime je formát vyvinutý firmou Apple, který byl v dřívější době, kdy mu nekonkuroval MPEG velmi zajímavý a používaný. Je přenositelný mezi PC a Macintosh platformami, používá kompresi 5:1 az 25:1. Dnes se používá například na prezentacích CD a pro video streaming. Presto v dnešní době jíž tento formát netrhá žádné rekordy a nelze jej příliš doporučit pro použití v praxi. Nutný je také přehrávač, který ale není součástí operačních systému, a je tedy nutné si jej z webových stránek firmy Apple stáhnout. Firma Apple tvrdí, že Quicktime je plně kompatibilní MPEG – 4 kodek, ale v přehrávači Quicktime verze 6.0 nebylo možné přehrát opravdový MPEG – 4 stream. g) RealVideo Real Video a Real System G2 jsou formáty komprese vyvinuté firmou Real Networks. Má podobné vlastnosti jako Quicktime, ale je více zaměřen na kompresi streamovaného videa. h) DivX 3.11a Sloha DivX 3.11a Aplha je nelegální a upravená verze kodeku ASF MS-MPEG – 4v3. Microsoft v beta verzi tohoto kodeku umožňoval ukládání videa do formátu AVI, ale ve finální verzi toto zakázal. Přesto se jednomu počítačovému pirátovi podařilo upravit finální kodek tak, aby umožňoval dále kompresi do formátu AVI. Vznikem tohoto nelegálně upraveného kodeku byly také odstraněné některé špatné vlastnosti kodeku ASF. Již nebylo omezeno maximální rozlišení na 352x288. Tento kodek, přestože je nelegální, zahýbal světem digitálního videa na počítačích. Na 1CD se s jeho pomocí podaří uložit až 1 hodina filmu ve velmi uspokojivé kvalitě. Snížením datového toku lze samozřejme nahrát více, ale na úkor kvality. V dnešní době je, ale tento kodek již překonán.

93 10.Odlišnost kompresních formátů video i) DivX 4, DivX 5 Skupina lidí majících prsty v upraveném kodeku DivX 3.11 Alpha se rozhodla vytvořit vlastní kodek. Z výchozího projektu nazvaný OpenDivX vyšla první verze nazvaná DivX 4, která byla sice dostupná i se zdrojovými kódy, ale kvalita kodeku nedosahovala kvalit kodeku DivX 3.11a. Kodek DivX 4 podporuje několik variant komprese. Jednopruchodová s daným datovým tokem, jednopruchodová s danou kvalitou a dvoupruchodová. První zmíněná varianta komprese se snaží při kompresi videa dodržet daný datový tok. Mnohdy jej ale nedodrží a vytvoří kódované video mnohem vetší než předpokládané. Varianta komprese s danou kvalitou pak komprimuje tak, aby kodek dosáhl dané konstantní kvality. Nevýhodou je nepředvídatelná velikost souboru. j) XviD V momentě, kdy se OpenDivX stal uzavřeným, se to nelíbilo některým programátorům pracujícím na OpenDivXu, vzali si zdrojové kódy, ještě nedodělaného OpenDivXu, a začali vyvíjet vlastní verzi kodeku nazvanou XviD. XviD je opět MPEG-4 kompatibilní kodek a implementuje mnoho vlastností MPEGu 4, bohužel zatím nepodporuje obousměrné kódování (B - snímky). Kodek XviD obsahuje mnoho nastavení a k dosažení kvalitního výstupu je potřeba vedět o tomto kodeku opravdu hodně a správné nastavení kodeku je poměrně obtížné. Také umí produkovat MPEG-4 kompatibilní datové proudy. Výhody  kodek je zdarma  vysoká kvalita videa při nízkém datovém toku  lze použít jakékoliv rozlišení dělitelné 4 až do 1920x1088  velké množství nastavení kodeku  podpora barevných formátu YUV a RGB  MPEG – 4 kompatibilní Nevýhody  vysoké zatížení CPU  přehrávatelné jen na osobních počítacích

94 10.Odlišnost kompresních formátů zvuk Komprese zvuku: a) PCM PCM, jak jsme si již řekli, ukládá zvuk nekomprimovaně. Toto lze použít pouze pro nahrávání, kvůli svému velkému objemu se nehodí na archivaci. b) MP1 (MPEG1 - Layer 1) Tento kodek se přestal používat, pro nízkou kvalitu zvuku a vysoký datový tok. c) MP2 (MPEG1 - Layer 2) MP2 nahradilo MP1. Kodek se používá ke kompresi zvuku ve formátech MPEG1, MPEG2, VCD, SVCD, DVD. Pro uložení stereo zvuku se používá konstantní datový tok 224kbit/s a vzorkovací frekvence 32-48kHz. Kódování do tohoto formátu zvládají všechny programy implementující export do MPEG – 1 nebo MPEG – 2 formátu. Samostatnou aplikaci pro kódování do MP – 2 lze nalézt velmi kvalitní program tooLame

95 10. Odlišnost kompresních formátů zvuk d) MP3 (MPEG1 – Layer 3) MP3 je náhradou pro MP1 a MP2. Při nižších datových tocích dosahuje vyšší kvality. Nevýhodou je, že není podporován ani v MPEG – 1 ani v MPEG – 2 kompresi a je určen výhradně na kompresi zvuku. V dnešní době se tento kodek používá nejvíce k ukládání písniček. Při nízkém datové toku dosahuje kvality zvuku kompaktního disku. Kodek lze různě nastavovat, především datový tok, čímž je dána také výsledná kvalita zvuku. Některé komprimační programy umožňují, kromě konstantního datového toku nastavit také datový tok proměnlivý, což má za následek opět zvýšení výsledné kvality. Například pro datový tok 192kbitu/s, 44100Hz, stereo je datový tok jen 24KB/s. Kromě použití pro ukládání písniček se také používá pro kompresi zvukové stopy videa v AVI formátu. Jako kvalitní programy pro kódování zvuku do MP3 lze povazovat programy LAME a kodek institutu Frauenhofer e) Microsoft WMA Firma Microsoft pro své formáty WMV a ASF vyvinula tento zvukový kodek. Udává, že při 64kbit je kvalita zvuku srovnatelná s kompaktním diskem, ale rozhodne to tak není. Kvalitu lze spíše srovnávat s kvalitami kodeku MP3. Zvuk lze enkódovat pouze s Windows Media Tools.

96 11. Použitá literatura Časopis Telekomunikace 1/1998: Ing. Vladimír Kameník Zemská digitální televize – kódování Časopis Telekomunikace 4/2000: Ing.Dušan Liška Digitální terestiální televize DVB – T/ Technické minimum – MPEG – 2 Časopis Telekomunikace 5/2000: Ing.Dušan Liška Digitální terestiální televize DVB – T/ Technické minimum – COFDM Časopis Trendy: Uživatelská rozhraní pro příjem DVB České radiotelekomunikace: Digitální televizní vysílání DVB Zpět >>

97 KONEC

98 Více k MPEG – 1 MPEG komprese používá ke kompresi videa I, P a B snímky. I snímky (Intra Pictures) jsou snímky klíčové, jsou komprimovány obdobně jako MJPEG, ale navíc s možností komprimovat různé části obrazu různým stupňem komprese. P-snímky (Predicted Pictures) jsou kódovány s ohledem na nejbližší předchozí I nebo P – snímek. B-snímky (Bidirectional Pictures) jsou pak dopočítávané jako rozdílové snímky mezi nejbližším předchozím I nebo P-snímkem a nebližším následujícím I nebo P-snímkem. Celá sekvence snímku (od jednoho I po další I snímek) se pak nazývá GOP (Group of Pictures) a standardní MPEG stream pro VCD, SVCD a DVD používá poradí IBBPBBPBBPBBPBBPBB. Presto MPEG standard neurčuje žádná pravidla a omezení pro vzdálenost I a P snímku. Komprese navíc umožňuje kdykoliv ukončit GOP a předčasně tak použít další sekvenci GOP začínající snímkem I. Toto vede především ke zlepšení kvality videa. Komprimované video obsahující proměnlivé vzdálenosti mezi klíčovými snímky se pak nazývá VKI (Variable Keyframe Interval). Počet I, P a B snímku lze většinou nastavit, záleží na implementaci kompresoru. Z pohledu zabíraného místa pak I snímky zabírají nejvíce místa, po nich jsou P snímky a úplně nejméně místa zabírají snímky B. Komprese MPEG – 1 se nehodí pro střih videa z důvodu vzdálených klíčových snímku. Většina střihových programu však umožňuje export do formátu MPEG – 1. Tento kodek je totiž jeden z nejrozšířenějších formátu a lze jej softwarově přehrát téměř na každém počítači a stejně tak na 95% všech stolních DVD přehrávačích. Tento formát lze také streamovat. V dnešní době je již tento kodek zastaralý, přesto je to nejkompatibilnější formát. Co se týče kvality je v porovnání s jinými kodeky na tom poněkud hůře, protože abyste dosáhly dobré kvality obrazu, potrubuje mnohem více bitu na kompresi než u jiných kodeků (DivX, XviD) Zpět >>


Stáhnout ppt "Výukový prezentační program Komprimace MPEG – 2 Zpracováno studenty 02B Jakub Rypar a Petr Švihel Střední průmyslová škola sdělovací techniky 110 00 Praha."

Podobné prezentace


Reklamy Google