Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Victor Paladino
widgetp@adinet.com.uy
Contenido
Pag
Introduccin general.............................................................................2
Seccin 1: Introduccin a MPEG
1.1 Por que es necesaria la compresin?...................................................3
1.2 Introduccin a la compresin de video................................................3
Seccin 2: ISO/IEC 13818-2, MPEG-2 Video
2.1 Codificacin espacial o temporal?.......................................................5
2.2 Codificacin espacial...........................................................................6
2.3 Ponderacin..........................................................................................7
2.4 Scanning...............................................................................................8
2.5 Codificacin entropica.........................................................................9
2.6 Un codificador espacial........................................................................9
2.7 Codificacin temporal........................................................................10
2.8 Compensacin de movimiento...........................................................12
2.9 Codificacin bidireccional.................................................................13
2.10 Imgenes I, P y B.............................................................................14
Seccin 3: Lo nuevo en MPEG-2
Introduccin............................................................................................16
3.1 Perfiles y Niveles..............................................................................16
3.1.1 Perfiles escalables..............................................................16
3.1.2 Reparto de datos en MPEG-2............................................18
3.2 Video entrelazado.............................................................................18
3.3 Entrelazado y Pulldown 3:2..............................................................18
3.4 MPEG-2 y el video entrelazado........................................................19
3.5 Exploracin (Scanning).....................................................................21
3.6 Entrelazada o progresiva?.................................................................21
3.7 Consecuencias del entrelazado..........................................................22
3.8 Codificacin de Mobile.....................................................................23
3.8.1 Codificacin de Mobile como entrelazada.........................23
3.8.2 Codificacin de Mobile como progresiva...........................24
Seccin 4: ISO/IEC 13818-1, La capa de sistema de MPEG-2
Resumen..................................................................................................27
4.1 Sobre la notacin...............................................................................27
4.2 Unidades de presentacin y unidades de acceso...............................27
4.3 Elementary Streams (Cadenas Elementales)....................................29
4.3.1 Sintaxis del Video Elementary Stream................................29
4.3.2 Audio Elementary Stream...................................................31
4.4 Cadenas elementales paquetizadas (PES).........................................31
La aplicacin primaria de MPEG-2 fue la transmisin digital de seales de TV con buena calidad y a
velocidades de 4 a 10 Mbps. Debido a esto, la principal caracterstica y diferencia con MPEG-1 es que
MPEG-2 brinda un soporte para imgenes entrelazadas, es decir, se tomo en cuenta el hecho de que las
cmaras de TV forman una imagen tomando primero un campo y luego el otro. Ya que estos dos
campos estn separados por un intervalo de tiempo, codificar la secuencia con MPEG-1 no producira
los mejores resultados, ya que MPEG-1 asume que no hay diferencia de tiempo entre lneas sucesivas
en la imagen. El estndar MPEG-2 provee una forma de codificar imgenes entrelazadas incluyendo
dos tcnicas basadas en campo: prediccin basada en campo y DCT basada en campo.
Otras mejoras, como la introduccin de una DCT con precisin de 10 bits en el coeficiente DC,
cuantizacin no lineal, tablas VLC y control mejorado de mismach (para los vectores de movimiento )
han sido introducidas en este nuevo estndar que han brindado mejoras sustanciales aun para material
progresivo. Otra especificacin clave del MPEG-2 son las extensiones escalables ,que permiten la
divisin de la seal de video en dos o mas cadenas de bits representando el video a diferentes
resoluciones, calidad de imagen ,o cadencia de cuadros.
Introduccin general
En Marzo de 1995 se complet el estndar
MPEG-2, compuesto de 9 partes, con el numeral
ISO/IEC 13818. El nombre completo es
Information TechnologyGeneric Coding of
Moving Pictures and Associated Audio
ISO/IEC 13818. Las primeras 5 partes estn
organizadas como en MPEG-1 (Sistema, Video,
Audio, Conformacin y Software). Las 4 partes
adicionales son listadas a continuacin.
La parte 6, Digital Storage Medium Command
and Control (DSM-CC), provee la sintaxis para
controlar el estilo de reproduccin y acceso
aleatorio de los bitstreams codificados y
almacenados en medios digitales tales como el
DVD. Los comandos de reproduccin incluyen
Still Frame, Fast Forward, Advance y GoTo.
La parte 7, Non-Backward Compatible Audio
(NBC), define una nueva sintaxis para audio
surround en una forma que no es compatible con
MPEG-1, por ejemplo el AC-3.
La parte 8 es una extensin a la parte de video
de MPEG-2 (13818-2) y define la sintaxis y
semntica para la representacin de video
codificado con una precisin de 10 bits por
muestra.
La parte 9, Real Time Interface (RTI), define
una sintaxis para seales de control de video
bajo demanda.
Este trabajo no pretende dar al lector
informacin cabal de las nueve partes antes
mencionadas. Simplemente, se hablar de la
parte de video (ISO/IEC 13818-2) y la parte del
Sistema (ISO/IEC 13818-1). Se supondr que el
lector no esta familiarizado con la compresin
de video, con lo cual se dar una breve
introduccin en la seccin 1.
En la seccin 2, se explica detalladamente la
forma en que MPEG consigue llevar a cabo la
compresin de una secuencia de video. Se
explican con detalle las tcnicas de compresin
espacial y temporal, compensacin de
Seccin 1
Y=8*13.5=108 Mbps
Cr=8*6.75=54 Mbps
Cb=8*6.75=54 Mbps
Introduccin a MPEG
Total=216 Mbps
MPEG es uno de los mas populares estndares
de compresin de video y audio, debido a que
no es un simple estndar. En vez de eso, es un
rango de estndares disponibles para diferentes
aplicaciones, pero basados en principios
similares. MPEG es el acrnimo de Moving
Pictures Experts Group, establecido por la ISO
para trabajar en compresin.
Esta seccin es simplemente una breve
introduccin a los conceptos que hay detrs de
la compresin de video. Puede tomarse como
referencia para la segunda seccin, en donde se
tratan con detalle los conceptos mencionados
aqu.
1.1 Por que es necesaria la compresin?
El xito inicial del video digital fue en
aplicaciones de post produccin, en donde la
produccin de video generaba alrededor de 200
Mbps de datos, con lo cual se requera de gran
capacidad de almacenamiento o gran ancho de
banda para su eventual transmisin. La siguiente
figura ilustra este concepto para la digitalizacin
de una imagen de 625 lneas, 720 pxeles por
lnea y una cadencia de cuadros de 30 cuadros
por segundo, resultando en un ancho de banda
de 216 Mbps para su eventual transmisin. El
formato de submuestreo de croma usado es
Figura 1.1
Seccin 2
ISO/IEC 13818-2 MPEG-2 Video
En esta seccin se tratan en detalle los
conceptos introducidos en la seccin anterior.
Se explicar como MPEG lleva a cabo la
compresin de una secuencia de video haciendo
uso de la compresin tanto espacial como
temporal. Todas las tcnicas mencionadas en
esta seccin son heredadas de MPEG-1. Como
se mencion anteriormente, en MPEG-2 aparece
el concepto de video entrelazado, pero no sino
hasta la seccin 3 se hablara de esto. En dicha
seccin, lo nuevo en MPEG-2, se explicar en
detalle el video entrelazado, y como MPEG-2
codifica dicho material. Pido por tanto al lector,
que se olvide de este concepto hasta la prxima
seccin.
2.1 Codificacin espacial o temporal?
Como se vio en la primera seccin, la
compresin de video saca partido tanto de la
redundancia espacial como la temporal .En
MPEG la redundancia temporal es extrada
usando similitudes entre imgenes sucesivas.
Tanto como sea posible, la imagen actual es
estimada a partir de imgenes recientemente
enviadas. Cuando se usa esta tcnica, solo se
necesita enviar la diferencia entre la imagen
estimada y la actual. La imagen diferencia es
entonces sujeta a codificacin espacial.
Es mas fcil comenzar explicando la
codificacin espacial antes que la temporal.
La compresin espacial se relaciona con las
similitudes entre pxeles adyacentes en reas
planas de la imagen y en frecuencias espaciales
5
Figura 2.1
Figura 2.2
2.3 Ponderacin
La figura 2.4 muestra que la percepcin humana
al ruido no es uniforme, sino que es funcin de
la frecuencia. Mas ruido puede ser tolerado a
altas frecuencias.
Figura 2.3
Figura 2.4
Figura 2.5
2.4 Scanning
En el decodificador, los coeficientes se
multiplicarn por sus valores correspondientes
de forma tal de recuperar los coeficientes de la
DCT con ruido de cuantizacin superpuesto. Por
supuesto, este ruido ser mayor a las altas
frecuencias.
Claramente, el grado de compresin obtenido y
el subsecuente bit rate, es funcin de la
severidad del proceso de recuantizacin.
Diferentes bit rates requerirn diferentes tablas
de cuantizacin y en MPEG-2 es posible usar
diferentes tablas para la compresin y
trasmitirlas al receptor para la correcta
decodificacin.
Figura 2.6
Figura 2.7
10
Figura 2.8
Figura 2.9
11
Figura 2.10
Figura 2.11
12
Figura 2.12
Figura 2.13
2.10 Imgenes I, P y B
En MPEG, se necesitan tres tipos diferentes de
imgenes para soportar codificacin diferencial
y bidireccional, mientras se minimiza la
propagacin del error.
Las imgenes I, son codificadas Intra, y no
requieren informacin adicional para la
decodificacin. Requieren un montn de datos
mas que las otras imgenes, y por lo tanto no se
trasmiten mas que la cantidad necesaria.
Consisten primariamente de coeficientes
transformados y no tienen vectores. Estas
imgenes permiten la conmutacin de canales y
detienen la propagacin del error.
Las imgenes P, son predichas hacia delante a
partir de una imagen previa que puede ser una
imagen I o una P. Los datos de estas imgenes
14
Figura 2.14
Figura 2.15
15
Seccin 3
Lo nuevo en MPEG-2
Introduccin
La seccin anterior introdujo con considerable
detalle la forma en que MPEG realiza la
compresin de video. Las tcnicas mencionadas
son comunes tanto para MPEG-1 como para
MPEG-2 ya que se pidi al lector que se
abstrajera de los conceptos que hay detrs del
video entrelazado. Como veremos en esta
seccin, MPEG-2 introduce dos tcnicas nuevas
en el proceso de codificacin aplicables a
material entrelazado. Aparecern por lo tanto en
esta seccin, los conceptos de campo y cuadro,
y aprenderemos como MPEG-2 codifica
eficientemente las imgenes entrelazadas.
Recordemos que una de las aplicaciones mas
importantes de este nuevo estndar es el de
codificar
seales
de
televisin
para
broadcasting, estando por lo tanto bajo el
tratamiento de imgenes entrelazadas. La
seccin 3.2 explica el concepto de video
entrelazado y la seccin 3.4 ensea como
MPEG-2 codifica dicho material. Como antes,
remito al lector a consultar el glosario ante la
aparicin de palabras nuevas.
3.1 Perfiles y niveles
MPEG-2 es aplicable a un amplio rango de
aplicaciones
que
requieren
diferentes
performance y complejidad. Para propsitos
prcticos, el estndar MPEG-2 es dividido en
perfiles y cada perfil es dividido en niveles (ver
figura 3.1). Un perfil es bsicamente el grado de
complejidad esperado en el codificador. Un
nivel es un conjunto de parmetros tales como el
tamao de la imagen o el bit rate usado en ese
perfil. Se puede decir que un perfil limita la
complejidad, es decir, los algoritmos, y un nivel
limita los parmetros tales como bit rate,
dimensiones de cuadro, frames rates, etc.
En principio hay 24 combinaciones posibles,
pero no todas han sido definidas. Un
16
Figura 3.1
Por
ejemplo,
un
codificador
MPEG
convencional podra recuantizar una imagen en
forma bastante severa , generando una imagen
codificada con considerable ruido de
cuantizacin. Ahora, si se decodifica localmente
esa imagen y se resta pxel a pxel con la imagen
original , se obtendr una imagen de ruido. Esta
imagen puede ser comprimida y trasmitida
como seal de ayuda. Un decodificador simple
podra solo decodificar la seal principal,
obteniendo una imagen ruidosa, pero uno mas
sofisticado decodificara las dos seales para
obtener una imagen de mejor calidad. Este es el
principio de la escalabilidad SNR.
En forma alternativa, codificar solo las
frecuencias espaciales mas bajas de una imagen
HDTV , producira una bitstream principal que
un decodificador de SDTV podra decodificar.
Si esta imagen de baja definicin se resta de la
imagen original, se obtendra una imagen con
solo las frecuencias mas altas presentes. Esta
imagen se podra codificar y trasmitir como
seal de ayuda. Un decodificador podra
decodificar ambas seales, la principal y la de
ayuda para recrear la imagen de HDTV. Este es
el principio de escalabilidad Espacial.
17
Figura 3.2
Figura 3.3
20
21
Figura 3.6
22
data1
data2
progresiva
entrelazada
F recuencias horizontales
100
50
0
-50
-100
10
15
20
25
30
35
40
45
35
40
45
F recuencias verticales
1000
500
0
-500
-1000
10
15
20
25
30
# de bloque DCT 8*8 en la fila
3.8.1
Codificacin
entrelazada
de
mobile
como
23
SNR (dB)
22
21
20
19
Campo par
Campo impar
18
17
10
15
n de cuadro
20
25
Figura 3.9
24
24
SNR (dB)
23
22
21
20
19
10
15
# de cuadro
20
25
Figura 3.10
25
24
23
SNR (dB)
22
21
20
19
progresiva
18
17
entrelazada
10
15
n de cuadro
20
25
25
26
Seccin 4
ISO/IEC 13818-1 :La capa del sistema
de MPEG-2
Resumen
La especificacin de Sistema de MPEG-2
describe como las cadenas de datos
comprimidos de audio y video pueden ser
multiplexados juntas con otros datos para
formar una simple cadena de datos (single data
stream) disponible para transmisin y/o
almacenamiento. Esta seccin cubre los
principios y terminologa de la capa del sistema
de MPEG-2. Aqu se cubren tres reas
fundamentales: Primeramente, las estructura de
los diferentes mltiplex; segundo, la
informacin de servicio que pueden presentar, y
tercero, el sistema de marcas de tiempo y
referencias de reloj utilizadas para sincronizar
en el decodificador componentes de programa
relacionados.
En la capa de sistema de MPEG-2, se
especifican dos posibles alternativas de
multiplexin. La cadena de programa
(programme stream), fue diseada pensando en
el almacenamiento y reproduccin de un simple
programa a partir de un dispositivo de
almacenamiento digital (eventualmente libre de
ruido), mientras que la cadena de transporte
(transport stream), fue pensada para la entrega
simultnea de mltiples programas
sobre
canales con ruido. Ambos mltiplex facilitan la
inclusin de informacin especfica de programa
(Programme Specific Information, PSI) que
detallan el/los programas y las cadenas
elementales presentes. Los mltiplex tambin
usan un sistema de marcas de tiempo y
referencias de reloj para asegurar la
reproduccin sincrnica de cadenas elementales
relacionadas, y el correcto comportamiento de
los buffers en el decodificador. En la figura 4.1
se esquematiza la produccin de las cadenas de
programa y de transporte. Mas adelante se
hablar en detalle de ambas. Hay muchos
elementos de sintaxis opcionales y muchas
27
28
4.3
Elementary
Elementales)
Streams
(Cadenas
al
final
del
GOP.
Figura 4.3
30
Figura 4.4
Figura 4.5
Figura 4.6
Figura 4.7
35
Figura 4.8
Figura 4.9
Figura 4.10
Figura 4.11
36
Figura 4.13
Figura 4.12
38
39
40
Seccin 5
Referencias de reloj
Los relojes usados en el multiplexor y en el
decodificador no miden tiempo en horas y
minutos, sino en unidades de 27 MHz
expresadas con nmeros binarios de 42 bits.
En una cadena de programa que puede llevar
solo un programa simple, el reloj se llama
System Clock. Las marcas de tiempo asignadas
a todas las unidades de acceso, estn basadas en
este reloj. La figura 5.1 resume el proceso de
asignacin de marcas de tiempo. Una marca de
tiempo es un valor que representa un tiempo.
Una de las funciones del multiplexor es el de
asignar marcas de tiempo a las unidades de
acceso que salen del codificador. En la figura
5.1, el codificador ha generado tres unidades de
acceso, y ellas han adquirido las marcas de
tiempo 10:27, 10:28 y 10:29 respectivamente.
Muestras regulares del reloj del sistema son
llevadas en la cadena de programa, para permitir
que el codificador y decodificador se
sincronicen. Estas muestras son llamadas
System Clock References (SCR) y son
codificadas en campos opcionales de los pack
headers de la cadena de programa. Una SCR
debe aparecer en la cadena de programa al
menos una vez cada 0.7 segundos.
La segunda alternativa de multiplexin de
MPEG-2, la cadena de transporte, puede tener
diferentes programas.
Cada programa tiene su propio reloj
independiente, llamado Programme Clock, que
no necesita estar sincronizado con los relojes de
los dems programas. Esta permitido, sin
embargo, que diferentes programas compartan
un mismo reloj de programa. Las marcas de
tiempo asignadas a las unidades de acceso, estn
basadas en sus respectivos relojes de programa.
41
Figura 5.1
42
Resumen
El estndar MPEG-2 fue pensado para transmisin de seales de TV en forma completamente digital.
De cara a esto, una de las mas sobresalientes caractersticas del estndar es el de dar soporte a material
entrelazado.
Debido a las diferentes necesidades de los usuarios finales de servicio (end users), MPEG-2 introdujo el
concepto de perfiles y niveles en donde aparecen los perfiles escalables. Gracias a ellos, se puede
transmitir una seal base con la informacin mas importante de video, y otra secundaria o de ayuda para
los usuarios mas exigentes. Esto es simulcasting. Un ejemplo de esto es la difusin de HDTV, donde los
usuarios convencionales solo decodifican el SDTV.
La capa del sistema de MPEG-2 es la primera parte del estndar (ISO/IEC 13818-1). En esta, se define
la sintaxis para el bit stream tanto de audio como de video, y se diferencia la sintaxis dependiendo de la
aplicacin. Si la aplicacin en cuestin es almacenamiento y reproduccin de la secuencia, MPEG-2
utiliza las cadenas de programa que son relativamente largas y de tamao variable. Como el medio es
virtualmente libre de ruido, es muy poco probable que se pierdan datos y/o el sincronismo, y la carga
adicional de esta cadenas de programa producida por los headers es sustancialmente menor que en las
cadenas de transporte. Si la aplicacin es la transmisin de mltiples programas por un canal ruidoso,
MPEG-2 hace uso de las cortas y de tamao fijo cadenas de transporte.
Debido a la necesidad de sincrona entre el transmisor y el receptor, se deben incluir en la secuencia las
referencias de reloj, que son muestras del reloj del codificador.
La especificacin completa de MPEG-2 estuvo lista en Noviembre de 1994, y fue publicada en el ao
1995.
MPEG-2 no estandariza los codificadores, pero si la sintaxis de salida del bitstream. Con esto se logra
que los diseadores se adapten a sus necesidades de costo, y a su vez, que todos los decodificadores sean
capaces de decodificar cualquier secuencia de video MPEG-2.
Glosario de trminos
Cadena Elemental (Elementary Stream): Secuencia de bits en bruto ya sea de audio, video o datos
auxiliares provenientes de la codificacin de un determinado material.
Cadenas de Programa (Programme Stream): Uno de los dos posibles mltiplex que define MPEG2.La cadena de programa es el mltiplex adecuado para almacenamiento de audio y/o video.
Cadenas de Transporte (Transport Stream): Uno de los dos posibles mltiplex que define MPEG2.La cadena de transporte es el mltiplex adecuado para la transmisin de audio y/o video sobre un
canal ruidoso.
Campo (field): Un campo corresponde a la mitad de las lneas de una imagen completa. El campo impar
de una imagen esta constituido por las lneas 1, 3, 5, 7....y el par por las lneas 2, 4, 6, 8.....Si la imagen
es entrelazada, esta se forma escaneando primero el campo impar y luego el par y entrelazando ambos
campos.
43
CAT (Conditional Acces Table) : Tabla de Acceso Condicional. Registros de los accesos
condicionales a determinados programas.
Compensacin de Movimiento: Procedimiento por el cual se minimiza la diferencia entre imgenes
consecutivas en una secuencia de video. Se basa en la busqueda en la imagen anterior de los
macrobloques presentes en la imagen actual.
Cuadro (frame): Imagen completa. Si esta fue adquirida en forma entrelazada, un cuadro se refiere al
conjunto de ambos campos.
DVD: Digital Video Disc.Dispositivo de almacenamiento digital.
Entrelazado: Procedimiento que mezcla dos campos de un cuadro para formar el cuadro completo. Las
lneas de cada campo se alternan en el mezclado.
HDTV: High Definition TV. Televisin de alta definicin.
Imagen (Picture): Se refiere ya sea a un solo campo de un cuadro o al cuadro completo. Depende del
contexto en que nos encontremos.
Mltiplex: Organizacin de las cadenas elementales paquetizadas (PES) realizada ya sea para
almacenamiento del material o la transmisin del mismo. MPEG-2 define dos alternativas de mltiplex:
la cadena de transporte y la cadena de programa.
NIT (Network Information Table): Tabla de Informacin de Red. Informacin opcional sobre el
enlace por el cual circulan los datos.
Nivel: Conjunto de parmetros de codificacin, tales como bit y frame rate o picture format, que junto
con el perfil definen el comportamiento de un codificador y decodificador, adecuado para determinada
aplicacin.
Overflowing: Estado de saturacin del buffer del codificador, producido posiblemente por la
codificacin de imgenes de mucha entropa.
PAT (Programme Asociation Table): Tabla de Asociacin de Programa. Informacin de todos los
programas en una cadena de transporte.
PC (Programme Clock): Reloj de Programa. Reloj que comanda las marcas de tiempo y referencias de
reloj de un determinado programa en una cadena de transporte.
PCR (Programme Clock References): Referencias de Reloj del Programa. Muestras del reloj de
determinado programa que el codificador enva al decodificador, a los efectos de mantener la sincrona.
Perfil: Indicador del grado de complejidad de un codificador. Cuanto mayor es el perfil en que opera un
codificador, mejor es la calidad de la secuencia de video que produce para un determinado bit rate. Junto
con el nivel, se establece el punto de operacin de un codificador.
PES (Paquetized Elementary Stream): Cadenas elementales paquetizadas. Sintaxis definida por
MPEG-2 para la divisin de las largas cadenas elementales de audio o video producidas por un
codificador. Cada PES contiene un header con los datos necesarios para la descodificacin. A partir de
los PES se forman las cadenas de transporte y programa definidas anteriormente.
44
PMT (Programme Map Table): Tabla de Mapa de Programa. Datos especficos de un programa en
particular.
Programa: Secuencia de video, audio o video con su audio asociado disponible en el codificador para
ser comprimida.
Imagen progresiva: Imagen que fue adquirida lnea por lnea.
RLC (Run Length Coding): codificacin por longitud de carrera. Algoritmo de codificacin que hace
uso de largas cadenas de smbolos iguales para una codificacin eficiente.
SDTV (Imagen Definition TV: Televisin de definicin estndar.
SC (System Clock): Reloj del Sistema. Reloj que comanda las marcas e tiempo y referencias de reloj en
una cadena de programa.
SCR (System Clock References): Referencias del Reloj del Sistema. Muestras del reloj del sistema que
el codificador enva al decodificador, a los efectos de mantener la sincrona.
Underflowing: Estado del buffer del codificador en el cual se encuentra prcticamente vaci, debido
posiblemente a la codificacin de imgenes de baja entropa.
VLC (Variable Length Coding): Codificacin de longitud variable. Algoritmo de codificacin que
hace uso de la estadstica de los smbolos para codificar de forma mas eficiente. Los smbolos mas
probables se codifican con palabras mas cortas.
Unidad de presentacin: Imagen sin comprimir, dispuesta a ser codificada.
Unidad de acceso: Imagen comprimida ya sea I, B, o P.
45
Apndice A
Estructura de los paquetes PES y las cadenas de transporte
46
47
Apndice B
Estructura del pack header y el system header de un pack, componentes de una
cadena de programa de MPEG-2
Estructura del pack header
48
49
Apndice C
Submuestreo del canal de croma
El primer paso en la reduccin del bit rate de una secuencia de video es el submuestreo del canal de
croma. Hoy la mayora de las imgenes electrnicas son grabadas en color, en el dominio RGB (Red,
Green, Blue). MPEG transforma las imgenes RGB al espacio luminancia crominancia, generalmente
referido al dominio Y-Cr-Cb, definido como
Y = 0.3R + 0.6 B + 0.1G
B Y
Cr =
+ 0.5
2
R Y
Cb =
+ 0.5
1.6
Es sabido que el sistema visual humano no responde de la misma manera a todas las frecuencias de la
imagen ni a los diferentes canales de color.
La siguiente figura ilustra la sensibilidad al contraste del ojo humano en funcin de la frecuencia
espacial de la imagen para la luminancia y los dos canales de crominancia.
Figura A.1
Observamos que la sensibilidad al contraste decae con la frecuencia espacial de la imagen, y que este
decaimiento es mas pronunciado para los canales de crominancia que para el de luminancia. Debido a
esto, se puede realizar un submuestreo de ambos canales de croma, por ejemplo 2:1, sin perder
perceptualidad en la imagen. El tipo de submuestreo usado depende de la aplicacin, fijando un
compromiso entre calidad y bit rate. La siguiente tabla ilustra los diferentes modos de submuestreo para
una imagen tpica CCIR 601 con 720 pixeles/linea y 480 lneas por cuadro:
50
Factor de
Factor de
Formato Muestras lneas Y Muestras lneas C submuestreo submuestreo
de croma Y por lnea por cuadro C por lnea por cuadro horizontal
vertical
4:4:4
4:2:2
4:2:0
4:1:1
4:1:0
720
720
720
720
720
480
480
480
480
480
720
360
360
180
180
480
480
240
480
120
ninguno
2:1
2:1
4:1
4:1
ninguno
ninguno
2:1
ninguno
4:1
Apndice D
Un compresor MPEG
Figura D.1
Las figuras D.1, D.2, y D.3 muestran las estructura de un compresor MPEG tpico. La seal de video
preprocesada entra en una serie de buffers que almacenan imgenes y eventualmente cambian el orden
de las imgenes. El dato luego entra al sustractor y al estimador de movimiento. En las figuras, los
cuadros en negro no son usados en el proceso. Para crear una imagen I (figura D.1), se selecciona la
51
imagen mas reciente del buffer de entrada y el sustractor es apagado, de modo que la imagen pasa
directamente al codificador espacial. Esta imagen es retenida en una memoria local para su uso futuro.
Figura D.2
Para crear una imagen P (figura D.2), las imgenes B que van llegando ( o mejor dicho, las que van a ser
imgenes B), son almacenadas en el buffer de entrada de forma que se seleccione una imagen futura.
Esta imagen P seleccionada es comparada con al imagen I almacenada en la memoria para crear el
vector de prediccin hacia delante (forward motion vector). La imagen I es corrida por este vector para
formar la imagen predecida. Luego se sustrae la imagen original de esta ultima para formar el error de
prediccin, que luego se codifica espacialmente. adems, se almacena en la memoria local esta imagen
P, de forma de usarla posteriormente.
52
Figura D.3
Una vez que se tienen almacenadas las imgenes I y P, se retira del buffer de entrada una imagen B
previamente almacenada (figura D.3). Esta imagen se compara con la imagen I anterior y la P posterior
para crear los vectores hacia delante y hacia atrs respectivamente y producir las dos imgenes
predecidas hacia adelante y atrs. Luego son restadas de la imagen actual y ambos errores de prediccin
se codifican espacialmente. En una base de macrobloque por macrobloque, son seleccionados los datos
que representan la diferencia mas pequea. Luego se transmiten junto con los respectivos vectores de
movimiento. Una vez que se codifican todas las imgenes intermedias (imgenes B), de nuevo se
retienen imgenes en el buffer de entrada para codificar la imagen P futura y el proceso se repite a lo
largo del GOP.
53
Documentos utilizados:
El presente trabajo esta basado en una recopilacion de diversos papers encontrados en Internet acerca de
MPEG-2. Se intent reunir de todos ellos los datos mas relevantes para armar un resumen de
la especificacin del estndar MPEG-2. Dos de los documentos que colaboraron con gran parte de la
informacin citada en el trabajo son los siguientes:
[1] MPEG Video Coding: A basic tutorial introduction, Research and Development
Department, Policy and Planning Directorate, The British Broadcasting Corporation.
[2]. A Guide to MPEG Fundamentals and Protocol Analysis
(Including DVB and ATSC), Tektronix. www.tektronix.com
54
55