Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Curso: TELECOMUNICACIONES
Turno: NOCHE
Periodo lectivo:
2015-III
1411483
1320447
INTRODUCCION
El ser humano tiene la innata necesidad de estar comunicado siendo esencial el estar informado
para mejorar el entendimiento de su entorno, una de las formas mas importantes para interactuar
con el medio ambiente que le rodea es a travs de sus sentidos Audio-Visuales.
Con el surgimiento de la electrnica y las comunicaciones se ha hecho posible manipular,
procesar, almacenar y transmitir informacin de imgenes y sonido gracias a su representacin a
travs de seales elctricas de variacin continua; sin embargo el nacimiento de las computadoras
y dispositivos digitales trajo consigo una manera distinta de representar la informacin, en ellas las
seales elctricas toman solo dos niveles posibles. As mismo la representacin digital de
informacin tiene ventajas con respecto a la analgica como son: mayor calidad, menor ruido,
permite una mayor manipulacin de las seales, a su vez los datos de tipo digital pueden ser
replicados exactamente y distribuidos fcilmente lo cual les da mucha mayor flexibilidad con
respecto a los datos en formato analgico. Este tipo de ventajas han mejorado una gran cantidad
de productos ya existentes, a su vez han contribuido a crear muchos otros, tanto para uso
domstico como en aplicaciones especializadas.
Uno de los avances que ha hecho posible la llamada revolucin digital ha sucedido en la
tecnologa de semiconductores generando dispositivos de Silicio que son mas pequeos,
poderosos, flexibles y baratos. En ellos las funciones como microprocesamiento, lgica,
procesamiento de seales y memoria estn integrados sobre un mismo componente, lo cual
proporciona varias ventajas, como el menor consumo de potencia, reduccin en los costos de
fabricacin, adems de poder ser usados para mltiples aplicaciones y productos dependiendo del
Software almacenado sobre ellos.
Estas aplicaciones han aumentado las necesidades de procesamiento para los datos de tipo
digital, como voz, audio, video, etc. Para lograr un procesamiento eficaz de estos datos, se
equiere de un dispositivo extremadamente veloz; uno de los dispositivos que apareci para el
mejoramiento del procesamiento digital de seales (PDS) fue el procesador digital de seales
(DSP) cuya funcin principal es el efectuar operaciones de manera rpida mediante el diseo de su
arquitectura.
A su vez no solo es importante el contar con dispositivos que sean capaces de procesar
informacin de manera rpida, si no tambin es importante contar con tcnicas que mejoren el
tratamiento de la informacin que generan las seales digitales. Dentro de estos procesos est la
compresin de datos, que optimiza la representacin que ocurre en los sistemas digitales.
La compresin de datos y en especial la de imgenes resulta cada vez mas importante, debido al
rpido desarrollo de las computadoras, al crecimiento de los sistemas multimedia y al gran avance
de INTERNET, la compresin de imgenes juega un papel fundamental en muchas y diversas
aplicaciones que dependen del procesamiento, almacenamiento y transmisin de imgenes
digitales.
IMAGEN Y VDEO
Imgenes
De acuerdo a algunas definiciones provenientes del diccionario el trmino imagen significa: copia,
figura, dibujo, fotografa, grabado, ilustracin, representacin mental de un objeto, siendo correctas
todas ellas [16]. Para obtener una imagen no es necesario percibir directamente el fenmeno a
representar, por ejemplo el desarrollo tecnolgico de las ltimas dcadas ha permitido la
generacin de imgenes empleando radiacin invisible a la visin humana, imgenes acsticas,
magnticas, de radar [9].
Sin embargo las imgenes ms importantes para el ser humano son las imgenes pticas las
cuales pueden percibirse directamente por el ojo humano, stas se pueden clasificar de muchas
maneras pudindose ser imgenes fijas, en movimiento, continuas o discretas por mencionar solo
algunas de sus caractersticas. Una definicin mas rigurosa de imgenes continuas y discretas es
la siguiente [ 6]:
Una imagen continua es aquella donde la variacin de tonos de gris o color se presenta sin
discontinuidades, sin lneas o fronteras aparte de las que pudiera tener la escena misma, una
imagen discreta por su parte es la que est compuesta por elementos definidos y diferenciados
como puntos o cuadrados.
Imagen digital
Para nuestro trabajo nos interesan solamente las imgenes discretas, como un subconjunto de
ellas se pueden encontrar las imgenes digitales; el hecho de que una imagen sea digital implica
que los elementos que la forman solo podrn tener valores formados por las combinaciones de 0 y
1. Al digitalizar una imagen, se produce una prdida de informacin con respecto a la imagen
continua.
El hecho de que la informacin contenida en una imagen digital, sean combinaciones de unos y
ceros permite que se pueda hacer referencia a cualquier cosa, de ah que la informacin numrica
de una imagen almacenada en un archivo pueda ser tericamente idntica a la de un sonido o un
texto [9].
Las imgenes de mapas de bits (bitmaps o imgenes raster) estn formadas por una rejilla de
celdas a cada una de las cuales se les denomina pxel (elemento de imagen por sus siglas en
ingles), a dichos elementos se les asigna un valor propio (dependiendo del modo de color utilizado)
de tal forma que su agrupacin crea la ilusin de una imagen en tono continuo.
Los pxeles son unidades de informacin mas no de medida, significando que contienen
informacin independientemente de su tamao, por ejemplo un pxel puede ser muy pequeo
(0.1mm) o muy grande (1 m). Una imagen de mapa de bits es creada mediante una rejilla de
pxeles nica cuando se modifica su tamao, se modifican grupos de pxeles, no los objetos o
figuras que contiene, por lo que estos suelen deformarse o perder algunos de los pxeles que los
definen; por lo tanto una imagen de bits est diseada para un tamao determinado perdiendo
calidad si se modifican sus dimensiones.
Resolucin
La resolucin se define como el nmero de pxeles que tiene una imagen por unidad de longitud,
es decir la densidad de pxeles en la imagen, una forma comn de clasificar imgenes segn su
resolucin es aquella que las divide en imgenes de alta resolucin e imgenes de baja resolucin.
A mayor resolucin existen ms pxeles en una imagen y por lo tanto su mapa de bits es mas
grande, contiene mayor informacin y es mayor su capacidad de distinguir los detalles espaciales
finos por lo que tendr mas definicin, permitiendo transiciones de color mas suaves y una mayor
calidad de reproduccin.
Profundidad de bits
Como parte de la informacin que contiene un pxel para representar la imagen original se le
asigna una cantidad determinada de bits, ha esta cantidad se le denomina profundidad de bits. Se
trata de un concepto importante porque a mayor profundidad de bits mas informacin contiene la
imagen y por consiguiente se puede tener un mayor nmero de colores.
Si la profundidad es de un solo bit solo existe la posibilidad de tener dos niveles o tonos.
Si la profundidad es de dos bits es posible tener cuatro niveles o tonos.
Los niveles que podr contener una imagen se encuentran mediante la siguiente relacin 2L,
siendo L el nmero de profundidad de bits; para imgenes en tono real se tiene una profundidad de
24 bits generalmente lo cual genera 16,777,216 colores posibles para su representacin [7].
Estndar MPEG-2
Despus del desarrollo del estndar MPEG-1, se increment la necesidad de comprimir video
digital para TV, la cual puede ser transmitida va satlite, as como por va area, Televisin por
cable (CATV) o realizar simplemente su almacenamiento. Las primeras versiones de MPEG-1 para
video entrelazado, las cuales fueron usadas para la transmisin se llamaron MPEG-1+ , los
transmisores de TV que inicialmente rechazaron usar cualquier tipo de compresin pronto
adoptaron la nueva generacin de MPEG, que es llamada MPEG-2 (y oficialmente es conocida
como ISO 13818) para codificacin de video entrelazado que maneja razones de bit desde 4 hasta
9 Mbits/s.
El estndar subsecuente MPEG-2 fue considerablemente ms amplio y ms eficaz, por ejemplo
MPEG-2 soporta video entrelazado y HDTV, mientras que MPEG-1 no. El estndar MPEG-2 se ha
vuelto muy importante debido a que ha sido elegido como el esquema de compresin para
Transmisin Digital Terrestre (DVB) y para el Disco verstil Digital (DVD), le fue aadida la
capacidad de soportar video entrelazado, as mismo fue ampliado el intervalo de imgenes
(soporta casi cualquier tipo de resolucin) as como sus razones de bits, adems los
decodificadores de MPEG-2 pueden manejar datos codificados en MPEG-1.
MPEG-2 tiene la capacidad de ajustar el nmero de imgenes estimadas bidireccionales por el
decodificador, est tcnica puede ser usada para sistemas de telecomunicaciones por ejemplo en
aplicaciones tales como video sobre demanda, el cliente puede elegir recibir video de diferente
nivel de calidad, en aplicaciones de redes durante la congestin las partes menos importantes
pueden ser descartadas.
Donde
j = (-1) 1 / 2
Si ahora la funcin x(t) est definida para 0 t < su Transformada Coseno de Fourier (FCT),
Xc() est definida por la ecuacin:
As mismo la Transformada Inversa Coseno de Fourier (IFCT), se define por la siguiente ecuacin:
Las ecuaciones (3.3) y (3.4) definen la Transformada Coseno en su forma continua de la misma
manera que las ecuaciones (3.1) y (3.2) definen a la Transformada de Fourier.
Por definicin se considera que f t = 1/2N, donde N es un nmero entero, por lo tanto se tiene
que la ecuacin (3.6) se transforma ahora en la ecuacin (3.7):
observar a partir de las ecuaciones (3.8), (3.9), (3.10) y (3.11), estas ecuaciones algunas veces son
denominadas DCTs tipos (I, II, III y IV).
Con base en las definiciones DCT-II y DCT-III, la Transformada Discreta Coseno Directa (FDCT)
unidimensional se define para un conjunto de ocho muestras en la ecuacin [1]:
Como ya se ha sealado la DCT es una transformacin que descompone una seal en un grupo
de seales senoidales ortogonales llamadas funciones base, estas funciones base de acuerdo a la
definicin de la ecuacin (3.12) son generadas por el trmino Coseno y a su vez son escaladas por
el factor C(u), estas funciones junto con los valores originales de las muestras son los encargados
de generar los coeficientes DCT.
En la Figura 3.2 se muestran las funciones base para un conjunto de ocho muestras, el eje de las
ordenadas contiene la amplitud de las seales base sin escalar y el eje de las abscisas, al nmero
correspondiente de cada muestra [6].
En la Figura 3.2 se pueden ver un conjunto de ocho formas de onda de diferente amplitud, cada
una formada por ocho elementos; la primera corresponde al coeficiente DCT cero y es
simplemente una constante, mientras que las otras siete muestran un comportamiento alternado
conforme la frecuencia se incrementa; el coeficiente que corresponde a la funcin base constante
es llamado coeficiente de DC, mientras que las otras funciones base corresponden a los
denominados coeficientes de AC [1].
Los valores de la primera funcin son obtenidos de la siguiente manera: por corresponder al primer
coeficiente DCT el valor de u es igual cero, debido a esto el termino Coseno proporciona un valor
de 1, no importando la variacin de x, despus de eso se debe escalar por el factor C(u) al cual le
corresponde el valor de 0.7071, que debe ser dividido entre 2, lo que da como resultado 0.3536,
para todas las muestras de esta funcin base. Este procedimiento es el utilizado en la generacin
de todas las funciones base de la Figura 3.2.
Por ejemplo considrese el vector
a = [84 84 90 92 88 66 77 86 ]
Que representa el conjunto de ocho muestras que se desea transformar por la aplicacin de la
DCT-unidimensional, la obtencin del vector transformado aT, se puede lograr por la aplicacin de
la ecuacin (3.12) o bien si se conocen a priori los valores de las funciones base escaladas por el
factor C(u), en cuyo caso solo es necesario realizar una suma de productos.
Para obtener el coeficiente de DC se realizan las siguientes operaciones
Este resultado es el valor del coeficiente DC, de igual manera se sigue el mismo procedimiento en
la obtencin del primer coeficiente de AC, solo que ahora se utilizan los valores de la funcin base
1.
f(x,y) Es el valor de una muestra bidimensional, para los ndices x, y de la matriz de elementos.
F(u,v) Es el valor de un coeficiente DCT bidimensional, para los ndices u, v de la matriz de
coeficientes.
En la codificacin intercuadro, las diferencias o errores de prediccin entre dos cuadros diferentes
se agrupan en bloques de 88 y se aplica una transformacin espacial mediante la DCT a estos
bloques de valores de diferencia.
Compresin
Una de las mayores desventajas del video digital es un su gran ancho de banda, como ejemplo se
cit una seal PAL que produce alrededor de 257.49 Mbits/s est razn es demasiado alta, lo que
imposibilita sus aplicaciones prcticas.
Esta razn tan elevada es la causa de la creacin y aplicacin de las tcnicas de compresin, las
cuales han jugado un papel muy importante en el mundo de las telecomunicaciones y los sistemas
multimedia donde el ancho de banda es el factor principal. Esto se debe al hecho de que l
espectro electromagntico tiene que ser compartido por muchos servicios tales como, telefona
celular, redes inalmbricas, comunicaciones satelitales, etc, lo que obliga al uso eficiente del
mismo; consecuentemente la necesidad de comprimir la informacin en las radiocomunicaciones
digitales se ha vuelto un criterio esencial.
Dentro de estas tcnicas se encuentran las de compresin de video digital, que son las principales
herramientas para reducir la cantidad de informacin necesaria para una secuencia de imgenes
sin perder la calidad juzgada por los seres humanos. Las tcnicas de compresin comnmente
denominadas algoritmos de compresin, tienen como objetivo, transformar un flujo de datos en un
flujo de palabras cdigo, si la transformacin es efectiva las palabras cdigo ocuparn menos bits
que los datos originales.
Con el transcurso de los aos, los algoritmos de compresin se han vuelto ms complejos, como
consecuencia se genera un incremento en el poder de computo, la rapidez de la compresin es
determinada por el tipo de datos, el algoritmo de compresin y la velocidad del procesador. Con la
disponibilidad de microprocesadores de alto desempeo la compresin de datos puede ejecutarse
por medio de software, a veces se necesita mas potencia y para estas aplicaciones se utiliza un
chip de alto desempeo como un DSP o hardware especializado .
Necesidad de la compresin
Ventajas de la compresin
Con el advenimiento del Fax se increment la necesidad para realizar una transmisin rpida de
documentos, sobre redes de conmutacin telefnicas publicas (PSTN), lo cual implic reducir el
nmero promedio de bits por pgina; a esto se le llam compresin digital de documentos (que fue
una de las primeras tcnicas digitales de compresin implementadas); con la aparicin de la
videoconferencia la necesidad de la compresin digital se volvi ms importante.
Para almacenamiento de video digital sobre un CD, la compresin es absolutamente necesaria, es
la nica manera de cumplir con los parmetros requeridos por la industria del entretenimiento (por
ejemplo mantener el espacio de almacenamiento del CD con una calidad visual aceptable),
mientras se conserva el tiempo de duracin de las pelculas, la cual puede exceder las dos horas.
Un canal de TV por cable puede tener entre 4 y 10 programas audio visuales comprimidos,
alternativamente un canal simple de transmisin de 6 MHz puede transportar HDTV comprimida
generando significativamente mejoras en la calidad de audio e imagen sin ancho de banda
adicional.
Las tcnicas de compresin posibilitan el servicio de video sobre demanda hacindolo
econmicamente factible. En estaciones de trabajo diseadas para editar audio y video, el material
es almacenado en discos duros para su rpido acceso, la compresin hace posible almacenar una
gran cantidad de archivos de video digital. La Videotelefona celular inalmbrica debe operar a
razones de pocas docenas de kilobits por segundo, lo cual solo se puede alcanzar a travs de una
gran compresin de datos.
Todas estas aplicaciones han mejorado de manera significativa su ancho de banda para
transmisin, as como su capacidad de almacenamiento a cambio de tener que incrementar el
poder de procesamiento.
Para comprimir datos simblicos solo se aplica la compresin sin prdidas, debido a que una
reproduccin exacta del dato original usualmente es requerida por aplicaciones que se utilizan en,
negocios, programas de computacin, correo electrnico y aplicaciones cientficas, las cuales solo
permiten la representacin exacta de la informacin.
En estas aplicaciones la prdida de algn bit, en un carcter de texto, dato numrico o programa
de computadora es inaceptable, claramente en programas de computadora la corrupcin de un bit
puede ser catastrfica, debido a esto la compresin sin prdidas generalmente es restringida a
factores de compresin alrededor de 2 : 1 o 3 : 1.
En contraste los datos difusos se pueden comprimir hasta factores de 100 a 1 o ms dependiendo
del tipo de datos, de la efectividad de los algoritmos de compresin y de la prdida de informacin
aceptable. Si la compresin de datos es con prdidas la informacin no critica es removida y la
descompresin de datos no puede ser exactamente igual al dato original, sin embargo el resultado
debe ser una aproximacin aceptable donde las percepciones sensoriales sean adecuadas, este
tipo de compresin es la que se necesita para los datos de tipo difuso [10].
Muchos avances en la compresin de datos difusos han sido posibles por la explotacin de los
sistemas humanos auditivo y visual; los seres humanos quienes usualmente son los receptores de
los datos de tipo difuso no necesitan o no pueden usar toda la informacin capturada durante la
digitalizacin. Han sido creados modelos poderosos y complejos para datos de video usando lo
que se describe como tcnicas de codificacin perceptual que explotan las limitaciones de los ojos
humanos.
La compresin de datos de tipo difuso puede involucrar prdidas desechando bits que no se
necesitan para la reproduccin de video, puede perderse alguna informacin que generar
diferencias entre los datos sin compresin y los comprimidos, pero los humanos debido a sus
lmites visuales hacen que estas diferencias sean aceptables para muchas aplicaciones. El anlisis
estadstico de las seales de video indica que existe una fuerte correlacin entre cuadros de
imagen sucesivos y con los elementos mismos de la imagen, tericamente la decorrelacin de
esas seales disminuye el ancho de banda sin afectar significativamente la resolucin de la
imagen, la respuesta del sistema visual humano para cierta informacin espacio-temporal puede
ser explotada para reducir las razones de bits, mientras se mantiene una calidad aceptable de las
imgenes.
Una cmara de video que capture 30 cuadros por segundo de una escena estacionaria produce
cuadros muy similares uno despus del otro, la compresin permite remover la informacin
superflua que est contenida en un cuadro. La seal de video digital contiene una cantidad
significativa de redundancia estadstica, ya que las muestras son muy similares entre s. Tal
redundancia estadstica puede ser removida sin destruir informacin til.
La datos originales son reducidos por el compresor; los datos comprimidos son entonces pasados
a travs de un canal de comunicacin o almacenados en algn dispositivo y regresados a su forma
original por el expansor, la razn entre la cantidad de los datos originales y los datos comprimidos
es llamada factor de compresin, algunas veces un compresor y un expansor en serie son
referidos como el compander, el compresor puede ser igualmente referido como el codec y el
expansor como el decoder, estos dos trminos tambin pueden ser llamados codecs.
Los compresores de video digital son diseados para eliminar la mayor parte de la redundancia
estadstica sin afectar el contenido de informacin de la seal; la redundancia estadstica para una
seal de video digital se puede dividir en tres tipos:
Redundancia espacial
Redundancia Temporal
Redundancia intersmbolos
Cada una de ellas se detalla en las siguientes secciones.
produce que la energa de la mayora de las imgenes en tonos reales se concentre en unos pocos
coeficientes (esta transformacin se analizar a fondo, as como sus efectos en el capitulo 3).
Debido a que en una secuencia de imgenes, los pxeles estn correlacionados en las direcciones
vertical, horizontal y temporal de la secuencia de video una eleccin natural para la transformacin
es una DCT en tres dimensiones, sin embargo cualquier transformacin en el dominio temporal
requiere de almacenamiento de varios cuadros lo cual produce grandes retardos, que restringen la
aplicacin de la codificacin intra, debido a esto la transformacin es confinada a dos dimensiones.
Una vez que los pxeles del bloque actual coinciden con los del bloque anterior dentro de la
ventana, es posible cuantificar su movimiento, las coordenadas que indican este desplazamiento
son conocidas como vectores de movimiento.
Una vez que se encuentran los vectores de movimiento para todas las reas de la imagen, la
imagen de referencia (cuadro anterior) es desplazada de acuerdo a esos vectores, como resultado
se obtiene una imagen estimada que es comparada con la imagen actual, para producir un error
llamado residuo. El residuo es transmitido junto con los vectores de movimiento hacia el receptor,
una vez que en l se genera la imagen de referencia, est se desplazar de acuerdo a los vectores
de movimiento transmitidos, para recrear la imagen estimada y despus el residuo es sumado para
obtener la imagen original.
La unidad fundamental de proceso en los estndares MPEG es el bloque, constituido por un grupo
de 88 elementos de imagen. Los bloques de informacin se organizan despus en macrobloques,
formados por cuatro bloques contiguos de luminancia, constituyendo matrices de 1616 elementos,
adems de un cierto nmero de bloques de crominancia. En el formato 4:4:4 hay cuatro bloques de
cada componente de crominancia por cada cuatro bloques de luminancia, en el formato 4:2:2 dos
bloques de cada componente de crominancia por cada cuatro de luminancia y en el formato 4:2:0,
un bloque de cada componente de crominancia. Este diezmado o submuestreo de la informacin
de crominancia es justificable dada la menor resolucin cromtica de la visin humana. En la figura
6.2 se ilustra la estructura de un macrobloque en el formato 4:2:0.
Una imagen MPEG est formada por segmentos (slices10), que son secuencias de macrobloques
contiguos en el mismo orden de barrido de la imagen y que comienzan en una posicin particular
sobre sta, especificada por un encabezado del segmento (slice header). La estructura
segmentada de la imagen aumenta la flexibilidad en el procesado y proporciona un mecanismo
conveniente para el manejo de errores. La figura 6.3 ilustra un cuadro de imagen segmentado en
que, como puede apreciarse esquemticamente, los segmentos pueden tener diferentes
longitudes.
Cuando ocurre un error en el caudal de datos, el decodificador puede saltar al inicio del segmento
siguiente. Como consecuencia de ello, el nmero de segmentos afecta la eficiencia en la
transferencia de los datos, ya que si bien la segmentacin favorece la ocultacin de errores, por
otra parte emplea bits necesarios para la identificacin de los segmentos que de otra forma podran
utilizarse para aumentar la calidad de la imagen.
La unidad primaria de codificacin de una secuencia de vdeo es la imagen o cuadro, formada por
un cierto nmero de segmentos que constituyen el rea activa. Una secuencia de vdeo, se
compone de uno o ms grupos de imgenes (GOP11) que, a su vez, estn constituidos por una o
ms imgenes. Esta jerarqua de la informacin de vdeo en MPEG se ilustra en la figura 6.4.
IMGENES, CUADROS I, P, B
Imgenes I: El primer tipo de imgenes es llamado I, son codificadas sin la referencia de una
imagen previa, estas permiten un punto de acceso para decodificar la secuencia, ests imgenes
son llamadas cuadros intra.
Imgenes P: Corresponden a las cuadros generados por la estimacin de movimiento, la
diferencia entre la imagen actual y la anterior, as como por la informacin de los vectores de
movimiento.
Imgenes B: Corresponden a una imagen estimada bidireccional, estn formadas por informacin
complementaria de cuadros anteriores y posteriores a un cuadro de referencia.
En el proceso de formacin de GOPs las imgenes B se consideran de informacin
complementaria porque contienen lo que falta para obtener cuadros con los datos tomados de las
imgenes de tipo I o P.
Los GOPs permiten acceder aleatoriamente en la secuencia, la primera imagen codificada en el
grupo es una imagen de tipo I, seguida por un arreglo de imgenes P y B tal como se muestra en
la Figura 2.3.
Esta agrupacin tiene sus limitaciones por ejemplo en el caso que suceda un error en la
transmisin, cada imagen subsecuente P o B, este se propagar a lo largo de todo el GOP.
Las capas de compresin contienen los datos que deben alimentarse a los decodificadores de
audio y vdeo en tanto que la capa del sistema proporciona los medios de control para el
demultiplexado de las capas de compresin y de sincronismo necesario en la reproduccin.
El caudal binario MPEG consiste de una secuencia de envolturas12 que, a su vez, se subdividen
en paquetes, en la forma que se muestra en la figura 6.7.
Cada envoltura consiste de una secuencia de 32 bits que contiene el cdigo de inicio y el
encabezado, seguido de uno o ms paquetes de datos que a su vez, contienen un cdigo de inicio
y un encabezado tambin con 32 bits, seguidos de datos comprimidos de audio o vdeo. El
decodificador del sistema identifica el tipo de informacin sin necesidad de decodificar los datos y
canaliza stos hacia los decodificadores respectivos, junto con la informacin de sincronismo,
extrada del decodificador del sistema.
Conclusiones
Los tiempos de decompresin son mayores a los tiempos de compresin, esto se debe a
que en la etapa de decompresin se deben realizar diversas comparaciones hasta
encontrar el cdigo Huffman correcto. Adems los tiempos de ejecucin para la IDCT son
ms grandes que para los de la DCT, este es otro factor para aumentar los tiempos de
decompresin.
Los tiempos de ejecucin nos permiten establecer que si bien es cierto que para una
secuencia que est formada por 20 cuadros y con sus tres componentes los tiempos de
compresin fluctan entre 7.8 y 9 seg, los de decompresin estn entre 9 y 14 seg. Casi es
posible realizar una implementacin del sistema en tiempo real. Para lograr reducir estos
tiempos de ejecucin se puede optar por optimizar al mximo el cdigo fuente del
programa (de ser preciso realizar la implementacin de la DCT e IDCT en lenguaje
ensamblador para eficientar el desempeo) y utilizar un DSP que trabaje con un nmero
mayor de MIPS, tal como es el caso del C713 u otro mas potente, logrando mejorar los
tiempos de ejecucin para la compresin y la decompresin alrededor de un factor del 2.4.
A = imread('lincol.jpg');
figure(1);
image(A);
T = A;
T(:,:,1) = 0;
T(:,:,2) = 0;
figure(2);
imshow(T);
figure(3);
T1=A;
T1(:,:,2) = 0;
T1(:,:,3) = 0;
imshow(T1);
figure(4);
T2=A;
T2(:,:,1) = 0;
T2(:,:,3) = 0;
imshow(T2);
figure(2)
subplot(1,4,1),image(A),title('imagen original');
subplot(1,4,2),image(T),title('imagen canal azul');
subplot(1,4,3),image(T1),title('imagen canal rojo');
subplot(1,4,4),image(T2),title('imagen canal verde');
I=imread('lincol.jpg');
figure(1)
image(I)
G=rgb2gray(I);
figure(2)
colormap(gray(256))
image(G)
B=im2bw(G);
figure(3)
colormap(gray(2))
image(B)
figure(4)
subplot(1,3,1),image(I),title('imagen original');
colormap(gray(256))
subplot(1,3,2),image(G),title('imagen a tono de grises');
subplot(1,3,3),image(B*255),title('imagen en binario');
3. Bordeo de imagen
clc
clear all
close all
Gx=[-1 0 1;-2 0 2;-1 0 1];
Gy=[-1 -2 -1;0 0 0;1 2 1];
I=imread('lincol.jpg');
colormap(gray(256))
G=rgb2gray(I);
image(G)
[fil,col]=size(G);
m=fil;
n=col;
IR1=zeros(m,n);
IR=[G(1,1) G(1,:) G(1,n);G(:,1) G(:,:) G(:,n);G(m,1) G(m,:) G(m,n)];
whos IR G
UMBRAL=90;
IR=double(IR);
for i=2:m+1
for j=2:n+1
A=IR(i-1:i+1,j-1:j+1);
H1=sum(sum(A.*Gx));
H2=sum(sum(A.*Gy));
H12=abs(H1)+abs(H2);
if H12>UMBRAL
IR1(i-1,j-1)=1;
else
IR1(i-1,j-1)=0;
end
end
end
colormap(gray(256))
subplot(121), image(G)
subplot(122), image(255*IR1)
Referencia:
file:///C:/Users/aayala/Desktop/Compresion%20de%20video.pdf