Sei sulla pagina 1di 3

Codificación Lempel – Ziv

Álvaro Chisaguano Pruna


Universidad de las Fuerzas Armadas- ESPE
Comunicación y codificación digital
Sangolquí - Ecuador
Email: cchisaguano@espe.edu.ec

Abstract –It is a very fast lossless compression Separación de bits


algorithm for both compression and decompression,
based on the multiplicity of occurrences of character 0 (0,0,0)
sequences in the chain that must be encoded. Its 1 (0,0,1)
principle is to replace patterns with an index code and 11 (1,1,1)
progressively build a dictionary. 01110 (4,4,0)
0111010 (9,6,0)
I. INTRODUCCIÓN 1101110011100 (14,12,0)

Lempel – Ziv es un método ingenioso de Un ejemplo bit a bit. De esta forma el diccionario
codificación, la mayoría de compresores que se inicial contiene simplemente 0 y 1. Considerar
utilizan en la actualidad como Zip y Rar utilizan este 01110100001# como la cadena a codificar. La división
método. Este método consiste en ir comprimiendo en frases y el diccionario correspondiente serían:
una secuencia de bits se busca si los próximos
símbolos coinciden con una secuencia anterior, y se
sustituye aquella por una tripleta (𝑚, 𝑛, 𝑠) donde:

 𝑚: Lugar hacia atrás donde se inicia la


secuencia.
 𝑛: Longitud de la secuencia previa
encontrada.
 𝑠: Próximo caracter de la cadena
comprimida.

II. COMPRESIÓN DE LOS DATOS Se han colocado las barras divisorias de frases debajo
para resaltar que cada carácter sobre una frase está tanto
Cada vez que se lee un nuevo carácter se revisa el en la frase de la izquierda como en la de la derecha.
diccionario para ver si forma parte de alguna entrada Para codificar, basta poner la referencia de todas las
previa, en caso de no estar se genera una nueva palabra frases sin su último carácter. Esto es lo mismo que si en
y se van almacenando así sucesivamente. Todos los la división en frases (sin #) los caracteres fronterizos
caracteres están inicialmente predefinidos en el pasasen a la derecha y buscásemos los resultados en el
diccionario así que siempre habrá al menos una diccionario
coincidencia, sin embargo, lo que se busca es la cadena
más larga posible. Si el carácter leído no forma parte de
más de una cadena más larga, entonces se emite la más
larga que se hubiera encontrado y se agrega al DESCOMPRESIÓN
diccionario una entrada formada por cualquiera que
hubiera sido el código previo y este nuevo código. La siguiente secuencia de valores corresponde a un
fichero codificado por medio del algoritmo Lempel-Ziv
III. EJEMPLO (0,0,0) (0,0,1) (2,2,1) (4,4,0) (10,9,1)
Obtener la cadena de bits que codifica.
Se tiene la siguiente cadena de bits: 0101110110 0101110111
01110111001110101101110011100
manera innecesaria en el diccionario.
IV. CONCLUSIONES
 La relación de compresión es de V. REFERENCIAS
aproximadamente un tercio del archivo.

 Una de las desventajas es que hay que agregar  Compression adaptive


al diccionario los carácteres que se va a usar, http://elisa.dyndns-
y haciendo un diagnóstico más detallado se web.com/~elisa/teaching/comp/info/adaptive
puede dar cuenta que muchos de los .pdfSklar, B. (2001). Digital
carácteres que son agregados ni siquiera se communications: fundamentals and
usan, ocupando demasiada memoria de una applications..

Potrebbero piacerti anche