Sei sulla pagina 1di 10

FCA - Editora de Informtica 1

1
1
-
-
I
I
n
n
t
t
r
r
o
o
d
d
u
u

o
o


C
C
o
o
m
m
p
p
r
r
e
e
s
s
s
s

o
o
M
M
u
u
l
l
t
t
i
i
m
m

d
d
i
i
a
a

A codificao e representao de informao multimdia uma rea tecnolgica em expan-
so. As aplicaes multimdia combinam contedos que pertencem a tipos de informao
digital de natureza heterognea (tambm designados por tipos de mdia), incluindo o texto,
os grficos vectoriais, as imagens bitmap, o vdeo digital, o udio digital e a animao
(Ribeiro, 2004). Nos ltimos anos, os formatos de codificao e representao destes tipos
de informao multimdia tm evoludo em termos das tcnicas a que recorrem para permi-
tir a respectiva utilizao em aplicaes multimdia. Muitos destes formatos deram igual-
mente origem a normas internacionais.
Quando se considera a utilizao destes tipos de informao multimdia necessrio pon-
derar os recursos de armazenamento e/ou de largura de banda que sero consumidos, uma
vez que ambos se tratam de recursos finitos e escassos. Assim, a utilizao de tipos de
mdia como o udio e o vdeo requer, por um lado, que a informao seja comprimida e,
por outro, que se preserve tanto quanto possvel a qualidade da informao original, isto ,
fazendo com que a informao que se perde durante o processo de compresso seja aquela
que a mais irrelevante do ponto de vista do utilizador humano.
Neste contexto, este livro tem como objectivo principal fornecer uma viso aprofundada,
fundamentada, objectiva e actualizada das tecnologias de compresso multimdia, permi-
tindo compreender as tcnicas que esto por trs dos formatos de representao dos mdia e
que possibilitam a utilizao de contedos multimdia nos vrios tipos de aplicaes mul-
timdia actuais, em particular dos tipos de informao multimdia que normalmente se
classificam como tipos de mdia no-estruturados: udio, imagem e vdeo. Este livro, sur-
gindo na sequncia da obra Multimdia e Tecnologias Interactivas (Ribeiro, 2004), preten-
de aprofundar a compreenso dos mtodos de compresso, com perdas e sem perdas, que
foram introduzidos nesse livro. Assim, analisam-se com detalhe os princpios de funciona-
mento e os algoritmos de compresso utilizados, entre outros, nos formatos JPEG (Joint
Photographic Experts Group) e JPEG2000 para a codificao de imagens bitmap, e nos
formatos da famlia MPEG (Moving Picture Experts Group), nomeadamente nas normas
MPEG-1, MPEG-2, MPEG-4 e MPEG-7, abrangendo necessariamente as partes das nor-
mas que contemplam a codificao quer de udio digital, incluindo o MP3, o AAC (Advan-
ced Audio Coding) e outras tcnicas tais como o ADPCM (Adaptive Differential Pulse-
Code Modulation) e o AC-3, quer de vdeo digital.
Neste captulo, faz-se uma introduo s tcnicas de compresso mais relevantes no contex-
to da codificao de informao multimdia. O objectivo identificar e analisar os meca-
nismos principais que so utilizados nos algoritmos de compresso em que se baseiam os
formatos e normas de codificao de udio, imagem e vdeo.
T TE EC CN NO OL LO OG GI IA AS S D DE E C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
2 FCA - Editora de Informtica
1.1 Motivao
A compresso, em particular de udio, imagem e vdeo digitais, necessria por dois
motivos principais:
Para limitar o espao de armazenamento consumido pelos contedos multimdia;
Para possibilitar a transferncia de contedos multimdia sobre redes de
comunicaes utilizando as taxas de transferncia, tambm designadas por
dbitos binrios ou bit rates, existentes actualmente.
Para compreender melhor a necessidade de mtodos de compresso de informao mul-
timdia examinemos os seguintes exemplos.
Consideremos em primeiro lugar a quantidade de dados contidos numa imagem bitmap
correspondente a uma frame de vdeo PAL (Phase Alternating Line) integral (Ribeiro,
2004). Por exemplo, para armazenar uma imagem com uma resoluo de 576 768 pxeis
(VGA) e uma profundidade de cor de 24 bits por pxel (codificao RGB com 8 bits por
componente) necessitamos de aproximadamente 1296 Kbytes, isto 1,265 Mbytes, j
que:
pxeis 442368 576 768 pxeis de Nmero = =
Kbytes 1296
1024
8
10616832
bits 10616832 bpp 24 pxeis 442368 = = =
bytes

Se considerarmos que cada uma destas imagens efectivamente uma frame de uma
sequncia de vdeo digital PAL, possvel determinar a largura de banda necessria
para transmitir um fluxo contnuo destas tramas de vdeo a 25 FPS numa rede como sen-
do de 253,125 Mbit/s, j que:
s / Mbit 125 , 253
1024
bits 8 32400
s / Kbyte 32400 FPS 25 Kbytes 1296 =

= =
Se considerarmos os requisitos de armazenamento impostos por esta sequncia de vdeo
digital PAL integral, por exemplo num DVD-ROM (capacidade de 4,377 Gbytes), pos-
svel determinar que um disco ptico permitiria apenas armazenar 141,65 segundos desta
sequncia de vdeo (aproximadamente 2 minutos e meio), j que:
min 36 , 2 s 65 , 141
s / Kbyte 32400
Kbytes 1024 1024 377 , 4
= =


I IN NT TR RO OD DU U O O C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
FCA - Editora de Informtica 3
Assim, recorrendo a um disco rgido magntico, e supondo que esta sequncia de vdeo
digital corresponde a um filme com 90 minutos, possvel determinar que necessitara-
mos de 166 Gbytes de espao de armazenamento em disco para armazenar este filme,
dado que:
Gbytes 85 , 166 Kbytes 174960000 s 60 min 90 Kbytes 32400 = =
Estes clculos podem facilmente ser repetidos para determinar o espao de armazenamen-
to e a largura de banda consumidos por outros tipos de mdia. Por exemplo, se conside-
rarmos a digitalizao de uma fotografia de 35 mm a cores por intermdio de um scanner
com uma resoluo mdia de 2000 2000 , isto corresponde a reter apenas 4 milhes dos
20 milhes de pxeis que constituem a fotografia analgica original. Esta digitalizao
resulta na gerao de um ficheiro com aproximadamente 10 Mbytes. Como evidente,
caso se aumente a resoluo da digitalizao, qualquer fotografia de 35 mm poder facil-
mente ocupar 50 Mbytes de espao de armazenamento. Isto verifica-se, por exemplo, em
aplicaes mdicas usadas num hospital onde se verifica a necessidade de armazenar e
disponibilizar para consulta dezenas de milhes de digitalizaes de raios X (Fluckiger,
1995).
Do que ficou exposto, torna-se evidente a necessidade de reduzir a quantidade de dados
envolvida na reproduo de udio digital, imagens bitmap ou vdeo digital. Neste contex-
to, a compresso de informao permite:
Reduzir o espao de armazenamento exigido pelos contedos multimdia;
Aumentar a velocidade do acesso aos contedos multimdia.
, pois, possvel concluir que a compresso apresenta-se como a nica forma existente
para se conseguir armazenar, disponibilizar e transmitir as grandes quantidades de dados
exigidas pelos contedos multimdia, por exemplo, para permitir manipular e visualizar
vdeo digital num PC.
A compresso de dados designa um processo pelo qual se converte um fluxo de dados de
entrada (fluxo de dados original) num outro fluxo de dados que contm dados comprimi-
dos, ocupando menos espao de armazenamento. Neste contexto, um fluxo de dados tanto
pode ser um ficheiro como um buffer de memria. Quando se descomprime o fluxo de
dados comprimido, obtm-se um fluxo de dados de sada, que esto descomprimidos e
que podem, ou no, ser idnticos aos dados contidos no fluxo de dados original, conforme
se trate de uma tcnica de compresso sem perdas ou com perdas, como se ver mais
adiante. A Figura 1.1 ilustra o diagrama de blocos de um esquema de compresso genri-
co. Os esquemas de compresso podem igualmente ser designados por tcnicas de com-
presso. Como se pode verificar, a compresso realizada por um codificador e a
descompresso por um descodificador; sada do codificador encontramos os cdigos
(tambm designados por codewords) correspondentes informao comprimida.
T TE EC CN NO OL LO OG GI IA AS S D DE E C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
4 FCA - Editora de Informtica
Figura 1.1 - Diagrama de um esquema genrico de compresso
Geralmente, o desempenho de um esquema de compresso pode ser medido, ou referido,
em termos do rcio de compresso que proporciona. O rcio de compresso uma quan-
tidade que se pode obter de vrias formas (Salomon, 2004). Contudo, a forma mais
comum do rcio de compresso obtm-se dividindo o espao de armazenamento ocupado
pelo fluxo de dados originais pelo espao consumido pelo fluxo de dados comprimidos ou
de cdigos (Bhaskaran & Konstantinides, 1997):
sada B
entrada B
compresso de Rcio =
Sendo B entrada o nmero de bits correspondente ao fluxo de dados originais (antes da
compresso), e B sada o nmero de bits correspondente ao fluxo de dados comprimi-
dos (cdigos), possvel verificar que quanto maior for o valor do rcio de compresso,
menor ser o comprimento do fluxo de dados comprimidos, isto , menor ser o espao
de armazenamento consumido pelo fluxo de dados comprimidos, ou menor ser a largura
de banda necessria para a sua transmisso numa rede de computadores.
1.2 Modos e categorias de compresso
Quanto ao modo como comprimem a informao, as tcnicas de compresso podem
classificar-se como:
Tcnicas de compresso sem perdas (lossless);
Tcnicas de compresso com perdas (lossy).
Fluxo de
dados
de
Entrada
Codificador
(compresso)
Descodificador
(descompresso)
Fluxo de
dados
de
Sada
Armazenamento
ou
transmisso
Dispositivos
pticos ou
magnticos
Redes
Dados comprimidos
(cdigos ou codewords)
Dados
descomprimidos
I IN NT TR RO OD DU U O O C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
FCA - Editora de Informtica 5
Na compresso sem perdas, tambm designada por lossless compression, bit-preserving
ou reversible compression, a informao recuperada sem qualquer alterao aps o
processo de descompresso. Isto , o fluxo de bits descomprimidos idntico ao fluxo de
bits original (antes da compresso).
Estas tcnicas so utilizadas na compresso de dados textuais e numricos ou na com-
presso de programas/aplicaes que, como evidente, no devem sofrer qualquer altera-
o devido ao processo de compresso. As tcnicas de compresso sem perdas tambm
so necessrias em certas aplicaes multimdia nas quais a exactido da informao
um factor essencial como, por exemplo, na utilizao de imagens para fins mdicos.
Na compresso com perdas, tambm designada por lossy compression ou irreversible
compression, a informao descomprimida diferente da informao original que entre-
tanto foi comprimida. Este modo de compresso adequa-se maior parte dos tipos de
mdia no-estruturados tais como o udio digital, as imagens bitmap e o vdeo digital.
No entanto, deve-se notar que, na compresso com perdas, o facto de a informao des-
comprimida ser diferente da informao original no implica necessariamente que a per-
cepo do utilizador seja diferente. Este aspecto essencial das tcnicas de compresso
com perdas ser aprofundado mais adiante e est relacionado com as caractersticas parti-
culares dos sentidos do ser humano.
Quanto forma como a informao encarada pelo esquema de compresso, as tcni-
cas de compresso de dados podem ser agrupadas em duas grandes categorias:
Tcnicas de codificao de entropia (entropy encoding);
Tcnicas de codificao de fonte (source encoding).
A Tabela 1.1 ilustra as caractersticas principais destas categorias.
Categoria Caracterstica Principal Modo de Compresso
Entropy Encoding
Independncia das caractersti-
cas do fluxo de dados a compri-
mir
Compresso sem perdas
Source Encoding
Toma em considerao a semn-
tica do fluxo de dados a compri-
mir
Compresso com e sem perdas
Tabela 1.1 - Categorias das tcnicas de compresso
importante notar que no se deve confundir a utilizao do conceito codificao no
contexto da compresso com a codificao efectuada como uma das fases do processo de
digitalizao (Ribeiro, 2004). De igual modo, importante notar que as tcnicas de
entropy e source encoding no so mutuamente exclusivas. Isto significa que os formatos
T TE EC CN NO OL LO OG GI IA AS S D DE E C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
6 FCA - Editora de Informtica
e normas de codificao de udio, imagem e vdeo utilizam geralmente combinaes de
tcnicas das duas categorias de modo a obterem o grau ou rcio de compresso mais ele-
vado possvel, sendo este o objectivo principal de qualquer tcnica de compresso.
As seces que se seguem analisam com mais pormenor as caractersticas associadas s
tcnicas de compresso pertencentes a cada uma destas categorias.
1.3 Tcnicas de codificao de entropia
Nesta seco apresenta-se uma viso global e introdutria que ilustra as caractersticas
principais e o modo de funcionamento das tcnicas de codificao de entropia mais
comuns.
O conceito de codificao de entropia um termo genrico que se refere s tcnicas de
compresso e codificao que no tm em conta a natureza da informao a ser compri-
mida. Por outras palavras, as tcnicas de compresso baseadas na entropia tratam todos os
dados como sequncias de bits, sem tentarem optimizar a compresso atravs do conhe-
cimento do tipo de informao que se est a comprimir. Por isso, dizemos que as tcnicas
de compresso baseadas na entropia ignoram a semntica da informao a comprimir.
Para alm disso, todas as tcnicas de codificao de entropia proporcionam sempre um
modo de compresso sem perdas.
Por exemplo, considere-se a substituio de uma srie de 10 bytes sucessivos, todos com
o valor zero (0), por um carcter especial seguido pelo nmero 10, obtendo-se por exem-
plo <!10>. Este um exemplo tpico de uma tcnica de codificao de entropia, j que ao
realizar este tipo de operao no se est a assumir nenhum pressuposto em relao ao
significado deste conjunto de zeros sucessivos.
As tcnicas de codificao de entropia podem ainda ser divididas em trs tipos principais:
Tcnicas de supresso de sequncias repetitivas;
Tcnicas de codificao estatstica;
Tcnicas baseadas em dicionrios.
1.3.1 Tcnicas de supresso de sequncias repetitivas
A tcnica de supresso de sequncias repetitivas o primeiro tipo de mtodos que se ir
analisar, j que uma das tcnicas de compresso mais simples e mais antigas da Cincia
da Computao. Esta tcnica baseia-se na produo de cdigos de comprimento fixo e
funciona em dois passos:
1 1. . Deteco de sequncias repetitivas de bits ou bytes.
I IN NT TR RO OD DU U O O C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
FCA - Editora de Informtica 7
2 2. . Consequente substituio destas sequncias pelo seu nmero de ocor-
rncias.
Este mtodo pode assumir uma de duas formas possveis, que sero analisadas a seguir:
Tcnicas de supresso de zeros ou espaos;
Tcnica Run-Length Encoding (RLE).
1.3.1.1 Supresso de zeros ou espaos
Nesta forma, o mtodo de supresso de sequncias repetitivas assume que apenas um
carcter (byte) predeterminado aparece frequentemente e repetido. Este carcter pode
ser o zero em dados numricos ou o espao em dados textuais. Consequentemente, uma
srie de n espaos, ou zeros, sucessivos ser substituda por um carcter especial (desig-
nado por flag ou meta character) imediatamente seguido pelo nmero de ocorrncias (n)
desse carcter.
Por exemplo, consideremos que temos a seguinte cadeia de caracteres numricos em que
cada carcter (neste caso, cada algarismo) codificado com um byte:
7420000000000005. Utilizando a tcnica de supresso de zeros, e definindo o carcter !
como a flag, possvel obter a seguinte sequncia comprimida: 742!125, j que existe
uma sequncia de 12 zeros consecutivos no fluxo de dados original.
No contexto deste exemplo pertinente realizar duas observaes. Em primeiro lugar
note-se que o nmero 12 que segue a flag dever ser codificado com um byte, de modo a
evitar qualquer confuso com o carcter 5 que se segue. Em segundo lugar, notando que
se partiu de uma sequncia com 16 bytes e se obteve uma sequncia comprimida com o
comprimento de 6 bytes, possvel determinar o rcio de compresso obtido do seguinte
modo:
66 , 2
6
16
compresso de Rcio = =
bytes
bytes

Isto significa que se conseguiu comprimir 2,66 unidades de informao do fluxo de dados
original numa nica unidade de informao no fluxo de dados comprimidos.
1.3.1.2 Run - Length Encoding
Na forma RLE, o mtodo de supresso de sequncia repetitivas permite que qualquer
sequncia de caracteres repetidos possa ser substituda por uma forma abreviada. Isto
significa que a tcnica RLE permite comprimir qualquer carcter que surja de forma repe-
titiva, para alm dos zeros e espaos.
T TE EC CN NO OL LO OG GI IA AS S D DE E C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
8 FCA - Editora de Informtica
O algoritmo da tcnica RLE consiste em substituir uma srie de n caracteres c consecu-
tivos pelo prprio carcter c precedido por um carcter especial (a flag ou escape cha-
racter) que, por sua vez, seguido pelo nmero n de ocorrncias do carcter repetido
(Fluckiger, 1995). Este conjunto de 3 caracteres que substitui a sequncia repetida desig-
na-se por token, e representa-se do seguinte modo: !<n><c>.
Analisando o modo de funcionamento descrito, possvel concluir que este mtodo no
deve ser utilizado nos casos em que um carcter surge repetido apenas duas vezes visto
que originaria uma sequncia mais comprida do que a sequncia original. De igual modo,
a sua utilizao para substituir sequncias de trs caracteres sucessivos no traria qual-
quer vantagem. Assim, pode concluir-se que a substituio deve apenas ser realizada caso
o nmero de ocorrncias sucessivas de um carcter seja igual ou superior a quatro.
A forma do mtodo RLE que acabou de se descrever a forma mais simples e utiliza-se
apenas para contedos textuais. Existem, contudo, outras variaes deste mtodo que
podem ser consultadas, por exemplo, na bibliografia aconselhada (Nelson & Gailly, 1995;
Salomon, 2004; Li & Drew, 2004).
Para exemplificar o funcionamento da tcnica RLE, consideremos a seguinte cadeia de
caracteres: ABCCCCCCABCABC. Ora, o mtodo RLE substitui sequncias de dados
redundantes por tokens, pelo que utilizando a codificao RLE possvel comprimir a
sequncia repetitiva de C utilizando uma determinada flag tal como o carcter !.
Assim, a forma comprimida da cadeia de caracteres original poderia assumir a seguinte
expresso: AB!6CABCABC.
Neste caso, o rcio de compresso obtido pode ser determinado do seguinte modo:
27 , 1
11
14
compresso de Rcio = =
bytes
bytes

Este exemplo permite ilustrar o funcionamento do algoritmo de compresso RLE. Inicia-
-se a leitura do fluxo de caracteres e, aps a leitura do primeiro carcter, actualiza-se o
valor do contador para 1, armazenando-se o carcter num buffer de memria. Os caracte-
res que se seguem so ento comparados com o carcter que est guardado no buffer e,
caso sejam idnticos, incrementa-se novamente o contador. Logo que se efectue a leitura
de um carcter diferente, a operao a efectuar depende do valor armazenado no conta-
dor. Se for inferior a 3, os caracteres so escritos no fluxo de dados comprimidos, e o
novo carcter agora armazenado no buffer para comparao. Caso contrrio, escreve-se
a flag no fluxo de dados comprimidos, seguida do valor do contador e do carcter presen-
te no buffer.
No que diz respeito descompresso, sempre que se encontra a flag no fluxo de dados
comprimidos, efectua-se uma operao de leitura do valor n e do carcter C que se
I IN NT TR RO OD DU U O O C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
FCA - Editora de Informtica 9
seguem, escrevendo-se o carcter C no fluxo de dados descomprimidos tantas vezes
quantas o valor de n.
Para alm de dados textuais, a tcnica RLE pode igualmente ser aplicada a dados de ima-
gem (Salomon, 2004). Como sabido, uma imagem bitmap constituda por um conjun-
to de pxeis, ocupando cada pxel 1 bit caso se trate de uma imagem a preto e branco, ou
mais do que 1 bit se a imagem for colorida (por exemplo, uma imagem com 4 bpp (bits
por pxel) pode conter at 16 cores diferentes). Neste caso, o fluxo de dados de entrada
constitudo pelos bits armazenados em cada um dos pxeis da imagem.
Normalmente, o primeiro pxel da imagem o que se situa no canto superior esquerdo, ao
passo que o ltimo se situa no canto inferior direito. Partindo do primeiro pxel, o codifi-
cador RLE l os restantes pxeis ordenadamente, linha a linha, at se atingir o ltimo
pxel, em busca de grupos repetitivos de pxeis (runs). , contudo, possvel efectuar o
varrimento dos pxeis da imagem seguindo um esquema diferente, por exemplo, coluna a
coluna, ou de acordo com uma ordenao ziguezague (descrita no Captulo 5 no mbito
da anlise da norma JPEG).
A compresso RLE aplicada ao caso das imagens baseia-se no seguinte pressuposto: se
um pxel da imagem tem um determinado valor, muito provvel que os pxeis vizinhos
assumam igualmente o mesmo valor, isto , possuam a mesma cor do pxel que conside-
ramos inicialmente.
Como se pode facilmente deduzir, este mtodo funciona bem (proporciona um bom rcio
de compresso) apenas nos casos em que as imagens contm pouco detalhe, e os valores
dos pxeis no variam muito (por exemplo, no caso em que as imagens resultam do ren-
dering de objectos grficos desenvolvidos no computador). Por isso, quanto maior for a
complexidade da imagem (por exemplo, no caso de imagens que resultam de fotografias
digitais ou digitalizadas) mais baixo ser o rcio de compresso, e portanto a eficincia do
mtodo RLE.
Para ilustrar o processo de compresso RLE de uma imagem colorida com 8 bpp, consi-
dere-se, por exemplo, a primeira linha da imagem contendo os seguintes valores:
75,75,75,75,75,75,10,45,58,30,30,30,30,8,8,8,8,8,3,
Aplicando o mtodo RLE, e assinalando a sublinhado os valores do nmero de ocorrn-
cias das runs, o resultado da compresso da primeira linha desta imagem seria:
6,75,10,45,58,4,30,5,8,3,
Como se pode verificar, o nico problema que existe : para cada byte, distinguir se o seu
valor corresponde a um valor de cor do pxel (como 75) ou a um valor do nmero de
ocorrncias (como 6).
T TE EC CN NO OL LO OG GI IA AS S D DE E C CO OM MP PR RE ES SS S O O M MU UL LT TI IM M D DI IA A
10 FCA - Editora de Informtica
Salomon (2005) sugere algumas solues para este problema, incluindo as seguintes:
Caso a imagem contenha apenas 128 valores diferentes de tonalidades de
cinzento (grayscales), possvel dedicar 1 bit de cada byte para assinalar se o
byte contm um valor de cor ou um nmero de ocorrncias;
Se a imagem contiver 256 tonalidades diferentes de cinzento (0 a 255), poder ser
reduzida para 255 tonalidades, reservando um dos 256 valores (por exemplo, o
ltimo valor de 255) para ser utilizado como flag. Neste caso, a sequncia
comprimida do exemplo acima ficaria:
255,6,75,10,45,58,255,4,30,255,5,8,3,
1.3.2 Tcnicas de codificao estatstica
A codificao estatstica, tambm designada por statistical encoding, o segundo tipo de
tcnicas de codificao de entropia que se ir analisar. A codificao estatstica igual-
mente um tipo de tcnicas bastante utilizado em formatos de codificao multimdia,
apesar de ser menos rudimentar do que o mtodo de supresso de sequncias repetitivas,
proporcionando tcnicas em que a compresso simtrica, isto , o codificador e o des-
codificador possuem uma complexidade idntica.
O mtodo de codificao estatstica baseia-se no seguinte processo genrico:
1 1. . Identificao dos padres de bits ou bytes que ocorrem mais frequente-
mente num dado fluxo de dados.
2 2. . Codificao de cada padro com menos bits do que o nmero de bits
dispendido para o representar no fluxo de dados original.
De acordo com Salomon (2004), na codificao estatstica os padres que ocorrem com
menor frequncia sero codificados mediante a utilizao de mais bits, ao passo que os
padres mais frequentes sero substitudos por cdigos menos extensos. A noo fun-
damental assenta, pois, na seguinte observao: na codificao estatstica, os padres de
bits ou bytes so substitudos de acordo com a frequncia com que ocorrem, sendo este o
motivo porque se designa por estatstica. Os padres mais frequentes utilizam cdigos
mais curtos, ao passo que os padres menos frequentes utilizam cdigos mais extensos.
No entanto, j que o mtodo da codificao estatstica implica a substituio de padres
por outros padres menos ou mais extensos, segue-se que deve existir uma tabela, nor-
malmente designada por codebook ou tabela de cdigos, que estabelea a correspondn-
cia entre os padres originais e o seu novo cdigo, quer no lado da codificao quer no da
descodificao. Em certos casos, a identificao da frequncia do padro e a atribuio de
cdigos j se encontra disponvel ou predefinida. Neste caso, a frequncia de ocorrncia
dos padres no necessita de ser determinada de cada vez que se codifica um novo fluxo

Potrebbero piacerti anche