Sei sulla pagina 1di 7

XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011

COMPARAÇÃO VISUAL E MÉTRICA EM IMAGENS DIGITAIS


NA TRANSFORMAÇÃO DE SISTEMA DE CORES RGB
PARA XYZ, YUV, YIQ E CMY

Gleice Pereira da Silva (1º)


Universidade Federal de Pernambuco
Centro de Tecnologia e Geociências
Departamento de Engenharia Cartográfica - Av. Acadêmico Hélio Ramos,
s/n - 2º andar - DECart - Cidade Universitária
CEP: 50740-530 - Recife – Pernambuco
gleice750@ig.com.br

João Marcos Leão Pereira de Araújo (2º)


Universidade Federal de Pernambuco
Centro de Tecnologia e Geociências
Departamento de Engenharia Cartográfica - Av. Acadêmico Hélio Ramos,
s/n - 2º andar - DECart - Cidade Universitária
CEP: 50740-530 - Recife – Pernambuco
jmarcos007@gmail.com

Ana Lúcia Bezerra Candeias (3º)


Universidade Federal de Pernambuco
Centro de Tecnologia e Geociências
Departamento de Engenharia Cartográfica - Av. Acadêmico Hélio Ramos,
s/n - 2º andar - DECart - Cidade Universitária
CEP: 50740-530 - Recife – Pernambuco
analucia@ufpe.br

RESUMO
A representação de uma imagem colorida é em geral no modelo RGB. Quando se utiliza outros modelos é possível
visualmente perceber, ou realçar certos detalhes na imagem. A imagem pode ser oriunda de sensores remotos orbitais
ou fotografias aéreas. Este artigo propõe uma análise visual e estatística de imagens convertida para outros modelos de
cores. Através da análise feita, foram obtidos dados qualitativos e quantitativos para se conhecer a métrica de suas cores
na conversão entre estes sistemas. Através dos cálculos estatísticos podemos comparar a qualidade dos resultados dos
modelos das cores. As imagens utilizadas no estudo foram adquiridas a partir do software Google Earth de áreas
distintas da região metropolitana do Recife e foram convertidas do sistema de cores RGB para os sistemas XYZ, YUV,
YIQ e CMY. Todas estas conversões são em sistemas de 3 bandas. A análise estatística é feita por banda. Os
algoritmos para estas conversões e análises estatísticas foram desenvolvidos em ambiente MATLAB. As análises
estatísticas são de erro máximo, erro médio absoluto, erro médio quadrático, relação sinal-ruído de pico, covariância,
coeficiente de correlação e coeficiente de Jaccard. Após a conversão, cada uma dessas métricas é calculada e nos darão
dados relativos ao quanto a imagem nova se aproxima da original RGB, o quanto variações locais ou ruídos podem
influenciar, a proximidade entre elas, avaliação de imagens com dimensões diferentes, o sinal-ruído de pico, nível de
cinza médio para cada banda, relação linear entre elas, similaridade etc. Foram obtidos bons resultados que puderam ser
comparados entre si tanto visualmente quanto quantitativamente. A aplicação é ampla em vários estudos que necessitam
de uma qualidade métrica nas cores de uma imagem e que se baseiam em informações coletadas via sensores orbitais ou
fotografias aéreas.

Palavras Chave: Métrica, Erro, Covariância, Jaccard, RGB, XYZ, YUV, YIQ, CMY.

ABSTRACT
The representation of a color image is usually in the RGB model. When using other models you can visually
see, or highlight certain details in the image. The image can be from satellite remote sensing or aerial photographs. This

364
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
article proposes a statistical and visual analysis of images converted to other color models. Through analysis, we
obtained qualitative and quantitative metrics to know their colors when converting between these systems. Through
statistical calculations we can compare the quality of the results of models of color. The images used in the study were
acquired from the Google Earth software from different areas of the metropolitan area of Recife and were converted
from RGB color system to system XYZ, YUV, CMY, and YIQ. All these conversions are systems in three bands.
Statistical analysis is performed by the band. The algorithms for these conversions and statistical analysis were
developed in MATLAB. Statistical analysis is the maximum error, mean absolute error, mean square error, signal-to-
peak noise, covariance, correlation coefficient and Jaccard coefficient. After conversion, each of these metrics are
calculated and give us data on how the new image is close to the original RGB, and local variations and noise can affect
the proximity between them, evaluation of images with different dimensions, the signal- noise peak, average gray level
for each band, linear relationship between them, so similarity. Good results were obtained that could be compared both
visually and quantitatively. The application is extensive in several studies that require a quality metric in the colors of
an image and that are based on information collected via orbital sensors or aerial photographs.

Keywords: Metrics, Error, Covariance, Jaccard, RGB, XYZ, YUV, YIQ, CMY.

1 INTRODUÇÃO O Software MATLAB foi utilizado para


fazer os algoritmos para estas conversões e as análises
Ao longo da história foram estudadas e estatísticas que foram feitas por banda. A escolha do
desenvolvidas técnicas e modelos de representação software MATLAB foi devido a sua facilidade para se
dessas cores. Observou-se que a partir de uma trabalhar com matrizes; já que as imagens são do tipo
combinação de 3 cores primárias é possível gerar todas raster, ou seja, matricial. As análises estatísticas foram
as outras. Este é o fundamento de grande parte dos programadas em MATLAB como erro máximo, erro
modelos de cores desenvolvidos. Entre eles temos o médio absoluto, erro médio quadrático, relação sinal-
RGB, XYZ, YUV, YIQ e CMY, que serão abordados, ruído de pico, covariância, coeficiente de correlação e
onde cada um deles tem uma característica e uma coeficiente de Jaccard. Após o processamento dos
aplicação diferente. dados podemos comparar a imagem nova com a
A aplicação de imagens digitais é ampla. original RGB.
Elas podem ser utilizadas para entretenimento em
jogos eletrônicos, nos computadores, na televisão, e em
aplicações que exigem grande precisão, como medicina
ou automação industrial. Em muitos casos, faz-se
necessária uma transformação entre esses modelos de
cores, como por exemplo, de um computador (RGB)
para uma televisão (YIQ). Porém as cores podem
sofrer distorções, então qual a diferença na qualidade
das cores? De que forma essa diferença pode ser
analisada e quantificada? Este artigo aborda modelos
matemáticos e estatísticos de como fazer essa análise
da métrica de qualidade em imagens.

Fig. 1 – Imagem Google: Boa Viagem – Recife – PE.


2 MATERIAIS E MÉTODOS

Utilizamos 3 imagens do software Google


Earth de áreas distintas da região metropolitana do
Recife que foram obtidas no mês de julho de 2011 e
foram convertidas do modelo de cores RGB para os
modelos XYZ, YUV, YIQ e CMY. O formato de
compactação de todas estas imagens é o JPG. As
Figuras 1, 2 e 3 apresentam as imagens obtidas do
Google Earth.
As áreas escolhidas (Figura 1, 2 e 3) foram
de um bairro nobre, uma área comercial e uma
comunidade carente, respectivamente. Observa-se
padrões bem diferenciados das imagens.

Fig. 2 – Imagem Google: Boa Vista – Recife – PE.

365
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
aproximada, dividido pela multiplicação das dimensões
da imagem:

(3)

Quanto menor essa métrica, melhor a nova


imagem se aproxima da original. Uma variante muito
utilizada desta métrica é conhecida como raiz do erro
médio quadrático:

(4)
Fig. 3 – Imagem Google: Dance Day – Recife – PE.

Outra variação é o erro médio quadrático


normalizado:
3 ESTATÍSTICAS: FÓRMULAS E MODELOS

Métricas de qualidade ou fidelidade podem


ser utilizadas para avaliar a similaridade de uma
(5)
imagem transformada g em relação à original f.
Algumas medidas são voltadas para avaliações
subjetivas, as quais se baseiam em análises realizadas
por observadores humanos. Por outro lado, avaliações
Cujos valores variam entre 0 e 1, o que torna
objetivas procuram medir a qualidade das imagens por
possível a avaliação de imagens com dimensões
meio de funções entre a imagem original e a imagem
diferentes
transformada. Algumas métricas para medir
similaridade entre as imagens são listadas a seguir:
3.4 Relação Sinal-Ruído de Pico (SNR, Peak Signal to
Noise Ratio):
3.1 Erro máximo (ME, Maximum Error):
É utilizada para avaliar a diferença global
É a maior diferença absoluta entre cada par
entre duas imagens:
de pontos na imagem original e na imagem
aproximada:

(1)
(6)
Quanto menor essa métrica, mais a nova
imagem g se aproxima da original f. Como depende do
valor de apenas 2 pixels, o erro máximo é bastante
sensível a ruídos.
Lmax: Valor máximo de intensidade de
3.2 Erro médio absoluto (MAE, Mean Absolute Error):
cinza. Para imagens 8 bits Lmax = 255.
É a soma da diferença absoluta de cada
A métrica PSNR é expressa em decibel
ponto da imagem original f e da imagem aproximada g,
(dB), unidade originalmente definida para medir
dividido pela dimensão das imagens (MN):
intensidade sonora em escala logarítmica. Valores
típicos de PSNR variam entre 20 (para RMSE = 25,5) e
40 (para RMSE = 2,55). Quanto maior esta métrica,
(2)
melhor a nova imagem se aproxima da original.

Uma métrica relacionada é a relação sinal-


Quanto menor essa métrica, melhor a nova
ruído (SNR, Signal to Noise Ratio):
imagem se aproxima da original.

3.3 Erro médio quadrático (MSE, Mean Square Error):


(7)
É a soma do quadrado das diferenças de
cada ponto da imagem original e da imagem

366
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
3.5 Covariância entre duas imagens f e g:

(8)

Onde µf e µg representam o nível de cinza CMY XYZ


médio nas imagens f e g, respectivamente.

3.6 Coeficiente de Correlação entre duas imagens f e g:

(9) YIQ YUV

Fig. 4 – Modelo de Cores para Boa Viagem.


A correlação pode ser vista como a
covariância dividida por um fator que depende da
distribuição dos níveis de cinza (variância da imagem)
de cada uma das imagens. O valor de r varia entre -1 a
1, sendo que valores próximo de zero representam um
relacionamento linear mais fraco entre as duas
imagens.

3.7 Coeficiente de Jaccard entre duas imagens f e g:


CMY XYZ

(10)

O coeficiente de Jaccard é igual a 0 para


duas imagens que não apresentam nenhuma YIQ YUV
similaridade. Duas imagens que apresentam todos os
elementos idênticos possuem coeficiente de Jaccard Fig. 5 – Modelo de Cores para Boa Vista.
igual a 1.

4 TRANSFORMAÇÃO ENTRE MODELOS DE


CORES

Nesta etapa, usando algoritmos criados no


MATLAB, foram aplicadas ao modelo RGB as devidas
matrizes de transformação entre modelos. As imagens
foram transformadas do modelo de cores RGB
(original) para CMY, XYZ, YIQ e YUV. Nas figuras CMY XYZ
4, 5 e 6 a seguir temos o resultado das transformações.

5 PROCESSAMENTO ESTATÍSTICO DAS


IMAGENS

As tabelas a seguir mostram os resultados


quantitativos das análises estatísticas comparando cada YIQ YUV
imagem convertida para outro modelo de cores com
sua imagem original (RGB). Isto foi feito banda a Fig. 6 – Modelo de Cores para Dance Day.
banda

367
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
TABELA 1 – DADOS COMPARATIVOS PARA A IMAGEM DA FIGURA 1 (BOA VIAGEM)

Erro Sinal
Modelo Erro Sinal Coef. Coef.
médio Erro médio quadrático Ruído Covariância
RGB Banda máximo Ruído Correlação Jaccard
absoluto Pico
versus:
ME MAE MSE RMSE NMSE PSNR SNR σfg r J
C 255,00 100,16 15175,87 123,19 0,95 6,32 0,24 -3572,52 -1,00 0,00
CMY M 255,00 97,34 14496,40 120,40 1,03 6,52 -0,14 -3136,58 -1,00 0,00
Y 255,00 104,16 15706,58 125,33 1,33 6,17 -1,24 -2895,05 -1,00 0,00
X 54,00 7,32 93,28 9,66 0,01 28,43 22,36 3376,27 0,99 0,05
XYZ Y 22,00 2,54 11,35 3,37 0,00 7,58 0,93 162,50 1,00 0,14
Z 17,00 2,03 7,23 2,69 0,00 39,54 32,13 2894,24 1,00 0,17
Y 68,00 9,72 160,54 12,67 0,01 26,07 20,00 3165,65 0,98 0,04
YIQ I 135,00 38,31 1905,98 43,66 0,14 15,33 8,67 2046,02 0,98 0,01
Q 140,00 41,61 2252,38 47,46 0,19 14,60 7,20 1724,70 0,98 0,01
Y 72,00 10,77 193,37 13,91 0,01 25,27 19,19 3106,04 0,98 0,03
YUV U 161,00 63,64 5031,70 70,93 0,36 11,11 4,46 1422,00 0,96 0,01
V 138,00 27,78 1159,31 34,05 0,10 17,49 10,08 1897,25 0,95 0,01

TABELA 2 – DADOS COMPARATIVOS PARA A IMAGEM DA FIGURA 2 (BOA VISTA)

Erro Sinal
Modelo Erro Sinal Coef. Coef.
médio Erro médio quadrático Ruído Covariância
RGB Banda máximo Ruído Correlação Jaccard
absoluto Pico
versus:
ME MAE MSE RMSE NMSE PSNR SNR σfg r J
C 255,00 86,51 11224,51 105,95 0,75 7,63 1,25 -2574,23 -1,00 0,00
CMY M 255,00 85,47 10547,81 102,70 0,82 7,90 0,87 -2116,84 -1,00 0,00
Y 255,00 101,20 14182,49 119,09 1,36 6,61 -1,33 -2250,65 -1,00 0,00
X 67,00 8,19 126,33 11,24 0,01 27,12 20,74 2388,95 0,98 0,04
XYZ Y 23,00 3,04 16,44 4,05 0,00 35,97 28,94 2132,96 1,00 0,12
Z 19,00 2,18 8,25 2,87 0,00 38,97 31,03 2243,34 1,00 0,16
Y 76,00 11,12 216,81 14,72 0,01 24,77 18,39 2145,38 0,97 0,03
YIQ I 118,00 37,88 1782,10 42,21 0,14 15,62 8,59 1399,97 0,94 0,00
Q 134,00 38,92 1952,24 44,18 0,19 15,23 7,29 1317,64 0,97 0,01
Y 80,00 12,41 264,85 16,27 0,02 23,90 17,52 2064,99 0,96 0,03
YUV U 150,00 64,44 4731,32 68,78 0,37 11,38 4,35 1053,16 0,96 0,00
V 114,00 25,35 980,60 31,31 0,09 18,22 10,28 1378,93 0,92 0,01

TABELA 3 – DADOS COMPARATIVOS PARA A IMAGEM DA FIGURA 3 (DANCE DAY)

Erro Sinal
Modelo Erro Sinal Coef. Coef.
médio Erro médio quadrático Ruído Covariância
RGB Banda máximo Ruído Correlação Jaccard
absoluto Pico
versus:
ME MAE MSE RMSE NMSE PSNR SNR σfg r J
C 255,00 101,08 14759,15 121,49 0,97 6,44 0,14 -3378,10 -1,00 0,00
CMY M 255,00 99,04 12903,65 113,59 1,09 7,02 -0,38 -2367,07 -1,00 0,00
Y 255,00 122,76 19985,24 141,37 2,13 5,12 -3,28 -2889,29 -1,00 0,00
X 54,00 10,56 187,83 13,71 0,01 25,39 19,09 3063,28 0,99 0,03
XYZ Y 22,00 3,88 23,65 4,86 0,00 34,39 26,99 2427,56 1,00 0,08
Z 17,00 2,00 6,91 2,63 0,00 39,74 31,33 2876,71 1,00 0,17
Y 71,00 12,73 278,72 16,69 0,02 23,68 17,38 2840,08 0,97 0,03
YIQ I 125,00 32,95 1438,66 37,93 0,12 16,55 9,15 1635,57 0,94 0,01
Q 128,00 32,93 1681,00 41,00 0,18 15,88 7,47 1617,62 0,98 0,02
Y 75,00 13,33 305,73 17,49 0,02 23,28 16,98 2805,07 0,97 0,03
YUV U 150,00 62,71 4532,58 67,32 0,38 11,57 4,16 1190,78 0,96 0,00
V 109,00 20,47 739,01 27,18 0,08 19,44 11,04 1818,90 0,94 0,02

368
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
6 RESULTADOS 6.4 Relação sinal ruído de pico (PSNR):

Os gráficos a seguir mostram de forma bem


mais intuitiva os resultados obtidos, onde cada gráfico
representa uma das 3 imagens (Boa Viagem, Boa Vista
e Dance Day, nesta ordem), e dentro de cada gráfico
serão exibidos 4 blocos correspondendo cada um deles
à transformação CMY, XYZ, YIQ e YUV
respectivamente. Ainda mais além, cada bloco será Aqui também é analisada a proximidade
subdividido em 3 bandas de acordo com a seguinte entre a imagem gerada e a original, porém é uma escala
legenda: logarítmica em decibéis (dB), ou seja, quanto maiores
os valores mais a imagem gerada se aproxima da
original. Observe como na imagem 1 (Boa Viagem) no
primeiro gráfico, o modelo XYZ é o que mais se
aproxima nas bandas 1 e 3, porém na banda 2 a
similaridade é pequena.
Fig. 7 – Legenda dos gráficos a seguir
6.5 Coeficiente de correlação (r):
6.1 Erro máximo (ME):

O valor de r varia entre -1 e 1. Valores


Observamos que o modelo CMY possui o próximos de 0 indicam relação linear mais fraca entre
maior erro máximo possível (255) em todas as 3 as imagens. Observe como o modelo CMY apresenta
imagens (maior diferença banda a banda). O que era de as bandas com r = -1. Os valores negativos são
se esperar, pois o CMY é nada mais que uma inversão resultado da inversão de cores, porém a relação é
de cores, então se tiver 1 único pixel branco ou preto completamente linear entre as imagens. Seria um
irá inverter de cor, gerando o maior erro possível. Já o processo análogo a uma função f(x)=x quando é
modelo XYZ apresentou menor erro máximo. rebatida em relação ao eixo x, tornando-se f(x)= -x.

6.2 Erro médio absoluto (MAE): 6.6 Coeficiente de Jaccard (J):

Temos um resultado análogo, neste caso, O valor de J = 0 significa que duas imagens
quanto menor este erro mais a imagem gerada se não possuem nenhuma similaridade, já se forem
aproxima da original. O CMY mostrou ser o mais idênticas J = 1. Observe como o modelo CMY não
“diferente”, já o XYZ mostrou ser o mais “parecido”. apresenta nenhuma similaridade e como o modelo
XYZ é o que mais se aproxima, porém ainda assim está
6.3 Raiz do erro médio quadrático (RMSE): um tanto distante, pois o maior pico é de 0,17 (na
banda 3) e este valor é apenas 17% da maior
similaridade possível (1,00 = 100%).

7 CONCLUSÕES

Os resultados obtidos foram excelentes e


mostram com clareza, tanto de forma visual quanto
Esta métrica também diz respeito ao quanto quantitativa, as diferenças entre imagens que são
a nova imagem se aproxima da original, confirmando convertidas do sistema RGB para os demais já citados.
os casos anteriores. Observe como cada banda de uma A estatística, voltada para as métricas de qualidade em
mesma imagem pode ficar próxima e outra banda imagens, mostrou-se ser uma poderosa ferramenta na
distante da imagem original. análise de imagens digitais. Com os resultados

369
XXV Congresso Brasileiro de Cartografia - Curitiba - PR - Brasil, 21 a 24 de agosto de 2011
3
apresentados é possível então quantificar o que
reconhecemos qualitativamente como “parecido” ou
“diferente” para as imagens.

8 REFERÊNCIAS BIBLIOGRÁFICAS

Pedrini. H., Schwartz. W. R., 2008, Análise de


Imagens Digitais: Princípios, algoritmos e aplicações,
Thomson, São Paulo, 508 páginas.

370

Potrebbero piacerti anche