Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
si el par
de (a,b) pertenece a R, diremos que a esta relacionado con b y normalmente se representara
como aRb. Tomese por ejemplo el conjunto de puntos A = {p 1,p2,p3,p4} ordenados de la
forma:
CAPITULO 1
INTRODUCCION
1.2. REPRESENTACION DIGITAL DE IMAGENES
El termino
imagen monocroma
p1
p2
p3
p4
espaciales como en el brillo. Una imagen digital puede considerarse como una matriz cuyos
indices de fila y columna identifican un punto de la imagen y el valor del correspondiente
elemento de la matriz indica el nivel de gris en ese punto. Los elemntos de una distribucin
digital de este tipo se denominan lementos de la imagen, o mas comnmente pixels o pels,
abreviaturas de su denominacin inglesa picture elements.
1.3. ETAPAS FUNDAMENTALES DEL PROCESAMIENTO DE IMGENES.
Adquisicin de imagen.
Es decir adquisicin de una imagen digital para ello se necesita un sensor de imagen y la
posibilidad de digitalizar la seak producida por el sensor. Puede ser una camara de TV,
fotogrfica, monocroma o color.
Procesamiento.
Su funcion es la de mejorar la imagen de forma que se aumenta las posibilidades de xito en
los procesos posteriores.
Segmentacin.
Conssite en partir una imagen de entrada en sus partes constituyentes u objetos. En general
la segmentacin autonoma es una de las labores mas difciles del tratamiento digital de
imgenes.
La descripcion.
Tambien denominada seleccin de rasgos, consiste en extraer rasgos con alguna informacin
cuantitativa de interes o que sean fundamentales para diferenciar una clase de objetos de
otra.
Reconocimiento e interpretacin.
El reconocimiento es el preceso que asigna una etiqueta a un objeto basandose en la
informacin proporcionada por sus descriptores. Interpretacin implica asignar significado
a un conjunto de objetos reconocidos.
Etapas fundamentales del procesamiento digital de imgenes.
El rango de niveles de luz a los q es capas de adaptarse el sistema visual humano es enorme
del orden de 1010 desde el umbral escotopico hasta el limite de deslumbramiento muchas
evidencias experimentales indican que la iluminacin subjetiva (iluminacin persivida por el
sistema humano) es una funcion logaritminca de la intensidad de la luz incidente sobre el
ojo.
La capacidad de ojo de discriminar entre cambios de iluminacin para cada nivel especifico
de adaptacin tambien es de considerable interes. un experimento clasico utilizado para
determinar la capacidad del sistema visual humano de discriminar la iluminacin consiste en
en colocar un objeto observando un area palana, uniformemente iluminada, lo
suficientemente grande para q ocupe todo el campo visula. El area es habitualmente simple
difusor d, tal como un vidrio esmerilado, que se ilumina desde atrs con una fuente de luz
cuya intensidad I, puede variarse. A este campo se aade un incremento de iluminacin, I,
en forma de destello de corta duracion que aparece como un circulo. si I no es
suficientemente brillante, el sujeto debe decir no indicando q no persive el cambio.
Conferme aumenta, el sujeto puede dar respuesta positiva si indicando q ha persivido el
cambio. Esto determinara una discriminacin de la iluminacin.
2.2 UN MODELO DE IMAGEN SIMPLE.
El termino imagen se refiere a una funcion bidimensionalmente de la luz y la intensidad, a la
que indicamos f(x,y) donde el valor o amplitud de f en las coordenadas espaciales (x,y) de la
intensidad (iluminacin) de la imagen en este punto. Puesto que la luz es una forma de
energa, f(x,y) de be de ser estrictamente mayor que cero y finita, es decir.
0<f(x,y)<
Las imgenes que se se perciben en las actividades visuales cotidianas provienen
normalmente de la luz reflejada por los objetos. La naturaleza basica de f(x,y) puede estar
caracterizada por 2 componentes: 1) la cantidad de luz incidente procedente de la fuente
sobre la escena contemplada y 2)la cantidad de luz reflejada por los objetos en la escena. De
forma apropiada, recibe el nombre de componentes de iluminacin y reflectancia, de i se
indican por i(x,y) y r(x,y) respectivamente. Las funciones i(x,y) y r(x,y) se conbinan, como
producto, para dar f(x,y):
f(x,y)=i(x,y) r(x,y)
donde:
0<i(x,y)<
y
0<r(x,y)<
2.3. MUESTREO Y CUANTIFICACIN.
2.3.2. Muestreo uniforme y cuantificacion.
Para ser utilizable el procesamiento por medio de computadora. Uan funcion de imagen
f(x,y) debe ser digitalizada tanto especialmente como en su amplitu . la digitalizacin de
coordenadas espaciales (x,y) muestreo de la imageny la digitalizacin en amplitud se
conoce como cuantificacion de nivel de gris.
Se supone que una imagen continua f(x,y) se descrive de forma aproxiamada por una serie
de muestras igualmente espaciadas organizadas en forma de una matriz NxM donde el
elemento de la amtriz es una cantidad discreta:
f(x, y) ~
f(0,0)
f(1,0)
f(N - 1,0)
f(0,1)
f(1,1)
f(N - 1,1)
1/ 2
Para esta medida de distancia, los pixeles que estan a una distancia menor o igual a algun
valor de r de (x,y) son los puntos contenidos en un circulo de radio r con centro (x,y).
La distancia D4 (denominada tambien la distancia city - block) estre dos puntos p y q se
define:
D 4 (q, p) x s y t
En este caso los pixels que este a uan distancia, de (x,y), D 4 menor o igual que un
determinado valor de r forman un rombo centrado en (x,y). por ejemplo los pixels con una
distancia D4 2 desde (x,y) (el punto central) formaran los siguientes contornos de distancia
constante:
2
2
2
Los pixels con distancia D4 = 1 son los 4-vecinos de (x,y).
La distancia D8 (tambien llamada distancia tablero de ajedrez) entre p y q se define:
D 8 (q, p) max( x s , y t )
En este caso los pixels a una distancia D 8 de (x,y) menor o igual que un cierto valor de r
forman uncuadro centrado en (x,y). por ejemplo, los pixels a una distancia D 8 2 de (x,y) el
(punto central) forman los siguientes contornos de distancia constante:
f(0, M - 1)
2
f(1, M - 1) 2
2
f(N - 1, M - 1)2
2
1
1
2
1
0
2
1
1
2
2
2
1
2
1
2
1
2
2
2
NOT q (o tambien,
Estas operaciones son funcionalmente completas en el sentido que pueden ser combinadas
para formar cualquier operacin logica, y se utilizan solamente en imgenes binarias,
mientras que las operaciones aritmeticas solo en pixels con varios valores.
2.5. GENERACION DE UNA IMAGEN.
2.5.1. Algunas transformaciones bsicas.
Todas las transformaciones estan expresadas en el sistema de coordenadas cartesiano
tridimensional (3-D), en el que las coordenadas de punto generico se representan por
(X,Y,Z). en los casos que implique imgenes bidimensionales (2-D), se mantiene la
convencin anterior de representacin en minsculas (x,y) para indicar las coordenadas de
un pxel. Hacer referencia a (X,Y,Z) como coordenadas globales de un punto es la
terminologa comn.
Traslacin:
Supongase que s etrata de trasladar un punto de coordenadas (X,Y,Z) a un nuevo
emplazamiento, empleando unos desplazamientos (X o,Yo,Zo). la traslacin se realiza
fcilmente empleando las ecuaciones:
X* = X + X o
Y* = Y + Y o
Z* = Z + Zo
Donde (X* ,Y* ,Z*) sona las coordenadas del nuevo punto. Lo anterior se puede expresar
como:
X *
1
*
Y 0
Z*
0
0
1
0
0
0
1
X0
Y0
Z 0
X
Y
Z
1
X *
*
Y*
1
0
0
0
0 0
1 0
0 1
0
X
Y
1 1
X0
Y0
Z0
SX
0
s
0
0
Sy
0
0
0
0
SZ
0
X0
0
0
Rotacion:
La forma mas simple de estas transformaciones es la rotacion de un punto sobre un eje de
coordenadas. Para girar un punto alrededor de otro punto arbitrario del espacio se requiere
tres transformaciones: la primera traslada ese punto hasta el origen, la segunda relaiza la
rotacion y la tercera traslada este punto de nuevo a la posicin original.
Concatenacion y transformaciones inversas.
La aplicacin de varias transformaciones puede representarse por una unica matriz de
treasformacion 4x4. por ejemplo , la trasalcion, el cambio de scala y rotacion sobre el eje Z
de un punto v vienen dadas por:
V*
=R0(S(TV))
=Av
donde A es la amtriz 4 x 4, A=R 0ST. Estas matrices generalmente no son conmutativas,
porque el orden de aplicacin es importante.
2.5.2. transformaciones de perspectiva.
Una transformacin de perpectiva (tambin denominada transformacin de imagen) proyecta
puntos del espacio tridimensional sobre un plano. Las transformaciones de perspectiva
desempean un papel central en el procesamiento de imgenes porque proporcionan una
aproximacin al modo en que se forma una imagen viendo el mundo tridimensional. Estas
transformaciones son fundamentalmente diferentes de las presentadas anteriormente porque
son no lineales en els entido que implican la divisin por los valores de las coordenadas.
2.5.3. Modelo de camara.
Este modelo esta basado en la hiptesis de que el sistema de coordenadas global y el de la
camara coinciden.
La figura muestra un sistema de coordenadas global (X,Y,Z) empleado para localizar tanto
los puntos de la camara como los 3-D (indicados por w). tambien muestra el sistema de
coordenadas camara (x,y,z) y los puntos imagen (indicados por c) se supone que la camara
esta montado sobre un pivote que le permite girar en el plano horizontal (pan) un angulo e
inclinarse (tilt) un angulo el primero de ellos (pan) corresponde al angulo entre los ejes x y
X, mientras que el segundo (tilt) correponde a el angulo entre los ejes z y Z. la separacion
del centro del trpode de origen del sistema de coordenadas global viene indicada por w o, y la
separacion del centro del plano imagen con respecto al centro del pivote se representa por el
vector r, de componentes (r1,r2,r3).
2.5.4. Calibracin d e la camara.
Con respecto a la ecuacin ch = PCRGwh, Sea A = PCRG, los elementos de A contienen
todos los parmetros de la camara y, de la ecuacin c h = PCRGwh, ch = Awh. haciendo k=1 en
la representacin homognea se tiene:
ch1
ch 2
ch 3
ch 4
a11
a21
a31
a12
a22
a32
a13
a23
a33
a41
a42
a43
X
Y
a44 1
a14
a24
a34
Cuando se expone la pelicula a la luz, los granos de haluro de plata absorben las frecuencias
opticas y sufren un complejo cambio fisico. los granos que han absorbido una cantidad
suficiente de energa contienen pequeas manchas de plata metalica, denominada centros de
desarrollo. al rebelar la pelcula, la existencia de un unico centro de desarrollo en un grano
de haluro de plata puede precipitar el cambio del grano entero de plata metalica. los granos
que no contienen centros de desarrollo no experimentan este cambio.
despus de revelado la pelcula se fija mediante la extraccin quimica de los restantes granos
de haluro de plata. cuanta mas luz alcanza a una zona de la pelcula. mas haluro de plata se
convierte en revelable y mas denso es el deposito de plata que alli se forma. como los
granos de plata metalica son muy opacos para las frecuencias opticas, se obtiene una imagen
de tonos grises en la que los niveles de brillo estan invertidos, produciendo asi el familiar
negativo fotografico.
2.6.2. caracteristicas de la pelcula.
Contraste:
las pelculas de alto contraste reproducen las diferencias tonales del sujeto como grandes
diferencias de densidad en la fotografia; las pelculas de bajocontraste convierten las
diferencias de tono en pequeas diferencias de densidad. La exposicin E, a la que ha sido
sometida una pelcula se define como energa por unidad de area en cada puntote la region
fotosensible. La exposicin depende de la intensidad incidente, I y de la la duracion de la
exposicin, T. estas cantidades estan relacionadas por la expresin:
E = IT
Velocidad.
La velociada de una pelcula determina cuanta luz es necesaria para producir una cierta
cantidad de plata en el revelado. Cuanto menor es la velocidad, mayor debe ser la exposicin
para determinar una determinada imagen ele estndar de velocidad mas ampliamente
empleado es la escala ASA. Esta escala es aritmetica, siendo el valor asignadoa al velociada
directamente proporcional a la sensibilidad de la pelcula. Un film de 200 ASA es el doble
de rapido d (para un sujeto dado se requieren la mitad de exposicion) que una pelcula de
100 ASA. Otras escalas de velocidades, como el sistema DIM empleado en Europa, son
logaritmicas, cada incremento de tres unidades en el numero DIM de la velocidad duplica la
velocidad. Una pelcula de 50 ASA es equivalente aun DIN 18, un 100 ASA a un DIM21, y
asi sucesivamente.
Las pelculas para exteriores, y algunas de interiores, tienen velocidades comprendidas entre
80 y 160 ASA.
Granulosidad.
La imagen extraida de los cristales de haluro de plata tienen estructura discontinua, lo que le
da la apariencia de granulosidades ampliaciones . el efecto es mas pronunciado en las
pelculas rapidas, que tienen comparativamente cristales mayores; las emulciones mas lentas,
de grano mas fino mas fino, son por lo tanto preferibles en ampliaciones en las que se
necesiten un detalle fino, o en las que sea necesaria una gran ampliacin de los negativos.
Poder de resolucion.
La presicion del detalle que puede resolver una pelcula depende no solo de su granulosidad
sino tambien de la propiedades de dispersin de luz de la emulsion y del contraste con el que
la pelcula reproduce los detalles finos. Los mayores poderes de resolucion se alcanza con
pelculas de grano fino y emulsiones delgadas.
2.6.3. Ajustes de diafragma y del obturador.
Ajuste en el difragama de la lente. una serie de mecanismos aumentan o disminuyen el
tamao de la apertura para controlar la cantidad de luz que atraviesa la lente de la pelcula.
El anillo de control del difragma esta calibrado en una escala de los denominados nmeros f
o nmeros de diafragma que forman series tales como 1,4; 2; 2,8; 4; 5,6; 8; 11; 16; 22, y 32.
los nmeros del diafragma son inversamente proporcional a la cantidad de luz admitida.
Las escalas de las velocidades del obturador, en las camaras actuales, tambien siguen estas
secuencias estandar doblemitad. Las velocidades tipicas son 1.1/2, 1/8, 1/15, 1/30, 1/60,
1/125, 1/500 y 1/1000 de segundo cuanto mayor es la velocidad del obturador, menor es el
tiempo de exposicin obtenido.
El conjunto del diafragma y obturador controlan la cantidad de luz que alcanza a la pelcula
al ajustar la intensidad de la luz y el tiempo durante el cual actua.
CAP3
Introduccion a la transformada de Fourier.- Sea f(x) una funcin continua de la variable real
x. La transformada de Fourier de f(x), indicada por F{f(x)}, se define por la ecuacin:
; donde j=
h. Muestreo.- Este problema consiste en establecer las condiciones de muestreo bajo las
cuales una imagen continua puede ser completamente recuperada a partir de un conj de
valores muestreados.
* Funciones unidimensionales.- Considere una funcin q se extiende desde - hasta , y se
supoen tb q la transformada de Fourier de f(x) se anula para valores de u fuera del intervalo
[-W, W]. Una funcin q tiene esta propiedad para cualquier valor finito de W se denomina
funcin de banda limitada. Para obtener una versin muestreada de f(x) basta multiplicar
esta funcin por una funcin de muestreo s(x), q consiste en un tren de impulsos separados
x
* Funciones bidimensionales.- Se encuentra definida por:
Para una funcin f(x,y), donde x e y son continuas, se obtiene una funcin muestreada al
formar el producto s(x,y)f(x,y). La operacin equivalente en el dominio de frecuencias es la
convolucion de S(u,v) y F(u,v).
La transformada rpida de Fourier.a.
Algoritmo de la FFT.- esta basado en el mtodo denominado de doblados sucesivos.
Por conveniencia se expresa la ecuacin de la forma:
donde WN= exp[-j2/N] u N se supone de la forma N=2n donde n
es un entero positivo. Entonces N se expresa como: N = 2M donde M tb es un entero
positivo.
b.
Numero de operaciones.- Por induccin el numero de multiplicaciones complejas y
de sumas necesarias para resolver el algoritmo de la FFT es:
m(n) = (1/2)2nlog22n entonces es igual a (1/2)N log 2N y esto es igual a (1/2)Nn n 1
y a(n) = 2nlog22n dndonos por resultado Nn n 1.
c.
FFT inversa.-
a.
tenemos
b.
c.
Invarianza espacial
Donde H es la respuesta al impulso
Por lo tanto h(x,y) es la funcin de distribucin normal
PSF = point spread function
CAPITULO 5
RESTAURACION DE IMAGENES
Restauracin vs. Mejora
Reconstruccin o recuperacin de imgenes suele basarse en el conocimiento a priori de la
causa de la degradacin
La mejora se basa en los aspectos psico-fsicos del sistema visual humano.
La restauracin pretende recuperar los datos originales de la imagen considerando el proceso
de degradacin que ha sufrido la misma hasta llegar a nosotros.
Tcnicas de restauracin
Deterministas:
Se supone conocida la funcin que degrad la imagen
Se realiza la transformada inversa
Son vlidas si tienen poco ruido
Estocsticas
Se intenta buscar, por inspeccin la funcin de degradacin
Modelo de degradacin
Relacin entrada-salida
g(x,y)=H(f(x,y))+n(x,y)
Basndose en la suposicin que la correlacin entre dos pxels cualquiera es una funcin de
la distancia entre los pixels y no de su posicin, Rf y Rn se pueden aproximar a matrices
circulantes por bloques y de esta forma diagonalizarse.
RESTAURACION POR MINIMOS CUADRADOS
La aproximacin por mnimos cuadrados deducida en la seccin anterior es un
procedimiento estadstico, poruqe el criterio de optimizacin esta basado en las matrices de
correlacion de las funciones de ruido e imagen. Esto implica que los resultados obtenidos al
usar el filtro Wiener generalmente son optimos. Sin embrago el procedimiento de
restauracin desarrollado en esta seccin es optimo para cada imagen dada y requiere
solamente el conocimiento del ruido medio de la varianza, tambin se considera el problema
de ajustar para satisfacer la restriccin
La restauracin obtenida al utilizar la ecuacin:
sobre x
O en notacin matricial
Donde C es una matriz suavizante, y f es un vector cuyos elementos son las muestras de f(x)
Propiedades Importantes:
Aditividad:
Homogeneidad
Notacin matricial:
HaciendoQ=Cyrecordando que:
Recordando la ecuacin:
Aplicando
los
mismos
del
filtro
Wiener:
Si A es bastante grande los dos impulsos de N(u,v) aparecen como puntos brillantes. Si
n(x,y) fuera completamente conocida, se podra restaurar la imagen original (Al restarle
n(x,y) )
A continuacin se presentan ejemplos de restauracin de ruidos de espectro conocido,
mediante filtrados en el espacio de la frecuencia. En este caso, la imagen est afectada por un
ruido sinusoidal, que en la frecuencia aparece como puntos fcilmente visibles. Si
eliminamos esos puntos y realizamos la transformada inversa obtenemos la imagen
restaurada que se observa a la derecha.
RESTAURACIN EN EL DOMINIO ESPACIAL
Despus de haber obtenido un filtro apropiado de restauracin en el dominio de la frecuencia
por cualquier mtodo anterior, a menudo se desea implementar la solucin en el dominio
espacial por medio de una mascara de convolucion, el cual se puede aplicar mas de una vez
en una misma figura. Los coeficientes de la mascara de convolucion se pueden obtener
directamente de una funcin de filtro.
Un mtodo simple para reducir los efectos de la interferencia en este caso consiste en colocar
un filtro tipo ranura que atene los valores de la transformada de Fourier en el eje vertical y
multiplique todos los dems valores de la transformada por 1. Se procede con utilizar el
filtro ranura y tomar la transformada de fourier inversa
TRANSFORMACIONES GEOMTRICAS
A diferencia de las estudiadas hasta ahora , las transformaciones geomtricas generalmente
modifican las relaciones espaciales entre pixels de una imagen.
Las transformaciones geomtricas se denominan a veces transformaciones de hoja elstica
Una transformacin geomtrica se compone de dos operaciones bsicas:
Una transformacin espacial, que define el reagrupamiento de los pixels en le plano de
imagen.
Una interpolacin de nivel de gris, que trata de la asignacin de niveles de gris a los pixels
de la imagen transformada espacialmente.
Transformaciones Espaciales
Supongamos que una imagen f con coordenadas de pxel (x,y) sufre una distorsin
geomtrica produciendo una imagen g con coordenadas:
Esta transformacin se puede expresar como:
Donde r(x,y) y s(x,y) representan las transformaciones espaciales que producen la imagen
distorsionada:
Redundancia
d cdigo: los
datos
utilizados
para
representar
la imagen no
se utilizan d
forma
ptima.
Ejemplo: en
un
histograma
con
picos
marcados los
grises d los
picos
son
ms
probables,
por lo q se pued variar la cantidad d bits en la representacin.
Redundancia interpxel: alta correlacin entre pxeles adyacentes.
Estudio d las relaciones geomtricas o estructurales entre los objetos d la escena.
El mtodo mas frecuentemente usado para solucionar este problema consiste en formular la
traslacin espacial de pxeles usando puntos enlazados que son un subconjunto de pxeles
cuyas ubicaciones en las imgenes de entrada (distorsionada) y salida (corregida) se conoce
con precisin
Se
obtienen
menos
bits
para
representar
grises ms probables (menor info segn la TI). Original: 2 bits/pxel.
Cdigo RLC
El cdigo d longitud d cadnas (en ingls RLC) o la codificacin d longitud d cadna (RLE)
disminuye la redundancia interpxel.
Trabaja contando el nmero d pxeles adyacentes con el mismo nivel d gris. Esta cuenta, la
longitud d ejecucin, es la q se codifica y almacena.
Aproximaciones:
Dar la posicin inicial y la
cantidad d algn smbolo. Ej: para los ceros se codifica con (1,3)(9,2).
Dar solamente la cantidad d smbolos (comenzando con uno particular). Ej: para los ceros se
codifica con 3, 5, 2.
El cdigo d salida es d longitud fija, q pued reducirse con codificacin d Huffman.
Uso estndar en imgenes binarias, con extensin a imgenes en tonos d gris.
Pasos necesarios:
Dfinicin d parmetros: escaneo por filas o columnas, nmero d bits requeridos para la
codificacin (para fila d 2n1 pxels se necesitan n bits).
Convencin para el primer nmero RLC d una fila: ceros o unos.
Conteo y codificacin.
Ejemplo d compresin con escaneo por filas, convencin d primer nmero para el cero, en
una imagen binaria d 7x7:
Seleccin d la transformada
- Ecuacin general d transformacin:
Si todos los pxeles son cambiantes respecto a los adycentes se tiene el lmite inferior: CR =
0.5, imagen dl doble dl tamao original.
Error d prediccin:
- Modlo dl dcodificador:
A medida q llegan pxeles fn al codificador, el mdulo genera un valor para cada pxel
basado en entradas pasadas ( fn), formando el error d prediccin:
codifica el error utilizando cdigo d longitud
variable.
Predictor: combinacin lineal d m pxeles previos
Se
m: ordn dl predictor,
ai:
prediccin.
Con un predictor d primer ordn: mdulo d prediccin d pxel previo:
coeficientes
se
dnomina:
codificacin
diferencial
.
Con a = 1:
por filas, el mdulo
predice el valor dl pxel basado en el pxel anterior. El primer pxel se codifica por separado.
La salida
dl cuantizador se representa por un bit, d manera q el codificador utiliza
cdigos d longitud d palabra fija d un bit.
Codificacin d la transformada
- Mtodos q transforman el dominio d la imagen (reversiblemente), y codifican una serie d
coeficientes.
- Se intenta encontrar el mnimo nmero d coeficientes q concentren la mayor cantidad d
energa.
- Xa lograr altas tasas d compresin se cuantizan al mismo nivel, o se dscartan, los
coeficientes con magnitud muy pequea (distorsin en la imagen reconstruda).
- Esquema dl proceso d codificacin y dcodificacin:
Asignacin d bits
- Dspus d transformar, la compresin se logra guardando slo una fraccin d los
coeficientes obtenidos.
- Los coeficientes q se almacenan se eligen por dos mtodos:
- Codificacin zonal: se retienen los d mxima varianza.
Es el mismo conjunto xa todas las subimgenes.
- Codificacin por umbral: se retienen los d mayor magnitud.
Conjunto diferente xa cada subimagen.
- Los coeficientes retenidos se cuantizan y codifican.
- El proceso completo d truncado, cuantizado y codificacin d los coeficientes elegidos en la
subimagen transformada se denomina asignacin d bits.
- Codificacin zonal:
1. Se calcula la varianza xa cada coeficiente d los (N/n)2 bloqs d nxn.
2. Se igualan a cero las k varianzas ms pequeas y se codifica.
3. Reconstruccin: se obtiene la IDCT xa cada bloq.
- Alternativamente al paso 2, se puedn reordnar las varianzas por magnitud alreddor dl
origen, y ver el proceso como una mscara d 0s y 1s q se aplica sobre los coeficientes:
- Codificacin por umbral: en cada subimagen, los coeficientes d mayor magnitud se
retienen.
- Tcnica adaptativa, ya q vara la mscara q se aplica a cada subimagen.
- Criterio d truncado:
- Umbral global: es el mismo xa todas las subimgenes. La razn d compresin vara d
imagen a imagen.
- N-mayores: se vara el umbral en cada subimagen xa retener N coeficientes. La razn d
compresin se conoce a priori.
- Umbral variable en funcin d la localizacin dl coeficiente en la subimagen. Razn d
compresin variable entre imgenes.
Estndares d compresin
Organismos d estandarizacin:
- ISO (International Standarization Organization).
- CCITT (Committee of the International Telephone and Telegraph).
Encargados d redactar las normas xa compresin d imgenes binarias y d tono continuo
(monocromas y color), en aplicaciones d cuadro fijo y vido.
Normas d compresin d imgenes binarias:
Diseados originalmente xa codificacin d FAX, se basan en tcnicas d compresin sin
prdidas.
- CCITT Group 3: codificacin RLC 1D (por lneas), con cdigos Huffman.
- CCITT Group 4: codificacin por lneas q toma en cuenta la lnea anterior (referencia),
guardando la posicin d los pxeles d cambio.
Normas d compresin d imgenes d tono continuo:
- Varias normas (algunas en estudio), basadas principalmente en codificacin con prdidas.
- Encargadas por los organismos a universidads, grupos d investigacin y compaas, se
seleccionaron en funcin d su calidad d imagen y tasa d compresin alcanzada.
- JPEG (Joint Photographic Experts Group): estndar q define tres sistemas d codificacin
diferentes
- Sistema base con prdidas: utiliza la DCT y es adcuado xa la mayora d las aplicaciones.
Requerido xa ser compatible JPEG.
- Sistema extendido: xa mayor compresin y aplicaciones d reconstruccin progresiva.
- Sistema indpendiente sin prdidas: xa compresin reversible.
Algoritmo dl sistema base JPEG:
1. Subdivisin d la imagen en bloques d 8x8, procesados a continuacin d izquierda a drecha
y d arriba hacia abajo.
2. Desplazamiento d nivel restando 2(n1), con n: nmero d bits d cada pxel original. Ej: en
256 niveles d grises se resta 127 a cada pxel.
3. Clculo d la DCT.
4. Cuantizacin d coeficientes.
5. Reordnamiento d coeficientes.
6. Codificacin dl coeficiente d brillo mediante DPCM con el brillo dl bloq anterior, y
cdigo Huffman.
7. Codificacin dl resto d coeficientes con cdigo Huffman.
Otras normas:
- JPEG 2000 (ISO/IEC 15441-1:2000): norma q mejora el JPEG al utilizar Transformada
Wavelets. Permite dscomprimir slo porciones d las imgenes. La cuantizacin es diferente
xa cada coeficiente.
Con gran cantidad d patentes d software.
- Vido: agregan tcnicas xa reducir la redundancia temporal entre cuadros.
Normas xa vidoconferencia: CCITT H.261 (T1), sucedido por la
ITU (International Telecommunications Union) H.262, H.263
(baja calidad) y H.320 (ISDN). Utilizan la DCT con DPCM dl
error d prediccin d movimiento.
Normas xa aplicaciones multimedia: dl Motion Picture Experts
Group. Usadas en compresin d vido xa almacenamiento en CDROMS (MPEG-1), compresin NTSC/PAL (MPEG-2), y HDTV
digital y material audiovisual (MPEG-4).
CAP 7 SEGMENTACIN
Deteccin de discontinuidades
Discontinuidad: cambio abrupto en las intensidades de gris.
Tipos bsicos de discontinuidades:
Puntos, Lneas, Bordes
Forma de deteccin: filtrado espacial con una mscara apropiada (ej. w3x3):
donde Lmax es el mximo nivel de gris, f (p) y f (q) son las intensidades de los pxeles p y q
respectivamente.
Por convencin, p va a estar siempre ubicado a la derecha de la direccin del barrido.
Un borde est formado por elementos de borde conectados.
Por una cuestin de simplificacin, se supondr que los bordes empiezan en la primera fila y
terminan en la ltima (no en los costados de la imagen).
Umbralizacin:
Mtodo: muy simple y muy usado.
Fundamento: divisin del histograma mediante un umbral.
Formulacin:
binarizacin), los pxeles son divididos en dos clases: C1, con niveles de gris [1, ...., t]; y
C2, con niveles de gris [t+1, ...., L]. Entonces, la distribucin de probabilidad de los
niveles de gris para las dos clases son:
Deteccin de lineas
Objetivo: Detectar lneas de grosor de un pxel con distintas orientaciones.
Se usan las siguientes mscaras:
Algoritmo:
b Calcular el gradiente de la imagen y umbralizar el resultado.
b Generar el espacio de parmetros mediante valores equiespaciados de r y q ,
inicializndolo en cero (acumulador).
b Para cada punto de borde de la imagen, calcular la curva correspondiente en el espacio de
parmetros para cada q j, despejando el valor de ri. Incrementar el acumulador en la posicin
(ri,q j).
b La interseccin de curvas en el espacio rq (altos valores en el acumulador) identifica la
colinearidad de los puntos a los cuales corresponden tales curvas.
b Conectar los puntos colineales cercanos (adyacentes o cuya distancia entre s sea inferior a
un umbral).
Teora de Grafos
Grafo:G = (N,U) es un conjunto finito, no vaco, formado por N nodos, junto con un
conjunto U d pares desordenados d elementos d N.
b Arco: Cada elemento (ni,nj) de U. Si los arcos tienen direccin, entonces
G es un grafo dirigido. Cada arco tiene un costo c(ni,nj) asociado.
b En un grafo dirigido, si un arco va de ni a nj entonces nj es un sucesor de ni. El padre de
nj es ni. Los sucesores de un nodo forman lo que se denomina su expansin.
b El nodo de nivel 0 es el nodo raz. Los nodos del ltimo nivel son los nodos objetivo.
b Un camino est formado por una secuencia de nodos n1, ...,ni, ...,nk, donde ni+1 es un
sucesor de ni. El costo de un camino es igual a:
Esta operacin genera una matriz unidimensional con M entradas que son 0, excepto en
la posicin donde se proyecta el objeto. En t=0, al multiplicar los componentes de la
matriz por:
con x=0,1,...,M-1, da un resultado :
Usando anlisis discriminante, Otsu defini la variancia entre clases de una imagen
umbralizada como:
Para una umbralizacin de dos niveles, Otsu verific que el umbral ptimo t* se elige de
manera que B2 sea mxima; esto es:
donde es un umbral.
Obsrvese que dij(x,y) tiene un 1 como coordenadas espaciales (x,y) solamente si la
diferencia de nivel de gris de dos imgenes es apreciablemente diferente de estas
coordenadas, segn el valor determinado por el umbral .
En la practica, las entradas de dij(x,y) de valor 1 aparecen a menudo a causa del ruido.
Normalmente, estas entradas son puntos aislados de la imagen diferencia, y un mtodo
sencillo para eliminaras consiste en formar regiones 4 u 8 conexas de valores 1 en
dij(x,y) e ignorar despus cualquier regin que tenga menos de un numero
predeterminado de entradas.
Metodo de diferencias acumulativas
Como ya se ha indicado, una imagen diferencia contiene a menudo entradas aisladas que
son producto del ruido. Aunque el nmero de estas entradas se puede reducir o eliminar
completamente por un anlisis de conectividad umbralizado, este proceso de filtrado
puede tambin eliminar objetos pequeos o de movimiento lento. Nosotros resolveremos
este problema considerando los cambios en la posicin de un pxel sobre varios
fotogramas, introduciendo as una memoria del proceso. La idea bsica consiste en
ignorar los cambios que se producen espordicamente en una sucesin de fotogramas y
que por ello pueden atribuirse a un ruido aleatorio.
Considrese una sucesin de fotogramas de imagen f(x,y,t1), f(x,y,t2), ..., f(x,y,tn), y sea
f(x,y,t1) la imagen de referencia. Para formar una imagen de diferencia acumulativa se
compara la imagen referencia con cada una de las imgenes subsiguientes de la
secuencia.
Un contador de cada posicin de pxel de la imagen acumulativa se incrementa cada vez
que se produce una diferencia en dicha posicin de pxel entre la referencia y una imagen
de la secuencia. De este modo, cuando se esta comparando el fotograma k-simo con la
referencia, la entrada de un pxel dado de la imagen acumulativa proporciona el nmero
de veces que el nivel de gris de esa posicin es diferente del valor correspondiente del
pxel de la imagen de referencia.
Establecimiento d una imagen de referencia
Una de las claves del xito de las tcnicas expuestas en las dos secciones anteriores
consiste en disponer de una imagen de referencia frente a la que se puedan hacer las
Cap9
Reconocimiento e interpretacin de imgenes
1 RECONOCIMIENTO
Esta compuesto de patrones, un patrn es una distribucin, se caracteriza por el orden de los
elementos que lo componen que por la naturaleza intrnseca de stos.
Patrn: descripcin estructural o cuantitativa de un objeto o de alguna otra entidad de
inters en una imagen.
Anlisis de imagen: proceso que consiste en descubrir, identificar y comprender los
patrones que son relevantes en el rendimiento de un trabajo basado en imgenes. Su objetivo
es el dotar a una maquina con una capacidad de aproximacin similar a los humanos.
Inteligencia (caractersticas):
- La capacidad de extraer la informacin de inters, separndola de un conjunto de detalles
irrelevantes.
- La capacidad de aprender a partir de ejemplos y de generalizar este conocimiento para que
se pueda aplicar en nuevas y diferentes circunstancias.
- La capacidad de realizar inferencias a partir de una informacin incompleta.
El reconocimiento de decisin terica se basa en la representacin de patrones en forma
vectorial y en la bsqueda posterior de aproximaciones que permitan agrupar y asignar estos
patrones vectoriales a las diferentes clases de patrones.
Las principales clases de decisin terica son los clasificadores de mnima distancia, los
correladores, los clasificadores de Bayes y las redes neuronales.
Donde cada densidad queda especificada por su vector medio mj y la matriz de covarianza
Cj que se definen como sigue
Donde Ej[.]representa el valor esperado para los patrones de ka clase wj. !cJ es el deter de de
la matriz !Cj!
Se puede utilizar la forma :
* Coeficiente de correlacin
Donde
,
El valor de los pixeles de w(x,y (que se calcula una sola vez ),f(x,y) es el valor medio f(x,y)
en la region coincidente con la actual ubicacin de w ,y los sumatorios se calculan para las
cordenadas comunes a f y w. el coeficiente de correlacion esta normalizado en el rango de -1
a 1.
La figura a)ilustra f(x,y) ,b) se ilustra w(x,y) y en c) imagen del coeficiente de correlacion
Para j= 1,2,..M La ecuacion representa las funciones de decision de Bayes par clases de
patrones gaussianasque tienen una funcion de error de 0-1.
Si todas las matrices de covarianza son iguales Cj=c para j=1,2,,M y quitando terminos
independientes
De esta forma:
Para los patrones de la clase wi y
El clasificador tiene M clases posibles para elegir la hora de clasificar un patron desconocido
dado, denominado clasificador de Bayes
9.3.1 Correspondencias
* Clasificador de mnima distancia:
Queda especificado por el vector medio y la matriz de covarianza de cada clase.
Ejemplo: Sistemas diseados para leer fuentes de caracteres estilizadas tales como el
conjunto de caracteres E-13B:.Aca el disador del sistema controla la naturaleza de entrada.
Los materiales se imprimen en tinta que contiene material magntico que acenta cada
carcter con el fin de simplificar la deteccion.
Donde:
Aadiendo a 9.3-13 en 9.3-11
Donde:
Formas de Conocimiento
- Conocimiento formal o cientfico
Cognicin o deduccin
- Conocimiento proveniente de la experiencia
Reconocimiento o induccin
Cuando tiene suficiente conocimiento y datos disponibles entonces puede tomar una decisin
adecuada.
Fundamentos de la interpretacion
-El problema de la informacin generada por todos estos procesos para intentar interpretar
el significado.
-No existe herramientas generales que haga posible la interpretacin de imgenes no
estructuradas.
-Para la incorporacin del conocimiento humano al proceso de interpretacin se requiere la
eleccin de un formalismo.
Ejemplos:
Deteccin de fallas en soldaduras
Inspector de cajas de botellas vacas para lneas embotelladoras
Taccerebral:
Es la tomografa computarizada (tc) el mtodo neurorradiolgico de mayor utilizacin en
neurologa, llegando a ser el primer examen diagnstico que se realiza despus de la historia
clnica de la mayora de pacientes con patologa neurolgica.
9.4.2 Correspondencia de cadenas
A y B contornos y a1,a2,an y b1,b2bn cadenas M res el numero de correspondencis
netre cadenas si estan en la k-esima posiscion Q:numero de simbolos
Q= max (!A!,!B!) M