Sei sulla pagina 1di 8

Una relacion binaria R en un conjunto A es un conjunto de pares de electos de A.

si el par
de (a,b) pertenece a R, diremos que a esta relacionado con b y normalmente se representara
como aRb. Tomese por ejemplo el conjunto de puntos A = {p 1,p2,p3,p4} ordenados de la
forma:

CAPITULO 1
INTRODUCCION
1.2. REPRESENTACION DIGITAL DE IMAGENES
El termino

imagen monocroma

p1

o simplemente imagen se refiere a uan funcion

bidimensional de intensidad de luz f(x,y), donde x e y representa las coordenadas espaciales

p2

p3

y el valor de f en un punto cualquiera (x,y) es proporcinal al brillo ( o nivel de gris) de la

p4

imagen en ese punto.


Una imagen digital es una imagen

f(x,y) que se ha discretizadotanto en coordenadas


2.1.3 Adaptacin a la iluminacin y discriminacin:

espaciales como en el brillo. Una imagen digital puede considerarse como una matriz cuyos
indices de fila y columna identifican un punto de la imagen y el valor del correspondiente
elemento de la matriz indica el nivel de gris en ese punto. Los elemntos de una distribucin
digital de este tipo se denominan lementos de la imagen, o mas comnmente pixels o pels,
abreviaturas de su denominacin inglesa picture elements.
1.3. ETAPAS FUNDAMENTALES DEL PROCESAMIENTO DE IMGENES.
Adquisicin de imagen.
Es decir adquisicin de una imagen digital para ello se necesita un sensor de imagen y la
posibilidad de digitalizar la seak producida por el sensor. Puede ser una camara de TV,
fotogrfica, monocroma o color.
Procesamiento.
Su funcion es la de mejorar la imagen de forma que se aumenta las posibilidades de xito en
los procesos posteriores.
Segmentacin.
Conssite en partir una imagen de entrada en sus partes constituyentes u objetos. En general
la segmentacin autonoma es una de las labores mas difciles del tratamiento digital de
imgenes.
La descripcion.
Tambien denominada seleccin de rasgos, consiste en extraer rasgos con alguna informacin
cuantitativa de interes o que sean fundamentales para diferenciar una clase de objetos de
otra.
Reconocimiento e interpretacin.
El reconocimiento es el preceso que asigna una etiqueta a un objeto basandose en la
informacin proporcionada por sus descriptores. Interpretacin implica asignar significado
a un conjunto de objetos reconocidos.
Etapas fundamentales del procesamiento digital de imgenes.

1.4. ELEMENTOS DE LOS SISTEMAS DE PROCESAMIENTO DIGITAL DE


IMGENES.
1.4.1. adquisiciond e imgenes.
Para la adquisiciond e imgenes se necesita de dos elemntos, el primero es un dispositivo
fisico sensible a una determinada banda de espectros de energa electromagnetica (como las
bandas de rayos X, ultravioleta, visible o infrarojo) y que produzca una seal electrica de
salida proporcional al nivel de energa detectado. El segundo el denominado digitalizador, es
un dispositivo para convertir la seal de salida del sistema sensible a forma digital.
1.4.2. Almacenamiento
El almacenamiento digital para palicaciones de procesamiento de imgenes cae de lleno en
tres categoras basicas:
1)
almacenamiento a corto plazo, para ser empleado durante el
procesamiento.
2)
Almacenamiento en linea, para una reutilizacion relativamente rpida.
3)
Almacenamiento en archivo. Caracterizado por un acceso poco frecuente.
El tamao de informacin almacenada se mide en bytes (8 bits), Kbytes (kilobytes, o miles
de bytes), Mbytes (megabytes, o millones de bytes), Gbytes (gigabytes, o miles de millones
de bytes), y Tbytes (terabytes, o billones de bytes).
1.4.3. Procesamiento.
El tratamiento de imgenes digitales emplica procedimientos que normalmente se expresan
en forma de algoritmos. As, con la excepcin de la adquisicin de las imgenes y su
representacin, la mayor parte de las funciones de tratamiento de imgenes pueden ser
implementadas en sofware. la unica razon de ser del hardware especialmente en el
procesamiento de imgenes es la necesidad de mayor velocidad en algunas aplicaciones para
evitar algunas limitaciones fundamentalmente de las computadoras.
1.4.4. comunicacin.
La comunicacin en el tratamiento digital implica principalmente, comunicaciones locales
entre sistemas dde procesamiento de imgenes y comunicaciones remotas entre dos puntos
habitualmente para la transmisin de los datos de las imgenes. El hardware y el sofware
para comunicacin local que existe en la actualidad es de fcil acceso para la mayora de las
computadoras.
1.4.5 Presentacion.
Los monitores de televicion monocromo y de color son los principales dispositivos de
presentacion utilizados en los sistemas modernos de procesamiento de imgenes.los
monitores estan gobernados por la salida de una placa de hardware de visualizacion de
imgenes; otros medios de visualizacion incluyen los tubos de rayos catodicos de acceso
aleatorio (CRT)y los dispsitivos de impresin.
CAPITULO 2
FUNDAMENTOS DE LA IMAGEN DIGITAL
2.1. ELEMENTOS DE LA PERCEPCIN VISUAL.
2.1.1 el ojo humano.
Es casi esferico con un dimetro de 2mm rodeado por:
Tres membranas
a)
La cornea: es transparente cubre la parte anterior del ojo; y la esclerotica:
que la continua es opaca y cubre la parte posterior q resta del ojo.
b)
La coroides: esta debajo de la esclerotica, esta constituida por venas que
nutren al ojo con proteinas.
c)
Retina: es la membrana que cubre la parte posterior total del ojo, y
contiens a los conos 6 a 7 millones por ojo ubicados en la foveay 75 a 150
millones de bastones que estan en la retina.
El cristalino
Iris o diafragma.
Cuerpo ciliar
Pupila (color de ojos)
2.1.2 Formacion de la imagen:
El cristalino es una lente flexible que puede cambiar su dimetro segn la tencion de los
cuerpos filiares, si se aprecia un objeto distantes la fibras se tensan haciendo q el cristalino
redusca su dimetro. Lo contrario para ver objetos cercanos.
La percepcin visual tiene lugar por la exitacion relativa de las celular fotosensibles (conos y
bastones)que transforman la energa radiante en impulsos elctricos que luego seran
decodificados por el cerebro.

El rango de niveles de luz a los q es capas de adaptarse el sistema visual humano es enorme
del orden de 1010 desde el umbral escotopico hasta el limite de deslumbramiento muchas
evidencias experimentales indican que la iluminacin subjetiva (iluminacin persivida por el
sistema humano) es una funcion logaritminca de la intensidad de la luz incidente sobre el
ojo.
La capacidad de ojo de discriminar entre cambios de iluminacin para cada nivel especifico
de adaptacin tambien es de considerable interes. un experimento clasico utilizado para
determinar la capacidad del sistema visual humano de discriminar la iluminacin consiste en
en colocar un objeto observando un area palana, uniformemente iluminada, lo
suficientemente grande para q ocupe todo el campo visula. El area es habitualmente simple
difusor d, tal como un vidrio esmerilado, que se ilumina desde atrs con una fuente de luz
cuya intensidad I, puede variarse. A este campo se aade un incremento de iluminacin, I,
en forma de destello de corta duracion que aparece como un circulo. si I no es
suficientemente brillante, el sujeto debe decir no indicando q no persive el cambio.
Conferme aumenta, el sujeto puede dar respuesta positiva si indicando q ha persivido el
cambio. Esto determinara una discriminacin de la iluminacin.
2.2 UN MODELO DE IMAGEN SIMPLE.
El termino imagen se refiere a una funcion bidimensionalmente de la luz y la intensidad, a la
que indicamos f(x,y) donde el valor o amplitud de f en las coordenadas espaciales (x,y) de la
intensidad (iluminacin) de la imagen en este punto. Puesto que la luz es una forma de
energa, f(x,y) de be de ser estrictamente mayor que cero y finita, es decir.
0<f(x,y)<
Las imgenes que se se perciben en las actividades visuales cotidianas provienen
normalmente de la luz reflejada por los objetos. La naturaleza basica de f(x,y) puede estar
caracterizada por 2 componentes: 1) la cantidad de luz incidente procedente de la fuente
sobre la escena contemplada y 2)la cantidad de luz reflejada por los objetos en la escena. De
forma apropiada, recibe el nombre de componentes de iluminacin y reflectancia, de i se
indican por i(x,y) y r(x,y) respectivamente. Las funciones i(x,y) y r(x,y) se conbinan, como
producto, para dar f(x,y):
f(x,y)=i(x,y) r(x,y)
donde:
0<i(x,y)<
y
0<r(x,y)<
2.3. MUESTREO Y CUANTIFICACIN.
2.3.2. Muestreo uniforme y cuantificacion.
Para ser utilizable el procesamiento por medio de computadora. Uan funcion de imagen
f(x,y) debe ser digitalizada tanto especialmente como en su amplitu . la digitalizacin de
coordenadas espaciales (x,y) muestreo de la imageny la digitalizacin en amplitud se
conoce como cuantificacion de nivel de gris.
Se supone que una imagen continua f(x,y) se descrive de forma aproxiamada por una serie
de muestras igualmente espaciadas organizadas en forma de una matriz NxM donde el
elemento de la amtriz es una cantidad discreta:

f(x, y) ~

f(0,0)
f(1,0)

f(N - 1,0)

f(0,1)
f(1,1)

f(N - 1,1)

Y definamos la relacion 4-conexin. En este caso R es el conjunto de pares de puntos de A


que estan 4-conectados; es decir, R = {(p 1,p2),(p2,p2), (p1,p3),(p3,p1) }. Asi p1 esta relacionado
con p2, con p3 y viceversa pero p4 no esta relacionado con ninguno.
Se dice que una relacion R sobre un conjunto A es:
a)
reflexiva si para cada a de A. aRa:
b)
simetrica si para cada a y b de A. aRb implica bRa; y
c)
transitiva si para cada a,b y c de A. aRb y bRc implica aRc.
Una relacion que satisfaga estas tres propiedades se denominan relacion de equivalencia.
2.4.5. Medidas de distancia.
Para los pixeles p, q y z, de coordenadas (x,y), (s,t), (u,v) respectivamente, D es una funcion
de distancia o una metrica si:
a)
D(p,q) 0(D(p,q)) = 0 si y solo si p=q.
b)
D(p,q) = (D(q,p), y
c)
D(p,z) D(p,q) + D(q,z).

- La distancia euclidiana entre p y q esta definida por:


2
2
D e (q, p) x - s y t

El terminod e la derecha de la ecuacin anterio representa comnmente se denomina imagen


digital a cada elemento de la matriz de se le puede denominar elemento de la imagen y pxel
o pel.
Este proceso de digitalizacin necesita dimensiones sobre valores para N y M y el numero
de niveles de griz permitido para cada pxel. En el proceso digital de imgenes es una
practica comn que estas cantidades potencias enteras de 2; es decir:
N = 2n
,
M = 4k ,
G = 2m .
Donde G indica el numero de niveles de gris, consideraremos que los niveles discretos estan
igualmente espaciados entre = y L en la escala de grises. Empleando las ecuanciones
anteriores obtenemos el numero b, de bits necesarios para almacenar una imagen
digitalizada:
B = N x M x m.
Si M = N,
b = N2 x m.
2.3.2. Muestreo no uniforme y cuantificacion.
Para un valor fijo de la resolucion espacial, la apariencia de una imagen puede mejorarse en
muchos casos empleados un esquema adaptativo en el que el proceso de muestreo dependa
de las caracteristicas de la imagen. En general, se necesita un muestreo fino en las
aproximidades de las transiciones bruscas en los niveles de gris. Mientras que se puede
aplicar un muestreo tosco en las regiones relativamente suaves.
La necesidad de identificar los contornos aunque solamente sea de forma aproximada, es uno
de los inconvenientes definidos del muestreo no uniforme. Este metodo tampoco para el
paso de imgenes que contengan regiones uniforme relativamente pequeas; por ejemplo el
muestreo no uniforme seria difcil de aplicar en la imagen de una multitud de personas
densa.
Este metodo esta sujeto a las observaciones precenetes sobre la deteccion de contornos y
contenido en detalles. Una tecnica alternativa que resulta particularmente atractiva para
distribuir los niveles de gris consiste en calcular la frecuencia de aparicion de todos los
niveles permitidos.
2.4. ALGUNAS RELACIONES BASICAS ENTRE PIXELES .
Consideraremos algunas relaciones basicas peor importante entre los pixeles de una imagen
digital. Como se menciona anteriormente una imagen se indica por f(x,y). cuando se haga
referencia a un pxel en particular, se emplearan letras minusculas, por ejemplo p y q. un
conjunto de pixeles de f(x,y) se indica mediante S.
2.4.1. Vecinos de un pxel.
Un pxel p de coordenadas (x,y) tiene cuarto vecinos horizontales y verticales cuyas
coordenadas son:
(x+1,y). (x-1,y), (x,y+1).(x,y-1)
Este conjunto de pixeles, denominados 4 vecinos de p,. se representan por N4(p). cada pxel
esta a una unidad de distancia de (x,y), y algunos de los vecinos p caen fuera de la imagen
digital si (x,y) esta en el borde de la imagen.
Los cuatro vecinos en diagonal del p tienen coordenadas:
(x+1+1,y). (x-1,y-1),
(x-1,y+1).(x-1,y-1)
Y se representan por Np(p) estos puntos, junto con los 4 vecinos se denominan 8- vecinos de
p y se representan por N8(p).
2.4.2. Conectividad.
La conectividad entre pixeles es un concepto importante para establecer los limites de los
objetos y los componentes en areas de una imagen.
Para determinar si dos pixeles estan conectados debe determinarse si son adyacentesen algun
sentido (como ser 4- vecinos) y sus niveles de gris cumplen un criterio especificado de
similitud (como ser iguales); por ejemplo, en una imagen binaria de valores 0 y 1, dos
pixeles pueden ser 4- vecinos pero no estan conectados a menos que tengan el mismo valor.
2.4.3 Etiquetado de componentes conexas.
Imagnese el barrido de una imagen pxel a pxel, de izq. A der. Y de abajo hacia arriba, y
supngase que, por el momento estamos interesados en componentes 4-conexas. Sea p el
pxel en cada paso del proceso de barrido y sean r y t los vecinos superior e izquierdote p,
respectivamente. La naturaleza de secuencia de barrido asegura que cuando se llega a p, los
puntos r y t ya han sido encontrados (y etiquetados si fuesen 1).
2.4.4. Relaciones, equivalencia y clausura transitiva.

1/ 2

Para esta medida de distancia, los pixeles que estan a una distancia menor o igual a algun
valor de r de (x,y) son los puntos contenidos en un circulo de radio r con centro (x,y).
La distancia D4 (denominada tambien la distancia city - block) estre dos puntos p y q se
define:

D 4 (q, p) x s y t
En este caso los pixels que este a uan distancia, de (x,y), D 4 menor o igual que un
determinado valor de r forman un rombo centrado en (x,y). por ejemplo los pixels con una
distancia D4 2 desde (x,y) (el punto central) formaran los siguientes contornos de distancia
constante:

2
2

2
Los pixels con distancia D4 = 1 son los 4-vecinos de (x,y).
La distancia D8 (tambien llamada distancia tablero de ajedrez) entre p y q se define:

D 8 (q, p) max( x s , y t )
En este caso los pixels a una distancia D 8 de (x,y) menor o igual que un cierto valor de r
forman uncuadro centrado en (x,y). por ejemplo, los pixels a una distancia D 8 2 de (x,y) el
(punto central) forman los siguientes contornos de distancia constante:

f(0, M - 1)
2
f(1, M - 1) 2
2

f(N - 1, M - 1)2

2
1
1

2
1
0

2
1
1

2
2
2

1
2

1
2

1
2

2
2

Los pixels con una distancia D8 = 1 son los 8 vecinos de (x,y).


2.4.6. Operaciones aritmtico lgicas.
Las operaciones aritmetico logicas entre pixels se emplean profusion en mayor parte de las
ramas de procesamiento de imgenes. Las operaciones aritmeticas entre pixels p y q son:
a)
Adicion:
p+q
b)
sustraccin:
p-q
c)
multiplicacin: p * q (o tambien pq y p x q)
d)
divisin:
p/q
las operaciones aritmeticas sobre imgenes: completas se realizan pxel a pxel. El principal
empleo de la adicion de imgenes es la reduccion del ruido mediante el promedio de
imgenes. La sustraccin de imgenes es una herramienta basica en el procesamiento de
imgenes medicas, donde se emplea para eliminar informacin estatica de fondo. Uno de los
principales empleos de la multiplicacin (o divicion) de imgenes consiste corregir las
variaciones de los niveles de gris que se deben a una iluminacin no uniforme o a la
respuesta desigual del sensor empleado para captar imgenes.
Las principales operaciones logicas: empleadas en el procesamiento de imgenes son Y
logico (AND), el O logico (OR) y el COMPLEMENTO logico COMPLEMENT,
representado por:
Y:p AND q (o tambien, p.q)
O:p OR q (o tambien, p+q)
COMPLEMENTO:

NOT q (o tambien,

Estas operaciones son funcionalmente completas en el sentido que pueden ser combinadas
para formar cualquier operacin logica, y se utilizan solamente en imgenes binarias,
mientras que las operaciones aritmeticas solo en pixels con varios valores.
2.5. GENERACION DE UNA IMAGEN.
2.5.1. Algunas transformaciones bsicas.
Todas las transformaciones estan expresadas en el sistema de coordenadas cartesiano
tridimensional (3-D), en el que las coordenadas de punto generico se representan por
(X,Y,Z). en los casos que implique imgenes bidimensionales (2-D), se mantiene la
convencin anterior de representacin en minsculas (x,y) para indicar las coordenadas de
un pxel. Hacer referencia a (X,Y,Z) como coordenadas globales de un punto es la
terminologa comn.
Traslacin:
Supongase que s etrata de trasladar un punto de coordenadas (X,Y,Z) a un nuevo
emplazamiento, empleando unos desplazamientos (X o,Yo,Zo). la traslacin se realiza
fcilmente empleando las ecuaciones:
X* = X + X o
Y* = Y + Y o
Z* = Z + Zo
Donde (X* ,Y* ,Z*) sona las coordenadas del nuevo punto. Lo anterior se puede expresar
como:

X *
1
*

Y 0
Z*
0

0
1
0

0
0
1

X0
Y0
Z 0

X
Y

Z

1

A menudo resulta provechoso concatenar varias transformaciones para producir un resultado


compuesto, como una traslacin, seguida de un cambio de escala y finalmente de una
rotacin. El empleo de matrices cuadradas simplifica considerablemente la notacion
necesaria para representar este proceso, la ecuacion anterior se puede reprentar como:

X *

*
Y*

1
0
0
0

0 0
1 0
0 1
0

X
Y

1 1
X0

Y0
Z0

2. La transformada de Fourier Discreta.


Supongamos q una funcin continua f(x) se ha discretizado en la sucesin:
Tomando N muestras separadas x. Para facilitar los comentarios posteriores es conveniente
emplear x indistintamente como una variable discreta o continua, dependiendo del contexto
de la discusin. Para hacerlo se necesita definir: f(x)= f(x0+xx); donde x toma ahora los
valores discretos, 0, 1, 2, , N-1. Teniendo en cuenta la notacin anterior, el par de
transformadas discretas de Fourier q se aplica pa las funciones muestreadas esta dado por:

La representacin matricial sera v* = Av.


Cambio de escala:
El cambio de escala empleando factores S x, Sy y Sz a lo largo de los ejes, X, Y y Z viene
dado por la amtriz de transformacin:

SX
0
s
0

0
Sy
0
0

0
0
SZ
0

X0
0
0

Rotacion:
La forma mas simple de estas transformaciones es la rotacion de un punto sobre un eje de
coordenadas. Para girar un punto alrededor de otro punto arbitrario del espacio se requiere
tres transformaciones: la primera traslada ese punto hasta el origen, la segunda relaiza la
rotacion y la tercera traslada este punto de nuevo a la posicin original.
Concatenacion y transformaciones inversas.
La aplicacin de varias transformaciones puede representarse por una unica matriz de
treasformacion 4x4. por ejemplo , la trasalcion, el cambio de scala y rotacion sobre el eje Z
de un punto v vienen dadas por:
V*
=R0(S(TV))
=Av
donde A es la amtriz 4 x 4, A=R 0ST. Estas matrices generalmente no son conmutativas,
porque el orden de aplicacin es importante.
2.5.2. transformaciones de perspectiva.
Una transformacin de perpectiva (tambin denominada transformacin de imagen) proyecta
puntos del espacio tridimensional sobre un plano. Las transformaciones de perspectiva
desempean un papel central en el procesamiento de imgenes porque proporcionan una
aproximacin al modo en que se forma una imagen viendo el mundo tridimensional. Estas
transformaciones son fundamentalmente diferentes de las presentadas anteriormente porque
son no lineales en els entido que implican la divisin por los valores de las coordenadas.
2.5.3. Modelo de camara.
Este modelo esta basado en la hiptesis de que el sistema de coordenadas global y el de la
camara coinciden.

La figura muestra un sistema de coordenadas global (X,Y,Z) empleado para localizar tanto
los puntos de la camara como los 3-D (indicados por w). tambien muestra el sistema de
coordenadas camara (x,y,z) y los puntos imagen (indicados por c) se supone que la camara
esta montado sobre un pivote que le permite girar en el plano horizontal (pan) un angulo e
inclinarse (tilt) un angulo el primero de ellos (pan) corresponde al angulo entre los ejes x y
X, mientras que el segundo (tilt) correponde a el angulo entre los ejes z y Z. la separacion
del centro del trpode de origen del sistema de coordenadas global viene indicada por w o, y la
separacion del centro del plano imagen con respecto al centro del pivote se representa por el
vector r, de componentes (r1,r2,r3).
2.5.4. Calibracin d e la camara.
Con respecto a la ecuacin ch = PCRGwh, Sea A = PCRG, los elementos de A contienen
todos los parmetros de la camara y, de la ecuacin c h = PCRGwh, ch = Awh. haciendo k=1 en
la representacin homognea se tiene:

ch1

ch 2
ch 3

ch 4

a11
a21
a31

a12
a22
a32

a13
a23
a33

a41

a42

a43

X
Y


a44 1
a14

a24
a34

Las coordenadas de la camara en formas cartesiana son:


x = ch1/ch4
y = ch2/ch4
Sustituyendo ch1 = ch4 y ch2 = ch4 en la anterior y desarrollando producto matricial se tiene:
xch4 = a11X + a12y + a13Z + a14
ych4 = a21X + a22y + a23Z + a24
ch4 = a41X + a42y + a43Z + a44
donde se ha omitido el desarrollo de ch3 debidoa que la relacion con z.
la sustitucin de ch 4 en las dos primeras ecuaciones anteriores da dos ecuaciones con 12
incognitas:
a11X + a12y + a13Z - a41xX - a42xX - a43xZ - a44x + a14 = 0
a21X + a22y + a23Z - a41yX - a42yY - a43yZ - a44y + a24 = 0
el procedimiento de calibracin, por tanto, consiste en :
1)
obtener m 6 puntos del espacio (puesto que hay dos ecuaciones) de coordenadas
conocidas (Xi,Yi,Zi) i = 1,2,3,m.
2)
calcular las imgenes de estos puntos cuando la camara este en la posicin
determinada para obtener los puntos correspondientes en la imagens (x i,yi), i =
1,2,3m.
3)
emplear estos resultados en las 2 ultimas ecuaciones para hallar los coeficientes
desconocidos.
2.5.5. Imagen estetoscopica.
Como se muestra en la figura, la
imagen estetoscopica implica la obtencin de dos
imgenes separadas del mismo objeto (un unico punto w del espacio tridimensional en esta
posicion). La distancia entre los centros de las dos lentes se denomina linea base. El
objetivo consiste en hallar coordenadas (X,Y,Z) del punto w que tiene las coordenadas
(x1,y1) y (x2,y2) en las dos imgenes.

2.6. LA PELCULA FOTOGRFICA


la pelcula fotografica es un elemento importante de los sistemas de procesamiento de
imgenes. a menudo se emplea como medio de registro de las imgenes de entrada, y es
como el medio mas popular de registrar los productos de salida.
2.6.1. la estructura de la pelcula.
esta formada por las capas y componentes siguientes:
1)
una capa superior de gelatina empleada como proteccion contra araazos y
abraciones.
2)
una capa de emulsion con diminutos cristalitos de haluro de plata.
3)
una capa de sustrato para proporcionar la adhesin de la emulsion a base
de la pelcula.
4)
la base o soporte de la pelcula, formada por triacetato de celulosa u otro
polimero similar.
5)
un estrato de refuerzo para evitar que se ondule.

Los trminos u y x estn relacionados por: u= 1/Nx


En el caso de dos variables el par de transformada discreta de Fourier es:

Para x= 0,1,2,, M-1 e y= 0,1,2,, N-1, y

Cuando las imgenes se muestrean con una distribucin cuadrada, M=N y

Cuando se expone la pelicula a la luz, los granos de haluro de plata absorben las frecuencias
opticas y sufren un complejo cambio fisico. los granos que han absorbido una cantidad
suficiente de energa contienen pequeas manchas de plata metalica, denominada centros de
desarrollo. al rebelar la pelcula, la existencia de un unico centro de desarrollo en un grano
de haluro de plata puede precipitar el cambio del grano entero de plata metalica. los granos
que no contienen centros de desarrollo no experimentan este cambio.
despus de revelado la pelcula se fija mediante la extraccin quimica de los restantes granos
de haluro de plata. cuanta mas luz alcanza a una zona de la pelcula. mas haluro de plata se
convierte en revelable y mas denso es el deposito de plata que alli se forma. como los
granos de plata metalica son muy opacos para las frecuencias opticas, se obtiene una imagen
de tonos grises en la que los niveles de brillo estan invertidos, produciendo asi el familiar
negativo fotografico.
2.6.2. caracteristicas de la pelcula.
Contraste:
las pelculas de alto contraste reproducen las diferencias tonales del sujeto como grandes
diferencias de densidad en la fotografia; las pelculas de bajocontraste convierten las
diferencias de tono en pequeas diferencias de densidad. La exposicin E, a la que ha sido
sometida una pelcula se define como energa por unidad de area en cada puntote la region
fotosensible. La exposicin depende de la intensidad incidente, I y de la la duracion de la
exposicin, T. estas cantidades estan relacionadas por la expresin:
E = IT
Velocidad.
La velociada de una pelcula determina cuanta luz es necesaria para producir una cierta
cantidad de plata en el revelado. Cuanto menor es la velocidad, mayor debe ser la exposicin
para determinar una determinada imagen ele estndar de velocidad mas ampliamente
empleado es la escala ASA. Esta escala es aritmetica, siendo el valor asignadoa al velociada
directamente proporcional a la sensibilidad de la pelcula. Un film de 200 ASA es el doble
de rapido d (para un sujeto dado se requieren la mitad de exposicion) que una pelcula de
100 ASA. Otras escalas de velocidades, como el sistema DIM empleado en Europa, son
logaritmicas, cada incremento de tres unidades en el numero DIM de la velocidad duplica la
velocidad. Una pelcula de 50 ASA es equivalente aun DIN 18, un 100 ASA a un DIM21, y
asi sucesivamente.
Las pelculas para exteriores, y algunas de interiores, tienen velocidades comprendidas entre
80 y 160 ASA.
Granulosidad.
La imagen extraida de los cristales de haluro de plata tienen estructura discontinua, lo que le
da la apariencia de granulosidades ampliaciones . el efecto es mas pronunciado en las
pelculas rapidas, que tienen comparativamente cristales mayores; las emulciones mas lentas,
de grano mas fino mas fino, son por lo tanto preferibles en ampliaciones en las que se
necesiten un detalle fino, o en las que sea necesaria una gran ampliacin de los negativos.
Poder de resolucion.
La presicion del detalle que puede resolver una pelcula depende no solo de su granulosidad
sino tambien de la propiedades de dispersin de luz de la emulsion y del contraste con el que
la pelcula reproduce los detalles finos. Los mayores poderes de resolucion se alcanza con
pelculas de grano fino y emulsiones delgadas.
2.6.3. Ajustes de diafragma y del obturador.
Ajuste en el difragama de la lente. una serie de mecanismos aumentan o disminuyen el
tamao de la apertura para controlar la cantidad de luz que atraviesa la lente de la pelcula.
El anillo de control del difragma esta calibrado en una escala de los denominados nmeros f
o nmeros de diafragma que forman series tales como 1,4; 2; 2,8; 4; 5,6; 8; 11; 16; 22, y 32.
los nmeros del diafragma son inversamente proporcional a la cantidad de luz admitida.
Las escalas de las velocidades del obturador, en las camaras actuales, tambien siguen estas
secuencias estandar doblemitad. Las velocidades tipicas son 1.1/2, 1/8, 1/15, 1/30, 1/60,
1/125, 1/500 y 1/1000 de segundo cuanto mayor es la velocidad del obturador, menor es el
tiempo de exposicin obtenido.
El conjunto del diafragma y obturador controlan la cantidad de luz que alcanza a la pelcula
al ajustar la intensidad de la luz y el tiempo durante el cual actua.
CAP3
Introduccion a la transformada de Fourier.- Sea f(x) una funcin continua de la variable real
x. La transformada de Fourier de f(x), indicada por F{f(x)}, se define por la ecuacin:

Para x, y= 0,1,2,, N-1.


3. Algunas propiedades de la transformada de Fourier bidimensional.- El rango dinamico del
espectro de Fourier es habitualmente mucho mayor de lo q los sistemas de visualizacin
ordinarios son capaces de reproducir fielmente, en cuyo caso solo las partes mas brillantes de
la imagen son visibles en la pantalla. Una tcnica muy utilizada q compensa esta dificultad
consiste en representar la funcin: D(u, v) = clog[1+|F(u,v)|]; en lugar de |F(u,v)|, donde c es
una constante de escala y la funcin log realiza la compresin necesaria.
a. Separabilidad.- El par de transformadas discretas de Fourier pueden expresarse en forma
separada como:

b. Traslacion.- Las propiedades de traslacin del par de Fourier son:

Donde la doble flecha indica la correspondencia entre una funcin y su transformada de


Fourier (y viceversa).
c. Periodicidad y simetra conjugada.- La transformada discreta de Fourier y su inversa
son funciones periodicas de periodo N, es decir:
Solo es necesario un periodo de la transformada para especificar F(u,v) completamente en el
dominio de frecuencias.
c. Rotacion.- Si introducimos las coordenadas polares: x = rcos, y=rsen, u=cos
v=sen; entonces f(x,y) y F(u,v) se convierten en f(r, ) y en F(,), respectivamente. La
sustitucin discreta en el par de transformadas de Fourier, tanto en el caso continuo como en
el discreto, proporciona: f(r, +0) F (, +0)
d. Distributividad y cambio de escala.- De la definicin del par de transformadas de
Fourier continuas o discretas,
y en general
en otras palabras la transf de Fourier y su
inversa son distributivas respecto a la suma pero no respecto a la multiplicacin.
e. Valor medio.- Una definicin muy utilizada del valor medio de una funcin discreta
bidimensional es la expresin:

f. Laplaciano.- se define como:

De la definicin de la transformada de Fourier bidimensional:


g. Convolucion y correlacion.-

Convolucion.- La conv de dos funciones f(x) y g(x), indicada por


f(x)*g(x), se define mediante la integral:

. Dada una F(u), podemos volver

Donde es una variable ficticia pa la integracin. La convolucin bidimensional de f e(x,y) y


ge(x,y) esta definida por la relacin:

a hallar f(x) empleando la transformada inversa de Fourier:


. La
transformada de Fouerier de una funcin real es en general compleja, es decir: F(u) = R(u) +
jI(u). Su forma exponencial es:

Correlacion.- La correlacion de dos funciones continuas f(x) y g(x), representada por

; donde j=

f(x)g(x), se define por la relacin:


La transformada de Fourier se puede expresar fcilmente a una expresin de dos variables,
f(x,y). Si esta es continua e integrable y F(u, v) es integrable entonces existe el siguiente par
de transformadas de Fourier:

donde * es el conjugado del complejo. Su


equivalente discreto vendra a ser:

En el caso bidimensional se define como:


El espectro de Fourier, la fase y el espectro de frecuencia son respectivamente:

Para el caso discreto:

h. Muestreo.- Este problema consiste en establecer las condiciones de muestreo bajo las
cuales una imagen continua puede ser completamente recuperada a partir de un conj de
valores muestreados.
* Funciones unidimensionales.- Considere una funcin q se extiende desde - hasta , y se
supoen tb q la transformada de Fourier de f(x) se anula para valores de u fuera del intervalo
[-W, W]. Una funcin q tiene esta propiedad para cualquier valor finito de W se denomina
funcin de banda limitada. Para obtener una versin muestreada de f(x) basta multiplicar
esta funcin por una funcin de muestreo s(x), q consiste en un tren de impulsos separados
x
* Funciones bidimensionales.- Se encuentra definida por:

Para una funcin f(x,y), donde x e y son continuas, se obtiene una funcin muestreada al
formar el producto s(x,y)f(x,y). La operacin equivalente en el dominio de frecuencias es la
convolucion de S(u,v) y F(u,v).
La transformada rpida de Fourier.a.
Algoritmo de la FFT.- esta basado en el mtodo denominado de doblados sucesivos.
Por conveniencia se expresa la ecuacin de la forma:
donde WN= exp[-j2/N] u N se supone de la forma N=2n donde n
es un entero positivo. Entonces N se expresa como: N = 2M donde M tb es un entero
positivo.
b.
Numero de operaciones.- Por induccin el numero de multiplicaciones complejas y
de sumas necesarias para resolver el algoritmo de la FFT es:
m(n) = (1/2)2nlog22n entonces es igual a (1/2)N log 2N y esto es igual a (1/2)Nn n 1
y a(n) = 2nlog22n dndonos por resultado Nn n 1.
c.
FFT inversa.-

Otras transformadas de la imagen separables.- La transformada de Fourier unidimensional


forma parte de una clase de importantes transformadas q pueden expresarse en trminos de la
relacion general:
donde T(u) es la transformada de f(x), g(x,u) es el nucleo
de la transformacin directa, y u toma los valores en el rango 0,1,, N-1. La transformada
inversa es la relacin:

a.

La transformada de Walsh.- Cuando N=2n, la transformada de Walsh de


una funcin f(x), representada por W(u), se obtiene sustituyendo el nucleo:

tenemos

Su transformada inversa es:

b.

La transformada de Hadamard.- Una de las diversas formulaciones del


nucleo de la transformada directa de Hadamard unidmensional es la relacin:

La transformada de Hadamard unidimensional es:

La transformada inversa de Hadamard es:

Los nucleos bidimensionales son:

Transformadas de Hadamar bidimensional:

c.

La transformada del coseno discreta(DCT) .- Se define como:

De forma similar la DCT inversa es:

El correspondiente par DCT bidimensional es:

CAPITULO 4 MEJORA DE IMAGEN


4.1 Fundamentos: El principal objetivo de las tecnicas de mejora es procesar una imagen de
forma que resulte mas adecuada que la original para una aplicacin especifica. Los mtodos
de mejora de la imagen presentados en este capitulo estn basados en tcnicas bien en el
dominio espacial o bien en el dominio de la frecuencia.
4.1.1 metodos en el dominio espacial se refieren a los procedimientos que operan
directamente sobre sobre el dominio espacial q lo conforman los pixeles
4.1.2 metodos en el dominio de la frecuencia se basan en el teorema de convolucion
4.2 Mejora por procesamiento de punto mtodos de procesamiento que se basan slo en la
intensidad de pixels individuales. Los procesos punto a punto se encuentran entre las
tcnicas mas simples de mejora de la imagen.
4.2.1 Algunas transformaicones de intensidad simples
Negativo de imgenes La idea es invertir el orden de blanco a negro, de forma que la
intensidad de la imagen de salida disminuya conforme a la intensidad de la imagen de
entrada aumente.
Aumento del contraste Se trata de dar mas variedad de niveles de gris a una imagen que
tiene pocos niveles de gris. Haciendo visible detalles q antes no eran visibles.
Comprension del rango dinamico Cuando el rango dinamico excede ampliamente la
capacidad del dispositivo de presentacin, en la q solo se vern las partes mas brillantes. En
este caso es preciso comprimir usando la transformacion logartmica o la transformacin de
ley de potencias.
Fraccionamiento del nivel de gris a) Adjudica un valor alto a todos aquellos niveles de gris
del rango de inters y un valor bajo a los restantes. Esta transformacin produce una imagen
binaria. b) Otra es intensificar el rango de niveles de gris deseado, pero al mismo tiempo
preservar el fondo y las tonalidades de gris de la imagen.

Fraccionamiento de los planos de bit Cuando se desea destacar la contribucin q realizan a


la imagen determinados bits, el nivel de gris quedara determinado por 8 bits, al cual hara
correspondencia a una imagen con 8 planos.
4.2.2 Procesamiento de histogramas
Ecualizacion de un histograma El objetivo es obtener un histograma lo mas uniforme
posible, lo cual implica un incremento del rango dinamico de los pixeles, usando la funcin
de distribucin acumulada de niveles de gris, de la imagen de entrada.
Especificacion del histograma Este es usado cuando se desea tener la posibilidad de
especificar determinados perfiles de histogramas capaces de destacar determinados rangos de
grises de la imagen
Mejora local Consiste en planerar funciones de transformacin basadas en la distribucin de
niveles de gris u otras propiedades en la vecindad de cada pixel de la imagen
4.2.3 Sustraccion de imgenes Se obtiene calculando la direncia entre todos los parede de
pixels correspondientes. La resta al igual q la suma de imgenes requiere q ambas imgenes
sean de igual tamao.
4.2.4 Promediado de la imagen El objetivo es reducir los efectos del ruido a base de sumar
un conjunto de imgenes. A mayor sea el numero de imgenes a procesar, el ruidos ser
reducido, y la imagen resultante ser mejor.
4.3 Filtrado espacial
4.3.1 Fundamentos Se emplea mascaras espaciales , estos se denominan filtros espaciales.
Los filtros pasa bajo atenan las componentes de alta frecuencia en el dominio de Fourier,
estas componentes de alta frecuencia caracterizan los bordes y los restantes detalles muy
marcados en la imagen, por ello el efecto de introducir un filtrado de pasa bajo es el de hacer
mas borrosa la imagen. Los filtros pasa alto atenan las componentes de baja frecuencia,
estas componentes son responsables de las caractersticas lentamente variables, contraste
global y la intensidad media, el resultado de este filtrado es la reduccin de estas
caractersticas y en correspondencia una aparente agudizacin de los bordes y de los
restantes detalles finos.
4.3.2 Filtros suavizantes Se emplean para hacer q la imagen aparezca algo borrosa y
tambin para reducir el ruido.
Filtrado espacial pasa bajo (filtro lineal) Este filtro ha de tener todos sus coeficientes
positivos y divididos en el numero de componentes
Filtrado por la mediana (filtro no lineal)Se usa cuanco el objetivo es mas la reduccin del
ruido q el difuminado. En este caso el nivel de gris de cada pixel se reemplaza por la
mediana de los niveles de gris en un entorno de este pixel. Primero se extrae los valores del
pixel y de su entorno, se extrae la mediana, este valor por la mediana se le asignara al pixel.
4.3.3 Filtros realzantes El obejtivo principal es el de destacar los detalles fino de una
imagen o intensificar detalles q han sido difuminados.
Filtrado espacial de paso alto bsico Este filtro ha de tener coeficiente positivo en su
centro y negativos en la periferia, la suma de estos coeficientes ha de ser cero. Ek resultado
de esestara dado por una mejora en los bordes sobre un fondo relativamente oscuro.
Filtrado high-boost Es el resultado de sumar una parte de la imagen original y la imagen q
ha pasado por un filtro pasa alto. Como resultado la imagen de salida se parece ms a la
original con un grado relativo de mejora de los bordes que depende del valor de A. Highboost=(A-1)(original) + paso alto
Filtros diferenciales Esta diferenciacin aumenta la nitidez de la imagen. El mtodo mas
comn de la diferenciacin en aplicaciones de procesado de la imagen es la gradiente.
4.4 Mejora en el dominio de la frecuencia Se trata de calcular la transformada de Fourier
de la imagen a intensificar, multiplicar el resultado por la funcin de transferencia de un
filtro y, finalmente, tomar la transformada de Fourier inversa para llegar a una imagen
mejorada.
4.4.1 Filtrado de pasa bajo el difuminado o suavizado se consigue a base de atenuar un
rango especfico de componentes de alta frecuencia en la transformada de una imagen dada.
4.4.2 Filtrado de paso alto Debido a que los cambios bruscos y bordes de la imagen estn
relacionados con las componentes de alta frecuencia, puede lograrse el realce de la imagen
en el dominio de la frecuencia mediante un procedimiento de filtrado pasa alto, que atena
las componentes de baja frecuencia.
4.4.3 Filtrado homomorfico Este mtodo esta basado en un caso particular de una clse de
sitemas. Conocido como sistemas homomorficos. La clave del mtodo consiste en la
separacin entre las componentes de iluminacin y reflectancia. La funcin de este filtro
homomorfico puede operar separadamente sobre estas componentes.
4.6 Procesamiento de imgenes en color
Primero, en el anlisis automtico de imgenes, el color representa un potente descriptor que
a menudo simplifica la identificacin de un objeto y su extraccin de una escena.
Segundo, en el anlisis de imgenes realizado por seres humanos, el inters por el color
reside en que nuestro ojo es capaz de discernir miles de matices e intensidades de color, en
comparacin con solo dos docenas de niveles de gris.
4.6.1 Fundamentos del color Bsicamente, los colores que los seres humanos percibimos en
un objeto estn determinados por la naturaleza de la luz reflejada por un objeto. La luz
visible est formada por una banda de frecuencias relativamente estrecha del espectro
electromagntico. Existe dos distensiones entre colores primarios de luz y colores primarios
de pigmentos o colorantes, el primero es aditivo mientras el segundo es sustractivo
4.6.2 Modelos de color Es la especificacin de un sistema de coordenadas tridimensional y
de un subespacio de este sistema en el que cada color quede representado por un nico punto
Modelo de color RGB Se basa en la combinacin de tres seales de luminancia cromtica
distinta: rojo, verde, azul
Modelo de color CMY Utiliza El cin, magenta y amarillo q son los colores secundarios de
luz, o bien los colores primarios de los pigmentos
Modelo de color YIQ es una recodificacin del RGB utilizada por su eficacia el transmisin
y para mantener la compatibilidad con los estndares de TV blanco y negro
Modelo de color HSI define su nombre a partir de los tres parmetros que considera; el
color (hue), la luminancia (cantidad de negro en el color) y la saturacin o croma, (cantidad
de blanco).
4.6.3 Procesamiento de imgenes en falso color Nos basamos en algunas propiedades de
su contenido de nivel gris
Division de la intensidad se asigna un color diferente a cada lado de un plano q corta las
intensidades de nivel de gris, cualquier pxel cuyo nivel de gris est por encima del plano se
codificara con un color, cualquier pxel inferior al plano se codificar con el otro. A los
niveles qu estn sobre el propio plano se les puede asignar arbitrariamente uno de los dos
colores. El resultado es una imagen bicoloreada.
Transformaciones de color del nivel de gris consiste en llevar a cabo tres transformaciones
independientemente del nivel de gris de cualquier pxel de entrada. A continuacin los tres
resultados alimentar separadamente los caones rojo, verde y azul de un monitor de TV en
color. Este mtodo produce una imagen compuesta cuyo contenido de color est modulado
por la naturaleza de las funciones de transformaciones . Esta transformaciones son de nivel
de gris de una imagen y no de la posicin de las funciones.
4.6.4 Procesamiento de imgenes en color real
En particular estamos interesados en el modelo HSI por las razones. La intensidad e
informacin del color de este modelo estn desacopladas. El tono y la saturacin estn
ntimamente relacionado con la forma en que los seres humanos describen la percepcin del
color.

Invarianza espacial
Donde H es la respuesta al impulso
Por lo tanto h(x,y) es la funcin de distribucin normal
PSF = point spread function

CAPITULO 5
RESTAURACION DE IMAGENES
Restauracin vs. Mejora
Reconstruccin o recuperacin de imgenes suele basarse en el conocimiento a priori de la
causa de la degradacin
La mejora se basa en los aspectos psico-fsicos del sistema visual humano.
La restauracin pretende recuperar los datos originales de la imagen considerando el proceso
de degradacin que ha sufrido la misma hasta llegar a nosotros.
Tcnicas de restauracin
Deterministas:
Se supone conocida la funcin que degrad la imagen
Se realiza la transformada inversa
Son vlidas si tienen poco ruido
Estocsticas
Se intenta buscar, por inspeccin la funcin de degradacin
Modelo de degradacin
Relacin entrada-salida

depende de la eleccin de la matriz Q entonces es interesante contar con la posibilidad de


elegir Q para que se minimicen los efectos adversos.
Una posibilidad de optimizar Q es usando el criterio de sugerido por Phillips, es formular un
criterio de optimizacin basado en una medida de suavizado, entonces para un caso
unidimensional.
Para una funcin discreta unidimensional: f(x), x = 0,1,2, la segunda derivada en el punto
x es:

g(x,y)=H(f(x,y))+n(x,y)

Esta expresin indica que si se conoce la respuesta de H a un impulso, entonces la respuesta


a cualquier f(,), se puede calcular por medio de esa expresin.
La propiedad de linealidad de la imagen de cualquier objeto complejo se puede "calcular"
cortando el objeto en partes pequeas, registrando sus imgenes independientemente, y
despus sumando todos los resultados. Cuando se divide el objeto en partes extremadamente
minsculas, en partculas puntuales de diferentes intensidades, la imagen se puede concebir
como la suma de muchas PSF, cada una situada en la posicin de cada partcula original y
ajustada su intensidad de acuerdo con la del punto correspondiente.
Las suposiciones q se toman para el anlisis son:
La degradacin es un proceso invariante espacial y lineal.
Las funciones se tratan como funciones peridicas ampliadas, es decir, para un convolucion
se evita la superposicin de los periodos individuales tomando
A y B son los vectores resultantes de muestrear f(x) y h(x). Y a cada uno se les da un
periodo M bajo este criterio rellenando el vector con ceros

Si suponemos que n(x,y)=0 o que no conocemos el ruido

Donde f y g son matrices columnas de tamao m y n respectivamente y H una matriz circular


de tamao MxN
Obtenemos una estimacin de los datos originales dividiendo la imagen por la funcin de
degradacin.
Matriz Circulante: Cada rengln lo puedo convertir a partir del rengln anterior
Por ser una matriz circular los valores se repiten.
Clculo de la PSF
Es la Funcin H de degradacin
A priori (con acceso al sistema de adquisicin):

Clculo terico de la PSF

Calculo experimental: Usando una fuente de imagen

puntual: Punto blanco en fotografa, microbola en microscopa, etc.


A posteriori: Algn punto brillante pequeo o una lnea en la imagen puede servir para el
clculo.
A partir de las matrices circulantes o circulantes por bloques(en 2D) se puede llevar a un
proceso de diagonalizacin.
Este proceso se realiza en base a los autovectores y autovalores de la matriz H.
El resultado de esta operacin es que las matrices nuevas estn dadas por las transformadas
de Fourier de los elementos de las matrices originales.
FILTRADO INVERSO
Se le dice inverso por que se toma la Matriz H como filtro de la operacin

En el espacio de frecuencias simplemente necesitamos realizar una divisin.


Luego pasamos los datos de nuevo al dominio espacial.
FILTRADO INVERSO
Problema:
H(u,v) suele disminuir rpidamente al subir en frecuencias.
El ruido suele tener un espectro plano
En altas frecuencias el ruido domina sobre la seal
La solucin es:Filtrado inverso en frecuencias definidas
Podemos intentar filtrar solo en las frecuencias donde no aparece ruido o es muy pequeo.
Filtro de mnimos cuadrados (Wiener)
Es un Procedimiento estadstico, debido a que esta basado en las matrices de correlacion de
las funciones de ruido e imagen.
Esto implica que los resultados obtenidos al utilizar el filtro Wiener generalmente son
optimos.
Sean Rf y Rn las matrices de correlacin de f y n, definidas respectivamente por las
ecuaciones:

Basndose en la suposicin que la correlacin entre dos pxels cualquiera es una funcin de
la distancia entre los pixels y no de su posicin, Rf y Rn se pueden aproximar a matrices
circulantes por bloques y de esta forma diagonalizarse.
RESTAURACION POR MINIMOS CUADRADOS
La aproximacin por mnimos cuadrados deducida en la seccin anterior es un
procedimiento estadstico, poruqe el criterio de optimizacin esta basado en las matrices de
correlacion de las funciones de ruido e imagen. Esto implica que los resultados obtenidos al
usar el filtro Wiener generalmente son optimos. Sin embrago el procedimiento de
restauracin desarrollado en esta seccin es optimo para cada imagen dada y requiere
solamente el conocimiento del ruido medio de la varianza, tambin se considera el problema
de ajustar para satisfacer la restriccin
La restauracin obtenida al utilizar la ecuacin:

En este caso, un criterio basado en esta expresin podra ser minimizar


esto es:

sobre x

O en notacin matricial

Donde C es una matriz suavizante, y f es un vector cuyos elementos son las muestras de f(x)
Propiedades Importantes:

Aditividad:

Homogeneidad

Notacin matricial:
HaciendoQ=Cyrecordando que:

Codificacin y decodificacin d canal: cuando el medio introduce ruido se agrega


redundancia controlada a la imagen d manera d reducir el ruido dl canal.
Ejemplo d codificacin d canal: agregado d bits d paridad para correccin d errores (mtodo
d Hamming).

Este criterio se puede expresar como:

Elementos d la teora d la info


Fundamento d la TI: la generacin d info se modela como un proceso probabilstico.
La TI tiene bases matemticas en la teora d probabilidad.
Los eventos (en imgenes: valores d grises) son tratados como una variable aleatoria:

Recordando la ecuacin:

Aplicando

los

mismos

del

filtro

Wiener:

La diferencia principal entre esta ecuacin y la ecuacin de wiener es que la ultima no


requiere un conocimiento explicito de los parmetros estadsticos salvo una estimacin de la
varianza y del ruido medio.
RESTAURACIN INTERACTIVA
En muchas aplicaciones, la aproximacin practica es aprovechar la intuicin humana, unida
con la capacidad de una computadora digital, para restaurar imgenes interactivamente. En
este caso el observador controla el proceso de restauracin y sintonizando los parmetros
disponibles, es capaz de obtener un resultado final q puede ser bastante adecuado
Uno de los casos mas simples de degradacin de imgenes que se presta bien a la
restauracin interactiva es la aparicin de un modelo de interferencia sinusoidal
bidimensional (Denominado ruido coherente) superpuesto a una imagen.
Llamemos n(x,y) aun modelo de interferencia (Ruido) sinusoidal de amplitud A y
componentes de frecuencia (uo,vo); esto es:

Aplicando la transformada de Fourier:

Si la degradacin que se considera es el ruido Aadido entonces se deduce:

Si A es bastante grande los dos impulsos de N(u,v) aparecen como puntos brillantes. Si
n(x,y) fuera completamente conocida, se podra restaurar la imagen original (Al restarle
n(x,y) )
A continuacin se presentan ejemplos de restauracin de ruidos de espectro conocido,
mediante filtrados en el espacio de la frecuencia. En este caso, la imagen est afectada por un
ruido sinusoidal, que en la frecuencia aparece como puntos fcilmente visibles. Si
eliminamos esos puntos y realizamos la transformada inversa obtenemos la imagen
restaurada que se observa a la derecha.
RESTAURACIN EN EL DOMINIO ESPACIAL
Despus de haber obtenido un filtro apropiado de restauracin en el dominio de la frecuencia
por cualquier mtodo anterior, a menudo se desea implementar la solucin en el dominio
espacial por medio de una mascara de convolucion, el cual se puede aplicar mas de una vez
en una misma figura. Los coeficientes de la mascara de convolucion se pueden obtener
directamente de una funcin de filtro.
Un mtodo simple para reducir los efectos de la interferencia en este caso consiste en colocar
un filtro tipo ranura que atene los valores de la transformada de Fourier en el eje vertical y
multiplique todos los dems valores de la transformada por 1. Se procede con utilizar el
filtro ranura y tomar la transformada de fourier inversa
TRANSFORMACIONES GEOMTRICAS
A diferencia de las estudiadas hasta ahora , las transformaciones geomtricas generalmente
modifican las relaciones espaciales entre pixels de una imagen.
Las transformaciones geomtricas se denominan a veces transformaciones de hoja elstica
Una transformacin geomtrica se compone de dos operaciones bsicas:
Una transformacin espacial, que define el reagrupamiento de los pixels en le plano de
imagen.
Una interpolacin de nivel de gris, que trata de la asignacin de niveles de gris a los pixels
de la imagen transformada espacialmente.
Transformaciones Espaciales
Supongamos que una imagen f con coordenadas de pxel (x,y) sufre una distorsin
geomtrica produciendo una imagen g con coordenadas:
Esta transformacin se puede expresar como:

Donde r(x,y) y s(x,y) representan las transformaciones espaciales que producen la imagen
distorsionada:

Aplicaciones de la Restauracin de Imgenes


Astronoma
Degradacin de observaciones desde la tierra debido al rpido cambio del ndice de
refraccin de la atmsfera.
En el espacio, a causa del movimiento, combinado con una velocidad de disparo lenta.
Ruido gaussiano por los componentes electrnicos y efectos de la transmisin.
Filtrado de ruido en rayos X y Resonancia Magntica.
Mejora en video grabaciones de cmaras de seguridad, identificacin de placas de
automviles.
Restauracin de cintas viejas y deterioradas.
Eliminacin del ruido producido en la compresin.
CAP6
CAPTURA Y PROCESAMIENTO DIGITAL D SEALES E IMGENES
Fundamentos
-Compresin: reduccin d la cantidad d datos requeridos para representar una imagen
mientras se mantiene la info necesaria.
-La teora d la info (Shannon), es la base terica d las tcnicas d compresin.
-Mtodos d compresin:
Sin prdidas: preservan la info, d manera q la imagen reconstruda a partir d la
comprimida es igual a la imagen no comprimida.
Con prdidas: logran una mayor compresin, xo la imagen reconstruda reproduce d
manera imperfecta la imagen no comprimida.
Diferencia entre datos e info: los datos son los medios por los cuales se lleva la info. Ej:
frases d distinta longitud con el mismo mensaje.
Redundancia d datos: dadas dos versiones d la misma info, los datos redundantes son
aqullos elementos q no aportan info.
Sean n1 y n2 las cantidads d datos q representan una misma info, con n1: versin original, y
n2: versin comprimida.
Se dfinen:
La relacin d compresin:
La redundancia relativa:

Redundancia
d cdigo: los
datos
utilizados
para
representar
la imagen no
se utilizan d
forma
ptima.
Ejemplo: en
un
histograma
con
picos
marcados los
grises d los
picos
son
ms
probables,
por lo q se pued variar la cantidad d bits en la representacin.
Redundancia interpxel: alta correlacin entre pxeles adyacentes.
Estudio d las relaciones geomtricas o estructurales entre los objetos d la escena.

La imagen se transforma a un formato ms


eficiente (usualmente no visual).
Redundancia psicovisual: info no importante
para el sistema visual humano.
La eliminacin d datos psicovisualmente redundantes se dnomina cuantizacin. Operacin
irreversible (compresin con prdidas).
Planteo d mtodos heursticos q mejoran los resultados d la cuantizacin uniforme.
Criterios d fidelidad: medidas d la prdida d info.
Objetivos: tomados d la teora d la info, proporcionan ecuaciones q midn la cantidad d error
en la imagen reconstruda (dscomprimida).
Raz dl error cuadrtico medio:

El mtodo mas frecuentemente usado para solucionar este problema consiste en formular la
traslacin espacial de pxeles usando puntos enlazados que son un subconjunto de pxeles
cuyas ubicaciones en las imgenes de entrada (distorsionada) y salida (corregida) se conoce
con precisin

P(E) se dic q contiene:


unidads d info. I(E): auto-info d E.
La base dl logaritmo dtermina las
unidads. Usual: base 2, lo q da la info en bits.
Ejemplos:
Si P(E) = 1: I(E) = 0. No existe incerteza en el evento, por lo q no se lleva info al comunicar
q el evento ocurri.
Si P(E) =0.5 (lanzamiento d una moneda): I(E) = 1 bit.
Si P(E) = 0.001: I(E) = 10 bits. Si el evento ocurre lleva mucha info.
Canal d info: medio fsico q conecta a la fuente d la info con el dstino.
Modelo matemtico para un sistema d info discreta:

La fuente produce una salida a partir d smbolos dl conjunto A (alfabeto).


La probabilidad d q la fuente produzca aj es P(aj), con Jj =1 P(aj) = 1
La info generada es I(aj) = logP(aj).
Si se generan k smbolos, en promedio el smbolo aj saldr kP(aj) veces, por lo q la info
obtenida d k salidas es:
Por cada smbolo d salida, la info promedio q se entrega se dnomina entropa (en bits):
Ejemplo con 8 niveles d gris, todos equiprobables.
Ejemplo con 8 niveles d gris, todos cero.
Concepto fsico: cuando se incrementa la entropa, ms incerteza (y ms info) se asocia con
cada smbolo d salida.
En una imagen, el no d bits necesarios para representar cada gris ak es l(ak). Ejemplo: en una
imagen d 8 niveles l(ak) = 3
La longitud promedio d bits reqridos para representar cada pxel es:
Ejemplo d imagen d 8 niveles d gris./ Idea d la relacin
entre entropa y longitud promedio.
Ejemplo d la reduccin d cdigo.
Mtodos d compresin sin prdidas
Necesidad d compresin sin prdidas en numerosas aplicaciones:
Imgenes en medicina: conservacin d la calidad diagnstica.
Documentacin legal: prohibicin d compresin con prdida.
Imgenes d difcil o costosa adquisicin.
Razn d compresin tpicas entre 2 y 10.
Estrategias q atacan la redundancia interpxel y/o la d codificacin:
Codificacin d Huffman (cdigo d longitud variable, variable-length coding)
Cdigo d longitud d cadnas (RLC, run-length coding).
Cdigo Lempel-Ziv-Welch (LZW).
Codificacin d Huffman
Cdigo d longitud variable: las palabras d cdigo tienen longituds dsiguales:
Los grises ms probables tienen cdigos ms cortos.
Resuelve el problema d la redundancia d codificacin.
Obtiene un cdigo d longitud mnima: dada la distribucin estadstica d grises (histograma),
el algoritmo busca un cdigo cercano al lmite mnimo (entropa).
Dcodificacin uno-a-uno entre los cdigos d cadnas y los eventos d la fuente.
Algoritmo:
1. Obtener el histograma y las probabilidads d grises.
2. Ordnar las probabilidads en forma dcreciente.
3. Combinar mediante adicin las dos probabilidads menores.
4. Volver al paso 2 hasta q slo quedn dos probabilidads.
5. Retrocediendo en el rbol, generar cdigos alternando 0s y 1s.
Ejemplo: sea una imagen d 2 bits/pxel d tamao 20x20 con histograma:

Cdigo d Huffman obtenido para la imagen:

Raz d la relacin sealruido cuadrtica media:

Criterios d fidelidad: medidas d la


prdida d info.
Subjetivos: requieren la definicin
d escalas d calidad para la evaluacin d las imgenes por observadores humanos.

Se
obtienen
menos
bits
para
representar
grises ms probables (menor info segn la TI). Original: 2 bits/pxel.
Cdigo RLC
El cdigo d longitud d cadnas (en ingls RLC) o la codificacin d longitud d cadna (RLE)
disminuye la redundancia interpxel.
Trabaja contando el nmero d pxeles adyacentes con el mismo nivel d gris. Esta cuenta, la
longitud d ejecucin, es la q se codifica y almacena.
Aproximaciones:
Dar la posicin inicial y la
cantidad d algn smbolo. Ej: para los ceros se codifica con (1,3)(9,2).
Dar solamente la cantidad d smbolos (comenzando con uno particular). Ej: para los ceros se
codifica con 3, 5, 2.
El cdigo d salida es d longitud fija, q pued reducirse con codificacin d Huffman.
Uso estndar en imgenes binarias, con extensin a imgenes en tonos d gris.
Pasos necesarios:
Dfinicin d parmetros: escaneo por filas o columnas, nmero d bits requeridos para la
codificacin (para fila d 2n1 pxels se necesitan n bits).
Convencin para el primer nmero RLC d una fila: ceros o unos.
Conteo y codificacin.
Ejemplo d compresin con escaneo por filas, convencin d primer nmero para el cero, en
una imagen binaria d 7x7:

Modelo dl sistema d compresin


Compresin:

Se resuelve el sistema de ecuaciones para los 8 coeficientes de Ci


Se aplica el mapeo para cada pxel de la imagen no distorsionada a generar, teniendo en
cuenta el juego de coeficientes a aplicar segn la regin correspondiente en la imagen
distorsionada
Interpolacin de Nivel de Gris
El mtodo anterior utilizaba valores enteros de las coordenadas (x,y) para obtener la imagen
corregida. Sin embargo dependiendo de los coeficientes ci se pueden proporcionar valores
no enteros de:
Al aplicar una transformacin, generalmente la localizacin de los pxeles no tiene valores
enteros por lo que se deben asignar grises en la grilla de la imagen.
Es necesario deducir los valores de nivel de gris que debera de haber en esos puntos,
basndose solamente en los valores de pxeles de puntos de coordenadas enteras.

Medida d la info: un evento aleatorio q ocurre con probabilidad

Mapeo: proyeccin d los datos d la imagen en un espacio matemtico no visual,


disminyendo la redundancia interpxel.
Cuantizado: reduccin d la redundancia psicovisual d acuerdo a un criterio d fidelidad.
Codificacin d smbolo: reduce la redundancia d codificacin mediante un cambio d
smbolos.
Descompresin:
Modelo
completo:

Canal: medio d transmisin d la imagen.

Extensin a imgenes d grises: dada la representacin polinmica

Espacial: RLC con prdida, truncado d bloques, codif predictiva


diferencial.
Frecuencial: codificacin d la transformada.
Descomposicin d la imagen en una serie d imgenes binarias, cada una con el m-simo
coeficiente d cada pxel.
Aplicacin dl algoritmo RLC binario a cada plano manera indpendiente.
Resultados medianamente satisfactorios (baja CR). Mayor compresin con preproceso para
reduccin d grises (implica prdida d info).
Problema dl mtodo: peqos cambios en los grises adyacentes puedn causar grands cambios
en los planos, por ej: gris d valor 127 (01111111) y valor 128 (10000000), aumentando el
tamao dl archivo.
Aproximacin alternativa: cdigo d Gray. Propiedad nica: cambia solamente 1 bit entre
grises adyacentes.
Cdigo d Gray: cambia la representacin binaria natural por un cdigo d m-bits gm1gm
. . .g1g0 calculado como
Otro
mtodo:
incluir
los
niveles d
gris
como
parte dl
cdigo,

formando un par (G,L), ej. (3,8): 8 pxeles continuos d gris 3.


Ejemplo d compresin con escaneo por filas, en una imagen d 8x8 d 16 tonos d gris:

RLC con prdida


- Sin prdida: codificacin RLC por planos d bits, xo con el problema d CR < 1 xa imgenes
con cantidad d grises mayor a 16.
- Con prdida:
1. El bloque d cuantizacin reduce la cantidad d grises.
2. Aplicacin d la tcnica estndar a la imagen cuantizada.
3. Conversin a cdigo Gray xa efectividad dl mtodo.
- Algoritmo ms sofisticado: ventana dinmica.
- Permite q los valores dntro d las cadnas sean diferentes, variando en el llamado rango
dinmico d la ventana.
- Rango inicial: fijado a priori.
- Dinmico: los lmites se varan a medida q se leen los grises d la imagen.
- Agregado d grises a la cadna hasta leer un valor fuera d la ventana.
- Codificacin final con dos valores: longitud d cadna y valor representativo d los grises d la
cadna (p. ej., la media).
- Ejm. con la secuencia: 80 82 81 79 78 83 85 86 87, con ancho d ventana Av = 7.
- El primer valor es la referencia: R = 80.
- Se dfinen los lmites d la ventana con:
MIN = R(Av1) = 74 y MAX = R+(Av1) = 86
- Dscompresin: Lv valores aleatorios en el rango [mLv/2,m+Lv/2]
Truncado d bloques
- Esta codificacin realiza las siguientes operaciones:
- Divisin d la imagen en pequeas subimgenes.
- Reduccin d los grises dntro d cada bloq segn propiedads estadsticas locales.
- Sustitucin d los grises d los pxeles por los niveles cuantizados.
- Ejemplo: codificacin en bloques d 4x4 con cuantizados binivel.
- Seleccin d niveles cuantizados q mantengan la media y la varianza d grises.
- C/pixel se compara con la media: si > se asigna 1 (gris cuantizado alto), si no un 0.
- Almacenamiento d 4 bytes por bloq: dos bytes xa los niveles d gris y dos bytes xa la cadna
d 1s y 0s.
- Razn d compresin: 4:1 (16:4).

Seleccin d la transformada
- Ecuacin general d transformacin:

Con [g,h](x, y,u, v): kernel d transformacin directa/inversa.


La transformacin se dfine:
- en 1-D: por una familia d funciones ortogonales (base d la transformada). Ej: la TDF se
dfine por un conjunto d senoidales y cada seal d entrada se expresa como combinacin
lineal d las senoidales d la base.
- en 2-D: por una familia d imgenes base. Cada imagen d entrada se transforma en un
conjunto d coeficientes q dfinen el aporte d cada imagen base a la original.
La eleccin d la transformada dpend d las distorsiones d reconstruccin y la complejidad
computacional toleradas.
- Transformada Walsh-Hamadard (WHT): solamente calcula productos d -1s y 1s, por lo
cual es muy simple d implementar.
- Transformada Discreta d Fourier (DFT): funciones senoidales d periodicidad n (tamao d
las subimgenes).
- Transformada Discreta Coseno (DCT): dada una imagen f (x, y) d NxN se dfine como

Codificacin predictiva diferencial


- Eliminacin d redundancia interpxel.
- Caso SIN PERDIDAS:
- Ventaja: g(u, v, x, y) = h(u, v, x, y) ) beneficioso xa una implementacin hardware.
- Conjunto d imgenes base fijo xa toda la imagen (funciones indpendientes d los datos d
entrada).
- No introduce artefactos d bloques en la imagen reconstruda (como lo hace la DFT) en los
bords d las subimgenes.

Archivo RLC: 9,8,9,4,10,4,9,3,8,5,10,. . ..


Razn d compresin grand cuando la imagen contiene grands zonas d gris constante.
La aplicacin dl RLC en imgenes d grises es apropiado cuando no se tienen muchos niveles
d gris (tpicamente 16).
En imgenes con mucho cambio d grises puedn darse razones d compresin menores a 1. Ej:

Si todos los pxeles son cambiantes respecto a los adycentes se tiene el lmite inferior: CR =
0.5, imagen dl doble dl tamao original.

Error d prediccin:

- Caso CON PERDIDAS:


- Se agrega un cuantificador q absorbe la seal d error y la transforma en un rango d valores
limitado.
- El error cuantizado establece la calidad d la compresin y distorsin asociada al predictor
con prdidas.
- Modelo dl codificador:

- Truncado d coeficientes: mediante una funcin d enmascaramiento

- La transformacin general se convierte en:

- La funcin se construye eliminando coeficientes con poca varianza.


Tamao d la subimagen
- Factor importante q se elige xa reducir la redundancia entre subimgenes adyacentes
- A medida q aumenta, se reduce la redundancia y aumenta el nivel d compresin, xo se
incrementa tambin la complejidad computacional.

Codificacin predictiva diferencial


Eliminacin d redundancia d pxeles q estn prximos espacialmente.
Un mdulo d prediccin codifica slo la nueva info en cada pxel: diferencia entre el valor
actual y el predicho para ese pxel.
Esquema d compresin:
La entrada al predictor tiene en cuenta la cuantizacin al ser funcin d las predicciones
pasadas y el error cuantizado:

- Modlo dl dcodificador:
A medida q llegan pxeles fn al codificador, el mdulo genera un valor para cada pxel
basado en entradas pasadas ( fn), formando el error d prediccin:
codifica el error utilizando cdigo d longitud
variable.
Predictor: combinacin lineal d m pxeles previos

- Tamaos estndar: 8x8 y 16x16.

Se

m: ordn dl predictor,
ai:
prediccin.
Con un predictor d primer ordn: mdulo d prediccin d pxel previo:

coeficientes

Codificacin predictiva diferencial


- Modulacin Dlta:

Con : coeficiente d prediccin (<= 1), : constante positiva.


El proceso

se
dnomina:
codificacin
diferencial
.
Con a = 1:
por filas, el mdulo
predice el valor dl pxel basado en el pxel anterior. El primer pxel se codifica por separado.

La salida
dl cuantizador se representa por un bit, d manera q el codificador utiliza
cdigos d longitud d palabra fija d un bit.

El esquema dl dscompresor es:

Reconstruye en a partir d las palabras d longitud variable y realiza la operacin inversa:


Cdigo LZW
Tcnica q disminuye la redundancia interpxel.
Emplea un "diccionario d traduccin": tabla d cdigos q reemplazan a las apariciones d
grises.
Asigna cadnas d longitud fija (las entradas dl diccionario) a secuencias d longitud variable
(las apariciones d grises).
No requiere conocimiento previo d la probabilidad d ocurrencia d los smbolos.
Guarda en el archivo comprimido los ndices y el diccionario.
Algoritmo patentado q es utilizado en formato GIF, TIF y PDF.
Versiones: LZ77, LZ78 y LZW (1984).
Tcnica q disminuye la redundancia interpxel.
Emplea un "diccionario d traduccin": tabla d cdigos q reemplazan a las apariciones d
grises.
Asigna cadnas d longitud fija (las entradas dl diccionario) a secuencias d longitud variable
(las apariciones d grises).
No requiere conocimiento previo d la probabilidad d ocurrencia d los smbolos.
Guarda en el archivo comprimido los ndices y el diccionario.
Algoritmo patentado q es utilizado en formato GIF, TIF y PDF.
Versiones: LZ77, LZ78 y LZW (1984).
Inicializacin dl diccionario: los smbolos d la fuente se copian en las primeras L entradas.
Tpicamente se utilizan palabras d 12 bits: 4096 cdigos posibles, con los primeros 256
reservados 3840 cdigos vacos para aparicin d cadnas.
Dsbord dl diccionario.
Mtodos con prdida d info
- Aumento d CR con tcnicas q eliminan info psicovisual no significativa.
- Las tcnicas actuales logran:
Con CR = 10.20: no existe diferencia con la imagen original.
Con CR d 50 ms: dgradacin imperceptible o no molesta.
- Dominio d la compresin:

Codificacin predictiva diferencial


- Fenmenos d la compresin (comunes tambin a otros mtodos):
- Si es pequeo: sobrecarga d pendiente (no pued seguir las diferencias grands d grises).
Produce dsenfoque d bords.
Solucin: aumentar el .
- Si el es grand y los grises tienen poca variacin: ruido granular.
Produce superficies granulares (ruido en regiones d gris constante).
Solucin: disminuir el .

Codificacin d la transformada
- Mtodos q transforman el dominio d la imagen (reversiblemente), y codifican una serie d
coeficientes.
- Se intenta encontrar el mnimo nmero d coeficientes q concentren la mayor cantidad d
energa.
- Xa lograr altas tasas d compresin se cuantizan al mismo nivel, o se dscartan, los
coeficientes con magnitud muy pequea (distorsin en la imagen reconstruda).
- Esquema dl proceso d codificacin y dcodificacin:

Asignacin d bits
- Dspus d transformar, la compresin se logra guardando slo una fraccin d los
coeficientes obtenidos.
- Los coeficientes q se almacenan se eligen por dos mtodos:
- Codificacin zonal: se retienen los d mxima varianza.
Es el mismo conjunto xa todas las subimgenes.
- Codificacin por umbral: se retienen los d mayor magnitud.
Conjunto diferente xa cada subimagen.
- Los coeficientes retenidos se cuantizan y codifican.
- El proceso completo d truncado, cuantizado y codificacin d los coeficientes elegidos en la
subimagen transformada se denomina asignacin d bits.
- Codificacin zonal:
1. Se calcula la varianza xa cada coeficiente d los (N/n)2 bloqs d nxn.
2. Se igualan a cero las k varianzas ms pequeas y se codifica.
3. Reconstruccin: se obtiene la IDCT xa cada bloq.
- Alternativamente al paso 2, se puedn reordnar las varianzas por magnitud alreddor dl
origen, y ver el proceso como una mscara d 0s y 1s q se aplica sobre los coeficientes:
- Codificacin por umbral: en cada subimagen, los coeficientes d mayor magnitud se
retienen.
- Tcnica adaptativa, ya q vara la mscara q se aplica a cada subimagen.
- Criterio d truncado:
- Umbral global: es el mismo xa todas las subimgenes. La razn d compresin vara d
imagen a imagen.
- N-mayores: se vara el umbral en cada subimagen xa retener N coeficientes. La razn d
compresin se conoce a priori.
- Umbral variable en funcin d la localizacin dl coeficiente en la subimagen. Razn d
compresin variable entre imgenes.
Estndares d compresin
Organismos d estandarizacin:
- ISO (International Standarization Organization).
- CCITT (Committee of the International Telephone and Telegraph).
Encargados d redactar las normas xa compresin d imgenes binarias y d tono continuo
(monocromas y color), en aplicaciones d cuadro fijo y vido.
Normas d compresin d imgenes binarias:
Diseados originalmente xa codificacin d FAX, se basan en tcnicas d compresin sin
prdidas.
- CCITT Group 3: codificacin RLC 1D (por lneas), con cdigos Huffman.
- CCITT Group 4: codificacin por lneas q toma en cuenta la lnea anterior (referencia),
guardando la posicin d los pxeles d cambio.
Normas d compresin d imgenes d tono continuo:
- Varias normas (algunas en estudio), basadas principalmente en codificacin con prdidas.
- Encargadas por los organismos a universidads, grupos d investigacin y compaas, se
seleccionaron en funcin d su calidad d imagen y tasa d compresin alcanzada.
- JPEG (Joint Photographic Experts Group): estndar q define tres sistemas d codificacin
diferentes
- Sistema base con prdidas: utiliza la DCT y es adcuado xa la mayora d las aplicaciones.
Requerido xa ser compatible JPEG.
- Sistema extendido: xa mayor compresin y aplicaciones d reconstruccin progresiva.
- Sistema indpendiente sin prdidas: xa compresin reversible.
Algoritmo dl sistema base JPEG:
1. Subdivisin d la imagen en bloques d 8x8, procesados a continuacin d izquierda a drecha
y d arriba hacia abajo.
2. Desplazamiento d nivel restando 2(n1), con n: nmero d bits d cada pxel original. Ej: en
256 niveles d grises se resta 127 a cada pxel.
3. Clculo d la DCT.

4. Cuantizacin d coeficientes.
5. Reordnamiento d coeficientes.
6. Codificacin dl coeficiente d brillo mediante DPCM con el brillo dl bloq anterior, y
cdigo Huffman.
7. Codificacin dl resto d coeficientes con cdigo Huffman.
Otras normas:
- JPEG 2000 (ISO/IEC 15441-1:2000): norma q mejora el JPEG al utilizar Transformada
Wavelets. Permite dscomprimir slo porciones d las imgenes. La cuantizacin es diferente
xa cada coeficiente.
Con gran cantidad d patentes d software.
- Vido: agregan tcnicas xa reducir la redundancia temporal entre cuadros.
Normas xa vidoconferencia: CCITT H.261 (T1), sucedido por la
ITU (International Telecommunications Union) H.262, H.263
(baja calidad) y H.320 (ISDN). Utilizan la DCT con DPCM dl
error d prediccin d movimiento.
Normas xa aplicaciones multimedia: dl Motion Picture Experts
Group. Usadas en compresin d vido xa almacenamiento en CDROMS (MPEG-1), compresin NTSC/PAL (MPEG-2), y HDTV
digital y material audiovisual (MPEG-4).
CAP 7 SEGMENTACIN
Deteccin de discontinuidades
Discontinuidad: cambio abrupto en las intensidades de gris.
Tipos bsicos de discontinuidades:
Puntos, Lneas, Bordes
Forma de deteccin: filtrado espacial con una mscara apropiada (ej. w3x3):

donde wi es el coeficiente de la mscara que afecta al valor de intensidad zi.


Luego se aplica umbralizacin para binarizar el resultado.
Deteccin de puntos
Objetivo: Detectar puntos aislados en zonas homogneas.
Se aplica una mscara correspondiente a un pasa altos con suma cero:

donde Lmax es el mximo nivel de gris, f (p) y f (q) son las intensidades de los pxeles p y q
respectivamente.
Por convencin, p va a estar siempre ubicado a la derecha de la direccin del barrido.
Un borde est formado por elementos de borde conectados.
Por una cuestin de simplificacin, se supondr que los bordes empiezan en la primera fila y
terminan en la ltima (no en los costados de la imagen).
Umbralizacin:
Mtodo: muy simple y muy usado.
Fundamento: divisin del histograma mediante un umbral.
Formulacin:

Al aplicar un umbral, u, se genera una particin de la imagen mediante:

Ejemplo: imagen con dos niveles de gris dominantes. Para dividir:


todos los pxeles > T (umbral), forman un objeto.
todos los pxeles < T, forman otro.
Umbralizacion global simple
Es la particin del histograma, utilizando un umbral nico T.
Umbralizacion optima
Mtodo de OTSU
Tcnica de umbralizacin adaptativa para separar dos clases entre s.
Objetivo: Maximizacin de la distancia entre las clases y minimizacin de sus reas.
Una imagen es una funcin bidimensional de la intensidad del nivel de gris, y contiene N
pxeles cuyos niveles de gris se encuentran entre 1 y L.
El nmero de pxeles con nivel de gris i se denota como fi, y la probabilidad de
ocurrencia del nivel de gris i en la imagen est dada por:

binarizacin), los pxeles son divididos en dos clases: C1, con niveles de gris [1, ...., t]; y
C2, con niveles de gris [t+1, ...., L]. Entonces, la distribucin de probabilidad de los
niveles de gris para las dos clases son:

Deteccin de lineas
Objetivo: Detectar lneas de grosor de un pxel con distintas orientaciones.
Se usan las siguientes mscaras:

donde T1 y T2 son dos umbrales no negativos.


Transformada de Hough
Dado p = (xi, yi), existen infinitas rectas de la forma yi = axi+b que pasan por p, para
diferentes valores de los parmetros a y b.
Reescribiendo la ecuacin de la recta en la forma b = xia+yi, se transforma al espacio de
parmetros ab, obteniendo una nica recta para cada punto p.
Sean p y q dos puntos que estn sobre la misma recta en el espacio xy.
Las dos rectas asociadas a p y a q en el espacio de parmetros se
intersectan en (a,b). El valor de a corresponde a la pendiente de la recta en el espacio xy,
mientras que b corresponde a la ordenada al origen.

Problema: para rectas verticales, ainfinito


Solucin: representacin de la recta en coordenadas polares:

siendo D igual a la distancia entre esquinas de la imagen.


N puntos pertenecientes a la recta xcosq j +ysinq j = ri producen N curvas
sinusoidales que se intersectan en (ri,q j) en el espacio de parmetros.

Algoritmo:
b Calcular el gradiente de la imagen y umbralizar el resultado.
b Generar el espacio de parmetros mediante valores equiespaciados de r y q ,
inicializndolo en cero (acumulador).
b Para cada punto de borde de la imagen, calcular la curva correspondiente en el espacio de
parmetros para cada q j, despejando el valor de ri. Incrementar el acumulador en la posicin
(ri,q j).
b La interseccin de curvas en el espacio rq (altos valores en el acumulador) identifica la
colinearidad de los puntos a los cuales corresponden tales curvas.
b Conectar los puntos colineales cercanos (adyacentes o cuya distancia entre s sea inferior a
un umbral).
Teora de Grafos
Grafo:G = (N,U) es un conjunto finito, no vaco, formado por N nodos, junto con un
conjunto U d pares desordenados d elementos d N.
b Arco: Cada elemento (ni,nj) de U. Si los arcos tienen direccin, entonces
G es un grafo dirigido. Cada arco tiene un costo c(ni,nj) asociado.
b En un grafo dirigido, si un arco va de ni a nj entonces nj es un sucesor de ni. El padre de
nj es ni. Los sucesores de un nodo forman lo que se denomina su expansin.
b El nodo de nivel 0 es el nodo raz. Los nodos del ltimo nivel son los nodos objetivo.
b Un camino est formado por una secuencia de nodos n1, ...,ni, ...,nk, donde ni+1 es un
sucesor de ni. El costo de un camino es igual a:

Un elemento de borde (xp, yp)(xq, yq) es el lmite entre dos pxeles


p = (xp, yq) y q = (xq, yq), tales que q N4(p).
Cada elemento de borde tiene un costo asociado:

Esta operacin genera una matriz unidimensional con M entradas que son 0, excepto en
la posicin donde se proyecta el objeto. En t=0, al multiplicar los componentes de la
matriz por:
con x=0,1,...,M-1, da un resultado :

donde k1 es un entero positivo y t es el intervalo de tiempo entre dos fotogramas. En el


2 fotograma (t=1), el objeto se ha movido a las coordenadas (x+1, y), esto es, se ha
movido 1 pxel paralelo al eje ox. Entonces, la repeticin del procedimiento genera :

En el caso de la umbralizacin en dos niveles de una imagen (a veces llamada

Luego se umbraliza el resultado a partir de un umbral T especificado:

Umbralizacin del resultado.


Permite detectar lneas en una determinada direccin (aplicacin de una sola mscara) o en
todas direcciones (suma del resultado de todas las mscaras).
Deteccion de bordes
Borde ideal (perfil=escaln) vs. borde real (perfil=rampa):
Modelo real: el borde est formado por todos los pxeles conectados contenidos en la rampa.
El grosor del borde depende de la pendiente de la rampa (grado de borrosidad).
Mtodo de la primera derivada:
La magnitud de la primera derivada detecta la presencia de borde en un punto.
Deteccin mediante umbralizacin de la derivada primera. Los puntos donde la misma sea
mayor que un umbral pertenecen al borde.
Mtodo de la segunda derivada:
La segunda derivada produce una respuesta doble (indeseable).
El signo de la segunda derivada detecta si un punto est del lado claro u oscuro.
El cruce por cero de la lnea imaginaria que une los valores mximo y mnimo de la derivada
segunda se encuentra aproximadamente en el centro del borde.
Enlazado de bordes
De forma ideal, los puntos detectados con los mtodos anteriores deberan todos pertenecer a
los bordes.
En la prctica, distintos factores (ruido, condiciones de iluminacin, etc.) causan la deteccin
de puntos espreos y bordes discontinuos.
Necesidad de conectar los puntos y segmentos detectados para encontrar los lmites de los
objetos de inters.
Mtodo: Recorrer la imagen de magnitud del gradiente, analizando pequeos entornos (ej.
3x3). Los puntos del entorno que tienen una magnitud y direccin de gradiente similar se
etiquetan como pertenecientes al mismo borde. Por ej., el pxel de borde en (x0, y0)
perteneciente a la vecindad de un pxel de borde (x, y) se conecta al mismo si se verifican
estas dos condiciones:

comparaciones subsiguientes. Como se indic, la diferencia entre dos imgenes en un


problema de imgenes dinmicas tiende a eliminar todos los componentes estacionarios,
dejando solamente los elementos de la imagen que corresponden al ruido y a los objetos
en movimiento.
En la practica, no siempre es posible la obtencin de una imagen de referencia solamente
con elementos estacionarios, y se hace necesaria la construccin de una a partir de un
conjunto de imgenes que contienen uno o ms objetos en movimiento.
Un procedimiento para generar una imagen de referencia es el siguiente: considrese que
la primera imagen de una sucesin es la de referencia. Cuando un componente no
estacionario se ha movido completamente fuera de su posicin en el fotograma de
referencia, el fondo correspondiente del fotograma actual puede duplicarse en la posicin
ocupada originalmente por el objeto en el fotograma de referencia. Cuando todos los
objetos en movimiento se han desplazado completamente fuera de sus posiciones
originales, una imagen de referencia contendr solamente los componentes estacionarios
que se han ido creando.
Tcnicas en el dominio de la frecuencia
Considrese una sucesin f(x,y,t) , t=0,1,...,T-1 de T fotogramas de imgenes digitales de
tamao M x N generadas por una cmara estacionaria.
Para empezar, supongamos que tenemos un objeto de 1 pxel de intensidad unidad que se
esta moviendo con velocidad constante sobre el eje ox.

La expresin anterior segn la formula de Euler, se puede expresar como:

Como en el ejemplo nos movemos 1 pxel, v1=1 y la frecuencia es igual a k1.


Como t varia entre 0 y T-1 en incrementos enteros, da lugar a que la transformada de
Fourier discreta de la sinusoide compleja tenga picos: uno localizado en la frecuencia
v1k1 y el otro en la (T-v1)k1 (ste ultimo se ignora).
De este modo la bsqueda de un pico en el espectro de Fourier proporciona v1k1. La
divisin de esta cantidad por k1 da v1, que es la componente de la velocidad en la
direccin del eje ox. De forma similar, las proyecciones sobre el eje oy podran dar v2, la
componente de la velocidad en la direccin de dicho eje.
La unidad de velocidad es en pxel por numero total de fotogramas. Por ejemplo, v1=10
se interpreta como un movimiento de 10 pxel en T fotogramas.

Tambin, la media para la clase C1 y la clase C2 es

Sea T la intensidad media de toda la imagen. Es fcil demostrar que:

Usando anlisis discriminante, Otsu defini la variancia entre clases de una imagen
umbralizada como:

Para una umbralizacin de dos niveles, Otsu verific que el umbral ptimo t* se elige de
manera que B2 sea mxima; esto es:

Segmentacin orientada a regiones


Crecimiento de regiones
La agregacin de pixeles comienza con un conjunto de puntos generadores, a partir de
los cuales van creciendo las regiones al agregar a cada uno de estos puntos los pixeles
prximos que tienen propiedades similares.
Por ejemplo, empleando dos puntos generadores se obtiene una segmentacin que
contiene al menos 2 regiones.
La propiedad que se utiliza para incluir un pixel en una region es que la diferencia entre
el nivel de gris de ese pixel y el del generador sea menor que un umbral T.
Division y fusion
Una alternativa al crecimiento de regiones consiste en subdividir la imagen inicialmente
en un conjunto de regiones arbitrarias disjuntas y despus fusionar y/o dividir las
regiones para satisfacer las condiciones de segmentacin.
A continuacin se describe un algoritmo de divisin y fusin.
Supongamos que R1 es una imagen completa y seleccionamos un predicado P.
Se subdividir en regiones Ri que cumplen P(Ri)=Verdadero.
Dividir Ri en cuatro cuadrantes si P(Ri)=Falso (criterio de homogeneidad no se cumple)
Unir 2 regiones adyacentes Ri y Rj si P(RiURj)=Verdadero (criterio de homogeneidad se
cumple)
Parar cuando no se puede ni unir ni dividir ninguna regin.
La eleccin de los parmetros (mnimo tamao de bloque, etc.) influir mucho en el
tiempo de computacin as como en los resultados.
El criterio de homogeneidad es muy dependiente de la aplicacin, pero la idea general es
seleccionar caractersticas que son similares dentro del objeto y diferentes en los objetos
de alrededor.
Ejemplo: medida de homogeneidad = varianza de los niveles de gris. Tendr que ser
menor que un cierto umbral.
Uso del movimiento en segmentacin
Uno de los mtodos ms sencillos para detectar cambios entre dos fotogramas f(x,y,ti) y
f(x,y,tj), tomados en los instantes ti y tj respectivamente, es comparar las dos imgenes
pxel a pxel.
Un procedimiento para hacerlo es formar una imagen diferencia.
Supngase que se tiene una imagen de referencia que contiene solamente componentes
estacionarios. Al comparar esta imagen con una imagen subsiguiente que tenga el mismo
entorno, pero que incluya objetos en movimiento, se obtiene la diferencia de las dos
imgenes, que elimina los componentes estacionarios, dejando solamente las entradas
distintas de cero, que corresponden a los componentes no estacionarios de la imagen.
Una imagen diferencia de otras dos tomadas en los tiempos ti y tj se puede definir como:

donde es un umbral.
Obsrvese que dij(x,y) tiene un 1 como coordenadas espaciales (x,y) solamente si la
diferencia de nivel de gris de dos imgenes es apreciablemente diferente de estas
coordenadas, segn el valor determinado por el umbral .
En la practica, las entradas de dij(x,y) de valor 1 aparecen a menudo a causa del ruido.
Normalmente, estas entradas son puntos aislados de la imagen diferencia, y un mtodo
sencillo para eliminaras consiste en formar regiones 4 u 8 conexas de valores 1 en
dij(x,y) e ignorar despus cualquier regin que tenga menos de un numero
predeterminado de entradas.
Metodo de diferencias acumulativas
Como ya se ha indicado, una imagen diferencia contiene a menudo entradas aisladas que
son producto del ruido. Aunque el nmero de estas entradas se puede reducir o eliminar
completamente por un anlisis de conectividad umbralizado, este proceso de filtrado
puede tambin eliminar objetos pequeos o de movimiento lento. Nosotros resolveremos
este problema considerando los cambios en la posicin de un pxel sobre varios
fotogramas, introduciendo as una memoria del proceso. La idea bsica consiste en
ignorar los cambios que se producen espordicamente en una sucesin de fotogramas y
que por ello pueden atribuirse a un ruido aleatorio.
Considrese una sucesin de fotogramas de imagen f(x,y,t1), f(x,y,t2), ..., f(x,y,tn), y sea
f(x,y,t1) la imagen de referencia. Para formar una imagen de diferencia acumulativa se
compara la imagen referencia con cada una de las imgenes subsiguientes de la
secuencia.
Un contador de cada posicin de pxel de la imagen acumulativa se incrementa cada vez
que se produce una diferencia en dicha posicin de pxel entre la referencia y una imagen
de la secuencia. De este modo, cuando se esta comparando el fotograma k-simo con la
referencia, la entrada de un pxel dado de la imagen acumulativa proporciona el nmero
de veces que el nivel de gris de esa posicin es diferente del valor correspondiente del
pxel de la imagen de referencia.
Establecimiento d una imagen de referencia
Una de las claves del xito de las tcnicas expuestas en las dos secciones anteriores
consiste en disponer de una imagen de referencia frente a la que se puedan hacer las

Cap9
Reconocimiento e interpretacin de imgenes
1 RECONOCIMIENTO
Esta compuesto de patrones, un patrn es una distribucin, se caracteriza por el orden de los
elementos que lo componen que por la naturaleza intrnseca de stos.
Patrn: descripcin estructural o cuantitativa de un objeto o de alguna otra entidad de
inters en una imagen.
Anlisis de imagen: proceso que consiste en descubrir, identificar y comprender los
patrones que son relevantes en el rendimiento de un trabajo basado en imgenes. Su objetivo
es el dotar a una maquina con una capacidad de aproximacin similar a los humanos.
Inteligencia (caractersticas):
- La capacidad de extraer la informacin de inters, separndola de un conjunto de detalles
irrelevantes.
- La capacidad de aprender a partir de ejemplos y de generalizar este conocimiento para que
se pueda aplicar en nuevas y diferentes circunstancias.
- La capacidad de realizar inferencias a partir de una informacin incompleta.
El reconocimiento de decisin terica se basa en la representacin de patrones en forma
vectorial y en la bsqueda posterior de aproximaciones que permitan agrupar y asignar estos
patrones vectoriales a las diferentes clases de patrones.
Las principales clases de decisin terica son los clasificadores de mnima distancia, los
correladores, los clasificadores de Bayes y las redes neuronales.

En el reconocimiento estructural los patrones se representan en forma simblica, y los


mtodos se basan en el emparejamiento de smbolos como sentencias de un lenguaje
artificial.
La interpretacin de una imagen consiste en asignar un significado a un conjunto de
elementos reconocidos en dicha imagen, tambin es la organizacin efectiva y el empleo del
conocimiento acerca del domino especifico de un problema.
Las tcnicas actuales para la interpretacin de imgenes se basan en la lgica de
predicados, en redes semnticas y en sistemas de produccin.
9.1 Elementos del anlisis de imgenes
Se divide en tres reas: Procesado de bajo nivel, procesado de nivel intermedio y procesado
de alto nivel.

* Clasificador de Bayes para clases de patrones gaussianas


Consideremos un problema unidimensional (n=1) que incluye 2 clases de patrones (M=2)
gobernadas por densidades gaussianas, con medias m1 m2 y desviaciones tipicas

Donde los patrones son escalares,de notacion x

* Correspondencia por correlacion


Replicas de una subimagen w(x,y) de tamao J x K dentro de una imagen f(x,y) de
dimension M x N donde se supone

La umbralidad se puede considerar como una operacin de realzado (preprocesado) o como


una herramienta de segmentacin, dependiendo de la aplicacin concreta.
El procesado de bajo nivel trata de un tipo de funciones a las que se puede considerar como
reacciones automticas, y que no requieren inteligencia por parte del sistema de anlisis de
imgenes.
El procesado de nivel intermedio se refiere a la labor de extraccin y caracterizacin de los
componentes de la imagen que se obtiene de un proceso a bajo nivel.
El proceso de alto nivel comprende el reconocimiento y la interpretacin.
9.2 Patrones y clases de patrones
En el anlisis de una imagen es fundamental realizar, en algn nivel, un reconocimiento de
patrones.UN PATRON es una descripcin estructural o cuantitativa de un objeto o de alguna
otra entidad de inters en una imagen.Una clase de patrones es una familia de patrones que
comparten algunas propiedades comunes.Las clases de patrones se representan por W1, W2,
W3,..,WM. Donde M es e numero de clases.
Las 3 representaciones de patrones principalmente utilizadas en la prctica son los vectores
(para descripciones cuantitativas), las cadenas (para descripciones estructurales) y los
rboles.
Este patrn puede ser muestreado y expresado en trminos de un patrn vectorial; con este
mtodo de descripcin se perdera la estructura bsica, que consiste en la repeticin de dos
sencillos elementos primitivos, ejemplo:
Queremos describir 3 tipos de iris:
-Iris setosa
-Iris virginica.
-Iris versicolor.
Por la medida de su longitud y la anchura de sus ptalos.

Es la correlacion de f(x,y) y w(x,y)


Donde s=0,1,2,..M-1 t=0,1,2,N-1
En el caso mas general de dimension n ,la densidad gaussiana de los vectorews de la j-esima
clase de patrones tiene la forma :

Donde cada densidad queda especificada por su vector medio mj y la matriz de covarianza
Cj que se definen como sigue

Donde Ej[.]representa el valor esperado para los patrones de ka clase wj. !cJ es el deter de de
la matriz !Cj!
Se puede utilizar la forma :
* Coeficiente de correlacin

Sustituyendo 9.3-17 en 9.3-24


Las 3 clases de patrones :w1, w2 , w3
Tendra mas sentido definir los elementos a y b y hacer que el patrn sea la cadena de
smbolos w=.ababab. .Patron de forma escalera. Este patron puede ser muestreado y
expresado en terminos de un patron vectorial Donde el patron es la cadena de simbolos w
=...ababab

Donde
,
El valor de los pixeles de w(x,y (que se calcula una sola vez ),f(x,y) es el valor medio f(x,y)
en la region coincidente con la actual ubicacin de w ,y los sumatorios se calculan para las
cordenadas comunes a f y w. el coeficiente de correlacion esta normalizado en el rango de -1
a 1.
La figura a)ilustra f(x,y) ,b) se ilustra w(x,y) y en c) imagen del coeficiente de correlacion
Para j= 1,2,..M La ecuacion representa las funciones de decision de Bayes par clases de
patrones gaussianasque tienen una funcion de error de 0-1.
Si todas las matrices de covarianza son iguales Cj=c para j=1,2,,M y quitando terminos
independientes

Si ademas C=1 siendo I la matriz de identidad y P(wj) para j=1,2,.. M. entonces

La fig. 9.11 muestra una sencilla distribucin de 2 clases de patrones en 2


dimensiones.Utilizamos estos patrones para ilustrar la mecanica de la implementacin del
clasificador de Bayes.
Fotografa area ,representa una escena compuesta de 2 zonas terrestres: rurales y urbanas
.La representacion del arbol invertido mostrada en la figura 9.5(b se obtuvo utilizando la
relacion estructural)

9.3.2Clasificadores estadsticos ptimos


-Fundamentos, Se desarrollara una aproximacin probabilstica al reconocimiento.
La probabilidad de que un patron concreto, x provenga de una clase wj cuando realmente
proviene de wi ,incurre en un error de notacion Lij . La clase de wj es

Se denomina riesgo condicional o perdidas:

9.3.- Mtodos de Decisin Terica


Se basan en la utilizacin de funciones de decisin (o discriminantes).Supongamos que:
Representa un patrn vectorial de dimensin como se vio en 9.2 .Para M clases de patrones
por decisin terica consiste en encontrar M funciones de decisin d1(x), d2(x),.
dM(x),que tenga la propiedad de que ,si un patrn x pertenece a la clase wi

Donde di(x) toma el mayor valor numerico


La frontera de decisin
Separa la clase wi de la wj viene dada por valores de x para los que

De esta forma:
Para los patrones de la clase wi y

Donde p(k/wk) es la funcion densidad de probabilidad de los patrones de la clase wk y


P(wk)es la probabilidad de ocurrencia de la clase wk y 1/p(x) es +

El clasificador tiene M clases posibles para elegir la hora de clasificar un patron desconocido
dado, denominado clasificador de Bayes

Al aplicar la ecuacion 9.3-23 las 2 clases de patrones se ontiene 2 matrices de covarianza en


este caso son iguales

En muchos problemas de reconocimiento, el error de una decision es cero


Dado que las matrices de covarianza son iguales entonces las funciones de decisiones de
Bayes vienen dadas por 9.3.-27 si P(w1)=P(w2)=1/2 se puede descartar Ln P(wi)
obteniendo:

para los patrones de clase wj:


El principal objetivo de la presentacin de esta seccin es desarrollar varias tcnicas que
permitan encontrar funciones de decisin que satisfagan la ecuacin

9.3.1 Correspondencias
* Clasificador de mnima distancia:
Queda especificado por el vector medio y la matriz de covarianza de cada clase.
Ejemplo: Sistemas diseados para leer fuentes de caracteres estilizadas tales como el
conjunto de caracteres E-13B:.Aca el disador del sistema controla la naturaleza de entrada.
Los materiales se imprimen en tinta que contiene material magntico que acenta cada
carcter con el fin de simplificar la deteccion.

Los patrones de la figura se obtiene:m (medias)

Donde:
Aadiendo a 9.3-13 en 9.3-11
Donde:

Desarrollando dj(x),sebtienen las siguientes funiones de decisin:


El clasificadorde Bayes asigna entonces un aptron xa la clase wi
Entonces la superficie de decisin que separa las 2 clases es:
Su forma equivalente:
En la figura 9.11 muestra una seccin de esta superficie ,donde observamos que las clases se
han separado de forma efectiva.

9.3.3 Redes Neuronales


Tambien llamadas: neurocomputadoras, PDP modelos de procesamiento paralelo
distribuido, sistemas neuromrficos, redesmulticapa autoconfigurablesy modelos
conexionistas.
Utilizamos estas redes como vehculos para el desarrollo de los coeficientes de las funciones
de decisin mediante la presentacin sucesiva de conjuntos de patrones de entrenamiento.
Es el proceso de utilizar un conjunto de entrenamiento para obtener funciones de decisin.
Viene a ser la utilizacin de una multitud de elementos de clculos no lineales y elementales
(denominadas neuronas), organizados como redes que se asemejan a la forma en que se
piensa que estn interconectadas neuronas en el cerebro.
* Perceptrn para 2 clases de patrones
El perceptrn aprende una funcin de decisin lineal que dicotomiza 2 conjuntos de
entrenamiento linealmente separables.
* Algoritmos de entrenamiento
- Clases linealmente separables,
Este metodo de emntrenamiento se basa se basa claramente en un concepto de premio y
castigo.La recompensa de la maquina por clasificar correctamente un patron es en realidad
la ausencia del castigo
La regla del factor de correccion fijo converge en un numero finito de etapas si los 2
conjuntos de entrenamiento son linealmente separables.
- Clases no separables
Conocida como regla delta de minimos cuadrados o regla Widrow Hoff, minimiza el error
entre la respuesta y real y la deseada.
* Redes neuronales multicapa alimentadas hacia adelante
- Arquitectura bsica, Consta de numerosas capas de nodos de calculo estructuralmente
identicas y dispuestas de modo que la salida de cada neurona de una determinada capa
alimenta las entradas de todas las neuronas dela siguiente capa.
- Entrenamiento por retropropagacin

- Complejidad de las superficies de decisin


Una red de 3 capas es capaz de implementar superficies de decision arbitrariamente
complejas que resultan de la intercepcion de planos.
9.4.- Mtodos Estructurales
Los metodos estructurales tratan de de lograr el reconocimiento del patrn..
9.4.1 Correspondencia de numeros de forma
Ejemplo: Supongamos que se tiene una forma F y deseamos hallar la forma mas parecida de
un conjunto de otras5 (A,B,C,D Y E) tal como e muestra en la figura

Inferencia mediante la demostracion de teoremas


9.5.4 Redes Semnticas
Son grafos dirigidos y etiquetados en los que los nodos normalmente representan objetos o
variables y los arcos representan relaciones entre dichos nodos.
Ofrecen una forma alternativa de realizar tareas de interpretacin.
La construccin de una red semntica a partir de expresiones en forma clausulada e
inmediata
9.5.5 Sistemas expertos de produccin
Ofrecen un enfoque alternativo a los tipos de inferencia .
Como en el calculo de predicados y las redes semnticas ,los sistemas expertos de
produccin requieren una concordancia para poder identificar la inferencia a realizar. Esta
flexibilidad de respuesta ha provocado un gran inters en el desarrollo de sistemas de
produccin
Los sistemas expertos han sido utilizado con xito en diversas aplicaciones ,desde el
procesado de imgenes ,la inspeccin industrial hasta los diagnosticos mdicos y el control
de procesos.
Componentes:

Formas de Conocimiento
- Conocimiento formal o cientfico
Cognicin o deduccin
- Conocimiento proveniente de la experiencia
Reconocimiento o induccin
Cuando tiene suficiente conocimiento y datos disponibles entonces puede tomar una decisin
adecuada.
Fundamentos de la interpretacion
-El problema de la informacin generada por todos estos procesos para intentar interpretar
el significado.
-No existe herramientas generales que haga posible la interpretacin de imgenes no
estructuradas.
-Para la incorporacin del conocimiento humano al proceso de interpretacin se requiere la
eleccin de un formalismo.

Ejemplos:
Deteccin de fallas en soldaduras
Inspector de cajas de botellas vacas para lneas embotelladoras
Taccerebral:
Es la tomografa computarizada (tc) el mtodo neurorradiolgico de mayor utilizacin en
neurologa, llegando a ser el primer examen diagnstico que se realiza despus de la historia
clnica de la mayora de pacientes con patologa neurolgica.
9.4.2 Correspondencia de cadenas
A y B contornos y a1,a2,an y b1,b2bn cadenas M res el numero de correspondencis
netre cadenas si estan en la k-esima posiscion Q:numero de simbolos
Q= max (!A!,!B!) M

La similitud entre A y B se mide :


R=infinito cuando existe una correspondencia total.
R=0 no hay correspondencia entre los simbolos de A y B
El mayor grado de correspondencia se obtienen con el mayor valor de R.
9.4.3 Mtodos Sintcticos
Es un de las tcnicas mas uasada en la gestin de problemas de reconocimiento de estructura
.Basicamente consiste en la especificacion de un conjunto de primitivas de patrones, un
conjunto de reglas que gobierna su interelacion y un reconocedor cuya estructura esta
determinada por elconjunto de reglas que impone la gramatica.
* Reconocimiento Sintactico de cadenas
Las imgenes han sido expresadas en forma de cadenas utilizando los elementos primitivos
apropiados
- Gramaticas de cadena
Las gramaticas de cadena se caracterizan por la forma de sus producciones .En el
reconocimiento sintactico de patrones son de especial interes las gramaticas regulares y las
gramaticas libres de contexto

Las gramaticas regulares


Donde A y B pertenecen a N y a pertenece a la .
Las gramaticas libres de contexto
donde A pertenece a N y
pertenece
cualquier cadena compuesta de terminales y no terminales a ecepcion de la cadena vacia
- Uso de la semntica, se almacenan en una base de conocimiento como se muestra
.Basicamente ,la sintaxis inherente a las reglas de producion define la estructura de un objeto
,mientras que la semantica define si es corecto o no
- Automatas reconocedores de cadenas
Reconoce u patron pertenece al lenguaje L(G) generado por una gramatica G.
* Reconocimiento Sintactico De Arboles
- Gramatica de arbol,
- Automata de arbol, Debe empezar en cad nodo dela frontera de un arbol de entrada y
continuar por caminos paralelos hacia la raiz.
* Aprendizaje
Las tcnicas de reconocimiento sintctico analizadas requieren la especificacin de
autmatas reconocedores apropiados para cada clase en consideracin.
2 (9.5)INTERPRETACIN
Se va a dar el significado de una imagen ,este proceso tambin suele llamarse comprensin
de imgenes o anlisis de escenas .
9.5.1 Fundamentos.-.Las dificultades se producen tanto por la gran cantidad de datos que se
deben procesar como por la falta de herramientas bsicas de procesado necesarias
Se puede considerar 2 etapas para la interpretacin.
1)Limitar la generalidad del problema.
2)Intentar incorporar el conocimiento humano al proceso.
Las 3 tcnicas mas importantes son:
1) La lgica formal.
2) Redes semnticas.
3) Sistemas de produccin .
9.5.2 Tipos de Conocimientos
Anteriormente las divisiones que se han dado fueron para algoritmos. Para clasificar los
grados de conocimiento:
-Conocimiento procedimental (seleccin y ajuste de los parmetros ).
-Conocimiento Visual (Distintos aspectos de la formacin de las imgenes).
-Conocimiento Universal.(Conocimiento Global en el ambito de un problema ,relacin
escena -entorno)
9.5.3 Sistemas lgicos calculo de predicados
Los componentes elementales del calculo de predicados son: los smbolos de predicado,
simbolos de funcin, simbolos variables y simbolos constantes.
Ejemplos de clausulas
Algunas equivalencias importantes

Potrebbero piacerti anche