Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
tema [5, 11, 18, 21] sólo discriminan un pequeño conjunto 1.2. Arquitectura de la propuesta
de emociones, los cuales están basados en el trabajo real-
izado por Charles Darwin. Adicionalmente, las anteriores La idea principal de este trabajo se centra en clasificar
técnicas no soportan eficazmente las traslaciones del rostro los patrones de movimiento en las secuencias de imágenes
dentro de la secuencia de video. del rostro situado frente al ordenador, para ello primero
enmallamos el rostro y apartir de ese instante inicia el
proceso de clasificación.
2. Reconocimiento de expresiones
faciales con flujo óptico
Dentro de nuestra propuesta están implicadas varias tec-
nologı́as, dentro de las cuales podemos nombrar: Detec-
ción de movimiento en secuencias de imágenes, seguimien-
to de objetos, clasificación de patrones entre los más im-
portantes.
Figura 1: Sistema de coordenadas para el sistema prop- Por medio de la diferencia de imágenes se pueden encon-
uesto trar los cambios que existen entre una imagen y otra. El
costo computacional que se requiere invertir con este tipo
de aproximación es reducido, en comparación con méto-
Esta referencia nos permite posicionar la malla sobre el dos donde se ejecuta correlación. Sin embargo, presenta
rostro adecuadamente para lograr una correcta estimación el problema de no poder eliminar el ruido. Ası́ mismo, la
del movimiento, sin importar la inclinación. operación de diferenciación no proporciona información de
3
cómo se llevó a cabo el movimiento, además detecta cam- cionar un subconjunto de ellos antes de proporcionar los
bios de luz y sombra. datos al clasificador SVM. Sin embargo en nuestro trabajo
Los métodos basados en caracterı́sticas se apoyan en la reducimos las muestras a vectores de 216 atributos reales,
elección de un conjunto de primitivas que corresponden correspondientes a las zonas que contienen las UAs.
a un rasgo distintivo de la escena. Con este método se
debe tener conocimiento de la geometrı́a de proyección,
la posición tridimensional relativa y el movimiento, los 3. Flujo óptico
tipos de primitivas usadas son por ejemplo: Lı́neas,
El cálculo del flujo óptico que se usa en este proyec-
bordes o esquinas. El problema con los métodos basados
to se basa en el método de los gradientes y la ”ecuación
en caracterı́sticas es que dependen de la forma de los
de restricción del Flujo Óptico”, formulada por Horn y
objetos, es decir, pequeños cambios en la forma de los
Schunck [13]:
objetos implican una modificación del patrón de búsqueda.
E x · u + Ey · v + Et = 0
Las aproximaciones que se realizan por medio de flujo
óptico, están basadas en el movimiento aparente de la in- Esta ecuación es válida bajo condiciones de patrón de bril-
tensidad de los patrones en la secuencia de imágenes. Este lo de la imagen constante, y gradiente local de intensidad
esquema está basado en dos suposiciones importantes: la lineal. Desarrollando a partir de ella llegamos a una solu-
primera de ellas está fundamentada en la observación, esto ción de tipo iterativa para cada uno de los componentes
significa que aún cuando los objetos cambian de posición del flujo óptico:
en la escena, su brillo debe permanecer constante, es decir,
que la iluminación sea constante en el tiempo. Esta suposi- Ex (Ex ū + Ey v̄ + Et )
u = ū − (1)
ción es conocida como restricción de constancia de datos. λ2 + Ex2 + Ey2
La segunda suposición es conocida como la coherencia es- Ey (Ex ū + Ey v̄ + Et )
pacial, es decir, que los puntos de una superficie tridimen- v = v̄ − (2)
λ2 + Ex2 + Ey2
sional correspondan a los mismos puntos de un vecindario
pequeño de la imagen. Las aproximaciones realizadas por Para la obtención de resultados válidos este algoritmo re-
medio del flujo óptico caen dentro de dos grandes cate- quiere un mı́nimo de textura en los objetos de la imagen,
gorı́as: basados en correlación y en gradientes. desplazamientos pequeños entre imágenes y el movimiento
Los métodos basados en correlación tienen un costo com- continuo de los objetos [3], el algoritmo implementado y
putacional elevado. Por otra parte los métodos que están usado es el de Lucas & Kanade [4].
basados en gradiente pueden ser computacionalmente efi- Otro problema es el cálculo computacional como lo men-
cientes, sin embargo, el uso de una ventana de análisis ciona G. Asensio [2], donde indica que los métodos varia-
pequeña origina el problema de apertura. El problema se cionales son especialmente útiles para resolver la ecuación
presenta cuando existe una insuficiente variación de los de flujo óptico u(x)·∆f (t, x)+∂t f (t, x) = 0, por que preser-
tonos de gris de las regiones consideradas en la imagen, van las discontinuidades y funcionan incluso cuando hay
por lo tanto más de un candidato se adapta a los datos de variaciones de iluminación. Sin embargo, tienen alto cos-
la imagen observada de la misma forma. to computacional y demuestran que el método multimalla
En imágenes de rostros si cumplen las suposiciones an- referente al cálculo es mucho mas eficientes. Tal método
teriores debido a que la forma del objeto es constante y no no es objeto de este trabajo, pero vemos que las tenden-
presenta diferentes intensidades a lo largo del tiempo. cias ayudan a presumir una mayor efectividad del modelo
Finalmente, existen los métodos basados en regiones propuesto.
donde el problema central es segmentar los objetos en
movimiento con respecto al fondo de la imagen. Una for-
ma de estimar el movimiento de objetos por medio de esta 4. Resultados
técnica es mediante el apareamiento de regiones. Otra for-
ma de realizar la operación de detección es a través de 4.1. Datos empleados
búsquedas de las regiones que definen a los objetos de in- Para el entrenamiento del localizador de ojos se empleo
terés entre un conjunto de cuadros, donde cada una de la base de datos [12], el cual cuenta con 240 imágenes de 40
ellas experimenta un movimiento sencillo entre un par de personas sin lentes, de los cuales 33 son hombres y 7 son
imágenes consecutivas. mujeres, a una resolución de 640x480 en formato JPEG
, de los cuales tomamos 480 muestras positivas de ojos,
2.2. Clasificador de patrones transformadas a una resolución de 20x10 y 5000 negativas
de resolución variable.
El Modelo de clasificación elegido es el Support Vec- Para la obtención de imágenes se empleo una cámara
tor Machine Multi Class(K-SVM), el cual es una imple- CIF Single chip, con velocidad de 30 cuadros/seg a una
mentación libre llamada LIBSVM [14], basada en [20]. resolución de 352x288pixels. El equipo dónde se realizaron
Cabe resaltar que los autores por su experiencia indican las pruebas es una AMD ATHLON 2000XP+, con 304MB
que si hay miles de atributos puede ser necesario selec- de memoria.
4
Para la etapa de entrenamiento y prueba del clasificador En la figura 5 item a) muestra el enmallado tradi-
se tomaron muestras de 33 individuos de los cuales 10 son cional; en forma de cuadrı́cula y aparentemente estática.
del sexo femenino entre edades de 19 a 23 años, todos el- En el item b) el enmallado cubre la zona del rostro y ex-
los estudiantes de pre-grado. las muestras se tomaron du- iste mayor flexibilidad puesto que nuestra propuesta hace
rante el dı́a bajo condiciones normales de iluminación, las un seguimiento del rostro permitiendo mayor libertad de
pruebas también se realizaron bajo las mismas condiciones, movimiento, ası́ se observa en la figura 6.
pero con individuos que no participaron en el entrenamien-
to.
En la figura 3 se observa escenas con recuadros de color Figura 6: Enmallado de rostro de nuestra propuesta.
para cada candidato a ojo, empleando umbrales numéri-
cos sobre este resultado logramos reducir solo a dos can-
didatos, los necesarios para posterimente poder calcular 4.4. Cálculo del flujo óptico
el centro (x0 , y0 ) del par de ojos. La figura 4 muestra el
Marcadas ya las zonas de interés, se inicia el proceso de
centro calculado(x0 , y0 ), basado en el sistema de coorde-
cálculo de flujo óptico, para lo cual usamos el algoritmo
nadas mostrado en la figura ??. Cada extremo de la lı́nea
de Lucas & Kande [4]. Mediante el cual, sabremos las
representa la posicion de cada ojo detectado. Una de las
nuevas posiciones de nuestros pixels marcados(estimación
ventajas de nuestra propuesta frente a los métodos tradi-
de movimiento aparente), obteniendo ası́ vectores de 216
cionales de flujo óptico es dar libertad de inclinación hacia
atributos, los cuales contienen información en módulo y
ambos extremos sin perturbar los resultados, ası́ se puede
dirección de nuestros pixels marcados.
observar en la figura 4.
Estos vectores intercalados y en grupos de 6 por segun-
do(nuestra cámara adquiere a 30 frames/seg.), son eti-
4.3. Enmallado quetados y almacenados en un repositorio, para posteri-
ormente entrenar el clasificador [14]. Las muestras de cada
Denominamos enmallado al proceso de marcar pixeles expresión son las transiciones de la estado facial normal o
en las zonas del rostro que contienen las llamadas UAs, neutro hacia los demás estados como son alegrı́a, sorpresa,
estos pixeles marcados se visualizan en forma de puntos ira, tristeza miedo y asco.
en las imágenes a) y b) de la figura 5. Mediante estos pix-
eles marcados podremos calcular el flujo óptico, es decir
4.5. Clasificación de la expresión facial
el movimiento aparente. Se puede observar el proceso de
enmallado de nuestra propuesta en ejecución en la figura Entrenado el clasificador [14], con las muestras que con-
6. stan de grupos de 6 vectores, esta cantidad fue estimada
5
Referencias
[1] Mauricio González Arias. Valoración del efecto de difer-
entes fuentes de información sobre el reconocimiento de
emociones en un contexto conversacional. PhD thesis,
Universidad de Chile, Facultad de Ciencias Sociales, En-
ero 2005.
[2] G. Asensio, P.M. Gonzalez, C. Platero, J.M.Poncela,
J.Sanguino, and M.C.Tobar. Métodos multimalla en prob-
lemas lineales de flujo óptico. septiembre 2007.
[3] D. Ballard and C. Brown. Computer Vision. Prentice-
Hall, 1982.
[4] B.D.Lucas and T. Kanade. An iterative image registration
technique with an application to stereo vision. in Proceed-
ings of Imaging Understanding Workshop, pages 121–130,
1981.
[5] M. J. Black, Y. Yacoob, A. D. Jepson, and D. J. Fleet.
Learning parameterized models of image motion. In IEEE
Proc. Computer Vision and Pattern Recognition, CVPR-
97, pages 561–567, Puerto Rico, June 1997.
[6] Jyh Yeong Chang and Jia Lin Chen. Automated facial ex-
pression recognition system using neural networks. Jour-
nal of the Chinese Institute of Engineers, 24(3):345–356,
2001.
[7] Ira Cohen, Nicu Sebe, B Ashutosh Garg, C Lawrence S.
Chen, and Thomas S. Huang A. Facial expression recog-
nition from video sequences: Temporal and static model-
Figura 7: Resumen de resultados obtenidos, con nuestra
ing. In Computer Vision and Image Understanding, pages
propuesta. 160–187, 2003.
[8] Jeffrey F. Cohn, Zara Ambadar, and Paul Ekman. Run-
Los items Frames y Ratio nos explican el proceso de ning head: Facial action coding system. University of
medición de nuestra propuesta, por ejemplo en el caso de Pittsburgh and University of California at San Francis-
Alegria se tomaron un promedio de 98 frames, de los cuales co, May 2005. Observer-Based Measurement of Facial Ex-
nuestra propuesta detectó 8 frames en estado Neutro, 74 pression with the Facial Action Coding System.
Alegre, 8 Sorpresa, 3 Enojo, 1 Tristeza, 2 Miedo y 2 Asco, [9] Paul Ekman. Facial expression and emotion. 48(4):384–
logrando un ratio de 75.51 %. 392, April 1993.
En general, algunos resultados de nuestras prue- [10] Paul Ekman and W.V. Friesen. The facial action coding
system: A technique for measurement of facial movement.
bas se encuentran publicados en http://refaciales.
1978.
awardspace.com. [11] I. Essa. Analysis, interpretation, and synthesis of facial
expressions, 1995.
[12] Jens Fagertun and Mikkel B. Stegmann. The imm frontal
5. Conclusiones face database. Informatics and Mathematical Modelling,
2005.
La consideración de la geometrı́a facial para enmallar [13] B. Horn. Robot Vision. Ed Mc Graw-Hill, 1986.
el rostro que contienen la UAs, marcando los pixel can- [14] Chih Wei Hsu, Chih Chung Chang, and Chih Jen Lin. A
didatos para el cálculo del flujo óptico, permite reducir la Practical Guide to Support Vector Classification. Depar-
dimensión de los vectores caracterı́sticos de las expresiones tament of Computer Science, National Taiwan University,
faciales. Taipei 106, Taiwan, 2008.
6