Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
net/publication/311428042
CITATION READS
1 464
3 authors:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Alejandro Gómez Montoya on 31 July 2017.
Abstract— In this work, we perform an approach to emotion a 8 Hz), Alfa (8 a 13 Hz), Beta (13 a 30 Hz), y Gamma (30 a
recognition from Electroencephalography (EEG) multichannel 70 Hz) [3, 4]. Diferentes autores han logrado la detección de
signals extracted from HCI Tagging Database. Multichannel estados emocionales en señales EEG con ı́ndices de acierto
EEG signals are decomposed using Stationary Wavelet Trans- entre el 75 % y el 99 % para diferentes grupos de emociones.
form and each subsignal are processed with a statistical analy- [5, 6, 7, 8, 9].
sis. Finally, a feature selection algorithm was used for reducing Este trabajo presenta un estudio sobre la detección de emo-
the dimensionality of feature set, and a QDA classifier was used, ciones en la base de datos HCI Tagging Database que contie-
obtaining accuracy rate between 78.8 % for Neutrality to 100 % ne las señales EEG referentes a nueve estados emocionales.
for Anger, Surprise and Anxiety. Se presentan algunas técnicas estadı́sticas de medida, aplica-
das a subseñales obtenidas de la Transformada Wavelet Esta-
Keywords— EEG Signal, Emotion Recognition, QDA, Wave- cionaria de una señal EEG multicanal. Diferentes conjuntos
let, Feature Selection de caracterı́sticas obtenidos de la selección de caracterı́sticas,
fueron usados en un clasificador QDA, buscando detectar uno
I. I NTRODUCCI ÓN de nueve estados emocionales. Se presenta una metodologı́a
para el reconomiento de emociones en señales EEG. El orden
Es difı́cil establecer una definición exacta de lo que es una de este articulo es: la sección 2 corresponde a la metodologı́a,
emoción, pero hay una definición emergente que establece a el preprocesamiento, la extracción, selección de caracterı́sti-
las emociones como estados mentales [1]. Siendo dichos esta- cas, y el clasificador propuesto; la sección 3, los resultados
dos mentales, la respuesta ante estı́mulos externos e internos obtenidos y finalmente la sección 4 las conclusiones.
como : escuchar una orquesta, el comportamiento ante otros
seres humanos, o cambios psicológicos o neuroendocrinos,
especı́ficamente en recuerdos o imágenes almacenadas en la
II. M ETODOLOG ÍA
mente[2]. Estos estados emocionales son manifestados como A. Selección de Datos y Pre-procesamiento
otras experiencias mentales, como resultado de una actividad
nerviosa en el cerebro [1], por lo cual es factible identificar Se utilizó la base de datos HCI Tagging Database [10],
los estados emocionales como patrones en señales EEG. La la cual cuenta con señales EEG de 513 sesiones, donde cada
detección de emociones utilizando las señales EEG, es muy sesión corresponde a la grabación de las señales EEG de 32
importante, dado que estas señales están directamente rela- canales con una frecuencia de muestreo de 256 Hz, durante la
cionadas con la actividad cerebral, permitiendo realizar un evocación de uno de nueve estados emocionales, que se listan
mapeo de los estados emocionales con las diferentes áreas de a continuación.
actividad neuronal. Esto permite a psicólogos validar o de-
terminar estados emocionales, o permitiendo a un sistema de 1. Tristeza 4. Neutralidad 7. Miedo
Inteligencia Artificial tomar decisiones sobre el estado emo- 2. Felicidad 5. Regocijo 8. Sorpresa
cional de un usuario, sin que requiera que esté realice una 3. Asco 6. Ira 9. Ansiedad
actividad fonética o expresión facial lo cual puede ser muy
útil con infantes. El propósito de utilizar esta base de datos, es simular algu-
La señal EEG generalmente tiene un rango de los µV, con nas de las condiciones de las señales EEG que pueden ser
componentes frecuenciales hasta los 300 Hz [3]. En múltiples obtenidas del equipo Emotiv EPOC [11], con el cual se bus-
estudios se reporta que el rango para la detección de emocio- cará crear una futura base de datos propias de señales EEG de
nes en señales EEG se encuentran en diferentes bandas fre- evocación de estados emocionales. Con el fin de cumplir este
cuenciales. Estas corresponden a : Delta (0.5 a 4 Hz), Teta (4 objetivo, se hizo un downsampling a 128 Hz, es por esto que
un proceso de filtrado fue implementado con dos filtros But- y espectral. La perspectiva temporal utiliza: integral del valor
terworth de orden 10: un paso alto a 0.4 Hz y un filtro paso promedio [16], media cuadrática [17, 16], media, varianza,
bajo a 70 Hz, eliminando componentes de ruido y evitando desviación estándar [18], longitud de onda [16], longitud de
la aliasing en el banco de señales EEG. Además, se redujo onda estándar y curtosis [19] ; y la perspectiva espectral uti-
el número de canales a un total de 14, equivalentes a los del liza: cruces por cero [20], frecuencia media, frecuencia pro-
Emotiv EPOC. En la figura 1 se representan de color verde medio y el valor máximo del poder espectral [21]. Buscando
los canales que corresponden al Emotiv EPOC, y de color ro- lograr describir mediante estas caracterı́sticas un estado emo-
jo los canales restantes encontrados en la base de datos. Como cional.
las señales EEG son consideradas estacionarias en intervalos
cortos [3], se implemento un proceso de ventaneo con la ven-
D. Selección de Caracterı́sticas
tana Hanning para luego hacer un análisis de cada segmento
de la señal. También se realizó un solapamiento del 50 %, con Cuando se tiene un conjunto con alta dimensionalidad de
caracterı́sticas descriptivas, una labor de clasificación requie-
re un alto gasto computacional. Además es posible que haya
Nz
un subconjunto de caracterı́sticas que pueda ser asociado a
Fp1
Fpz
Fp2
elementos de ruido o información diferente a estados emo-
AF7 AF8
F9
F7
AF3 AFz AF4
F8
F10 cionales, es por esto que es necesario implementar un pro-
F5 F6
F3 F1 Fz F2 F4
ceso de selección de caracterı́sticas. En este trabajo se im-
FT9 FT7 FC8 FT10
FC5 FC3 FC1 FCz FC2 FC4 FC6
plementó el método Chi Square, el cual mide la dependencia
A1 T9 T7 C5 C3 C1 Cz C2 C4 C6 T8 T10 A2
entre un vector de caracterı́sticas X con una clase yi , es decir,
TP9 TP7
CP5 CP3 CP1 CPz CP2 CP4 CP6 TP8 TP10
un estado emocional. Si X e yi son poco dependientes, enton-
P7
P5 P3 P1 Pz P2 P4 P6
P8
ces el puntaje es bajo. Este procedimiento se implementa para
P9
PO7
PO3 POz PO4
PO8
P10
cada yi y se promedian los resultados [22]. De tal manera es
O1
Oz
O2
posible seleccionar las k caracterı́sticas con el puntaje mas al-
Iz to, y logren describir correctamente los patrones relacionados
Figura 1: Posición de Electrodos con los estados emocionales. La selección de caracterı́sticas
fué implementada buscando 3 tamaños objetivos: 150, 300 y
un tamaño de ventana de 1s, para luego descomponer la señal 600, del conjunto inicial de 1680 caracterı́sticas.
como se detalla a continuación [9].
E. Clasificador
B. Transformada Wavelet Estacionaria Como elemento clasificador se utilizó un Análisis Discri-
La Transformada Wavelet Estacionaria (SWT), es una mo- minante Cuadrático (QDA), este calcula la combinación li-
dificación de la Transformada Wavelet Discreta. Esta aprove- neal de la matriz de caracterı́sticas de entrenamiento, para
cha el concepto de la Transformada Wavelet como un banco construir c − 1 vectores canónicos v, donde c corresponde
de filtros [12, 13] sin embargo, no se efectúa un downsam- al número de clases (emociones), realizando el cálculo de la
pling y en su lugar se conserva el tamaño original de la señal. matriz de covarianza para cada clase, permitiéndole separar
Por lo cual se modifican los filtros de descomposición de cada el espacio Rc−1 , construido por las caracterı́sticas, con fun-
nivel, con un proceso de padding de ceros [14]. Cada banco ciones cuadráticas [23]. El proceso de clasificación se imple-
de filtros es asociado a una familia Wavelet, en este caso la mento con una validación cruzada, utilizando el método de
Wavelet Daubechies. Particularmente se trabajó con la Wave- holdout con random subsampling para un total de 30 experi-
let db1. Cada segmento tomado del proceso de ventaneo, es mentos [24].
descompuesto con la SWT en un total de 5 niveles, en donde III. R ESULTADOS
se construyó una matriz de subseñales con las 5 señales de
aproximación y las 5 de detalle [14, 15]. Las técnicas de selección, indican que conjunto de carac-
terı́sticas logran representar mejor, un grupo de clases, en es-
C. Caracterı́sticas Descriptivas te caso, de estados emocionales. Esto permite analizar que
canales EEG pueden tener una contribución mayor a la des-
Cada subseñal obtenida por la SWT, fue analizada por do- cripción de estos estados emocionales. Por esto es necesario
ce caracterı́sticas descriptivas con dos perspectivas: temporal calcular la distribución de caracterı́sticas en función de los
canales EEG. La siguiente lista representa el nombre de cada Cuadro 1: Descomposición Wavelet como Bandas Frecuenciales EEG
canal, que corresponde al eje X de la figura 2. Nivel de
Banda Principal Banda Secundaria
Descomposición
1. AF3 4. FC5 7. O1 10. T8 13. F8 A1 Delta Teta, Alfa y Beta
2. F7 5. T7 8. O2 11. FC6 14. AF4 A2 Delta Teta y Alfa
3. F3 6. P7 9. P8 12. F4 A3 Delta Teta
A4 Delta Parcialmente Teta
En la figura 2, se encuentra la distribución de caracterı́sti- A5 Delta Ninguna
cas en función de los canales EEG, para los diferentes ta- D1 Gamma Beta y Alfa
maños de caracterı́sticas obtenidas luego de la selección de D2 Beta Alfa y Gamma
caracterı́sticas. Es notorio que a medida que aumenta el ta- D3 Teta y Alfa Beta
maño del conjunto, la distribución de estás tiende a tomar D4 Teta Alfa
un aspecto mas uniforme, pero se sigue conservando valo- D5 Teta Ninguna
res mı́nimos para los canales que corresponden al hemisferio
posterior izquierdo, y una mayor densidad para los canales
que corresponden al hemisferio frontal. Esto puede indicar contribución del nivel D2, que es en mayor parte representado
que zonas de la corteza cerebral contienen mayor informa- por la banda Beta.
ción sobre los estados emocionales.
20
15 150 300 600
Porcentaje ( %) 15
Porcentaje ( %)
10
10
5 5
Otro análisis que se puede efectuar es la distribución de ca- Los resultados luego de realizar la validación cruzada, para
racterı́sticas en función de los niveles de descomposición. La los tres conjuntos obtenidos mediante la selección de carac-
importancia de este análisis radica, en tomar la SWT como un terı́sticas, y para el conjunto original, que se encuentran en
banco de filtros pasabandas. Por lo cual es factible identificar la figura 4, puede notarse que los ı́ndices de acierto mas al-
que bandas frecuenciales tienen mayor peso para describir es- tos corresponden a los conjuntos de 600 y 1680 caracterı́sti-
tados emocionales, es decir, que ritmos (delta, alfa, gamma, cas. Es notorio que en general el porcentaje de acierto luego
etc) aportan mayor cantidad de información sobre los estados de la selección de caracterı́sticas, es menor que el conjun-
emocionales. En el cuadro 1, se encuentra que bandas fre- to original. Sin embargo, es posible, con el conjunto de 600
cuenciales predominan en cada nivel de descomposición, y caracterı́sticas, obtener ı́ndices de acierto similares a los del
que las bandas están presentes pero no son predominantes. conjunto original, reduciendo el tiempo de computo.
En la figura 3, se encuentra la distribución de caracterı́sti- Un análisis mas a fondo del comportamiento del clasifica-
cas para cada nivel de descomposición. Pueden notarse que dor QDA con 600 caracterı́sticas, se encuentra en la figura 5,
a medida que se aumenta el conjunto de caracterı́sticas, este que corresponde a la matriz de confusión de dicho clasifica-
tiende a ser homogéneo, con picos en los niveles A2 y D3, dor para uno de los experimentos de la validación cruzada.
que son representativos de las bandas Delta, Teta y Alfa, con Puede notarse el buen comportamiento del clasificador para
leves contribuciones de la banda Beta y Gamma, con una leve los estados emocionales de Asco, Ira, Miedo, Sorpresa y An-
100 con una dimensionalidad menor al conjunto original de ca-
95 racterı́sticas e ı́ndices de aciertos cercanos. Permitiendo redu-
90 cir el costo computacional del entrenamiento y clasificación
Acierto ( %)