Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Instituto de Exatas
Departamento de Estatstica
de dados de EEG:
Braslia
2010
M URILO C OUTINHO S ILVA - 07/36562
Bacharel em Estatstica.
Braslia - DF
2010
Agradecimentos
Ao SAS Institute Brasil por possibilitar a utilizao desse software por meio de parceria acadmica
Nosso mundo um lugar catico. Como profetiza o efeito borboleta pequenas alte-
raes podem trazer grandes consequncias, e por isso no podemos deixar de nos
questionar como chegamos nesse exato instante de nossas vidas. Que atos e decises
Esse tipo de pensamento sugere que essa monografia no , por algum ponto de vista,
um trabalho realizado por mim com o auxlio do meu orientador, e sim um trabalho que
aparece como mera consequncia das minhas escolhas durante a vida. Portanto, sinto-
me obrigado a agradecer pessoas que, tenho certeza, sem elas nada disso seria possvel.
como me solteira, cuidou de mim com muito carinho em todos os momentos que mais
precisei dela, me ensinou amor, moral e tica. Sou imagem da pessoa maravilhosa que
Em seguida quero agradecer o resto da minha famlia. Agradeo minha irm, minha v,
a minha tia, aos meus tios, meu padrasto e aos meus primos que so grandes amigos
acima de tudo. Agradeo a quase todos os momentos de minha vida em que estive na
ilustre presena dessas pessoas que foram sempre momentos de extrema felicidade.
1
Este trabalho teve suporte parcial da FINATEC por meio dos editais de auxlio pesquisa 02/2009 e
01/2010.
A composio social mais catica da vida devem ser os amigos que so os primeiros
pontos de vista diferentes da famlia que algum ouve na vida. Alguns tm pssimas
influncias, j eu tive timas. Agradeo a esse grandes amigos que estiveram comigo
primeiro professor a quem devo muito o Lus Antnio, meu professor do ensino mdio
com quem aprendi clculo no primeiro ano e que me incentivou enormemente nos es-
tudos. O segundo o professor Rathie com que fiz dois anos de iniciao cientfica e
artigo publicado. O terceiro o meu orientador desta monografia, o professor George von
Para finalizar devo citar mais duas pessoas. A primeira delas minha namorada e
futura mulher, no consigo nem imaginar como seriam esses ltimos anos sem sua pre-
sena. A segunda pessoa meu falecido av, Mrio Coutinho, que de forma estranha e
sobrenatural me proporciona uma enorme fora com cada simples lembrana, como se
estivesse sempre ao meu lado segurando minha mo para me levar aonde tenho que ir,
4
Resumo
Esse trabalho discorre sobre um novo mtodo para a anlise de discriminante e clas-
Vetorial e anlise de frequncias de Fourier. Alm disso, tambm faz parte desta mono-
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Eletroencefalografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1 Histria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Coleta de dados de EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Mquina de Suporte Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1 Caso de dados binrios e linearmente separveis . . . . . . . . . . . . . . 6
3.2 Caso de dados binrios no separveis . . . . . . . . . . . . . . . . . . . 10
3.3 SVM e Kernels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Um exemplo de aplicao de discriminante de sinais simulados utilizando
SVM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4 Anlise preliminar dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1 Os dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Anlise dos eletrodos utilizando Agrupamentos Hierrquicos . . . . . . . . 24
4.3 Componentes Principais . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 Mtodo para Discriminante de dados de EEG . . . . . . . . . . . . . . . . . 33
5.1 O Periodograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Introduo ao novo mtodo para discriminante de dados de EEG. . . . . . 40
5.4 Clculo do Discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.5 Sistema de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.6 Fase de teste ou Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.7 Algoritmo para o treinamento . . . . . . . . . . . . . . . . . . . . . . . . 45
5.8 Algoritmos para a fase de testes e aplicaes . . . . . . . . . . . . . . . . 46
6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1 Introduo
solidria e segura para todos. Vivemos em um mundo em que a demanda por tratamentos
de sade mais baratos e eficientes cresce a cada dia. Novas tcnicas e equipamentos
nesse contexto que se percebe com clareza a importncia dos sinais biomdicos.
Esses sinais eltricos produzidos pelo corpo humano tm a singular capacidade de for-
O crebro o rgo mais complexo do corpo humano. O mistrio sobre o seu fun-
cionamento foi motivao para pesquisas e estudos pela humanidade h muito tempo.
Porm, os estudos dos sinais eltricos emitidos pelo crebro s foi possvel a partir do
final do sculo XIX com o advento de equipamentos sensveis o suficiente para captar
esses sinais.
e de anormalidades - como problemas durante o sono. Muito embora o EEG esteja con-
solidado para algumas aplicaes, para outras ainda motivo de pesquisa, sendo papel
criminante de Fisher, redes neurais (Neural Network), e mquina de suporte vetorial (Sup-
falografia bem como desenvolvimentos importantes que esse tipo de estudo pode trazer.
atuais. Alm disso, neste captulo, apresentada, brevemente, a forma como realizada
vetorial - do ingls support vector machine (SVM) - que parte importante deste trabalho.
Esta tcnica utilizada para fazer discriminante e classificao de diversos tipos de dados,
e sua escolha foi motivada pelo nmero de artigos recentes que usam a tcnica de SVM
O quarto captulo expe uma breve anlise exploratria dos dados, um estudo utilizando
volvido. O mtodo composto por diversas tcnicas incluindo mquina de suporte vetorial
e anlise de frequncias de Fourier, por esta razo este captulo inclui tambm um estudo
sobre o periodograma.
e classificao dos dados de EEG. Desse modo avalia-se tambm a eficcia do novo
gens do novo mtodo alm de propor linhas de pesquisa e evidenciar problemas encon-
sendo um tipo de informao sobre seu pensamento. Este captulo apresenta detalhes
histricos da eletroencefalografia bem como uma breve introduo de como esses dados
so coletados.
2.1 Histria
sculo XIX. Foi s com a chegada da tecnologia e de aparelhos capazes de captar va-
riaes eltricas da ordem de milivolts, que foi possvel se captar sinais eltricos emitidos
pelo crebro.
Em 1875, Richard Caton publicou o que foi o primeiro registro da atividade eltrica
utilizando equipamentos muito rsticos. Seu estudo revelou, dentre outras coisas, duas
Caton percebeu foi que, ao contrrio do que imaginaramos, a amplitude do sinal eltrico
emitido pelo crebro aumenta durante o sono. A segunda e mais importante descoberta
de seu trabalho foi que a atividade eltrica se correlaciona com a atividade motora e
estmulos externos.
Foi ento, em 1924, que Hans Berger registrou o primeiro EEG de atividade cerebral hu-
folha de papel, sendo assim capaz de perceber os padres resultantes dessas ondas
cerebrais variando com o tempo. Berger percebeu que essas ondas no so totalmente
tambm, que as ondas cerebrais dos indivduos tm alta amplitude e baixa frequncia du-
rante o sono e baixa amplitude e alta frequncia quando acordados. Outra descoberta de
Berger, e uma das mais interessantes, foi que o EEG era modificado durante um ataque
epiltico. Hans Berger ainda no era muito conhecido e ento foi s em 1934 quando os
tambm pela descoberta do ritmo alfa que era uma oscilao regular de aproximadamente
algum foca alguma coisa, presta ateno ou fica em estado de alerta em algo no seu
campo de viso.
coloca uma touca (ver Figura 2.1) com vrios eletrodos que captam os potenciais eltricos
emitidos pelo crebro. Os dados analisados neste trabalho foram coletados empregando
o mtodo no invasivo utilizando uma touca com 128 eletrodos, posicionados de forma
A tcnica de Mquina de Suporte Vetorial (do ingls Support Vector Machine (SVM))
surgiu em 1992 e uma tcnica relativamente nova mas que vem sendo muito utilizada
pela quantidade de artigos recentes que vem empregando SVM para a classificao de
dados de EEG. Durante o perodo de trabalho aplicou-se a tcnica de SVM como vinha
sendo utilizada mas no obteve-se boas taxas de classificao. Este fato foi a principal
motivao para a nossa iniciativa em desenvolver um novo mtodo para anlise desse
tipo de dados.
caso particular em que se deseja separar duas classes que so separveis por um hiper-
plano
X T + 0 = 0. (3.1)
portanto, necessrio determinar um critrio que nos permita otimizar essa separao.
Desse modo, escolhe-se o hiperplano que deixe a maior margem (M ) de distncia pos-
Figura 3.1: Um exemplo de duas classes separveis. Trs exemplos de hiperplanos (retas
no caso bidimensional) so mostrados. claro que existem infinitos hiper-
planos que podem separar esses dados e portanto necessrio um critrio
para escolher o hiperplano timo.
X
X
X
Figura 3.2: O mesmo exemplo de duas classes separveis. O hiperplano verde (reta no
caso bidimensional) o hiperplano timo. As retas pontilhadas definem a
margem que mxima neste caso. Os pontos marcados com um "X"so os
chamados vetores suporte.
g(x) = X T + 0 = 0, X p (3.2)
1 ( T ) g(xi )
D= xi + 0 = . (3.3)
g (xi )
8
1 se xi W1
yi = (3.4)
1 se x W
i 1
que yi g(xi ) > 0 se xi for corretamente classificado em sua classe pelo hiperplano.
de distncia possvel entre as classes. claro que nenhum ponto xi tem distncia menor
equao (3.3),
1 ( T )
xi + 0 M (3.5)
1 ( T )
yi xi + 0 M
( )
yi xiT + 0 M
Para qualquer e 0 que satisfaam essa equao, qualquer mltiplo positivo destes
( )
yi xiT + 0 1 (3.6)
Max M
,0
1 ( T )
sujeito a yi xi + 0 M, i = 1, 2, ..., N
ou de mesmo modo
9
1
Min 2 (3.7)
,0 2
( )
sujeito a yi xiT + 0 1, i = 1, 2, ..., N
1 N [ ( ) ]
L p = i yi xiT + 0 1
2
(3.8)
2 i=1
se
N
= i yi xi (3.9)
i=1
N
iyi = 0 (3.10)
i=1
N
1 N N
LD = i ik yiyk xiT xk , i 0 (3.11)
i=1 2 i=1 k=1
Tucker (KKT):
[ ( ) ]
i yi xiT + 0 1 = 0, i = 1, 2, ..., N (3.12)
Encontra-se, desse modo, o hiperplano timo para separar as duas classes. im-
( )
portante notar que a equao (3.12) implica que i = 0 ou que yi xiT + 0 = 1, ou
seja, i s diferente de zero (em geral) se e somente se o ponto xi estiver sobre uma
onde f(x) = xT + 0
Na seo 3.1 foi definido o hiperplano timo na separao de duas classes linearmente
1 ( T )
yi xi + 0 M
ii) Pontos corretamente classificados residindo entre as margens:
1 ( T )
0< yi xi + 0 < M
iii) Pontos incorretamente classificados:
1 ( T )
yi xi + 0 0
Esses trs casos podem ser resumidos em um nico caso ao se introduzir novas va-
1 ( T )
yi xi + 0 M(1 i ). (3.14)
11
Desse modo, para i = 0 tem-se pontos do primeiro tipo, para 0 < i < 1 tem-se pontos
do segundo tipo e para i 1 tem-se pontos do terceiro tipo. Alm disso, escolhe-se e
( )
yi xiT + 0 1 i , i = 1, 2, ..., N. (3.15)
pode ser vista na Figura 3.3. Logicamente o intuito da tcnica ter o mnimo de pontos
N
do tipo (ii) e do tipo (iii) e para isso minimiza-se a soma i que a quantidade total
i=1
pela qual pontos esto proporcionalmente do lado errado da margem. Levando essas
N
1
Min +C i
2
(3.16)
,0 ,i 2 i=1
sujeito a
( )
yi xiT + 0 1 i , i = 1, 2, ..., N
i 0, i = 1, 2, ..., N.
problema de minimizao. Note que para C grande a influncia das variveis i se torna
maior resultando assim em uma margem menor. Se existirem duas classes linearmente
Para resolver este problema ser novamente utilizada a tcnica dos multiplicadores de
1 N N [ ( ) ] N
L p = 2 +C i i yi xiT + 0 (1 i ) i i (3.17)
2 i=1 i=1 i=1
12
4
2 3
N
= i yi xi , (3.18)
i=1
N
iyi = 0, (3.19)
i=1
i = C i , (3.20)
com i = 1, 2, ..., N . Substituindo (3.18), (3.19) e (3.20) em (3.17) obtm-se a funo dual
de Wolfe
N
1 N N
LD = i ik yiyk xiT xk . (3.21)
i=1 2 i=1 k=1
[ ( ) ]
i yi xiT + 0 (1 i ) = 0, (3.22)
13
i i = 0, (3.23)
( )
yi xiT + 0 (1 i ), (3.24)
N
= i yi xi . (3.25)
i=1
Desse modo, determinou-se o hiperplano timo para separar as duas classes. impor-
( )
tante notar novamente que a equao (3.22) implica que i = 0 ou que yi xiT + 0 =
( )
1 i ou seja, i s diferente de zero (em geral) se e somente se yi xiT + 0 = 1 i ,
e portanto como i 0, i s diferente de zero se seu ponto xi correspondente estiver
em cima de uma das margens, entre as margens, ou se tiver sido incorretamente classifi-
clusivamente devido a esses ponto como pode-se notar na equao (3.25). Essa uma
caracterstica muito interessante desse classificador pois ele foca ateno nos pontos que
realmente importam.
Outra motivao para o uso de SVM que nenhuma suposio sobre a distribuio
dos dados necessria, j que o que levado em conta apenas a distncia entre as
classes.
mapeamento
x p y k (3.26)
que transforme o espao dos dados em um espao k-dimensional onde as classes pos-
Se tal mapeamento existir pode-se utilizar as tcnicas vistas na seo anterior para en-
contrar o hiperplano timo que separe essas classes no espao k-dimensional, resultando
primeira vista essa ideia no parece ser muito vivel j que aumentando as dimenses
mesmo impossvel. Porm, existe uma bela propriedade da tcnica de SVM que per-
Nas sees anteriores foi definido nosso problema de minimizao para o clculo do
hiperplano timo. Note ento na equao (3.21) que todos os clculos envolvidos sobre
os dados esto na forma do produto interno xiT xi . Da mesma forma, para o novo espao
ressante que para alguns mapeamentos esses produtos internos podem ser calculados
x (x) H (3.27)
equivalente
onde i (x) o i-simo componente do mapeamento (x) e K(x, z) uma funo simtrica
que satisfaz
K(x, z)g(x)g(z)dxdz 0 (3.29)
15
[g(x)]2 dx < + (3.30)
O inverso tambm verdadeiro, ou seja, para qualquer funo K(x, z) que satisfaa
(3.29) e (3.30) existe um espao onde K(x, z) define um produto interno. Tais funes so
i) Polinomiais
( )
||x z||2
K(x, z) = exp (3.32)
2
iii) Sigmoide
torna
N
1 N N
Max
i ik yiyk K(xi, xk)
2 i=1
i=1 k=1
iyi = 0
i
nel, ou seja, pode-se trabalhar em dimenses elevadas sem ter que estimar um grande
nmero de parmetros.
16
Programao R.
Pacote: e1071
x - dados.
y - classes.
kernel - Kernel utilizado. Tem como padro o kernel Radial. Outras opes:
linear, polynomial, radial basis, sigmoid.
cost - Valor do parmetro C.
Exemplo:
z = read.table(dados.txt,header=T)
attach(z)
x <- subset(z, select = -classe)
y <- classe
model <- svm(x, y , kernel = linear)
# Grfico (Banco de dados bidimensional).
plot(model, data = z, x y)
print(model)
summary(model)
anteriormente.
dados de EEG. Entretanto, este Kernel pode ser bem til no discriminante de outros tipos
de sinais, e por isso, o apresentamos nesta seo como exemplo do uso da tcnica de
SVM.
1
Utilizaremos a partir de agora apenas a sigla em ingls SVM para indicar mquina de suporte vetorial.
18
Figura 3.5. Esses dados foram gerados por duas funes seno do tipo
de cada grupo. Neste caso as diferenas entre as duas curvas so principalmente suas
frequncias e amplitudes.
Capturar as amplitudes das curvas uma tarefa simples j que a amplitude para cada
ponto simplesmente o valor do sinal neste ponto. O clculo das frequncias um pouco
mais complicado principalmente quando no se lida com curvas perfeitas como estas
a derivada das curvas tendo em vista o fato de que para amplitudes iguais, frequn-
cias maiores causam primeiras derivadas maiores em valores absolutos para senos ou
cossenos com argumentos iguais para ambas as frequncias, isto , em termos matemti-
cos:
ou seja, a derivada aliada a amplitude trazem por si prprias informao sobre a frequn-
cia.
O fato apresentado na Eq.(5.6) sugere uma proposta de anlise interessante. Con-
sidere ento que Xt o potencial eltrico observado no tempo t para um dos sinais e a
seguinte transformao:
Xt + Xt1
At1 =
2
It1 = Xt Xt1 (3.38)
A varivel At1 pode ser interpretada como a amplitude mdia do sinal entre Xt e Xt1
e a varivel It1 como uma aproximao da derivada para intervalos de tempo unitrios.
Tk = (Ak , Ik ) (3.39)
Observe na Figura 3.5 e na Figura 3.7 o que acontece ao plotar o grfico de A por I para
ambos os grupos. Nesta situao, ao se utilizar a tcnica de SVM com um Kernel Radial,
se obtm uma taxa de classificao correta de 100% como pode ser visto na Figura 3.7.
Aparentemente, a tcnica de SVM no foi suficiente para a classificao dos dados no
sentido que foi necessria uma transformao nos dados. Porm, pode-se incluir essa
transformao no Kernel Radial criando um novo Kernel que ideal ao problema. Para
XA = (X2 , X3 , ..., Xn )
Figura 3.6: Simulao de dois senos distintos com rudo, antes e aps a transformao.
Xk = (XA , XB ) (3.40)
onde
1
1
= 2 (3.41)
1
2 1
Deste modo aplicar o Kernel Radial nos dados transformados o mesmo que utilizar a
( )
||X. Z.||2
K(X, Z) = exp . (3.42)
2
Basta olhar para a Figura 3.4 para se perceber que a anlise foi muito longe da realidade.
Para melhorar esta anlise, simulou-se novamente os dados, porm desta vez adicio-
nando rudo aos mesmos. Nota-se, na Figura 3.6, que a transformao proposta j no
A soluo encontrada neste caso foi simplesmente ajustar Splines Cbicos aos dados.
Essa tcnica nada mais do que um modelo de regresso mltipla que surge ao definir-
B
o o o o o o o
o o o o x
o
o o
0.1 x o o x
o
x
o o o x
o o
x o x
o
x x x
o x
x
o x x o
0.0
I
x x
x x
o x
o
x o o x
o
o
x o o x
o o
0.1 x o o o
x o o o
o o
o o o o o o x
A
o x
o
0.2 x x
o
o x
o x
o
x x
o
x
o x
x o
0.3 xo
x o o
xx xo
x xo
ooooo
2 1 0 1 2
Figura 3.7: Classificao utilizando SVM com o Kernel Radial aps transformao, ou apli-
cando diretamente o Kernel dado na Eq.(3.42).
se
M
f (t) = mhm(t), (3.43)
m=1
como sendo uma expanso em bases lineares em t . A beleza deste modelo est no fato
de que uma vez definidas as funes hm , temos modelos lineares nessas novas variveis
com a restrio de que, tanto a curva, como a primeira e a segunda derivada, sejam
Ajustados os Splines Cbicos, basta agora utilizar os valores esperados dos modelos
para cada um dos sinais e repetir a mesma anlise da seo anterior. Fazendo isso nos
dados com rudo obtm-se a classificao mostrada na Figura 3.8. Note que apenas 3
pontos foram classificados de forma errnea, e isso se deve a instabilidade dos Splines
nos extremos do intervalo tempo. Se fossem retirados esses pontos instveis o discrimi-
o o o
o oo oo oo o
0.4 oo oo
o o
o xx ox ox oo
o ox o
ox o x
x ox xx oooo
B
o o
xx xx o
0.2 o o o
o
xx x oooo xo o
o o oo o oooooxoxoxo o oo
x o xo oo o oxox o x
xx oo oxo x x xo
xox x xxx xoo o
o
xx xx xoxxx
xx xxx x oo
I
0.0 x ox x x xo
xx xxx xoo o
o o x
o x x xxx oo
xxo ooo
o
o oo oooox oo
o
xxoo oo o o o o ooo x ox
x
xx x ooooooo o o o o oooooooo
ooo o o ooooox x o
x x oo
o xox x x x
0.2 x x
A
x o
xxx
o x xo o
o xx x x xo
x
oo x x o ox
o o o o
o x o oo o o
0.4 o o o ooo o
o o o oo
2 0 2
Figura 3.8: Classificao utilizando SVM com o Kernel Radial aps utilizar splines e em
seguida a transformao.
4 Anlise preliminar dos dados
Este captulo descreve inicialmente ao leitor como constitudo o banco de dados uti-
nentes principais, realizadas com o intuito de identificar as regies do crebro mais esti-
so apresentadas.
4.1 Os dados
Os dados de EEG nada mais so que sinais eltricos emitidos pelo crebro. Para captar
em que um voluntrio senta-se em frente a uma tela que mostra um conjunto de 10 ima-
gens.
uma ordem aleatria (ver as imagens do experimento na Figura 4.1). Cada sinal captado
possui mais de 4000 pontos registrados, para um total de 10 imagens, repetidas 4 vezes,
captadas por 128 eletrodos, o que resulta em um banco de dados extremamente grande.
Um dos objetivos desse trabalho obter a melhor taxa de classificao possvel com
o mnimo de pontos e por isso a quantidade de pontos por sinal utilizada foi reduzida
para 164 pelos engenheiros eltricos que nos forneceram os dados aplicando tcnicas
24
consolidadas. Desse modo tem-se um total de 164 10 4 128 = 839680 pontos para
as anlises.
Hierrquicos
O objetivo final deste trabalho fazer o discriminante e a classificao das figuras ob-
para isso. Neste aspecto de se considerar que, talvez, e muito provavelmente, seja
eletrodos prximos e alm disso usar o sinal com mais de 4000 pontos em apenas 5
De fato, ao se observar a Figura 4.2, nota-se que existe uma correlao alta entre muitos
Com o objetivo de identificar grupos de eletrodos com informao similar, foi feita uma
serve, por meio do dendograma na Figura 4.3, de uma anlise de agrupamento hie-
rrquico realizada, que possvel perceber que uma formao com 4 grupos razovel.
el82
el83
el80
el78
el79
el96
el91
el92
el94
el95
el81
el93
el99
el100 2e05 2e05 3e05 3e05 2e05
el88
el89
el90
el73
el74
el76
el77
2e05
el84
el85
el87
el23
el97
el1
el65
el66
el75
el69
el70
el71
el64
2e05
el67
el68
el101
el24
el102
el103
el108
el114
el107
el115
el72
el86
el111
2e05
el109
el98
el110
el28
el25
el29
el26
el27
el39
el40
el41
el22
3e05
el20
el21
el37
el38
el30
el26
el19
el31
el16
3e05
el17
el18
el8
el9
el10
el15
2e05
el25
el23
el24
el27
el11
el12
el13
el14
el113
el117
el118
el116
2e05
el104
el105
el127
el128
el28
el106
el120
el123
el124
el6
el119
el121
2e05
el122
el5
el126
el7
el125
el29
el63
el33
el52
el53
el54
el61
el62
el112
2e05
el2
el3
el56
el60
el30
el34
el50
el51
el44
el42
el43 2e05 2e05 2e05 2e05
el4
el32
el36
el45
el57
el58
el55
el59
el46
el47
el35
el48
el49
Programao R.
Agrupamento Hierrquico.
x - Banco de dados.
method - A medida de distncia a ser utilizada. Deve ser um de: "euclidean",
"maximum", "manhattan", "canberra", "binary"ou "minkowski".
Para uma melhor visualizao, pode-se fazer um mapeamento dos eletrodos de cada
pos. Neste caso o agrupamento foi feito utilizando a distncia manhattan, porm a mesma
anlise foi feita para diversos tipos de distncia e todas deram resultados extremamente
parecidos.
Portanto, ficam claros 4 grupos muito bem definidos correspondendo a regies do cre-
bro: parte frontal, posterior, esquerda e direita. Essa anlise mostra exatamente o que se
dados. Outra ideia que pode ser pensada que, talvez, algumas dessas regies no nos
tragam nenhuma informao importante. De fato, se sabe que a rea mais acionada por
combinaes lineares das variveis originais. Em geral, em bancos de dados cujas va-
combinaes lineares
28
... ...
Yp = ap X = a p1 X1 + a p2 X2 + ... + a pp X p
Var(Yi ) = ai ai (4.1)
Cov(Yi ,Y j ) = ai aj . (4.2)
Max Var(a1 X)
a1
sujeito a a1 a1 = 1
Max Var(a2 X)
a2
sujeito a a2 a2 = 1
Cov(a1 X, a2 X) = 0
...
Max Var(ai X)
ai
sujeito a ai ai = 1
Cov(aj X, ai X) = 0, j < i.
Yi = ei X. (4.3)
p p
Prova-se tambm que Var(Xi) = Var(Yi), ou seja, as componentes principais re-
i=1 i=1
presentam toda a variabilidade do sistema, porm podemos diminuir a dimenso do pro-
da variabilidade.
sionalidade elevada dos dados identificando as regies mais estimuladas do crebro pelo
Programao R.
Componentes Principais.
prcomp(x, ...)
x - banco de dados.
Exemplo:
Foi possvel notar que, em geral, precisa-se de apenas 5 componentes principais para
Mas o mais interessante foi perceber que as regies do crebro mais relevantes para
Figura 4.5 os pesos que cada regio do crebro tem na composio de cada componente
Fica claro que cada componente principal leva em conta uma parte especfica do cre-
bro, mas as componentes mais importantes levam em conta a parte frontal e posterior do
crebro. Desse modo, possvel que essas duas partes sejam as mais importantes para
onde a variabilidade est mais presente, isso significa que sob a hiptese de que as
regies estimulas apresentem sinais com maior energia, e consequentemente com maior
31
Programao SAS.
Componentes Principais.
estimuladas.
partes com maior variabilidade, obtemos melhores resultados. Ser possvel notar que,
aparentemente, o restante dos eletrodos captam apenas rudos que atrapalham no mo-
Figura 4.5: Curvas de nvel para os loadings das 4 primeiras componentes principais.
5 Mtodo para Discriminante de dados de EEG
A classificao de dados de EEG uma tarefa difcil. A grande maioria dos eletrodos
citadas e tambm outras, como a sugerida nesta monografia na seo 3.4, e diversas
novo mtodo de classificao que misturasse tcnicas e que principalmente pudesse por
Este captulo descreve o mtodo de classificao desenvolvido e com o qual foram obti-
5.1 O Periodograma
Considere que {Xt } seja uma srie temporal estacionria. Considere tambm o vetor
x1
x2
x = . Cn (5.1)
:
xn
onde Cn denota o conjunto de todos os vetores coluna com elementos complexos. Seja
tambm ] [
2k n1 [n]
k = , k= , ..., , (5.2)
n 2 2
onde [y] denota o maior inteiro menor igual a y. O conjunto de todos os k - que denota-
Defina tambm
eik
2ik
e [ ]
1
n1 [n]
ek = . , k= , ..., , (5.3)
n : 2 2
enik
onde e j denota o vetor linha em que todos elementos so os respectivos complexos con-
jugados do vetor e j . Tem-se portanto que {e1 , e2 , ..., en } uma base de Cn , ou seja,
[n/2]
x= ak ek . (5.5)
k=[(n1)/2]
Esta equao pode ser reescrita como uma combinao linear de funes seno e
cosseno com frequncias k Fn , isso pode ser feito escrevendo o t-simo componente
de x como
[n/2]
xt = ak [cos(kt) + isen(k t)], t = 1, ..., n. (5.6)
k=[(n1)/2]
se, portanto,
1 n
ak = ek x = xt eitk . (5.7)
n t=1
2
1 n
it
In () = xt e (5.8)
n t=1
n [n/2] [n/2]
|xt |2 = xx = |ak |2 = In (k ), (5.9)
t=1 k=[(n1)/2] k=[(n1)/2]
No ambiente SAS, o periodograma pode ser calculado por meio do procedimento PROC
Primeiramente, o clculo feito no conjunto dos nmeros reais de forma que a parte
complexa em (5.6) soma para zero. Alm disso o SAS utiliza uma decomposio um
pouco diferente para (5.6) de forma que k s varie no intervalo (0, ], no SAS, portanto
xt dado por
m
a0
xt = + [ak cos(k t) + bk sen(k t)] (5.10)
2 k=1
amostral de x).
n
Jk = (a2k + b2k ). (5.11)
2
A densidade espectral pode ser estimada suavizando o periodograma por uma funo
peso W (.) chamada janela espectral. Essa suavizao diminui a varincia, porm adi-
ciona vis.
Programao SAS.
Periodograma.
5.2 Motivao
e mostra a base lgica que ser aplicada no discriminante. Para o melhor acompa-
nhamento do leitor ressaltamos que, quando for mencionada a palavra Figura, estare-
mos nos referindo a uma das vrias figuras presentes no texto, e quando for mencionada
Veja agora os 3 grficos no lado esquerdo da Figura 5.2, esses grficos mostram os
todas as suas repeties disponveis. Observe por exemplo o primeiro grfico, nota-se
dogramas vermelhos (imagem 4). Esse tipo de padro se repete em outros grficos.
Figura 5.1: Quatro das dez imagens do experimento, numeradas como 3, 4, 6 e 7 respec-
tivamente.
Nos grficos do lado direito foi aplicado um suavizamento com mdias mveis nos res-
pectivos periodogramas esquerda da Figura 5.2. Esta tcnica muito simples, considere
A interpretao neste caso simples, temos que o primeiro ponto dos grficos suaviza-
dos da parte esquerda da Figura 5.2 a contribuio mdia das quatro frequncias iniciais
Neste caso observamos padres semelhantes porm mais estveis j que o periodograma
foi suavizado. Nos testes realizados utilizando o novo mtodo de classificao - como ser
enfatizado adiante - aplicou-se estas ideias, variando tambm o valor de n, e tambm al-
0 20 40 60 80 0 20 40 60 80
K K
0 20 40 60 80 0 20 40 60 80
K K
0 20 40 60 80 0 20 40 60 80
K K
Figura 5.2: Periodogramas e periodogramas com mdias mveis. Para o eletrodo 22, pe-
riodogramas vermelhos e verdes indicam imagens 4 e 6 respectivamente, para
o eletrodos 82, periodogramas laranjas e azuis indicam imagens 4 e 7 respec-
tivamente, e para o eletrodo 114, periodogramas roxos e amarelos indicam
imagens 3 e 6 respectivamente.
40
dados de EEG.
tersticos para cada sinal emitido pelo crebro ao perceber cada imagem do experimento
em particular. De fato, a partir de agora, possvel identificar uma imagem, apenas dado
um sinal qualquer.
na Figura 5.2, adicionada uma linha que pode ser utilizada como discriminante, classi-
ficando algum periodograma suavizado com MM4 que possua amplitudes superiores a
mas verdes) e como pertencendo a imagem 4, caso contrrio. Desta forma, claro que
0 20 40 60 80 0 20 40 60 80
K K
O principal problema que surge que nem todos os eletrodos produzem periodogramas
to claros, e alm disso, mesmo nos periodogramas apresentados, existem uma srie de
prticas.
41
terface entre homem e mquina por exemplo, os sinais captados sejam automaticamente
que possvel melhorar o discriminante gerado pela reta da Figura 5.3 ao se considerar
um discriminante diferente para cada frequncia distinta, como ilustrado na Figura 5.4.
Decidiu-se ento utilizar, para cada um desses discriminantes, a tcnica de SVM j que
as classes. Neste caso, cada discriminante classificar um novo sinal entre duas classes
dependendo se o sinal possui periodograma maior ou menor que certo valor naquele
ponto especfico.
T o valor do perio-
Para introduzir a notao, considere duas classes A e B. Seja Jl,k
T de acordo com o
dograma no k-simo ponto para um sinal teste, classificaremos Jl,k
discriminante
1, T for classificado na classe A
se Jl,k
T
SVMl,k [Jl,k ]= , (5.13)
1, caso contrrio.
Cabe perceber que existem alguns discriminantes mais confiveis que outros. Os dis-
criminantes centrais na Figura 5.4 so claramente mais confiveis do que o ltimo dis-
42
criminante apresentado na Figura 5.4, note que este classificou 2 pontos erroneamente
taxa de classificao incorreta para cada discriminante. Dessa forma, definiu-se os pesos
como
periodograma suavizado.
Note que se a classificao perfeita ento a taxa de erro zero e, portanto, o peso vale
1, e se a classificao aloca metade dos pontos ou mais erroneamente, temos peso zero.
Observe tambm que o parmetro permite que pesos para classificaes com poucos
erros sejam proporcionalmente maiores que pesos para classificaes com muitos erros
43
com o aumento de . Por exemplo, se a taxa de erro 25% ento o peso obtido 0.5 se
= 1, 0.25 se = 2 e 0.707 se = 1/2, sendo que o peso sempre 1 para taxa de erro
0%.
Cabe aqui fazer uma observao sobre a expresso do peso. Como a classificao
binria - duas classes - no faria sentido uma taxa de erro maior que 50%, pois se
assim fosse, bastaria inverter o discriminante para obtermos taxa de erro menor que 50%.
Porm, como a tcnica de SVM usa o critrio de maximizar as margens, esse tipo de
anomalia pode ocorrer em alguns casos mais raros, por essa razo a expresso utiliza o
sinal captado por eletrodo - para ser classificado com o discriminante obtido. Como isso
classe definidos como 1 ou -1, o que fazer com isso? neste momento que entram em
a taxa de classificao incorreta para k = 3 maior ou igual 50% enquanto que, para
k = 50 e k = 62, esta taxa vale 0%. Ou seja, mais provvel que o sinal pertena classe
B do que classe A.
Pensando desta maneira pode-se generalizar para todos os discriminantes obtidos.
m
Dl = SVMl,k [Jl,kT ] Pesol,k . (5.15)
k=1
44
Neste caso, obtm-se a deciso definida pelo eletrodo l como sendo um sinal perten-
Esse processo repetido para todos os eletrodos. Para juntar todas as decises temos
128
D= Dl , (5.16)
l=1
A segunda considerar a deciso final como sendo a deciso dada pela maioria dos
eletrodos.
A primeira opo parece ser mais apropriada pois leva em conta o desempenho do
obtidos utilizando a segunda opo, pois foi a ideia que surgiu primeiro durante o perodo
de trabalho.
testes.
45
Utilizou-se o novo mtodo para fazer o discriminante dos dados disposio. Para que
o contedo desta seo fique mais claro, cabe aqui explicar novamente como formado
o conjunto de dados.
O sujeito usa uma touca com 128 eletrodos sendo que cada um deles capta um sinal
Como o mtodo desenvolvido serve para separao de apenas duas classes, o discri-
minante das imagens deve ser feito 2 a 2, o que totalizaria 45 discriminantes. Porm, como
muitas das imagens so semelhantes - ver Figura 4.1 - decidiu-se fazer o discriminante
apenas das imagens abstratas contra as imagens que apresentam operaes matemti-
mtodo. A validao cruzada foi feita da seguinte forma: para cada par de imagens
seguida, exclui-se a terceira repetio de cada imagem para a fase de teste, utilizando as
Portanto, no final foram testados 16 4 2 = 128 sinais na fase de teste. Note que os
Realizou-se diversas anlises nas quais vrias variaes foram aplicadas. Testou-se
o mtodo para valores diferentes de n, e C nas equaes (5.12), (5.14) e (3.16) res-
crebro.
classificao correta obtida foi de 69%, que no uma taxa elevada mas mostra que o
eficincia de cada regio cerebral. Note que a parte frontal do crebro apresenta taxas
Figura 6.1: Curvas de nvel para as taxas de classificao correta por eletrodo: tcnica
com periodograma, = 2 e C = 1 e tcnica com periodograma suavizado,
n = 4, = 2 e C = 1).
ficao correta de 80%. A Figura 6 mostra a eficincia de cada regio cerebral, note que
o primeiro grfico da Figura 4.5, presente na seo 4.3. Fica evidente que parece ser
50
vlida a hiptese anterior de que a primeira componente principal, por ser a componente
que possui maior variabilidade, identificaria as regies do crebro mais ativadas no ex-
minantes.
Sob essas hipteses, pode-se imaginar que grande parte dos eletrodos captem apenas
segundo mtodo de teste no qual todos os eletrodos possuem o mesmo peso na anlise,
dessa forma parece ser interessante descartar os eletrodos que aparentemente no nos
Para fazer isso, aplicou-se a anlise feita na seo 4.2 descartando todos os discrimi-
nantes no presentes no grupo frontal da Figura 4.4 (diviso em 4 grupos). Deste modo,
literatura. Observe tambm nas tabelas 6.1 e 6.2 a taxa de classificao correta entre
nosso trabalho diversas tcnicas foram aplicadas e, neste ltimo captulo, apresentamos
pode ter mais de 4000 pontos. Essa quantidade enorme de informao se torna redun-
estatsticas.
Como j foi mencionado, o banco de dados utilizado neste trabalho era composto por
apenas 164 pontos por cada eletrodo e, mesmo assim, obteve-se um taxa de classificao
correta de 94%, o que reala que muita informao nos bancos de dados de EEG
redundante.
Mostrou-se tambm que o sinal emitido por eletrodos prximos bastante correla-
cionado e redundante, porm neste caso a informao sobre mais regies do crebro
fato de que os eletrodos mais importantes para a primeira componente principal foram
No que concerne a classificao dos dados de EEG, pode-se afirmar que a aplicao
O novo mtodo para o discriminante de dados de EEG se mostrou bastante eficaz para
o problema em questo. De fato, utilizando apenas 164 pontos por sinal captado por cada
um dos 48 eletrodos usados, obteve-se uma taxa de classificao correta de 94% que
A principal vantagem do novo mtodo, alm da eficincia, o fato de que uma vez ar-
com a frequncia, isso importante pois muito difcil assegurar que o incio do sinal
na maioria das aplicaes prticas existiro mais que 2 classes. Outra desvantagem o
fato de que sempre necessria a mesma quantidade de pontos por sinal, j que, caso
no seria adequado.
esta a principal sugesto da pesquisa. Outras sugestes, que devem ser testadas, so
formas de contornar o problema de mesmo nmero de pontos por sinal, testar outros tipos
Conclumos, ento, destacando o fato de que trabalhar com este tipo de dado bastante
motivador por ser um desafio grande, e tambm por ser uma aplicao que, se bem
de necessidades especiais.
Referncias Bibliogrficas
[1] ADLAKHA, A.; EBRAHIMI, T. Single trial EEG Classification. Swiss Federal Institute
[2] BROCKWELL, P.J.; DAVIS, R.A. Introduction to Time Series and Forecasting. 2nd
[4] HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning:
Data Mining, Inference, and Prediction. 2nd ed. Stanford: Springer. 2009.
[5] JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. 6th ed.
[7] SANEI, S.; CHAMBERS, J.A. EEG Signal Processing.1st ed. Chichester: John Wiley
[8] SRNMO, L.; LAGUNA, P. Bioelectrical Signal Processing in cardiac and neuro-
[9] THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. 3rd ed. San Diego:
Elsevier. 2006.
55
[10] VON BORRIES, G. F. ; COUTINHO, M.; VON BORRIES, R.F. ; MIOSSO, C.J. . Princi-
Chile, 2010.