Monografia - Murilo Coutinho PDF

Universidade de Braslia - UnB
Instituto de Exatas
Departamento de Estatstica
Um novo mtodo para a classificao
de dados de EEG:
Uma aplicao de Mquinas de Suporte Vetorial

e Anlise de Fourier
Murilo Coutinho Silva - 07/36562
Braslia
2010
M URILO C OUTINHO S ILVA - 07/36562
Um novo mtodo para a classificao de dados
de EEG: Uma aplicao de Mquinas de
Suporte Vetorial e Anlise de Fourier
Relatrio apresentado disciplina Estgio Supervisionado
II do curso de graduao em Estatstica, Departamento de
Estatstica, Instituto de Exatas, Universidade de Braslia,
como parte dos requisitos necessrios para o grau de
Bacharel em Estatstica.
Orientador: Prof.o George Freitas von Borries
Braslia - DF
2010
Agradecimentos
Ao SAS Institute Brasil por possibilitar a utilizao desse software por meio de parceria acadmica
com o Departamento de Estatstica da UnB.
Fundao de Empreendimentos Cientficos e Tecnolgicos (FINATEC). 1
Nosso mundo um lugar catico. Como profetiza o efeito borboleta pequenas alte-
raes podem trazer grandes consequncias, e por isso no podemos deixar de nos
questionar como chegamos nesse exato instante de nossas vidas. Que atos e decises
tomadas no passado poderiam nos levar a realidades completamente distintas se tivsse-
mos agido de maneira diferente?
Esse tipo de pensamento sugere que essa monografia no , por algum ponto de vista,
um trabalho realizado por mim com o auxlio do meu orientador, e sim um trabalho que
aparece como mera consequncia das minhas escolhas durante a vida. Portanto, sinto-
me obrigado a agradecer pessoas que, tenho certeza, sem elas nada disso seria possvel.
Primeiramente gostaria de agradecer minha me que me criou com muito esforo
como me solteira, cuidou de mim com muito carinho em todos os momentos que mais
precisei dela, me ensinou amor, moral e tica. Sou imagem da pessoa maravilhosa que
ela pois nela em quem me espelho.
Em seguida quero agradecer o resto da minha famlia. Agradeo minha irm, minha v,
a minha tia, aos meus tios, meu padrasto e aos meus primos que so grandes amigos
acima de tudo. Agradeo a quase todos os momentos de minha vida em que estive na
ilustre presena dessas pessoas que foram sempre momentos de extrema felicidade.
1
Este trabalho teve suporte parcial da FINATEC por meio dos editais de auxlio pesquisa 02/2009 e
01/2010.
A composio social mais catica da vida devem ser os amigos que so os primeiros
pontos de vista diferentes da famlia que algum ouve na vida. Alguns tm pssimas
influncias, j eu tive timas. Agradeo a esse grandes amigos que estiveram comigo
desde a infncia. Nos transformamos juntos no que somos, e a ausncia de qualquer um
desse grupo mudaria enormemente a vida que levei.
Agradeo agora os professores que me levaram ao posto em que me encontro. O
primeiro professor a quem devo muito o Lus Antnio, meu professor do ensino mdio
com quem aprendi clculo no primeiro ano e que me incentivou enormemente nos es-
tudos. O segundo o professor Rathie com que fiz dois anos de iniciao cientfica e
que me ensinou a fazer e gostar da pesquisa, me proporcionando inclusive me primeiro
artigo publicado. O terceiro o meu orientador desta monografia, o professor George von
Borries, que obviamente de fundamental importncia para este trabalho.
Para finalizar devo citar mais duas pessoas. A primeira delas minha namorada e
futura mulher, no consigo nem imaginar como seriam esses ltimos anos sem sua pre-
sena. A segunda pessoa meu falecido av, Mrio Coutinho, que de forma estranha e
sobrenatural me proporciona uma enorme fora com cada simples lembrana, como se
estivesse sempre ao meu lado segurando minha mo para me levar aonde tenho que ir,
como me levava h muito tempo atrs.
Murilo Coutinho Silva
4
Resumo
Esse trabalho discorre sobre um novo mtodo para a anlise de discriminante e clas-
sificao de dados de eletroencefalografia que inclui a tcnica de Mquina de Suporte
Vetorial e anlise de frequncias de Fourier. Alm disso, tambm faz parte desta mono-
grafia, a identificao das regies cerebrais estimuladas durante o experimento utilizando
Anlise de Componentes Principais.
Palavras-chaves: Eletroencefalografia, EEG, Componentes Principais, Discriminantes,
Classificao, Mquina de Suporte Vetorial, SVM, Anlise de Fourier, Periodograma.

Sumrio
1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Eletroencefalografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1 Histria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Coleta de dados de EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Mquina de Suporte Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1 Caso de dados binrios e linearmente separveis . . . . . . . . . . . . . . 6
3.2 Caso de dados binrios no separveis . . . . . . . . . . . . . . . . . . . 10
3.3 SVM e Kernels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Um exemplo de aplicao de discriminante de sinais simulados utilizando
SVM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4 Anlise preliminar dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1 Os dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Anlise dos eletrodos utilizando Agrupamentos Hierrquicos . . . . . . . . 24
4.3 Componentes Principais . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 Mtodo para Discriminante de dados de EEG . . . . . . . . . . . . . . . . . 33
5.1 O Periodograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Introduo ao novo mtodo para discriminante de dados de EEG. . . . . . 40
5.4 Clculo do Discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.5 Sistema de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.6 Fase de teste ou Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.7 Algoritmo para o treinamento . . . . . . . . . . . . . . . . . . . . . . . . 45
5.8 Algoritmos para a fase de testes e aplicaes . . . . . . . . . . . . . . . . 46
6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1 Introduo
A medicina tem papel fundamental na construo de uma sociedade melhor, mais
solidria e segura para todos. Vivemos em um mundo em que a demanda por tratamentos
de sade mais baratos e eficientes cresce a cada dia. Novas tcnicas e equipamentos
precisam ser desenvolvidos para ajudar em diagnsticos, monitoramento e tratamento de
doenas, e anormalidades do corpo humano.
nesse contexto que se percebe com clareza a importncia dos sinais biomdicos.
Esses sinais eltricos produzidos pelo corpo humano tm a singular capacidade de for-
necer informaes preciosas sobre as condies de uma pessoa se forem apropriada-
mente processados e analisados. Particularmente, dentre os sinais biomdicos est o
eletroencefalograma (EEG), que so os sinais eltricos emitidos pelo crebro humano.
O crebro o rgo mais complexo do corpo humano. O mistrio sobre o seu fun-
cionamento foi motivao para pesquisas e estudos pela humanidade h muito tempo.
Porm, os estudos dos sinais eltricos emitidos pelo crebro s foi possvel a partir do
final do sculo XIX com o advento de equipamentos sensveis o suficiente para captar
esses sinais.
A importncia do EEG est no diagnstico de diversas doenas - tais como a epilepsia,
e de anormalidades - como problemas durante o sono. Muito embora o EEG esteja con-
solidado para algumas aplicaes, para outras ainda motivo de pesquisa, sendo papel
do estatstico a identificao e classificao de padres nesses dados.
Infelizmente, no h um tipo de anlise estatstica padronizada para a anlise de EEG,
sendo encontrada uma diversidade de tcnicas na literatura. Particularmente, na anlise
de discriminante e classificao, so encontradas entre outras tcnicas, a anlise de dis-

2
criminante de Fisher, redes neurais (Neural Network), e mquina de suporte vetorial (Sup-
port Vector Machine (SVM)).
A anlise de discriminante e classificao em EEG no s importante para a iden-
tificao de doenas e anormalidades como tambm para o desenvolvimento de inter-
faces homem-mquina, permitindo, por exemplo, o controle do computador por meio do
pensamento. Este tipo de aplicao seria muito interessante para o desenvolvimento de
prteses controlveis por pacientes portadores de necessidades especiais.
Essas so algumas motivaes para o estudo de classificao de dados de eletroence-
falografia bem como desenvolvimentos importantes que esse tipo de estudo pode trazer.
A seguir descrevemos a organizao deste trabalho.
O segundo captulo narra a histria da eletroencefalografia desde 1875 quando Richard
Caton publicou o primeiro registro de atividade eltrica no crtex de animais at os dias
atuais. Alm disso, neste captulo, apresentada, brevemente, a forma como realizada
a coleta desse tipo de dados.
O terceiro captulo totalmente dedicado ao estudo da tcnica de mquina de suporte
vetorial - do ingls support vector machine (SVM) - que parte importante deste trabalho.
Esta tcnica utilizada para fazer discriminante e classificao de diversos tipos de dados,
e sua escolha foi motivada pelo nmero de artigos recentes que usam a tcnica de SVM
para a classificao de dados de EEG. O final do terceiro captulo apresenta um exemplo
de uso de SVM em dados de sinais.
O quarto captulo expe uma breve anlise exploratria dos dados, um estudo utilizando
componentes principais para a identificao das regies cerebrais estimuladas durante o
experimento e tambm um estudo utilizando agrupamentos hierrquicos para a identifi-
cao das regies do crebro que so mais correlacionadas entre si.
O quinto captulo introduz o novo mtodo de classificao de dados de EEG desen-
volvido. O mtodo composto por diversas tcnicas incluindo mquina de suporte vetorial
e anlise de frequncias de Fourier, por esta razo este captulo inclui tambm um estudo
sobre o periodograma.
O sexto captulo utiliza o mtodo desenvolvido no captulo 5 para fazer o discriminante
e classificao dos dados de EEG. Desse modo avalia-se tambm a eficcia do novo
mtodo comparando-o a outras tcnicas mais usuais.

3
Finalmente, o stimo captulo apresenta as concluses e uma reflexo sobre todos os
resultados obtidos no trabalho por inteiro. Mostra-se tambm as vantagens e desvanta-
gens do novo mtodo alm de propor linhas de pesquisa e evidenciar problemas encon-
trados que devem ser resolvidos.

2 Eletroencefalografia
A eletroencefalografia nada mais que o registro da variao do potencial eltrico do
crebro. Essa variao depende do estado e da situao em que se encontra um indivduo
sendo um tipo de informao sobre seu pensamento. Este captulo apresenta detalhes
histricos da eletroencefalografia bem como uma breve introduo de como esses dados
so coletados.
2.1 Histria
O estudo e o desenvolvimento do eletroencefalograma (EEG) s se iniciou no final do
sculo XIX. Foi s com a chegada da tecnologia e de aparelhos capazes de captar va-
riaes eltricas da ordem de milivolts, que foi possvel se captar sinais eltricos emitidos
pelo crebro.
Em 1875, Richard Caton publicou o que foi o primeiro registro da atividade eltrica
do crtex cerebral de animais. Caton conseguiu perceber alguns fenmenos do crebro
utilizando equipamentos muito rsticos. Seu estudo revelou, dentre outras coisas, duas
situaes muito importantes e conhecidas no estudo do EEG. A primeira situao que
Caton percebeu foi que, ao contrrio do que imaginaramos, a amplitude do sinal eltrico
emitido pelo crebro aumenta durante o sono. A segunda e mais importante descoberta
de seu trabalho foi que a atividade eltrica se correlaciona com a atividade motora e
estmulos externos.
Foi ento, em 1924, que Hans Berger registrou o primeiro EEG de atividade cerebral hu-
mana utilizando um galvanmetro muito sensvel. Criador do termo eletroencefalograma,
estudou as sucessivas posies do elemento mvel do galvanmetro, registradas numa

5
folha de papel, sendo assim capaz de perceber os padres resultantes dessas ondas
cerebrais variando com o tempo. Berger percebeu que essas ondas no so totalmente
aleatrias e demonstram certos padres de periodicidade e regularidade. Ele percebeu
tambm, que as ondas cerebrais dos indivduos tm alta amplitude e baixa frequncia du-
rante o sono e baixa amplitude e alta frequncia quando acordados. Outra descoberta de
Berger, e uma das mais interessantes, foi que o EEG era modificado durante um ataque
epiltico. Hans Berger ainda no era muito conhecido e ento foi s em 1934 quando os
ingleses Adrian e Matthews publicaram um artigo verificando as descobertas de Berger
que a eletroencefalografia e as ondas eltricas do crebro foram aceitas pela comunidade
cientfica. Adrian e Matthews no s foram importantes pela disseminao do EEG como
tambm pela descoberta do ritmo alfa que era uma oscilao regular de aproximadamente
10 a 12 Hz registrados dos lbulos occipitais do crtex cerebral que desaparece quando
algum foca alguma coisa, presta ateno ou fica em estado de alerta em algo no seu
campo de viso.
2.2 Coleta de dados de EEG
O dados de EEG so coletados diretamente de um indivduo. Esses dados podem ser
coletados de forma invasiva ou no invasiva. No mtodo invasivo eletrodos so intro-
duzidos dentro do crnio sobre o cortex cerebral, j no mtodo no invasivo o indivduo
coloca uma touca (ver Figura 2.1) com vrios eletrodos que captam os potenciais eltricos
emitidos pelo crebro. Os dados analisados neste trabalho foram coletados empregando
o mtodo no invasivo utilizando uma touca com 128 eletrodos, posicionados de forma
especfica de acodo com regras de padronizao internacional.
Figura 2.1: Coleta de dados, BIM Lab, UTEP, Texas.

3 Mquina de Suporte Vetorial
A tcnica de Mquina de Suporte Vetorial (do ingls Support Vector Machine (SVM))
surgiu em 1992 e uma tcnica relativamente nova mas que vem sendo muito utilizada
recentemente. A tcnica de SVM utilizada tanto em problemas de regresso quanto em
problemas de classificao e reconhecimento de padres.
A deciso de utilizar a tcnica de SVM nesta monografia foi motivada, inicialmente,
pela quantidade de artigos recentes que vem empregando SVM para a classificao de
dados de EEG. Durante o perodo de trabalho aplicou-se a tcnica de SVM como vinha
sendo utilizada mas no obteve-se boas taxas de classificao. Este fato foi a principal
motivao para a nossa iniciativa em desenvolver um novo mtodo para anlise desse
tipo de dados.
3.1 Caso de dados binrios e linearmente separveis
Para iniciar a discusso sobre Mquinas de Suporte Vetorial (SVM), abordaremos o
caso particular em que se deseja separar duas classes que so separveis por um hiper-
plano
X T + 0 = 0. (3.1)
Logicamente, como se pode visualizar na Figura 3.1, esse hiperplano no nico e,
portanto, necessrio determinar um critrio que nos permita otimizar essa separao.
Desse modo, escolhe-se o hiperplano que deixe a maior margem (M ) de distncia pos-
svel entre as classes, como pode-se visualizar na Figura 3.2.

7
Figura 3.1: Um exemplo de duas classes separveis. Trs exemplos de hiperplanos (retas
no caso bidimensional) so mostrados. claro que existem infinitos hiper-
planos que podem separar esses dados e portanto necessrio um critrio
para escolher o hiperplano timo.
X
X
X
Figura 3.2: O mesmo exemplo de duas classes separveis. O hiperplano verde (reta no
caso bidimensional) o hiperplano timo. As retas pontilhadas definem a
margem que mxima neste caso. Os pontos marcados com um "X"so os
chamados vetores suporte.
3.1.1 Definies e conceitos matemticos
Nesta seo so dadas algumas definies e conceitos matemticos importantes.
Seja o hiperplano L dado pela equao
g(x) = X T + 0 = 0, X p (3.2)
ento a distncia de qualquer ponto xi ao hiperplano L dada por
1 ( T ) g(xi )
D= xi + 0 = . (3.3)
g (xi )
8
Considere yi uma varivel indicadora definida por

1 se xi W1
yi = (3.4)
1 se x W
i 1
Sejam tambm xi p , i = 1, 2, ..., N , os vetores (feature vectors) de um conjunto de
treinamento (training set) X , classificados em uma de duas classes W1 ou W1 de modo
que yi g(xi ) > 0 se xi for corretamente classificado em sua classe pelo hiperplano.
3.1.2 Hiperplano timo
O objetivo maximizar a margem M , isto , escolher o hiperplano de maior margem
de distncia possvel entre as classes. claro que nenhum ponto xi tem distncia menor
do que M em relao ao hiperplano, portanto em termos matemticos tem-se, usando a
equao (3.3),
1 ( T )

xi + 0 M (3.5)
e como as duas classes so separveis, temos equivalentemente
1 ( T )
yi xi + 0 M

( )
yi xiT + 0 M
Para qualquer e 0 que satisfaam essa equao, qualquer mltiplo positivo destes
tambm a satisfaz. Logo, possvel escolher arbitrariamente = M

1
de modo que
( )
yi xiT + 0 1 (3.6)
Desta forma, o problema se resume ao problema de otimizao
Max M
,0
1 ( T )
sujeito a yi xi + 0 M, i = 1, 2, ..., N

ou de mesmo modo
9
1
Min 2 (3.7)
,0 2
( )
sujeito a yi xiT + 0 1, i = 1, 2, ..., N
Este um problema de otimizao convexa, ento, usando multiplicadores de La-
grange, obtm-se a funo primal
1 N [ ( ) ]
L p = i yi xiT + 0 1
2
(3.8)
2 i=1
onde i so os multiplicadores de Lagrange. Derivando (3.8) em relao a e 0 obtm-
se
N
= i yi xi (3.9)
i=1
N
iyi = 0 (3.10)
i=1
Substituindo (3.9) e (3.10) em (3.8), encontra-se a funo dual de Wolfe:
N
1 N N
LD = i ik yiyk xiT xk , i 0 (3.11)
i=1 2 i=1 k=1
A soluo obtida maximizando LD , um problema simples de otimizao convexa que
deve satisfazer (3.9), (3.10) e (3.11) alm de satisfazer as condies de Karush-Kuhn-
Tucker (KKT):
[ ( ) ]
i yi xiT + 0 1 = 0, i = 1, 2, ..., N (3.12)
Encontra-se, desse modo, o hiperplano timo para separar as duas classes. im-
( )
portante notar que a equao (3.12) implica que i = 0 ou que yi xiT + 0 = 1, ou
seja, i s diferente de zero (em geral) se e somente se o ponto xi estiver sobre uma
das margens e portanto a uma exata distncia M do hiperplano L respeitando a restrio

( )
yi xiT + 0 = 1. Os pontos que respeitam essa restrio (ver Figura 3.2) so chamados
de Vetores Suporte (Support Vectors) e so pontos muito importantes j que o parmetro
determinado exclusivamente devido a eles.

10
Para finalizar define-se o classificador
G(x) = sinal( f(x)), (3.13)
onde f(x) = xT + 0
para a classificao de observaes futuras.
3.2 Caso de dados binrios no separveis
Na seo 3.1 foi definido o hiperplano timo na separao de duas classes linearmente
separveis. Na prtica, entretanto, muitas vezes os dados no so linearmente separveis
e a matemtica descrita at aqui passa a no ser mais vlida.
A soluo para este problema simplesmente permitir observaes entre as margens
e observaes incorretamente classificadas pelo hiperplano. Desse modo encontrar-se-
trs tipos de pontos:
i) Pontos corretamente classificados fora ou em cima das margens, ou seja:
1 ( T )
yi xi + 0 M

ii) Pontos corretamente classificados residindo entre as margens:
1 ( T )
0< yi xi + 0 < M

iii) Pontos incorretamente classificados:
1 ( T )
yi xi + 0 0

Esses trs casos podem ser resumidos em um nico caso ao se introduzir novas va-
riveis i da seguinte maneira:
1 ( T )
yi xi + 0 M(1 i ). (3.14)

11
Desse modo, para i = 0 tem-se pontos do primeiro tipo, para 0 < i < 1 tem-se pontos
do segundo tipo e para i 1 tem-se pontos do terceiro tipo. Alm disso, escolhe-se e
0 em (3.14)convenientemente de modo que = 1

M e portanto obtm-se
( )
yi xiT + 0 1 i , i = 1, 2, ..., N. (3.15)
As variveis i so conhecidas como variveis de folga e sua representao grfica
pode ser vista na Figura 3.3. Logicamente o intuito da tcnica ter o mnimo de pontos
N
do tipo (ii) e do tipo (iii) e para isso minimiza-se a soma i que a quantidade total
i=1
pela qual pontos esto proporcionalmente do lado errado da margem. Levando essas
situaes em conta, pode-se generalizar o problema dado em (3.7) por
N
1
Min +C i
2
(3.16)
,0 ,i 2 i=1
sujeito a
( )
yi xiT + 0 1 i , i = 1, 2, ..., N
i 0, i = 1, 2, ..., N.
A constante C previamente escolhida e determina a influncia dos dois termos no
problema de minimizao. Note que para C grande a influncia das variveis i se torna
maior resultando assim em uma margem menor. Se existirem duas classes linearmente
separveis ento pode-se utilizar as equaes dadas em (3.16) fazendo C .
3.2.1 Clculo do hiperplano timo
Para resolver este problema ser novamente utilizada a tcnica dos multiplicadores de
Lagrange. Do problema definido em (3.16) obtm-se a funo primal de Lagrange
1 N N [ ( ) ] N
L p = 2 +C i i yi xiT + 0 (1 i ) i i (3.17)
2 i=1 i=1 i=1
12
4
2 3

Figura 3.3: Um exemplo de duas classes no separveis. O hiperplano verde (reta no

caso bidimensional) o hiperplano timo. As linhas pontilhadas delimitam as
margens de largura M. Os pontos quadrados so os vetores suporte (Support
Vectors). Os vetores representados por i so vetores cuja norma propor-
cional (M vezes) a varivel de folga correspondente ao seu respectivo ponto
xi .
onde i e i so os multiplicadores de Lagrange e devem ser positivos ou iguais a zero.
Derivando em relao a , 0 e i , e igualando a zero, encontra-se
N
= i yi xi , (3.18)
i=1
N
iyi = 0, (3.19)
i=1
i = C i , (3.20)
com i = 1, 2, ..., N . Substituindo (3.18), (3.19) e (3.20) em (3.17) obtm-se a funo dual
de Wolfe
N
1 N N
LD = i ik yiyk xiT xk . (3.21)
i=1 2 i=1 k=1
A soluo obtida maximizando LD , um problema simples de otimizao convexa que
deve satisfazer as condies (3.18), (3.19), (3.20) e 0 i C alm de satisfazer as
condies de Karush-Kuhn-Tucker (KKT):
[ ( ) ]
i yi xiT + 0 (1 i ) = 0, (3.22)
13
i i = 0, (3.23)
( )
yi xiT + 0 (1 i ), (3.24)
para i = 1, 2, ..., N . Chega-se ento ao estimador de que dado por
N
= i yi xi . (3.25)
i=1
Desse modo, determinou-se o hiperplano timo para separar as duas classes. impor-
( )
tante notar novamente que a equao (3.22) implica que i = 0 ou que yi xiT + 0 =
( )
1 i ou seja, i s diferente de zero (em geral) se e somente se yi xiT + 0 = 1 i ,
e portanto como i 0, i s diferente de zero se seu ponto xi correspondente estiver
em cima de uma das margens, entre as margens, ou se tiver sido incorretamente classifi-
cado (ver Figura 3.3).
Os pontos cujo respectivo i diferente de zero so chamados de vetores suporte
(Support Vectors) e so de suma importncia j que o parmetro determinado ex-
clusivamente devido a esses ponto como pode-se notar na equao (3.25). Essa uma
caracterstica muito interessante desse classificador pois ele foca ateno nos pontos que
realmente importam.
Outra motivao para o uso de SVM que nenhuma suposio sobre a distribuio
dos dados necessria, j que o que levado em conta apenas a distncia entre as
classes.
3.2.2 Classificador no linear
Considere duas classes que no so linearmente separveis. Suponha que exista um
mapeamento
x p y k (3.26)
que transforme o espao dos dados em um espao k-dimensional onde as classes pos-
sam ser satisfatoriamente separveis por um hiperplano.

14
Se tal mapeamento existir pode-se utilizar as tcnicas vistas na seo anterior para en-
contrar o hiperplano timo que separe essas classes no espao k-dimensional, resultando
em uma funo no linear no espao original.
primeira vista essa ideia no parece ser muito vivel j que aumentando as dimenses
dos dados, o processo computacional de estimao se tornaria, muitas vezes, invivel ou
mesmo impossvel. Porm, existe uma bela propriedade da tcnica de SVM que per-
mite aumentar muito o nmero de dimenses (tornando-as infinitas se necessrio) sem
adicionais demandas computacionais.
3.3 SVM e Kernels
Nas sees anteriores foi definido nosso problema de minimizao para o clculo do
hiperplano timo. Note ento na equao (3.21) que todos os clculos envolvidos sobre
os dados esto na forma do produto interno xiT xi . Da mesma forma, para o novo espao
k-dimensional, os clculos envolvidos estaro na forma de produto interno. O fato inte-
ressante que para alguns mapeamentos esses produtos internos podem ser calculados
como funo do produto interno original xiT xi .
Teorema. Teorema de Mercer. Sejam x p e um mapeamento ,
x (x) H (3.27)
onde H um espao Euclideano. A operao de produto interno tem a representao
equivalente
K(x, z) = i (x)i (z) (3.28)

i
onde i (x) o i-simo componente do mapeamento (x) e K(x, z) uma funo simtrica
que satisfaz

K(x, z)g(x)g(z)dxdz 0 (3.29)
15
para qualquer g(x), x p tais que

[g(x)]2 dx < + (3.30)
O inverso tambm verdadeiro, ou seja, para qualquer funo K(x, z) que satisfaa
(3.29) e (3.30) existe um espao onde K(x, z) define um produto interno. Tais funes so
conhecidas como Kernels e o espao H como "Reproducing Kernel Hilbert Space"(RKHS).
Alguns dos Kernels mais utilizados so
i) Polinomiais
K(x, z) = (xT z + 1)q , q>0 (3.31)
ii) Radiais ou Gaussianos
( )
||x z||2
K(x, z) = exp (3.32)
2
iii) Sigmoide
K(x, z) = tanh(xT z + ) (3.33)
para valores de e que satisfaam as condies do teorema de Mercer.
Portanto, adotado um Kernel conveniente, o problema de otimizao dado em (3.21) se
torna
N
1 N N
Max

i ik yiyk K(xi, xk)
2 i=1
i=1 k=1
sujeito a 0 i C, i = 1, 2, ..., N (3.34)
iyi = 0
i
A caracterstica que deve ser ressaltada que a complexidade computacional envolvida
na tcnica de SVM independe do nmero de dimenses extras adicionadas pelo Ker-
nel, ou seja, pode-se trabalhar em dimenses elevadas sem ter que estimar um grande
nmero de parmetros.
16
Programao R.
Pacote: e1071
Mquina de suporte vetorial (SVM).
Comandos e parmetros fundamentais:
svm(x, y, kernel = radial, cost = 1)
x - dados.
y - classes.
kernel - Kernel utilizado. Tem como padro o kernel Radial. Outras opes:
linear, polynomial, radial basis, sigmoid.
cost - Valor do parmetro C.
Exemplo:
z = read.table(dados.txt,header=T)
attach(z)
x <- subset(z, select = -classe)
y <- classe
model <- svm(x, y , kernel = linear)
# Grfico (Banco de dados bidimensional).
plot(model, data = z, x y)
print(model)
summary(model)
# Testando acurcia no treinamento.

pred <- predict(model, x)
table(pred, y)
17
3.4 Um exemplo de aplicao de discriminante de sinais
simulados utilizando SVM.
As sees anteriores introduziram e fundamentaram a tcnica SVM 1 . Ressalta-se,
porm, que o objetivo deste trabalho a classificao de dados de eletroencefalografia
e, obviamente, no conseguiremos separar sinais utilizando nenhum dos Kernels vistos
anteriormente.
No incio do perodo de trabalho desenvolvemos um Kernel para ser utilizado na clas-
sificao de sinais, porm este Kernel no se mostrou eficiente para a classificao de
dados de EEG. Entretanto, este Kernel pode ser bem til no discriminante de outros tipos
de sinais, e por isso, o apresentamos nesta seo como exemplo do uso da tcnica de
SVM.
3.4.1 Separao de Senos e Cossenos
Figura 3.4: Um exemplo de dois sinais distintos.
1
Utilizaremos a partir de agora apenas a sigla em ingls SVM para indicar mquina de suporte vetorial.
18
Para comear de forma mais simples, considere o problema de separar os sinais da
Figura 3.5. Esses dados foram gerados por duas funes seno do tipo
g1 (t) = R1 sen( f1t + c1 ) (3.35)
g2 (t) = R2 sen( f2t + c2 ) (3.36)
Figura 3.5: Simulao de dois senos distintos, antes e aps a transformao.
A ideia fundamental de uma anlise de discriminantes capturar os padres distintos
de cada grupo. Neste caso as diferenas entre as duas curvas so principalmente suas
frequncias e amplitudes.
Capturar as amplitudes das curvas uma tarefa simples j que a amplitude para cada
ponto simplesmente o valor do sinal neste ponto. O clculo das frequncias um pouco
mais complicado principalmente quando no se lida com curvas perfeitas como estas
simuladas. Para facilitar o estudo, ao invs de frequncias utilizou-se aproximaes para
a derivada das curvas tendo em vista o fato de que para amplitudes iguais, frequn-
cias maiores causam primeiras derivadas maiores em valores absolutos para senos ou
cossenos com argumentos iguais para ambas as frequncias, isto , em termos matemti-
cos:
Sendo G1 (t) = g1 (t) = R1 f1 cos( f1t + c1 ) e G2 (t) = g2 (t) = R2 f2 cos( f2t + c2 )
ento se R1 = R2 = R, f1 < f2 e t1 = t2 = w, tem-se que

( ) ( )
t c t c
G1 1 1 = |R f1 cos(w)| |R f2 cos(w)| = G2 2 2 (3.37)
f1 f2
19
ou seja, a derivada aliada a amplitude trazem por si prprias informao sobre a frequn-
cia.
O fato apresentado na Eq.(5.6) sugere uma proposta de anlise interessante. Con-
sidere ento que Xt o potencial eltrico observado no tempo t para um dos sinais e a
seguinte transformao:
Xt + Xt1
At1 =
2
It1 = Xt Xt1 (3.38)
A varivel At1 pode ser interpretada como a amplitude mdia do sinal entre Xt e Xt1
e a varivel It1 como uma aproximao da derivada para intervalos de tempo unitrios.
Juntando esses valores em dois vetores tem-se:
Ak = (A1 , A2 , ..., An1 )
Ik = (I1 , I2 , ..., In1 )
Onde k = 1 para um dos sinais e k = 2 para o outro sinal. Juntando Ak e Ik em uma
matriz obtm-se para cada um dos grupos:
Tk = (Ak , Ik ) (3.39)
Observe na Figura 3.5 e na Figura 3.7 o que acontece ao plotar o grfico de A por I para
ambos os grupos. Nesta situao, ao se utilizar a tcnica de SVM com um Kernel Radial,
se obtm uma taxa de classificao correta de 100% como pode ser visto na Figura 3.7.
Aparentemente, a tcnica de SVM no foi suficiente para a classificao dos dados no
sentido que foi necessria uma transformao nos dados. Porm, pode-se incluir essa
transformao no Kernel Radial criando um novo Kernel que ideal ao problema. Para
fazer isso considere XA o vetor das observaes de potenciais eltricos e XB o vetor de
observaes no lag de XA para um dos sinais. Descartando o primeiro termo de XA e o
ltimo de XB por questes operacionais, obtm-se
XA = (X2 , X3 , ..., Xn )
XB = (X1 , X2 , ..., Xn1 )

20
Figura 3.6: Simulao de dois senos distintos com rudo, antes e aps a transformao.
Fazendo isso para cada um dos sinais, encontra-se a matriz de observaes
Xk = (XA , XB ) (3.40)
Pode-se ento obter a matriz Tk dada na Eq.(3.39) simplesmente fazendo Tk = Xk .
onde
1
1
= 2 (3.41)
1
2 1
Deste modo aplicar o Kernel Radial nos dados transformados o mesmo que utilizar a
tcnica de SVM para discriminar os dados das matrizes X1 e X2 utilizando o Kernel
( )
||X. Z.||2
K(X, Z) = exp . (3.42)
2
3.4.2 Separao de sinais com Rudo por Splines Cbicos
claro que o exemplo da seo anterior foi um exemplo extremamente idealizado.
Basta olhar para a Figura 3.4 para se perceber que a anlise foi muito longe da realidade.
Para melhorar esta anlise, simulou-se novamente os dados, porm desta vez adicio-
nando rudo aos mesmos. Nota-se, na Figura 3.6, que a transformao proposta j no
to eficiente como antes.
A soluo encontrada neste caso foi simplesmente ajustar Splines Cbicos aos dados.
Essa tcnica nada mais do que um modelo de regresso mltipla que surge ao definir-
mos um conjunto de transformaes dos dados que chamamos bases lineares.

21
SVM classification plot

xooo
oooo
xo xoxx
0.3
x
xo x
o
x o
x
o o
x o
o o
o o
0.2 x x
o
o o
B
o o o o o o o
o o o o x
o
o o
0.1 x o o x
o
x
o o o x
o o
x o x
o
x x x
o x
x
o x x o
0.0
I
x x
x x
o x
o
x o o x
o
o
x o o x
o o
0.1 x o o o
x o o o
o o
o o o o o o x
A
o x
o
0.2 x x
o
o x
o x
o
x x
o
x
o x
x o
0.3 xo
x o o
xx xo
x xo
ooooo
2 1 0 1 2
Figura 3.7: Classificao utilizando SVM com o Kernel Radial aps transformao, ou apli-
cando diretamente o Kernel dado na Eq.(3.42).
Denote por hm (t) : p a m-sima transformao de t , m = 1, ..., M . Ento modela-
se
M
f (t) = mhm(t), (3.43)
m=1
como sendo uma expanso em bases lineares em t . A beleza deste modelo est no fato
de que uma vez definidas as funes hm , temos modelos lineares nessas novas variveis
e podemos estimar os parmetros como em uma regresso mltipla.
O ajuste dos Splines Cbicos ento obtido dividindo o domnio de t em k intervalos
delimitados por k 1 ns, e ajustando um polinmio cbico em cada um desses intervalos
com a restrio de que, tanto a curva, como a primeira e a segunda derivada, sejam
contnuas em todas as junes de intervalos. Desse modo pode-se construir as bases
h1 (t) = 1 h2 (t) = t h3 (t) = t 2 h4 (t) = t 3
h5 (t) = (t 1 )3+ h6 (t) = (t 2 )3+ ... hm (t) = (t m4 )3+ (3.44)

22
Ajustados os Splines Cbicos, basta agora utilizar os valores esperados dos modelos
para cada um dos sinais e repetir a mesma anlise da seo anterior. Fazendo isso nos
dados com rudo obtm-se a classificao mostrada na Figura 3.8. Note que apenas 3
pontos foram classificados de forma errnea, e isso se deve a instabilidade dos Splines
nos extremos do intervalo tempo. Se fossem retirados esses pontos instveis o discrimi-
nante acertaria 100% dos pontos mais uma vez.
SVM classification plot
o o o
o oo oo oo o
0.4 oo oo
o o
o xx ox ox oo
o ox o
ox o x
x ox xx oooo
B
o o
xx xx o
0.2 o o o
o
xx x oooo xo o
o o oo o oooooxoxoxo o oo
x o xo oo o oxox o x
xx oo oxo x x xo
xox x xxx xoo o
o
xx xx xoxxx
xx xxx x oo
I
0.0 x ox x x xo
xx xxx xoo o
o o x
o x x xxx oo
xxo ooo
o
o oo oooox oo
o
xxoo oo o o o o ooo x ox
x
xx x ooooooo o o o o oooooooo
ooo o o ooooox x o
x x oo
o xox x x x
0.2 x x
A
x o
xxx
o x xo o
o xx x x xo
x
oo x x o ox
o o o o
o x o oo o o
0.4 o o o ooo o
o o o oo
2 0 2
Figura 3.8: Classificao utilizando SVM com o Kernel Radial aps utilizar splines e em
seguida a transformao.
4 Anlise preliminar dos dados
Este captulo descreve inicialmente ao leitor como constitudo o banco de dados uti-
lizado neste trabalho. Em seguida, anlises de agrupamentos hierrquicos e de compo-
nentes principais, realizadas com o intuito de identificar as regies do crebro mais esti-
muladas pelo experimento, e as regies cerebrais que so fortemente correlacionadas
so apresentadas.
A anlise de componentes principais produziu resultados muito interessantes, como
descritos neste captulo e em [10].
4.1 Os dados
Os dados de EEG nada mais so que sinais eltricos emitidos pelo crebro. Para captar
esses dados utilizam-se os procedimentos descritos no Captulo 2.
O conjunto de dados analisados nesse trabalho so provenientes de um experimento
em que um voluntrio senta-se em frente a uma tela que mostra um conjunto de 10 ima-
gens.
Cada imagem apresentada ao voluntrio 4 vezes por um perodo de 5 segundos em
uma ordem aleatria (ver as imagens do experimento na Figura 4.1). Cada sinal captado
possui mais de 4000 pontos registrados, para um total de 10 imagens, repetidas 4 vezes,
captadas por 128 eletrodos, o que resulta em um banco de dados extremamente grande.
Um dos objetivos desse trabalho obter a melhor taxa de classificao possvel com
o mnimo de pontos e por isso a quantidade de pontos por sinal utilizada foi reduzida
para 164 pelos engenheiros eltricos que nos forneceram os dados aplicando tcnicas
24
Figura 4.1: As 10 imagens utilizadas no experimento.
consolidadas. Desse modo tem-se um total de 164 10 4 128 = 839680 pontos para
as anlises.
4.2 Anlise dos eletrodos utilizando Agrupamentos
Hierrquicos
O objetivo final deste trabalho fazer o discriminante e a classificao das figuras ob-
servadas, mas desejvel e interessante empregar somente a informao necessria
para isso. Neste aspecto de se considerar que, talvez, e muito provavelmente, seja
desnecessrio e redundante discriminar as figuras utilizando dados captados por 128
eletrodos prximos e alm disso usar o sinal com mais de 4000 pontos em apenas 5
segundos por eletrodo.
De fato, ao se observar a Figura 4.2, nota-se que existe uma correlao alta entre muitos
desses eletrodos e isso j um indcio de que os eletrodos prximos possivelmente esto
captando sinais praticamente idnticos e, portanto, talvez no seja necessrio se consi-
derar todos esses eletrodos na anlise.
Com o objetivo de identificar grupos de eletrodos com informao similar, foi feita uma
anlise de agrupamento para a matriz de correlao desses eletrodos. Dessa forma,
pode-se identificar os grupos de eletrodos que so mais fortemente correlacionados. Ob-
serve, por meio do dendograma na Figura 4.3, de uma anlise de agrupamento hie-
rrquico realizada, que possvel perceber que uma formao com 4 grupos razovel.
el82
el83
el80
el78
el79
el96
el91
el92
el94
el95
el81
el93
el99
el100 2e05 2e05 3e05 3e05 2e05
el88
el89
el90
el73
el74
el76
el77
2e05
el84
el85
el87
el23
el97
el1
el65
el66
el75
el69
el70
el71
el64
2e05
el67
el68
el101
el24
el102
el103
el108
el114
el107
el115
el72
el86
el111
2e05
el109
el98
el110
el28
el25
el29
el26
el27
el39
el40
el41
el22
3e05
el20
el21
el37
el38
el30
el26
el19
el31
el16
3e05
el17
el18
el8
el9
el10
el15
2e05
el25
el23
el24
el27
el11
el12
el13
el14
el113
el117
el118
el116
2e05
el104
el105
el127
el128
el28
el106
el120
el123
el124
el6
el119
el121
2e05
el122
el5
el126
el7
el125
el29
el63
el33
el52
el53
el54
el61
el62
el112
2e05
el2
el3
el56
el60
el30
el34
el50
el51
el44
el42
el43 2e05 2e05 2e05 2e05
el4
el32
el36
el45
el57
el58
el55
el59
el46
el47
el35
el48
el49
Figura 4.3: Dendograma da anlise de agrupamento para os eletrodos.

Figura 4.2: Grficos de disperso para um pequeno conjunto de eletrodos.
25
26
Figura 4.4: Mapeamento dos eletrodos por grupo.
Programao R.
Agrupamento Hierrquico.
dist(x, method = "euclidean", ...)
x - Banco de dados.
method - A medida de distncia a ser utilizada. Deve ser um de: "euclidean",
"maximum", "manhattan", "canberra", "binary"ou "minkowski".
hclust(d, method = "complete",...)
d - Resultado produzido pela funo dist.

method - Mtodo de agrupamento utilizado. Deve ser um de: "ward", "single",
"complete", "average", "mcquitty", "median"ou "centroid".
27
Para uma melhor visualizao, pode-se fazer um mapeamento dos eletrodos de cada
grupo como o apresentado na Figura 4.4 quando se tem respectivamente 2, 3, 4 e 5 gru-
pos. Neste caso o agrupamento foi feito utilizando a distncia manhattan, porm a mesma
anlise foi feita para diversos tipos de distncia e todas deram resultados extremamente
parecidos.
Portanto, ficam claros 4 grupos muito bem definidos correspondendo a regies do cre-
bro: parte frontal, posterior, esquerda e direita. Essa anlise mostra exatamente o que se
postulou a princpio sobre a possvel correlao de regies vizinhas e redundncia dos
dados. Outra ideia que pode ser pensada que, talvez, algumas dessas regies no nos
tragam nenhuma informao importante. De fato, se sabe que a rea mais acionada por
estmulos visuais a parte posterior do crebro. A seguir utilizamos algumas tcnicas de
reduo de dimensionalidade para retirar a possvel redundncia dos dados.
4.3 Componentes Principais
Uma anlise de componentes principais utilizada para explicar a estrutura de varincia-
covarincia de um conjunto de variveis por um conjunto menor de variveis formadas por
combinaes lineares das variveis originais. Em geral, em bancos de dados cujas va-
riveis so fortemente correlacionadas - como no caso de dados de EEG - a tcnica de
componentes principais muito til na reduo da dimenso do problema. Esse tipo de
anlise, em muitos casos, tambm capaz de revelar relaes inesperadas ou difceis de
se identificar entre as variveis.
4.3.1 A tcnica de componentes principais
Considere um sistema com p variveis aleatrias X1 , X2 , ...X p . Seja a matriz de
varincias-covarincias do vetor aleatrio X = [X1 , X2 , ..., X p ]. Considere tambm as
combinaes lineares
28
Y1 = a1 X = a11 X1 + a12 X2 + ... + a1p X p
Y2 = a2 X = a21 X1 + a22 X2 + ... + a2p X p
... ...
Yp = ap X = a p1 X1 + a p2 X2 + ... + a pp X p
neste contexto tem-se que:
Var(Yi ) = ai ai (4.1)
Cov(Yi ,Y j ) = ai aj . (4.2)
Chamam-se componentes principais as p combinaes lineares Y1 ,Y2 , ...Yp , no cor-
relacionadas com varincias (dadas em 4.1) decrescentes e mximas.
A primeira componente principal a combinao linear com maior varincia possvel,
ou seja, precisamos maximizar Var(Y1 ) = a1 a1 . claro que Var(Y1 ) cresce apenas
aumentando a norma de a1 , desse modo adiciona-se a restrio de que a1 a1 = 1 ao
problema. Portanto calculam-se as componentes principais resolvendo os problemas de
maximizao descritos abaixo.
Primeira componente principal

Encontrar a1 que solucione
Max Var(a1 X)
a1
sujeito a a1 a1 = 1
Segunda componente principal

Encontrar a2 que solucione
29
Max Var(a2 X)
a2
sujeito a a2 a2 = 1
Cov(a1 X, a2 X) = 0
...
i-sima componente principal

Encontrar ai que solucione
Max Var(ai X)
ai
sujeito a ai ai = 1
Cov(aj X, ai X) = 0, j < i.
Prova-se facilmente (ver Jonhson and Wichern 2007) que a soluo a1 = e1 , a2 = e2 ,
... , ap = ep , onde (1 , e1 ), (2 , e2 ), ... , ( p , ep ) so os pares de autovalores-autovetores
da matriz de varincias-covarincias onde 1 2 ... p 0. Ento a i-sima
componente principal dada por
Yi = ei X. (4.3)
p p
Prova-se tambm que Var(Xi) = Var(Yi), ou seja, as componentes principais re-
i=1 i=1
presentam toda a variabilidade do sistema, porm podemos diminuir a dimenso do pro-
blema escolhendo as k primeiras componentes principais que representem a maior parte
da variabilidade.
4.3.2 Aplicao de componentes principais aos dados
Utilizamos a tcnica de componentes principais tendo em vista a reduo da dimen-
sionalidade elevada dos dados identificando as regies mais estimuladas do crebro pelo
experimento, como ficar claro em seguida.

30
Programao R.
Componentes Principais.
prcomp(x, ...)
x - banco de dados.
Exemplo:
data = read.table(dados.txt, header = T)

pc1 <- prcomp(data, scale. = T)
rot <- pc1$r
x <- pc1$x
summary(pc1)
No objeto pc1 armazenado, alm de outros resultados, os loadings das

componentes principais que podem ser obtidos por meio do comando pc1$r.
Foi possvel notar que, em geral, precisa-se de apenas 5 componentes principais para
explicar aproximadamente 80% da variabilidade total e de apenas 15 componentes prin-
cipais para explicar aproximadamente 90% da variabilidade total.
Mas o mais interessante foi perceber que as regies do crebro mais relevantes para
a composio das componentes principais foram a parte frontal e posterior. Observe na
Figura 4.5 os pesos que cada regio do crebro tem na composio de cada componente
principal, para as 4 primeiras componentes principais.
Fica claro que cada componente principal leva em conta uma parte especfica do cre-
bro, mas as componentes mais importantes levam em conta a parte frontal e posterior do
crebro. Desse modo, possvel que essas duas partes sejam as mais importantes para
o reconhecimento de padres que sero feitos.
De fato, a tcnica de componentes principais identifica com propriedade as regies
onde a variabilidade est mais presente, isso significa que sob a hiptese de que as
regies estimulas apresentem sinais com maior energia, e consequentemente com maior
31
Programao SAS.
Componentes Principais.
proc princomp data = sigma cov;

run;
sigma - banco de dados.

cov - parmetro para trabalhar com a matriz de covarincia.
amplitude, as componentes principais estaro, portanto, identificando estas regies mais
estimuladas.
Os prximos captulos mostraro que esta hiptese verdadeira e que, utilizando as
partes com maior variabilidade, obtemos melhores resultados. Ser possvel notar que,
aparentemente, o restante dos eletrodos captam apenas rudos que atrapalham no mo-
mento do clculo do discriminante por captarem sinais de regies pouco estimuladas.

32
Figura 4.5: Curvas de nvel para os loadings das 4 primeiras componentes principais.
5 Mtodo para Discriminante de dados de EEG
A classificao de dados de EEG uma tarefa difcil. A grande maioria dos eletrodos
captam apenas rudos de regies cerebrais no ativadas atrapalhando a anlise. Iden-
tificar a informao importante imprescindvel para obter o sucesso desejado, porm
somente isso no suficiente.
Na literatura, diversos artigos publicados aplicam tcnicas que so aparentemente in-
corretas na situao em questo, ou utilizam mtodos pouco claros apresentando resul-
tados um tanto quanto obscuros.
O desafio, de conseguir classificar adequadamente os dados de EEG, bastante mo-
tivador. Testamos diversas tcnicas e diversas modificaes, incluindo as tcnicas j
citadas e tambm outras, como a sugerida nesta monografia na seo 3.4, e diversas
anlises de sries temporais.
Percebemos nessas tentativas vantagens particulares em cada tcnica de forma que
conclumos que, para obter sucesso em nossa anlise, precisaramos desenvolver um
novo mtodo de classificao que misturasse tcnicas e que principalmente pudesse por
si s identificar as regies do crebro estimuladas e, portanto, importantes.
Este captulo descreve o mtodo de classificao desenvolvido e com o qual foram obti-
dos resultados interessantes. Antes de descrev-lo necessrio definir alguns conceitos
importantes, o que ser feito nas sees seguintes.

34
5.1 O Periodograma
Considere que {Xt } seja uma srie temporal estacionria. Considere tambm o vetor

x1

x2

x = . Cn (5.1)
:

xn
onde Cn denota o conjunto de todos os vetores coluna com elementos complexos. Seja
tambm ] [
2k n1 [n]
k = , k= , ..., , (5.2)
n 2 2
onde [y] denota o maior inteiro menor igual a y. O conjunto de todos os k - que denota-
mos por Fn - chamado de Frequncias de Fourier associadas ao tamanho amostral n.
Note que este conjunto um subconjunto do intervalo (, ].
Defina tambm

eik

2ik
e [ ]
1

n1 [n]
ek = . , k= , ..., , (5.3)
n : 2 2

enik
uma propriedade importante desses vetores que eles so ortonormais, ou seja

1, se j = k,
e j ek = (5.4)
0, caso contrrio.
35
onde e j denota o vetor linha em que todos elementos so os respectivos complexos con-
jugados do vetor e j . Tem-se portanto que {e1 , e2 , ..., en } uma base de Cn , ou seja,
pode-se escrever o vetor x dado em (5.1) em funo da base:
[n/2]
x= ak ek . (5.5)
k=[(n1)/2]
Esta equao pode ser reescrita como uma combinao linear de funes seno e
cosseno com frequncias k Fn , isso pode ser feito escrevendo o t-simo componente
de x como
[n/2]
xt = ak [cos(kt) + isen(k t)], t = 1, ..., n. (5.6)
k=[(n1)/2]
possvel encontrar os coeficientes ak multiplicando (5.5) por ek e usando (5.4), obtm-
se, portanto,
1 n
ak = ek x = xt eitk . (5.7)
n t=1
A sequncia {ak } chamada de transformada discreta de Fourier da sequncia {x1 , ..., xn }.
Definimos agora o periodograma.
Definio. O periodograma de {x1 , x2 , ..., xn } a funo
2
1 n
it
In () = xt e (5.8)
n t=1
Agora, se uma das frequncias de Fourier k , ento In (k ) = |ak |2 . Esse fato
implica em uma relao muito importante, observe que
n [n/2] [n/2]
|xt |2 = xx = |ak |2 = In (k ), (5.9)
t=1 k=[(n1)/2] k=[(n1)/2]
deste modo, o valor do periodograma na frequncia k pode ser interpretado como a
contribuio dessa frequncia para a soma de quadrados.

36
5.1.1 Periodograma no SAS
No ambiente SAS, o periodograma pode ser calculado por meio do procedimento PROC
SPECTRA, porm algumas diferenas de definio so importantes.
Primeiramente, o clculo feito no conjunto dos nmeros reais de forma que a parte
complexa em (5.6) soma para zero. Alm disso o SAS utiliza uma decomposio um
pouco diferente para (5.6) de forma que k s varie no intervalo (0, ], no SAS, portanto
xt dado por
m
a0
xt = + [ak cos(k t) + bk sen(k t)] (5.10)
2 k=1
onde m = n/2 se n par e m = (n 1)/2 se n impar e a0 = 2x (duas vezes a mdia
amostral de x).
No SAS o periodograma ento a sequncia {Jk }, onde
n
Jk = (a2k + b2k ). (5.11)
2
Da mesma forma o periodograma interpretado como a contribuio da frequncia k
para a soma de quadrados total.
A densidade espectral pode ser estimada suavizando o periodograma por uma funo
peso W (.) chamada janela espectral. Essa suavizao diminui a varincia, porm adi-
ciona vis.
Programao SAS.
Periodograma.
proc spectra data = sigma out = sada ;

var x;
run;
sigma - banco de dados.

saida - nome para o banco de dados resultante.
var - varivel utilizada.
37
5.2 Motivao
Esta seo descreve a principal motivao para o desenvolvimento do novo mtodo
e mostra a base lgica que ser aplicada no discriminante. Para o melhor acompa-
nhamento do leitor ressaltamos que, quando for mencionada a palavra Figura, estare-
mos nos referindo a uma das vrias figuras presentes no texto, e quando for mencionada
a palavra Imagem estaremos nos referindo a uma da 10 imagens utilizadas no experi-
mento do qual resultou nosso banco de dados (ver Figura 5.1).
Inicialmente, aplicou-se a anlise de Fourier para a montagem dos periodogramas e,
com os grficos obtidos, realizou-se uma srie de comparaes. Observando os pe-
riodogramas notou-se certos padres interessantes em alguns casos.
Veja agora os 3 grficos no lado esquerdo da Figura 5.2, esses grficos mostram os
periodogramas para algumas combinaes de eletrodos e imagens do experimento em
todas as suas repeties disponveis. Observe por exemplo o primeiro grfico, nota-se
claramente como os periodogramas verdes (imagem 6) possuem valores maiores entre
as frequncias com k = 35 e k = 60 aproximadamente, em comparao com os perio-
dogramas vermelhos (imagem 4). Esse tipo de padro se repete em outros grficos.
Figura 5.1: Quatro das dez imagens do experimento, numeradas como 3, 4, 6 e 7 respec-
tivamente.
Nos grficos do lado direito foi aplicado um suavizamento com mdias mveis nos res-
pectivos periodogramas esquerda da Figura 5.2. Esta tcnica muito simples, considere
{Jk } a sequncia de pontos do periodograma, ento para algum n qualquer temos o

suavizamento dado por
n
1
MMk =
n Jk+ j1, (5.12)
j=1
ou seja, temos simplesmente que MMk a mdia de n termos em sequncia iniciando-se
no ponto Jk . Denotaremos esse suavizamento como MMn .

38
A interpretao neste caso simples, temos que o primeiro ponto dos grficos suaviza-
dos da parte esquerda da Figura 5.2 a contribuio mdia das quatro frequncias iniciais
(utilizou-se n = 4) para a soma de quadrados total; j o segundo ponto a contribuio
mdia das quatro frequncias iniciando-se do segundo ponto do respectivo periodograma,
e assim por diante.
Neste caso observamos padres semelhantes porm mais estveis j que o periodograma
foi suavizado. Nos testes realizados utilizando o novo mtodo de classificao - como ser
enfatizado adiante - aplicou-se estas ideias, variando tambm o valor de n, e tambm al-
gumas outras variaes.

39
Periodograma - Eletrodo 22 - Imagens 4 e 6 Periodograma + MM4 - Eletrodo 22 - Imagens 4 e 6
0 20 40 60 80 0 20 40 60 80
K K
0 20 40 60 80 0 20 40 60 80
K K
0 20 40 60 80 0 20 40 60 80
K K
Figura 5.2: Periodogramas e periodogramas com mdias mveis. Para o eletrodo 22, pe-
riodogramas vermelhos e verdes indicam imagens 4 e 6 respectivamente, para
o eletrodos 82, periodogramas laranjas e azuis indicam imagens 4 e 7 respec-
tivamente, e para o eletrodo 114, periodogramas roxos e amarelos indicam
imagens 3 e 6 respectivamente.
40
5.3 Introduo ao novo mtodo para discriminante de
dados de EEG.
Os grficos da Figura 5.2 so interessantes pois possvel observar padres carac-
tersticos para cada sinal emitido pelo crebro ao perceber cada imagem do experimento
em particular. De fato, a partir de agora, possvel identificar uma imagem, apenas dado
um sinal qualquer.
Por exemplo, considere a Figura 5.3. O grfico esquerda um dos apresentados
na Figura 5.2, adicionada uma linha que pode ser utilizada como discriminante, classi-
ficando algum periodograma suavizado com MM4 que possua amplitudes superiores a
linha traada entre os pontos prximos de 40 como pertencendo a imagem 6 (periodogra-
mas verdes) e como pertencendo a imagem 4, caso contrrio. Desta forma, claro que
o periodograma suavizado, apresentado no grfico direita, produzido por um sinal
gerado pela observao da imagem 6.
Periodograma + MM4 - Eletrodo 22 - Imagens 4 e 6 Periodograma + MM4 - Eletrodo 22 - Imagem desconhecida
0 20 40 60 80 0 20 40 60 80
K K
Figura 5.3: O periodograma direita pertence ao conjunto dos periodogramas gerados

pela Imagem 6 (periodogramas verdes esquerda.)
O principal problema que surge que nem todos os eletrodos produzem periodogramas
to claros, e alm disso, mesmo nos periodogramas apresentados, existem uma srie de
frequncias que no trazem nenhuma informao clara. Outro problema que no
desejvel obter o discriminante apenas de maneira visual, o que invivel em aplicaes
prticas.
41
Desta forma, necessrio desenvolver um algoritmo de classificao que automatica-
mente identifique os eletrodos relevantes e que tambm identifique as partes importantes
dentro de um conjunto de periodogramas, de forma que, em uma aplicao do tipo in-
terface entre homem e mquina por exemplo, os sinais captados sejam automaticamente
interpretados entre uma das possveis respostas.
5.4 Clculo do Discriminante
Considerando todo o texto escrito at aqui, sero introduzidos em seguida, os passos
lgicos e notaes fundamentais para o mtodo de classificao. Primeiramente, claro
que possvel melhorar o discriminante gerado pela reta da Figura 5.3 ao se considerar
um discriminante diferente para cada frequncia distinta, como ilustrado na Figura 5.4.
Decidiu-se ento utilizar, para cada um desses discriminantes, a tcnica de SVM j que
esta tem a vantagem de no assumir distribuies e considerar apenas as distncias entre
as classes. Neste caso, cada discriminante classificar um novo sinal entre duas classes
dependendo se o sinal possui periodograma maior ou menor que certo valor naquele
ponto especfico.
T o valor do perio-
Para introduzir a notao, considere duas classes A e B. Seja Jl,k
T de acordo com o
dograma no k-simo ponto para um sinal teste, classificaremos Jl,k
discriminante

1, T for classificado na classe A
se Jl,k
T
SVMl,k [Jl,k ]= , (5.13)
1, caso contrrio.
onde l = 1, ..., 128 representa o eletrodo e k representa o indicador do k-simo ponto do
periodograma ou periodograma suavizado.
5.5 Sistema de pesos
Cabe perceber que existem alguns discriminantes mais confiveis que outros. Os dis-
criminantes centrais na Figura 5.4 so claramente mais confiveis do que o ltimo dis-
42
Figura 5.4: Alguns discriminantes pontuais para k variando de 36 48 para os periodogra-

mas produzidos pelos sinais captados pelo eletrodo 22 relativos as imagens 4
e 6. Os pontos azuis representam os discriminantes.
criminante apresentado na Figura 5.4, note que este classificou 2 pontos erroneamente
enquanto aqueles classificaram todos os pontos corretamente.
Levando esse fato em considerao, introduziu-se um sistema de pesos baseado na
taxa de classificao incorreta para cada discriminante. Dessa forma, definiu-se os pesos
como
Pesol,k = [1 2 (Min{Taxa de Erro, 0.5})] , (5.14)
onde a Taxa de Erro dada entre 0 e 1, um parmetro escolhido a priori, l representa
o eletrodo sendo l = 1, ..., 128 e k o indicativo do k-simo ponto do periodograma ou do
periodograma suavizado.
Note que se a classificao perfeita ento a taxa de erro zero e, portanto, o peso vale
1, e se a classificao aloca metade dos pontos ou mais erroneamente, temos peso zero.
Observe tambm que o parmetro permite que pesos para classificaes com poucos
erros sejam proporcionalmente maiores que pesos para classificaes com muitos erros
43
com o aumento de . Por exemplo, se a taxa de erro 25% ento o peso obtido 0.5 se
= 1, 0.25 se = 2 e 0.707 se = 1/2, sendo que o peso sempre 1 para taxa de erro
0%.
Cabe aqui fazer uma observao sobre a expresso do peso. Como a classificao
binria - duas classes - no faria sentido uma taxa de erro maior que 50%, pois se
assim fosse, bastaria inverter o discriminante para obtermos taxa de erro menor que 50%.
Porm, como a tcnica de SVM usa o critrio de maximizar as margens, esse tipo de
anomalia pode ocorrer em alguns casos mais raros, por essa razo a expresso utiliza o
mnimo entre 0.5 e a taxa de erro, j que no desejvel pesos negativos.
5.6 Fase de teste ou Aplicao
Na fase de teste ou em uma aplicao prtica, temos um novo conjunto de sinais - um
sinal captado por eletrodo - para ser classificado com o discriminante obtido. Como isso
pode ser feito?
Inicialmente, o sinal de algum eletrodo - digamos o eletrodo l - escolhido. Obviamente
o prximo passo calcular o periodograma ou periodograma suavizado do sinal. Em

T ] dado em (5.13).
seguida para cada ponto k utiliza-se o discriminante SVMl,k [Jl,k
Neste ponto temos vrios discriminantes calculados e uma srie de indicadores de
classe definidos como 1 ou -1, o que fazer com isso? neste momento que entram em
cena os pesos calculados anteriormente.
l,50 [Jl,50 ] = 1 e SVMl,62 [Jl,62 ] = 1,

T ] = 1, SVM
Suponha por exemplo que SVMl,3 [Jl,3 T T
suponha tambm que Pesol,3 = 0, Pesol,50 = 1 e Pesol,62 = 1. Neste caso hipottico,
a taxa de classificao incorreta para k = 3 maior ou igual 50% enquanto que, para
k = 50 e k = 62, esta taxa vale 0%. Ou seja, mais provvel que o sinal pertena classe
B do que classe A.
Pensando desta maneira pode-se generalizar para todos os discriminantes obtidos.
Para fazer isso basta definir
m
Dl = SVMl,k [Jl,kT ] Pesol,k . (5.15)
k=1
44
Neste caso, obtm-se a deciso definida pelo eletrodo l como sendo um sinal perten-
cente classe A se Dl > 0, classe B se Dl < 0 e no existe deciso se Dl = 0.
Esse processo repetido para todos os eletrodos. Para juntar todas as decises temos
duas opes, a primeira fazer a soma
128
D= Dl , (5.16)
l=1
e decidir a favor da classe A se Dl > 0, da classe B se Dl < 0 e no decidir se Dl = 0.
A segunda considerar a deciso final como sendo a deciso dada pela maioria dos
eletrodos.
A primeira opo parece ser mais apropriada pois leva em conta o desempenho do
eletrodo na fase de treinamento, porm os resultados para os dados analisados foram
obtidos utilizando a segunda opo, pois foi a ideia que surgiu primeiro durante o perodo
de trabalho.
A seguir trs algoritmos so apresentados, o primeiro relativo a fase de treinamento,
o segundo a primeira opo da fase de testes e o terceiro a segunda opo da fase de
testes.
45
5.7 Algoritmo para o treinamento

46
5.8 Algoritmos para a fase de testes e aplicaes

47
6 Resultados
Utilizou-se o novo mtodo para fazer o discriminante dos dados disposio. Para que
o contedo desta seo fique mais claro, cabe aqui explicar novamente como formado
o conjunto de dados.
O experimento consiste em colocar um sujeito em frente a uma tela que mostra 4
repeties de um conjunto de 10 Imagens - ver Figura 4.1 - apresentadas aleatoriamente.
O sujeito usa uma touca com 128 eletrodos sendo que cada um deles capta um sinal
diferente. Desta forma temos um total de 4 10 128 sinais.
Como o mtodo desenvolvido serve para separao de apenas duas classes, o discri-
minante das imagens deve ser feito 2 a 2, o que totalizaria 45 discriminantes. Porm, como
muitas das imagens so semelhantes - ver Figura 4.1 - decidiu-se fazer o discriminante
apenas das imagens abstratas contra as imagens que apresentam operaes matemti-
cas, totalizando 16 discriminantes ao invs de 45.
Como o intuito no era apenas montar os discriminantes e sim testar a eficincia do
mtodo utilizou-se validao cruzada para aproximar a taxa de classificao correta do
mtodo. A validao cruzada foi feita da seguinte forma: para cada par de imagens
analisados excluiu-se a quarta repetio de cada imagem (independentes das demais)
para serem empregadas na fase de teste, utilizando as demais para o treinamento. Em
seguida, exclui-se a terceira repetio de cada imagem para a fase de teste, utilizando as
demais para o treinamento, e assim sucessivamente.
Portanto, no final foram testados 16 4 2 = 128 sinais na fase de teste. Note que os
sinais empregados na fase de teste no foram aplicados na montagem do discriminante
testado, sendo portanto uma anlise confivel.

49
Realizou-se diversas anlises nas quais vrias variaes foram aplicadas. Testou-se
o mtodo para valores diferentes de n, e C nas equaes (5.12), (5.14) e (3.16) res-
pectivamente e, alm disso, o mtodo foi testado em regies distintas e particulares do
crebro.
O primeiro teste realizado foi feito, naturalmente, para o periodograma tradicional (n = 1)
e, neste caso, utilizou-se = 2 e C = 1. Empregando todos os eletrodos, a taxa de
classificao correta obtida foi de 69%, que no uma taxa elevada mas mostra que o
discriminante est identificando certos padres caractersticos.
Calculou-se tambm a taxa de classificao correta por eletrodo. A Figura 6 mostra a
eficincia de cada regio cerebral. Note que a parte frontal do crebro apresenta taxas
mais elevadas em relao as demais.
Figura 6.1: Curvas de nvel para as taxas de classificao correta por eletrodo: tcnica
com periodograma, = 2 e C = 1 e tcnica com periodograma suavizado,
n = 4, = 2 e C = 1).
Mantendo-se constante = 2 e C = 1 novos discriminantes foram calculados utilizando
periodogramas suavizados para vrios valores de n. Para n = 4, obteve-se taxa de classi-
ficao correta de 80%. A Figura 6 mostra a eficincia de cada regio cerebral, note que
a parte frontal do crebro destaca-se ainda mais que antes.
No se pode deixar de observar a semelhana do grfico direita da Figura 6 com
o primeiro grfico da Figura 4.5, presente na seo 4.3. Fica evidente que parece ser
50
vlida a hiptese anterior de que a primeira componente principal, por ser a componente
que possui maior variabilidade, identificaria as regies do crebro mais ativadas no ex-
perimento e, assim, que possivelmente produziriam melhores resultados para os discri-
minantes.
Sob essas hipteses, pode-se imaginar que grande parte dos eletrodos captem apenas
rudo atrapalhando o discriminante. Como mencionado no final da seo 5.6, utilizou-se o
segundo mtodo de teste no qual todos os eletrodos possuem o mesmo peso na anlise,
dessa forma parece ser interessante descartar os eletrodos que aparentemente no nos
trazem informao til.
Para fazer isso, aplicou-se a anlise feita na seo 4.2 descartando todos os discrimi-
nantes no presentes no grupo frontal da Figura 4.4 (diviso em 4 grupos). Deste modo,
refazendo-se a anlise, obtivemos uma taxa de classificao correta de 89%.
O passo seguinte - mantendo o periodograma suavizado com n = 4 - foi variar os
parmetros e C. Testou-se discriminantes para o parmetro variando entre 1/2, 1, 2, 3
e 5 e o parmetro C em trs nveis 0.0001, 1 e 1000. Esses valores de C foram escolhidos
para atingir os extremos de pouca importncia para as variveis de folga (C = 0.0001) e
muita importncia para as variveis de folga (C = 1000).
Utilizando os eletrodos da parte frontal do crebro, o periodograma suavizado com
MM4 , e tambm = 5 e C = 1000, obteve-se uma taxa de classificao correta de 94%,

que uma taxa extremamente elevada levando-se em conta as taxas apresentadas na
literatura. Observe tambm nas tabelas 6.1 e 6.2 a taxa de classificao correta entre
imagens especficas e por eletrodo individualmente.

51
Discriminante Taxa de classificao correta

Imagem 3 x Imagem 1 1.00
Tabela 6.1: Taxa de classificao correta para cada discriminante binrio.
Eletrodo Taxa Eletrodo Taxa Eletrodo Taxa

el1 0.59 el79 0.88 el95 0.91
el64 0.55 el80 0.88 el96 0.84
el65 0.62 el81 0.83 el97 0.62
el66 0.52 el82 0.87 el98 0.67
el67 0.65 el83 0.84 el99 0.73
el68 0.73 el84 0.70 el100 0.77
el69 0.71 el85 0.71 el101 0.78
el70 0.73 el86 0.59 el102 0.77
el71 0.75 el87 0.62 el103 0.74
el72 0.84 el88 0.73 el107 0.74
el73 0.82 el89 0.76 el108 0.76
el74 0.81 el90 0.84 el109 0.74
el75 0.73 el91 0.80 el110 0.67
el76 0.70 el92 0.82 el111 0.59
el77 0.80 el93 0.70 el114 0.76
el78 0.71 el94 0.84 el115 0.68
Tabela 6.2: Taxa de classificao correta para cada eletrodo.

7 Consideraes Finais
A classificao de dados de EEG se mostrou um desafio bastante complicado. Durante
nosso trabalho diversas tcnicas foram aplicadas e, neste ltimo captulo, apresentamos
as concluses obtidas, problemas no solucionados e sugestes de pesquisa.
Primeiramente, cabe ressaltar, que os bancos de dados de EEG so desnecessaria-
mente grandes. Em geral o sinal de um nico eletrodo em um intervalo de 5 segundos
pode ter mais de 4000 pontos. Essa quantidade enorme de informao se torna redun-
dante e complica principalmente a computao de uma grande quantidade de tcnicas
estatsticas.
Como j foi mencionado, o banco de dados utilizado neste trabalho era composto por
apenas 164 pontos por cada eletrodo e, mesmo assim, obteve-se um taxa de classificao
correta de 94%, o que reala que muita informao nos bancos de dados de EEG
redundante.
Mostrou-se tambm que o sinal emitido por eletrodos prximos bastante correla-
cionado e redundante, porm neste caso a informao sobre mais regies do crebro
definitivamente importante. Como foi feito, pode-se identificar as regies do crebro
mais ativadas com o uso de componentes principais e, portanto, a grande quantidade de
eletrodos, neste caso, bem vinda.
O uso de componentes principais e agrupamentos hierrquicos no se mostrou apenas
til na identificao da regies importantes, mas tambm fundamental para excluir as
regies do crebro que emitem rudo e que atrapalham a classificao. Destaca-se o
fato de que os eletrodos mais importantes para a primeira componente principal foram
tambm os eletrodos que obtiveram a melhor taxa de classificao.

53
No que concerne a classificao dos dados de EEG, pode-se afirmar que a aplicao
de tcnicas tradicionais por si s no adequada. Tcnicas como discriminante de Fisher,
redes neurais e mquinas de suporte vetorial, utilizadas sozinhas, no so eficientes.
O novo mtodo para o discriminante de dados de EEG se mostrou bastante eficaz para
o problema em questo. De fato, utilizando apenas 164 pontos por sinal captado por cada
um dos 48 eletrodos usados, obteve-se uma taxa de classificao correta de 94% que
uma taxa bastante elevada.
A principal vantagem do novo mtodo, alm da eficincia, o fato de que uma vez ar-
mazenados os pesos e os pontos discriminantes, o teste ou a aplicao so processados
muito rapidamente, o que importante em situaes prticas. Outra vantagem que, ao
se utilizar o periodograma, perde-se a noo do ponto inicial do sinal, trabalhando apenas
com a frequncia, isso importante pois muito difcil assegurar que o incio do sinal
coincida com o estimulo propriamente dito.
Algumas desvantagens, porm, tambm podem ser citadas. A principal desvantagem
, provavelmente, o fato de se tratar de discriminantes binrios, um fato prejudicial j que
na maioria das aplicaes prticas existiro mais que 2 classes. Outra desvantagem o
fato de que sempre necessria a mesma quantidade de pontos por sinal, j que, caso
fossem diferentes, o periodograma teria quantidade de pontos distintos e o discriminante
no seria adequado.
Portanto, necessrio principalmente desenvolver discriminantes no binrios sendo
esta a principal sugesto da pesquisa. Outras sugestes, que devem ser testadas, so
formas de contornar o problema de mesmo nmero de pontos por sinal, testar outros tipos
de periodogramas ou densidades espectrais e tambm determinar a quantidade tima de
pontos e a quantidade tima de eletrodos.
Conclumos, ento, destacando o fato de que trabalhar com este tipo de dado bastante
motivador por ser um desafio grande, e tambm por ser uma aplicao que, se bem
sucedida, pode ajudar a vida de diversas pessoas, principalmente daquelas portadoras
de necessidades especiais.
Referncias Bibliogrficas
[1] ADLAKHA, A.; EBRAHIMI, T. Single trial EEG Classification. Swiss Federal Institute
of Technology. July. 2002.
[2] BROCKWELL, P.J.; DAVIS, R.A. Introduction to Time Series and Forecasting. 2nd
ed. Colorado: Springer. 2002. Cap. 4.
[3] BRONZINO, J.D. Principles of Electroencephalography. The Biomedical Engineering
Handbook. Boca Raton: CRC Press, 1999. Cap. 15.
[4] HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning:
Data Mining, Inference, and Prediction. 2nd ed. Stanford: Springer. 2009.
[5] JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. 6th ed.
New Jersey: Pearson Prentice Hall, 2007.
[6] KARATZOGLOU, A.; MEYER, D. Support Vector Machines in R. Journal of Statistical
Software. v. 15, issue 9. April. 2006.
[7] SANEI, S.; CHAMBERS, J.A. EEG Signal Processing.1st ed. Chichester: John Wiley
& Sons, 2007.
[8] SRNMO, L.; LAGUNA, P. Bioelectrical Signal Processing in cardiac and neuro-
logical applications. 1st ed. UK: Elsevier, 2005.
[9] THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. 3rd ed. San Diego:
Elsevier. 2006.
55
[10] VON BORRIES, G. F. ; COUTINHO, M.; VON BORRIES, R.F. ; MIOSSO, C.J. . Princi-
pal Component Analysis of Brain-Generated Biopotencial Measurements. Resumenes
en IX - Congreso Latinoamericano de Sociedades de Estadstica, Vinha del Mar -
Chile, 2010.

Monografia - Murilo Coutinho PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Monografia - Murilo Coutinho PDF

Caricato da

Copyright:

Formati disponibili

Universidade de Braslia - UnB

Um novo mtodo para a classificao

Uma aplicao de Mquinas de Suporte Vetorial

Murilo Coutinho Silva - 07/36562

Um novo mtodo para a classificao de dados

de EEG: Uma aplicao de Mquinas de

Suporte Vetorial e Anlise de Fourier

Relatrio apresentado disciplina Estgio Supervisionado

II do curso de graduao em Estatstica, Departamento de

Estatstica, Instituto de Exatas, Universidade de Braslia,

como parte dos requisitos necessrios para o grau de

Orientador: Prof.o George Freitas von Borries

com o Departamento de Estatstica da UnB.

Fundao de Empreendimentos Cientficos e Tecnolgicos (FINATEC). 1

tomadas no passado poderiam nos levar a realidades completamente distintas se tivsse-

mos agido de maneira diferente?

Primeiramente gostaria de agradecer minha me que me criou com muito esforo

ela pois nela em quem me espelho.

desde a infncia. Nos transformamos juntos no que somos, e a ausncia de qualquer um

desse grupo mudaria enormemente a vida que levei.

Agradeo agora os professores que me levaram ao posto em que me encontro. O

que me ensinou a fazer e gostar da pesquisa, me proporcionando inclusive me primeiro

Borries, que obviamente de fundamental importncia para este trabalho.

como me levava h muito tempo atrs.

Murilo Coutinho Silva

sificao de dados de eletroencefalografia que inclui a tcnica de Mquina de Suporte

grafia, a identificao das regies cerebrais estimuladas durante o experimento utilizando

Anlise de Componentes Principais.

Palavras-chaves: Eletroencefalografia, EEG, Componentes Principais, Discriminantes,

Classificao, Mquina de Suporte Vetorial, SVM, Anlise de Fourier, Periodograma.

A medicina tem papel fundamental na construo de uma sociedade melhor, mais

precisam ser desenvolvidos para ajudar em diagnsticos, monitoramento e tratamento de

doenas, e anormalidades do corpo humano.

necer informaes preciosas sobre as condies de uma pessoa se forem apropriada-

mente processados e analisados. Particularmente, dentre os sinais biomdicos est o

eletroencefalograma (EEG), que so os sinais eltricos emitidos pelo crebro humano.

A importncia do EEG est no diagnstico de diversas doenas - tais como a epilepsia,

do estatstico a identificao e classificao de padres nesses dados.

Infelizmente, no h um tipo de anlise estatstica padronizada para a anlise de EEG,

sendo encontrada uma diversidade de tcnicas na literatura. Particularmente, na anlise

de discriminante e classificao, so encontradas entre outras tcnicas, a anlise de dis-

port Vector Machine (SVM)).

A anlise de discriminante e classificao em EEG no s importante para a iden-

tificao de doenas e anormalidades como tambm para o desenvolvimento de inter-

faces homem-mquina, permitindo, por exemplo, o controle do computador por meio do

pensamento. Este tipo de aplicao seria muito interessante para o desenvolvimento de

prteses controlveis por pacientes portadores de necessidades especiais.

Essas so algumas motivaes para o estudo de classificao de dados de eletroence-

A seguir descrevemos a organizao deste trabalho.

O segundo captulo narra a histria da eletroencefalografia desde 1875 quando Richard

Caton publicou o primeiro registro de atividade eltrica no crtex de animais at os dias

a coleta desse tipo de dados.

O terceiro captulo totalmente dedicado ao estudo da tcnica de mquina de suporte

para a classificao de dados de EEG. O final do terceiro captulo apresenta um exemplo

de uso de SVM em dados de sinais.

componentes principais para a identificao das regies cerebrais estimuladas durante o

experimento e tambm um estudo utilizando agrupamentos hierrquicos para a identifi-

cao das regies do crebro que so mais correlacionadas entre si.

O quinto captulo introduz o novo mtodo de classificao de dados de EEG desen-

O sexto captulo utiliza o mtodo desenvolvido no captulo 5 para fazer o discriminante

mtodo comparando-o a outras tcnicas mais usuais.

Finalmente, o stimo captulo apresenta as concluses e uma reflexo sobre todos os

resultados obtidos no trabalho por inteiro. Mostra-se tambm as vantagens e desvanta-