Sei sulla pagina 1di 61

Universidade de Braslia - UnB

Instituto de Exatas
Departamento de Estatstica

Um novo mtodo para a classificao

de dados de EEG:

Uma aplicao de Mquinas de Suporte Vetorial


e Anlise de Fourier

Murilo Coutinho Silva - 07/36562

Braslia

2010
M URILO C OUTINHO S ILVA - 07/36562

Um novo mtodo para a classificao de dados

de EEG: Uma aplicao de Mquinas de

Suporte Vetorial e Anlise de Fourier

Relatrio apresentado disciplina Estgio Supervisionado

II do curso de graduao em Estatstica, Departamento de

Estatstica, Instituto de Exatas, Universidade de Braslia,

como parte dos requisitos necessrios para o grau de

Bacharel em Estatstica.

Orientador: Prof.o George Freitas von Borries

Braslia - DF
2010
Agradecimentos

Ao SAS Institute Brasil por possibilitar a utilizao desse software por meio de parceria acadmica

com o Departamento de Estatstica da UnB.

Fundao de Empreendimentos Cientficos e Tecnolgicos (FINATEC). 1

Nosso mundo um lugar catico. Como profetiza o efeito borboleta pequenas alte-

raes podem trazer grandes consequncias, e por isso no podemos deixar de nos

questionar como chegamos nesse exato instante de nossas vidas. Que atos e decises

tomadas no passado poderiam nos levar a realidades completamente distintas se tivsse-

mos agido de maneira diferente?

Esse tipo de pensamento sugere que essa monografia no , por algum ponto de vista,

um trabalho realizado por mim com o auxlio do meu orientador, e sim um trabalho que

aparece como mera consequncia das minhas escolhas durante a vida. Portanto, sinto-

me obrigado a agradecer pessoas que, tenho certeza, sem elas nada disso seria possvel.

Primeiramente gostaria de agradecer minha me que me criou com muito esforo

como me solteira, cuidou de mim com muito carinho em todos os momentos que mais

precisei dela, me ensinou amor, moral e tica. Sou imagem da pessoa maravilhosa que

ela pois nela em quem me espelho.

Em seguida quero agradecer o resto da minha famlia. Agradeo minha irm, minha v,

a minha tia, aos meus tios, meu padrasto e aos meus primos que so grandes amigos

acima de tudo. Agradeo a quase todos os momentos de minha vida em que estive na

ilustre presena dessas pessoas que foram sempre momentos de extrema felicidade.

1
Este trabalho teve suporte parcial da FINATEC por meio dos editais de auxlio pesquisa 02/2009 e
01/2010.
A composio social mais catica da vida devem ser os amigos que so os primeiros

pontos de vista diferentes da famlia que algum ouve na vida. Alguns tm pssimas

influncias, j eu tive timas. Agradeo a esse grandes amigos que estiveram comigo

desde a infncia. Nos transformamos juntos no que somos, e a ausncia de qualquer um

desse grupo mudaria enormemente a vida que levei.

Agradeo agora os professores que me levaram ao posto em que me encontro. O

primeiro professor a quem devo muito o Lus Antnio, meu professor do ensino mdio

com quem aprendi clculo no primeiro ano e que me incentivou enormemente nos es-

tudos. O segundo o professor Rathie com que fiz dois anos de iniciao cientfica e

que me ensinou a fazer e gostar da pesquisa, me proporcionando inclusive me primeiro

artigo publicado. O terceiro o meu orientador desta monografia, o professor George von

Borries, que obviamente de fundamental importncia para este trabalho.

Para finalizar devo citar mais duas pessoas. A primeira delas minha namorada e

futura mulher, no consigo nem imaginar como seriam esses ltimos anos sem sua pre-

sena. A segunda pessoa meu falecido av, Mrio Coutinho, que de forma estranha e

sobrenatural me proporciona uma enorme fora com cada simples lembrana, como se

estivesse sempre ao meu lado segurando minha mo para me levar aonde tenho que ir,

como me levava h muito tempo atrs.

Murilo Coutinho Silva

4
Resumo

Esse trabalho discorre sobre um novo mtodo para a anlise de discriminante e clas-

sificao de dados de eletroencefalografia que inclui a tcnica de Mquina de Suporte

Vetorial e anlise de frequncias de Fourier. Alm disso, tambm faz parte desta mono-

grafia, a identificao das regies cerebrais estimuladas durante o experimento utilizando

Anlise de Componentes Principais.

Palavras-chaves: Eletroencefalografia, EEG, Componentes Principais, Discriminantes,

Classificao, Mquina de Suporte Vetorial, SVM, Anlise de Fourier, Periodograma.


Sumrio

1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Eletroencefalografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1 Histria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Coleta de dados de EEG . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3 Mquina de Suporte Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.1 Caso de dados binrios e linearmente separveis . . . . . . . . . . . . . . 6
3.2 Caso de dados binrios no separveis . . . . . . . . . . . . . . . . . . . 10
3.3 SVM e Kernels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Um exemplo de aplicao de discriminante de sinais simulados utilizando
SVM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4 Anlise preliminar dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1 Os dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Anlise dos eletrodos utilizando Agrupamentos Hierrquicos . . . . . . . . 24
4.3 Componentes Principais . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 Mtodo para Discriminante de dados de EEG . . . . . . . . . . . . . . . . . 33
5.1 O Periodograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.2 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Introduo ao novo mtodo para discriminante de dados de EEG. . . . . . 40
5.4 Clculo do Discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.5 Sistema de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.6 Fase de teste ou Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.7 Algoritmo para o treinamento . . . . . . . . . . . . . . . . . . . . . . . . 45
5.8 Algoritmos para a fase de testes e aplicaes . . . . . . . . . . . . . . . . 46
6 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
7 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
1 Introduo

A medicina tem papel fundamental na construo de uma sociedade melhor, mais

solidria e segura para todos. Vivemos em um mundo em que a demanda por tratamentos

de sade mais baratos e eficientes cresce a cada dia. Novas tcnicas e equipamentos

precisam ser desenvolvidos para ajudar em diagnsticos, monitoramento e tratamento de

doenas, e anormalidades do corpo humano.

nesse contexto que se percebe com clareza a importncia dos sinais biomdicos.

Esses sinais eltricos produzidos pelo corpo humano tm a singular capacidade de for-

necer informaes preciosas sobre as condies de uma pessoa se forem apropriada-

mente processados e analisados. Particularmente, dentre os sinais biomdicos est o

eletroencefalograma (EEG), que so os sinais eltricos emitidos pelo crebro humano.

O crebro o rgo mais complexo do corpo humano. O mistrio sobre o seu fun-

cionamento foi motivao para pesquisas e estudos pela humanidade h muito tempo.

Porm, os estudos dos sinais eltricos emitidos pelo crebro s foi possvel a partir do

final do sculo XIX com o advento de equipamentos sensveis o suficiente para captar

esses sinais.

A importncia do EEG est no diagnstico de diversas doenas - tais como a epilepsia,

e de anormalidades - como problemas durante o sono. Muito embora o EEG esteja con-

solidado para algumas aplicaes, para outras ainda motivo de pesquisa, sendo papel

do estatstico a identificao e classificao de padres nesses dados.

Infelizmente, no h um tipo de anlise estatstica padronizada para a anlise de EEG,

sendo encontrada uma diversidade de tcnicas na literatura. Particularmente, na anlise

de discriminante e classificao, so encontradas entre outras tcnicas, a anlise de dis-


2

criminante de Fisher, redes neurais (Neural Network), e mquina de suporte vetorial (Sup-

port Vector Machine (SVM)).

A anlise de discriminante e classificao em EEG no s importante para a iden-

tificao de doenas e anormalidades como tambm para o desenvolvimento de inter-

faces homem-mquina, permitindo, por exemplo, o controle do computador por meio do

pensamento. Este tipo de aplicao seria muito interessante para o desenvolvimento de

prteses controlveis por pacientes portadores de necessidades especiais.

Essas so algumas motivaes para o estudo de classificao de dados de eletroence-

falografia bem como desenvolvimentos importantes que esse tipo de estudo pode trazer.

A seguir descrevemos a organizao deste trabalho.

O segundo captulo narra a histria da eletroencefalografia desde 1875 quando Richard

Caton publicou o primeiro registro de atividade eltrica no crtex de animais at os dias

atuais. Alm disso, neste captulo, apresentada, brevemente, a forma como realizada

a coleta desse tipo de dados.

O terceiro captulo totalmente dedicado ao estudo da tcnica de mquina de suporte

vetorial - do ingls support vector machine (SVM) - que parte importante deste trabalho.

Esta tcnica utilizada para fazer discriminante e classificao de diversos tipos de dados,

e sua escolha foi motivada pelo nmero de artigos recentes que usam a tcnica de SVM

para a classificao de dados de EEG. O final do terceiro captulo apresenta um exemplo

de uso de SVM em dados de sinais.

O quarto captulo expe uma breve anlise exploratria dos dados, um estudo utilizando

componentes principais para a identificao das regies cerebrais estimuladas durante o

experimento e tambm um estudo utilizando agrupamentos hierrquicos para a identifi-

cao das regies do crebro que so mais correlacionadas entre si.

O quinto captulo introduz o novo mtodo de classificao de dados de EEG desen-

volvido. O mtodo composto por diversas tcnicas incluindo mquina de suporte vetorial

e anlise de frequncias de Fourier, por esta razo este captulo inclui tambm um estudo

sobre o periodograma.

O sexto captulo utiliza o mtodo desenvolvido no captulo 5 para fazer o discriminante

e classificao dos dados de EEG. Desse modo avalia-se tambm a eficcia do novo

mtodo comparando-o a outras tcnicas mais usuais.


3

Finalmente, o stimo captulo apresenta as concluses e uma reflexo sobre todos os

resultados obtidos no trabalho por inteiro. Mostra-se tambm as vantagens e desvanta-

gens do novo mtodo alm de propor linhas de pesquisa e evidenciar problemas encon-

trados que devem ser resolvidos.


2 Eletroencefalografia

A eletroencefalografia nada mais que o registro da variao do potencial eltrico do

crebro. Essa variao depende do estado e da situao em que se encontra um indivduo

sendo um tipo de informao sobre seu pensamento. Este captulo apresenta detalhes

histricos da eletroencefalografia bem como uma breve introduo de como esses dados

so coletados.

2.1 Histria

O estudo e o desenvolvimento do eletroencefalograma (EEG) s se iniciou no final do

sculo XIX. Foi s com a chegada da tecnologia e de aparelhos capazes de captar va-

riaes eltricas da ordem de milivolts, que foi possvel se captar sinais eltricos emitidos

pelo crebro.

Em 1875, Richard Caton publicou o que foi o primeiro registro da atividade eltrica

do crtex cerebral de animais. Caton conseguiu perceber alguns fenmenos do crebro

utilizando equipamentos muito rsticos. Seu estudo revelou, dentre outras coisas, duas

situaes muito importantes e conhecidas no estudo do EEG. A primeira situao que

Caton percebeu foi que, ao contrrio do que imaginaramos, a amplitude do sinal eltrico

emitido pelo crebro aumenta durante o sono. A segunda e mais importante descoberta

de seu trabalho foi que a atividade eltrica se correlaciona com a atividade motora e

estmulos externos.

Foi ento, em 1924, que Hans Berger registrou o primeiro EEG de atividade cerebral hu-

mana utilizando um galvanmetro muito sensvel. Criador do termo eletroencefalograma,

estudou as sucessivas posies do elemento mvel do galvanmetro, registradas numa


5

folha de papel, sendo assim capaz de perceber os padres resultantes dessas ondas

cerebrais variando com o tempo. Berger percebeu que essas ondas no so totalmente

aleatrias e demonstram certos padres de periodicidade e regularidade. Ele percebeu

tambm, que as ondas cerebrais dos indivduos tm alta amplitude e baixa frequncia du-

rante o sono e baixa amplitude e alta frequncia quando acordados. Outra descoberta de

Berger, e uma das mais interessantes, foi que o EEG era modificado durante um ataque

epiltico. Hans Berger ainda no era muito conhecido e ento foi s em 1934 quando os

ingleses Adrian e Matthews publicaram um artigo verificando as descobertas de Berger

que a eletroencefalografia e as ondas eltricas do crebro foram aceitas pela comunidade

cientfica. Adrian e Matthews no s foram importantes pela disseminao do EEG como

tambm pela descoberta do ritmo alfa que era uma oscilao regular de aproximadamente

10 a 12 Hz registrados dos lbulos occipitais do crtex cerebral que desaparece quando

algum foca alguma coisa, presta ateno ou fica em estado de alerta em algo no seu

campo de viso.

2.2 Coleta de dados de EEG

O dados de EEG so coletados diretamente de um indivduo. Esses dados podem ser

coletados de forma invasiva ou no invasiva. No mtodo invasivo eletrodos so intro-

duzidos dentro do crnio sobre o cortex cerebral, j no mtodo no invasivo o indivduo

coloca uma touca (ver Figura 2.1) com vrios eletrodos que captam os potenciais eltricos

emitidos pelo crebro. Os dados analisados neste trabalho foram coletados empregando

o mtodo no invasivo utilizando uma touca com 128 eletrodos, posicionados de forma

especfica de acodo com regras de padronizao internacional.

Figura 2.1: Coleta de dados, BIM Lab, UTEP, Texas.


3 Mquina de Suporte Vetorial

A tcnica de Mquina de Suporte Vetorial (do ingls Support Vector Machine (SVM))

surgiu em 1992 e uma tcnica relativamente nova mas que vem sendo muito utilizada

recentemente. A tcnica de SVM utilizada tanto em problemas de regresso quanto em

problemas de classificao e reconhecimento de padres.

A deciso de utilizar a tcnica de SVM nesta monografia foi motivada, inicialmente,

pela quantidade de artigos recentes que vem empregando SVM para a classificao de

dados de EEG. Durante o perodo de trabalho aplicou-se a tcnica de SVM como vinha

sendo utilizada mas no obteve-se boas taxas de classificao. Este fato foi a principal

motivao para a nossa iniciativa em desenvolver um novo mtodo para anlise desse

tipo de dados.

3.1 Caso de dados binrios e linearmente separveis

Para iniciar a discusso sobre Mquinas de Suporte Vetorial (SVM), abordaremos o

caso particular em que se deseja separar duas classes que so separveis por um hiper-

plano

X T + 0 = 0. (3.1)

Logicamente, como se pode visualizar na Figura 3.1, esse hiperplano no nico e,

portanto, necessrio determinar um critrio que nos permita otimizar essa separao.

Desse modo, escolhe-se o hiperplano que deixe a maior margem (M ) de distncia pos-

svel entre as classes, como pode-se visualizar na Figura 3.2.


7

Figura 3.1: Um exemplo de duas classes separveis. Trs exemplos de hiperplanos (retas
no caso bidimensional) so mostrados. claro que existem infinitos hiper-
planos que podem separar esses dados e portanto necessrio um critrio
para escolher o hiperplano timo.

X
X
X

Figura 3.2: O mesmo exemplo de duas classes separveis. O hiperplano verde (reta no
caso bidimensional) o hiperplano timo. As retas pontilhadas definem a
margem que mxima neste caso. Os pontos marcados com um "X"so os
chamados vetores suporte.

3.1.1 Definies e conceitos matemticos

Nesta seo so dadas algumas definies e conceitos matemticos importantes.

Seja o hiperplano L dado pela equao

g(x) = X T + 0 = 0, X p (3.2)

ento a distncia de qualquer ponto xi ao hiperplano L dada por

1 ( T ) g(xi )
D= xi + 0 = . (3.3)
g (xi )
8

Considere yi uma varivel indicadora definida por


1 se xi W1
yi = (3.4)
1 se x W
i 1

Sejam tambm xi p , i = 1, 2, ..., N , os vetores (feature vectors) de um conjunto de

treinamento (training set) X , classificados em uma de duas classes W1 ou W1 de modo

que yi g(xi ) > 0 se xi for corretamente classificado em sua classe pelo hiperplano.

3.1.2 Hiperplano timo

O objetivo maximizar a margem M , isto , escolher o hiperplano de maior margem

de distncia possvel entre as classes. claro que nenhum ponto xi tem distncia menor

do que M em relao ao hiperplano, portanto em termos matemticos tem-se, usando a

equao (3.3),
1 ( T )

xi + 0 M (3.5)

e como as duas classes so separveis, temos equivalentemente

1 ( T )
yi xi + 0 M

( )
yi xiT + 0 M

Para qualquer e 0 que satisfaam essa equao, qualquer mltiplo positivo destes

tambm a satisfaz. Logo, possvel escolher arbitrariamente = M


1
de modo que

( )
yi xiT + 0 1 (3.6)

Desta forma, o problema se resume ao problema de otimizao

Max M
,0
1 ( T )
sujeito a yi xi + 0 M, i = 1, 2, ..., N

ou de mesmo modo
9

1
Min 2 (3.7)
,0 2
( )
sujeito a yi xiT + 0 1, i = 1, 2, ..., N

Este um problema de otimizao convexa, ento, usando multiplicadores de La-

grange, obtm-se a funo primal

1 N [ ( ) ]
L p = i yi xiT + 0 1
2
(3.8)
2 i=1

onde i so os multiplicadores de Lagrange. Derivando (3.8) em relao a e 0 obtm-

se
N
= i yi xi (3.9)
i=1

N
iyi = 0 (3.10)
i=1

Substituindo (3.9) e (3.10) em (3.8), encontra-se a funo dual de Wolfe:

N
1 N N
LD = i ik yiyk xiT xk , i 0 (3.11)
i=1 2 i=1 k=1

A soluo obtida maximizando LD , um problema simples de otimizao convexa que

deve satisfazer (3.9), (3.10) e (3.11) alm de satisfazer as condies de Karush-Kuhn-

Tucker (KKT):
[ ( ) ]
i yi xiT + 0 1 = 0, i = 1, 2, ..., N (3.12)

Encontra-se, desse modo, o hiperplano timo para separar as duas classes. im-
( )
portante notar que a equao (3.12) implica que i = 0 ou que yi xiT + 0 = 1, ou

seja, i s diferente de zero (em geral) se e somente se o ponto xi estiver sobre uma

das margens e portanto a uma exata distncia M do hiperplano L respeitando a restrio


( )
yi xiT + 0 = 1. Os pontos que respeitam essa restrio (ver Figura 3.2) so chamados
de Vetores Suporte (Support Vectors) e so pontos muito importantes j que o parmetro

determinado exclusivamente devido a eles.


10

Para finalizar define-se o classificador

G(x) = sinal( f(x)), (3.13)

onde f(x) = xT + 0

para a classificao de observaes futuras.

3.2 Caso de dados binrios no separveis

Na seo 3.1 foi definido o hiperplano timo na separao de duas classes linearmente

separveis. Na prtica, entretanto, muitas vezes os dados no so linearmente separveis

e a matemtica descrita at aqui passa a no ser mais vlida.

A soluo para este problema simplesmente permitir observaes entre as margens

e observaes incorretamente classificadas pelo hiperplano. Desse modo encontrar-se-

trs tipos de pontos:

i) Pontos corretamente classificados fora ou em cima das margens, ou seja:

1 ( T )
yi xi + 0 M

ii) Pontos corretamente classificados residindo entre as margens:

1 ( T )
0< yi xi + 0 < M

iii) Pontos incorretamente classificados:

1 ( T )
yi xi + 0 0

Esses trs casos podem ser resumidos em um nico caso ao se introduzir novas va-

riveis i da seguinte maneira:

1 ( T )
yi xi + 0 M(1 i ). (3.14)

11

Desse modo, para i = 0 tem-se pontos do primeiro tipo, para 0 < i < 1 tem-se pontos

do segundo tipo e para i 1 tem-se pontos do terceiro tipo. Alm disso, escolhe-se e

0 em (3.14)convenientemente de modo que = 1


M e portanto obtm-se

( )
yi xiT + 0 1 i , i = 1, 2, ..., N. (3.15)

As variveis i so conhecidas como variveis de folga e sua representao grfica

pode ser vista na Figura 3.3. Logicamente o intuito da tcnica ter o mnimo de pontos
N
do tipo (ii) e do tipo (iii) e para isso minimiza-se a soma i que a quantidade total
i=1
pela qual pontos esto proporcionalmente do lado errado da margem. Levando essas

situaes em conta, pode-se generalizar o problema dado em (3.7) por

N
1
Min +C i
2
(3.16)
,0 ,i 2 i=1

sujeito a
( )
yi xiT + 0 1 i , i = 1, 2, ..., N

i 0, i = 1, 2, ..., N.

A constante C previamente escolhida e determina a influncia dos dois termos no

problema de minimizao. Note que para C grande a influncia das variveis i se torna

maior resultando assim em uma margem menor. Se existirem duas classes linearmente

separveis ento pode-se utilizar as equaes dadas em (3.16) fazendo C .

3.2.1 Clculo do hiperplano timo

Para resolver este problema ser novamente utilizada a tcnica dos multiplicadores de

Lagrange. Do problema definido em (3.16) obtm-se a funo primal de Lagrange

1 N N [ ( ) ] N
L p = 2 +C i i yi xiT + 0 (1 i ) i i (3.17)
2 i=1 i=1 i=1
12

4
2 3

Figura 3.3: Um exemplo de duas classes no separveis. O hiperplano verde (reta no


caso bidimensional) o hiperplano timo. As linhas pontilhadas delimitam as
margens de largura M. Os pontos quadrados so os vetores suporte (Support
Vectors). Os vetores representados por i so vetores cuja norma propor-
cional (M vezes) a varivel de folga correspondente ao seu respectivo ponto
xi .

onde i e i so os multiplicadores de Lagrange e devem ser positivos ou iguais a zero.

Derivando em relao a , 0 e i , e igualando a zero, encontra-se

N
= i yi xi , (3.18)
i=1

N
iyi = 0, (3.19)
i=1

i = C i , (3.20)

com i = 1, 2, ..., N . Substituindo (3.18), (3.19) e (3.20) em (3.17) obtm-se a funo dual

de Wolfe
N
1 N N
LD = i ik yiyk xiT xk . (3.21)
i=1 2 i=1 k=1

A soluo obtida maximizando LD , um problema simples de otimizao convexa que

deve satisfazer as condies (3.18), (3.19), (3.20) e 0 i C alm de satisfazer as

condies de Karush-Kuhn-Tucker (KKT):

[ ( ) ]
i yi xiT + 0 (1 i ) = 0, (3.22)
13

i i = 0, (3.23)

( )
yi xiT + 0 (1 i ), (3.24)

para i = 1, 2, ..., N . Chega-se ento ao estimador de que dado por

N
= i yi xi . (3.25)
i=1

Desse modo, determinou-se o hiperplano timo para separar as duas classes. impor-
( )
tante notar novamente que a equao (3.22) implica que i = 0 ou que yi xiT + 0 =
( )
1 i ou seja, i s diferente de zero (em geral) se e somente se yi xiT + 0 = 1 i ,
e portanto como i 0, i s diferente de zero se seu ponto xi correspondente estiver

em cima de uma das margens, entre as margens, ou se tiver sido incorretamente classifi-

cado (ver Figura 3.3).

Os pontos cujo respectivo i diferente de zero so chamados de vetores suporte

(Support Vectors) e so de suma importncia j que o parmetro determinado ex-

clusivamente devido a esses ponto como pode-se notar na equao (3.25). Essa uma

caracterstica muito interessante desse classificador pois ele foca ateno nos pontos que

realmente importam.

Outra motivao para o uso de SVM que nenhuma suposio sobre a distribuio

dos dados necessria, j que o que levado em conta apenas a distncia entre as

classes.

3.2.2 Classificador no linear

Considere duas classes que no so linearmente separveis. Suponha que exista um

mapeamento

x p y k (3.26)

que transforme o espao dos dados em um espao k-dimensional onde as classes pos-

sam ser satisfatoriamente separveis por um hiperplano.


14

Se tal mapeamento existir pode-se utilizar as tcnicas vistas na seo anterior para en-

contrar o hiperplano timo que separe essas classes no espao k-dimensional, resultando

em uma funo no linear no espao original.

primeira vista essa ideia no parece ser muito vivel j que aumentando as dimenses

dos dados, o processo computacional de estimao se tornaria, muitas vezes, invivel ou

mesmo impossvel. Porm, existe uma bela propriedade da tcnica de SVM que per-

mite aumentar muito o nmero de dimenses (tornando-as infinitas se necessrio) sem

adicionais demandas computacionais.

3.3 SVM e Kernels

Nas sees anteriores foi definido nosso problema de minimizao para o clculo do

hiperplano timo. Note ento na equao (3.21) que todos os clculos envolvidos sobre

os dados esto na forma do produto interno xiT xi . Da mesma forma, para o novo espao

k-dimensional, os clculos envolvidos estaro na forma de produto interno. O fato inte-

ressante que para alguns mapeamentos esses produtos internos podem ser calculados

como funo do produto interno original xiT xi .

Teorema. Teorema de Mercer. Sejam x p e um mapeamento ,

x (x) H (3.27)

onde H um espao Euclideano. A operao de produto interno tem a representao

equivalente

K(x, z) = i (x)i (z) (3.28)


i

onde i (x) o i-simo componente do mapeamento (x) e K(x, z) uma funo simtrica

que satisfaz

K(x, z)g(x)g(z)dxdz 0 (3.29)
15

para qualquer g(x), x p tais que


[g(x)]2 dx < + (3.30)

O inverso tambm verdadeiro, ou seja, para qualquer funo K(x, z) que satisfaa

(3.29) e (3.30) existe um espao onde K(x, z) define um produto interno. Tais funes so

conhecidas como Kernels e o espao H como "Reproducing Kernel Hilbert Space"(RKHS).

Alguns dos Kernels mais utilizados so

i) Polinomiais

K(x, z) = (xT z + 1)q , q>0 (3.31)

ii) Radiais ou Gaussianos

( )
||x z||2
K(x, z) = exp (3.32)
2

iii) Sigmoide

K(x, z) = tanh(xT z + ) (3.33)

para valores de e que satisfaam as condies do teorema de Mercer.

Portanto, adotado um Kernel conveniente, o problema de otimizao dado em (3.21) se

torna

N
1 N N
Max

i ik yiyk K(xi, xk)
2 i=1
i=1 k=1

sujeito a 0 i C, i = 1, 2, ..., N (3.34)

iyi = 0
i

A caracterstica que deve ser ressaltada que a complexidade computacional envolvida

na tcnica de SVM independe do nmero de dimenses extras adicionadas pelo Ker-

nel, ou seja, pode-se trabalhar em dimenses elevadas sem ter que estimar um grande

nmero de parmetros.
16

Programao R.

Pacote: e1071

Mquina de suporte vetorial (SVM).

Comandos e parmetros fundamentais:

svm(x, y, kernel = radial, cost = 1)

x - dados.
y - classes.
kernel - Kernel utilizado. Tem como padro o kernel Radial. Outras opes:
linear, polynomial, radial basis, sigmoid.
cost - Valor do parmetro C.

Exemplo:

z = read.table(dados.txt,header=T)
attach(z)
x <- subset(z, select = -classe)
y <- classe
model <- svm(x, y , kernel = linear)
# Grfico (Banco de dados bidimensional).
plot(model, data = z, x y)

print(model)
summary(model)

# Testando acurcia no treinamento.


pred <- predict(model, x)
table(pred, y)
17

3.4 Um exemplo de aplicao de discriminante de sinais

simulados utilizando SVM.

As sees anteriores introduziram e fundamentaram a tcnica SVM 1 . Ressalta-se,

porm, que o objetivo deste trabalho a classificao de dados de eletroencefalografia

e, obviamente, no conseguiremos separar sinais utilizando nenhum dos Kernels vistos

anteriormente.

No incio do perodo de trabalho desenvolvemos um Kernel para ser utilizado na clas-

sificao de sinais, porm este Kernel no se mostrou eficiente para a classificao de

dados de EEG. Entretanto, este Kernel pode ser bem til no discriminante de outros tipos

de sinais, e por isso, o apresentamos nesta seo como exemplo do uso da tcnica de

SVM.

3.4.1 Separao de Senos e Cossenos

Figura 3.4: Um exemplo de dois sinais distintos.

1
Utilizaremos a partir de agora apenas a sigla em ingls SVM para indicar mquina de suporte vetorial.
18

Para comear de forma mais simples, considere o problema de separar os sinais da

Figura 3.5. Esses dados foram gerados por duas funes seno do tipo

g1 (t) = R1 sen( f1t + c1 ) (3.35)

g2 (t) = R2 sen( f2t + c2 ) (3.36)

Figura 3.5: Simulao de dois senos distintos, antes e aps a transformao.

A ideia fundamental de uma anlise de discriminantes capturar os padres distintos

de cada grupo. Neste caso as diferenas entre as duas curvas so principalmente suas

frequncias e amplitudes.

Capturar as amplitudes das curvas uma tarefa simples j que a amplitude para cada

ponto simplesmente o valor do sinal neste ponto. O clculo das frequncias um pouco

mais complicado principalmente quando no se lida com curvas perfeitas como estas

simuladas. Para facilitar o estudo, ao invs de frequncias utilizou-se aproximaes para

a derivada das curvas tendo em vista o fato de que para amplitudes iguais, frequn-

cias maiores causam primeiras derivadas maiores em valores absolutos para senos ou

cossenos com argumentos iguais para ambas as frequncias, isto , em termos matemti-

cos:

Sendo G1 (t) = g1 (t) = R1 f1 cos( f1t + c1 ) e G2 (t) = g2 (t) = R2 f2 cos( f2t + c2 )

ento se R1 = R2 = R, f1 < f2 e t1 = t2 = w, tem-se que


( ) ( )
t c t c
G1 1 1 = |R f1 cos(w)| |R f2 cos(w)| = G2 2 2 (3.37)
f1 f2
19

ou seja, a derivada aliada a amplitude trazem por si prprias informao sobre a frequn-

cia.
O fato apresentado na Eq.(5.6) sugere uma proposta de anlise interessante. Con-

sidere ento que Xt o potencial eltrico observado no tempo t para um dos sinais e a

seguinte transformao:
Xt + Xt1
At1 =
2
It1 = Xt Xt1 (3.38)

A varivel At1 pode ser interpretada como a amplitude mdia do sinal entre Xt e Xt1

e a varivel It1 como uma aproximao da derivada para intervalos de tempo unitrios.

Juntando esses valores em dois vetores tem-se:

Ak = (A1 , A2 , ..., An1 )

Ik = (I1 , I2 , ..., In1 )

Onde k = 1 para um dos sinais e k = 2 para o outro sinal. Juntando Ak e Ik em uma

matriz obtm-se para cada um dos grupos:

Tk = (Ak , Ik ) (3.39)

Observe na Figura 3.5 e na Figura 3.7 o que acontece ao plotar o grfico de A por I para

ambos os grupos. Nesta situao, ao se utilizar a tcnica de SVM com um Kernel Radial,

se obtm uma taxa de classificao correta de 100% como pode ser visto na Figura 3.7.
Aparentemente, a tcnica de SVM no foi suficiente para a classificao dos dados no

sentido que foi necessria uma transformao nos dados. Porm, pode-se incluir essa

transformao no Kernel Radial criando um novo Kernel que ideal ao problema. Para

fazer isso considere XA o vetor das observaes de potenciais eltricos e XB o vetor de

observaes no lag de XA para um dos sinais. Descartando o primeiro termo de XA e o

ltimo de XB por questes operacionais, obtm-se

XA = (X2 , X3 , ..., Xn )

XB = (X1 , X2 , ..., Xn1 )


20

Figura 3.6: Simulao de dois senos distintos com rudo, antes e aps a transformao.

Fazendo isso para cada um dos sinais, encontra-se a matriz de observaes

Xk = (XA , XB ) (3.40)

Pode-se ento obter a matriz Tk dada na Eq.(3.39) simplesmente fazendo Tk = Xk .

onde
1
1
= 2 (3.41)
1
2 1

Deste modo aplicar o Kernel Radial nos dados transformados o mesmo que utilizar a

tcnica de SVM para discriminar os dados das matrizes X1 e X2 utilizando o Kernel

( )
||X. Z.||2
K(X, Z) = exp . (3.42)
2

3.4.2 Separao de sinais com Rudo por Splines Cbicos

claro que o exemplo da seo anterior foi um exemplo extremamente idealizado.

Basta olhar para a Figura 3.4 para se perceber que a anlise foi muito longe da realidade.

Para melhorar esta anlise, simulou-se novamente os dados, porm desta vez adicio-

nando rudo aos mesmos. Nota-se, na Figura 3.6, que a transformao proposta j no

to eficiente como antes.

A soluo encontrada neste caso foi simplesmente ajustar Splines Cbicos aos dados.

Essa tcnica nada mais do que um modelo de regresso mltipla que surge ao definir-

mos um conjunto de transformaes dos dados que chamamos bases lineares.


21

SVM classification plot


xooo
oooo
xo xoxx
0.3
x
xo x
o
x o
x
o o
x o
o o
o o
0.2 x x
o
o o

B
o o o o o o o
o o o o x
o
o o
0.1 x o o x
o
x
o o o x
o o
x o x
o
x x x
o x
x
o x x o
0.0
I

x x
x x
o x
o
x o o x
o
o
x o o x
o o
0.1 x o o o
x o o o
o o
o o o o o o x

A
o x
o
0.2 x x
o
o x
o x
o
x x
o
x
o x
x o
0.3 xo
x o o
xx xo
x xo
ooooo

2 1 0 1 2

Figura 3.7: Classificao utilizando SVM com o Kernel Radial aps transformao, ou apli-
cando diretamente o Kernel dado na Eq.(3.42).

Denote por hm (t) : p a m-sima transformao de t , m = 1, ..., M . Ento modela-

se
M
f (t) = mhm(t), (3.43)
m=1

como sendo uma expanso em bases lineares em t . A beleza deste modelo est no fato

de que uma vez definidas as funes hm , temos modelos lineares nessas novas variveis

e podemos estimar os parmetros como em uma regresso mltipla.

O ajuste dos Splines Cbicos ento obtido dividindo o domnio de t em k intervalos

delimitados por k 1 ns, e ajustando um polinmio cbico em cada um desses intervalos

com a restrio de que, tanto a curva, como a primeira e a segunda derivada, sejam

contnuas em todas as junes de intervalos. Desse modo pode-se construir as bases

h1 (t) = 1 h2 (t) = t h3 (t) = t 2 h4 (t) = t 3

h5 (t) = (t 1 )3+ h6 (t) = (t 2 )3+ ... hm (t) = (t m4 )3+ (3.44)


22

Ajustados os Splines Cbicos, basta agora utilizar os valores esperados dos modelos

para cada um dos sinais e repetir a mesma anlise da seo anterior. Fazendo isso nos

dados com rudo obtm-se a classificao mostrada na Figura 3.8. Note que apenas 3

pontos foram classificados de forma errnea, e isso se deve a instabilidade dos Splines

nos extremos do intervalo tempo. Se fossem retirados esses pontos instveis o discrimi-

nante acertaria 100% dos pontos mais uma vez.

SVM classification plot

o o o
o oo oo oo o
0.4 oo oo
o o
o xx ox ox oo
o ox o
ox o x
x ox xx oooo

B
o o
xx xx o
0.2 o o o
o
xx x oooo xo o
o o oo o oooooxoxoxo o oo
x o xo oo o oxox o x
xx oo oxo x x xo
xox x xxx xoo o
o
xx xx xoxxx
xx xxx x oo
I

0.0 x ox x x xo
xx xxx xoo o
o o x
o x x xxx oo
xxo ooo
o
o oo oooox oo
o
xxoo oo o o o o ooo x ox
x
xx x ooooooo o o o o oooooooo
ooo o o ooooox x o
x x oo
o xox x x x
0.2 x x

A
x o
xxx
o x xo o
o xx x x xo
x
oo x x o ox
o o o o
o x o oo o o
0.4 o o o ooo o
o o o oo

2 0 2

Figura 3.8: Classificao utilizando SVM com o Kernel Radial aps utilizar splines e em
seguida a transformao.
4 Anlise preliminar dos dados

Este captulo descreve inicialmente ao leitor como constitudo o banco de dados uti-

lizado neste trabalho. Em seguida, anlises de agrupamentos hierrquicos e de compo-

nentes principais, realizadas com o intuito de identificar as regies do crebro mais esti-

muladas pelo experimento, e as regies cerebrais que so fortemente correlacionadas

so apresentadas.

A anlise de componentes principais produziu resultados muito interessantes, como

descritos neste captulo e em [10].

4.1 Os dados

Os dados de EEG nada mais so que sinais eltricos emitidos pelo crebro. Para captar

esses dados utilizam-se os procedimentos descritos no Captulo 2.

O conjunto de dados analisados nesse trabalho so provenientes de um experimento

em que um voluntrio senta-se em frente a uma tela que mostra um conjunto de 10 ima-

gens.

Cada imagem apresentada ao voluntrio 4 vezes por um perodo de 5 segundos em

uma ordem aleatria (ver as imagens do experimento na Figura 4.1). Cada sinal captado

possui mais de 4000 pontos registrados, para um total de 10 imagens, repetidas 4 vezes,

captadas por 128 eletrodos, o que resulta em um banco de dados extremamente grande.

Um dos objetivos desse trabalho obter a melhor taxa de classificao possvel com

o mnimo de pontos e por isso a quantidade de pontos por sinal utilizada foi reduzida

para 164 pelos engenheiros eltricos que nos forneceram os dados aplicando tcnicas
24

Figura 4.1: As 10 imagens utilizadas no experimento.

consolidadas. Desse modo tem-se um total de 164 10 4 128 = 839680 pontos para

as anlises.

4.2 Anlise dos eletrodos utilizando Agrupamentos

Hierrquicos

O objetivo final deste trabalho fazer o discriminante e a classificao das figuras ob-

servadas, mas desejvel e interessante empregar somente a informao necessria

para isso. Neste aspecto de se considerar que, talvez, e muito provavelmente, seja

desnecessrio e redundante discriminar as figuras utilizando dados captados por 128

eletrodos prximos e alm disso usar o sinal com mais de 4000 pontos em apenas 5

segundos por eletrodo.

De fato, ao se observar a Figura 4.2, nota-se que existe uma correlao alta entre muitos

desses eletrodos e isso j um indcio de que os eletrodos prximos possivelmente esto

captando sinais praticamente idnticos e, portanto, talvez no seja necessrio se consi-

derar todos esses eletrodos na anlise.

Com o objetivo de identificar grupos de eletrodos com informao similar, foi feita uma

anlise de agrupamento para a matriz de correlao desses eletrodos. Dessa forma,

pode-se identificar os grupos de eletrodos que so mais fortemente correlacionados. Ob-

serve, por meio do dendograma na Figura 4.3, de uma anlise de agrupamento hie-

rrquico realizada, que possvel perceber que uma formao com 4 grupos razovel.
el82
el83
el80
el78
el79
el96
el91
el92
el94
el95
el81
el93
el99
el100 2e05 2e05 3e05 3e05 2e05
el88
el89
el90
el73
el74
el76
el77

2e05
el84
el85
el87
el23

el97
el1
el65
el66
el75
el69
el70
el71
el64
2e05

el67
el68
el101
el24

el102
el103
el108
el114
el107
el115
el72
el86
el111

2e05
el109
el98
el110
el28
el25

el29
el26
el27
el39
el40
el41
el22
3e05

el20
el21
el37
el38
el30
el26

el19
el31
el16
3e05

el17
el18
el8
el9
el10
el15

2e05
el25
el23
el24
el27

el11
el12
el13
el14
el113
el117
el118
el116
2e05

el104
el105
el127
el128
el28

el106
el120
el123
el124
el6
el119
el121
2e05

el122
el5
el126
el7
el125
el29

el63
el33
el52
el53
el54
el61
el62
el112
2e05

el2
el3
el56
el60
el30

el34
el50
el51
el44
el42
el43 2e05 2e05 2e05 2e05
el4
el32
el36
el45
el57
el58
el55
el59
el46
el47
el35
el48
el49

Figura 4.3: Dendograma da anlise de agrupamento para os eletrodos.


Figura 4.2: Grficos de disperso para um pequeno conjunto de eletrodos.
25
26

Figura 4.4: Mapeamento dos eletrodos por grupo.

Programao R.

Agrupamento Hierrquico.

Comandos e parmetros fundamentais:

dist(x, method = "euclidean", ...)

x - Banco de dados.
method - A medida de distncia a ser utilizada. Deve ser um de: "euclidean",
"maximum", "manhattan", "canberra", "binary"ou "minkowski".

hclust(d, method = "complete",...)

d - Resultado produzido pela funo dist.


method - Mtodo de agrupamento utilizado. Deve ser um de: "ward", "single",
"complete", "average", "mcquitty", "median"ou "centroid".
27

Para uma melhor visualizao, pode-se fazer um mapeamento dos eletrodos de cada

grupo como o apresentado na Figura 4.4 quando se tem respectivamente 2, 3, 4 e 5 gru-

pos. Neste caso o agrupamento foi feito utilizando a distncia manhattan, porm a mesma

anlise foi feita para diversos tipos de distncia e todas deram resultados extremamente

parecidos.

Portanto, ficam claros 4 grupos muito bem definidos correspondendo a regies do cre-

bro: parte frontal, posterior, esquerda e direita. Essa anlise mostra exatamente o que se

postulou a princpio sobre a possvel correlao de regies vizinhas e redundncia dos

dados. Outra ideia que pode ser pensada que, talvez, algumas dessas regies no nos

tragam nenhuma informao importante. De fato, se sabe que a rea mais acionada por

estmulos visuais a parte posterior do crebro. A seguir utilizamos algumas tcnicas de

reduo de dimensionalidade para retirar a possvel redundncia dos dados.

4.3 Componentes Principais

Uma anlise de componentes principais utilizada para explicar a estrutura de varincia-

covarincia de um conjunto de variveis por um conjunto menor de variveis formadas por

combinaes lineares das variveis originais. Em geral, em bancos de dados cujas va-

riveis so fortemente correlacionadas - como no caso de dados de EEG - a tcnica de

componentes principais muito til na reduo da dimenso do problema. Esse tipo de

anlise, em muitos casos, tambm capaz de revelar relaes inesperadas ou difceis de

se identificar entre as variveis.

4.3.1 A tcnica de componentes principais

Considere um sistema com p variveis aleatrias X1 , X2 , ...X p . Seja a matriz de

varincias-covarincias do vetor aleatrio X = [X1 , X2 , ..., X p ]. Considere tambm as

combinaes lineares
28

Y1 = a1 X = a11 X1 + a12 X2 + ... + a1p X p

Y2 = a2 X = a21 X1 + a22 X2 + ... + a2p X p

... ...

Yp = ap X = a p1 X1 + a p2 X2 + ... + a pp X p

neste contexto tem-se que:

Var(Yi ) = ai ai (4.1)

Cov(Yi ,Y j ) = ai aj . (4.2)

Chamam-se componentes principais as p combinaes lineares Y1 ,Y2 , ...Yp , no cor-

relacionadas com varincias (dadas em 4.1) decrescentes e mximas.

A primeira componente principal a combinao linear com maior varincia possvel,

ou seja, precisamos maximizar Var(Y1 ) = a1 a1 . claro que Var(Y1 ) cresce apenas

aumentando a norma de a1 , desse modo adiciona-se a restrio de que a1 a1 = 1 ao

problema. Portanto calculam-se as componentes principais resolvendo os problemas de

maximizao descritos abaixo.

Primeira componente principal


Encontrar a1 que solucione

Max Var(a1 X)
a1

sujeito a a1 a1 = 1

Segunda componente principal


Encontrar a2 que solucione
29

Max Var(a2 X)
a2

sujeito a a2 a2 = 1

Cov(a1 X, a2 X) = 0

...

i-sima componente principal


Encontrar ai que solucione

Max Var(ai X)
ai

sujeito a ai ai = 1

Cov(aj X, ai X) = 0, j < i.

Prova-se facilmente (ver Jonhson and Wichern 2007) que a soluo a1 = e1 , a2 = e2 ,

... , ap = ep , onde (1 , e1 ), (2 , e2 ), ... , ( p , ep ) so os pares de autovalores-autovetores

da matriz de varincias-covarincias onde 1 2 ... p 0. Ento a i-sima

componente principal dada por

Yi = ei X. (4.3)
p p
Prova-se tambm que Var(Xi) = Var(Yi), ou seja, as componentes principais re-
i=1 i=1
presentam toda a variabilidade do sistema, porm podemos diminuir a dimenso do pro-

blema escolhendo as k primeiras componentes principais que representem a maior parte

da variabilidade.

4.3.2 Aplicao de componentes principais aos dados

Utilizamos a tcnica de componentes principais tendo em vista a reduo da dimen-

sionalidade elevada dos dados identificando as regies mais estimuladas do crebro pelo

experimento, como ficar claro em seguida.


30

Programao R.

Componentes Principais.

Comandos e parmetros fundamentais:

prcomp(x, ...)

x - banco de dados.

Exemplo:

data = read.table(dados.txt, header = T)


pc1 <- prcomp(data, scale. = T)
rot <- pc1$r
x <- pc1$x
summary(pc1)

No objeto pc1 armazenado, alm de outros resultados, os loadings das


componentes principais que podem ser obtidos por meio do comando pc1$r.

Foi possvel notar que, em geral, precisa-se de apenas 5 componentes principais para

explicar aproximadamente 80% da variabilidade total e de apenas 15 componentes prin-

cipais para explicar aproximadamente 90% da variabilidade total.

Mas o mais interessante foi perceber que as regies do crebro mais relevantes para

a composio das componentes principais foram a parte frontal e posterior. Observe na

Figura 4.5 os pesos que cada regio do crebro tem na composio de cada componente

principal, para as 4 primeiras componentes principais.

Fica claro que cada componente principal leva em conta uma parte especfica do cre-

bro, mas as componentes mais importantes levam em conta a parte frontal e posterior do

crebro. Desse modo, possvel que essas duas partes sejam as mais importantes para

o reconhecimento de padres que sero feitos.

De fato, a tcnica de componentes principais identifica com propriedade as regies

onde a variabilidade est mais presente, isso significa que sob a hiptese de que as

regies estimulas apresentem sinais com maior energia, e consequentemente com maior
31

Programao SAS.

Componentes Principais.

Comandos e parmetros fundamentais:

proc princomp data = sigma cov;


run;

sigma - banco de dados.


cov - parmetro para trabalhar com a matriz de covarincia.

amplitude, as componentes principais estaro, portanto, identificando estas regies mais

estimuladas.

Os prximos captulos mostraro que esta hiptese verdadeira e que, utilizando as

partes com maior variabilidade, obtemos melhores resultados. Ser possvel notar que,

aparentemente, o restante dos eletrodos captam apenas rudos que atrapalham no mo-

mento do clculo do discriminante por captarem sinais de regies pouco estimuladas.


32

Figura 4.5: Curvas de nvel para os loadings das 4 primeiras componentes principais.
5 Mtodo para Discriminante de dados de EEG

A classificao de dados de EEG uma tarefa difcil. A grande maioria dos eletrodos

captam apenas rudos de regies cerebrais no ativadas atrapalhando a anlise. Iden-

tificar a informao importante imprescindvel para obter o sucesso desejado, porm

somente isso no suficiente.

Na literatura, diversos artigos publicados aplicam tcnicas que so aparentemente in-

corretas na situao em questo, ou utilizam mtodos pouco claros apresentando resul-

tados um tanto quanto obscuros.

O desafio, de conseguir classificar adequadamente os dados de EEG, bastante mo-

tivador. Testamos diversas tcnicas e diversas modificaes, incluindo as tcnicas j

citadas e tambm outras, como a sugerida nesta monografia na seo 3.4, e diversas

anlises de sries temporais.

Percebemos nessas tentativas vantagens particulares em cada tcnica de forma que

conclumos que, para obter sucesso em nossa anlise, precisaramos desenvolver um

novo mtodo de classificao que misturasse tcnicas e que principalmente pudesse por

si s identificar as regies do crebro estimuladas e, portanto, importantes.

Este captulo descreve o mtodo de classificao desenvolvido e com o qual foram obti-

dos resultados interessantes. Antes de descrev-lo necessrio definir alguns conceitos

importantes, o que ser feito nas sees seguintes.


34

5.1 O Periodograma

Considere que {Xt } seja uma srie temporal estacionria. Considere tambm o vetor


x1


x2


x = . Cn (5.1)
:



xn

onde Cn denota o conjunto de todos os vetores coluna com elementos complexos. Seja

tambm ] [
2k n1 [n]
k = , k= , ..., , (5.2)
n 2 2
onde [y] denota o maior inteiro menor igual a y. O conjunto de todos os k - que denota-

mos por Fn - chamado de Frequncias de Fourier associadas ao tamanho amostral n.

Note que este conjunto um subconjunto do intervalo (, ].

Defina tambm

eik

2ik
e [ ]
1


n1 [n]
ek = . , k= , ..., , (5.3)
n : 2 2



enik

uma propriedade importante desses vetores que eles so ortonormais, ou seja



1, se j = k,
e j ek = (5.4)
0, caso contrrio.
35

onde e j denota o vetor linha em que todos elementos so os respectivos complexos con-

jugados do vetor e j . Tem-se portanto que {e1 , e2 , ..., en } uma base de Cn , ou seja,

pode-se escrever o vetor x dado em (5.1) em funo da base:

[n/2]
x= ak ek . (5.5)
k=[(n1)/2]

Esta equao pode ser reescrita como uma combinao linear de funes seno e

cosseno com frequncias k Fn , isso pode ser feito escrevendo o t-simo componente

de x como

[n/2]
xt = ak [cos(kt) + isen(k t)], t = 1, ..., n. (5.6)
k=[(n1)/2]

possvel encontrar os coeficientes ak multiplicando (5.5) por ek e usando (5.4), obtm-

se, portanto,
1 n
ak = ek x = xt eitk . (5.7)
n t=1

A sequncia {ak } chamada de transformada discreta de Fourier da sequncia {x1 , ..., xn }.

Definimos agora o periodograma.

Definio. O periodograma de {x1 , x2 , ..., xn } a funo

2
1 n
it
In () = xt e (5.8)
n t=1

Agora, se uma das frequncias de Fourier k , ento In (k ) = |ak |2 . Esse fato

implica em uma relao muito importante, observe que

n [n/2] [n/2]
|xt |2 = xx = |ak |2 = In (k ), (5.9)
t=1 k=[(n1)/2] k=[(n1)/2]

deste modo, o valor do periodograma na frequncia k pode ser interpretado como a

contribuio dessa frequncia para a soma de quadrados.


36

5.1.1 Periodograma no SAS

No ambiente SAS, o periodograma pode ser calculado por meio do procedimento PROC

SPECTRA, porm algumas diferenas de definio so importantes.

Primeiramente, o clculo feito no conjunto dos nmeros reais de forma que a parte

complexa em (5.6) soma para zero. Alm disso o SAS utiliza uma decomposio um

pouco diferente para (5.6) de forma que k s varie no intervalo (0, ], no SAS, portanto

xt dado por
m
a0
xt = + [ak cos(k t) + bk sen(k t)] (5.10)
2 k=1

onde m = n/2 se n par e m = (n 1)/2 se n impar e a0 = 2x (duas vezes a mdia

amostral de x).

No SAS o periodograma ento a sequncia {Jk }, onde

n
Jk = (a2k + b2k ). (5.11)
2

Da mesma forma o periodograma interpretado como a contribuio da frequncia k

para a soma de quadrados total.

A densidade espectral pode ser estimada suavizando o periodograma por uma funo

peso W (.) chamada janela espectral. Essa suavizao diminui a varincia, porm adi-

ciona vis.

Programao SAS.

Periodograma.

Comandos e parmetros fundamentais:

proc spectra data = sigma out = sada ;


var x;
run;

sigma - banco de dados.


saida - nome para o banco de dados resultante.
var - varivel utilizada.
37

5.2 Motivao

Esta seo descreve a principal motivao para o desenvolvimento do novo mtodo

e mostra a base lgica que ser aplicada no discriminante. Para o melhor acompa-

nhamento do leitor ressaltamos que, quando for mencionada a palavra Figura, estare-

mos nos referindo a uma das vrias figuras presentes no texto, e quando for mencionada

a palavra Imagem estaremos nos referindo a uma da 10 imagens utilizadas no experi-

mento do qual resultou nosso banco de dados (ver Figura 5.1).

Inicialmente, aplicou-se a anlise de Fourier para a montagem dos periodogramas e,

com os grficos obtidos, realizou-se uma srie de comparaes. Observando os pe-

riodogramas notou-se certos padres interessantes em alguns casos.

Veja agora os 3 grficos no lado esquerdo da Figura 5.2, esses grficos mostram os

periodogramas para algumas combinaes de eletrodos e imagens do experimento em

todas as suas repeties disponveis. Observe por exemplo o primeiro grfico, nota-se

claramente como os periodogramas verdes (imagem 6) possuem valores maiores entre

as frequncias com k = 35 e k = 60 aproximadamente, em comparao com os perio-

dogramas vermelhos (imagem 4). Esse tipo de padro se repete em outros grficos.

Figura 5.1: Quatro das dez imagens do experimento, numeradas como 3, 4, 6 e 7 respec-
tivamente.

Nos grficos do lado direito foi aplicado um suavizamento com mdias mveis nos res-

pectivos periodogramas esquerda da Figura 5.2. Esta tcnica muito simples, considere

{Jk } a sequncia de pontos do periodograma, ento para algum n qualquer temos o


suavizamento dado por
n
1
MMk =
n Jk+ j1, (5.12)
j=1

ou seja, temos simplesmente que MMk a mdia de n termos em sequncia iniciando-se

no ponto Jk . Denotaremos esse suavizamento como MMn .


38

A interpretao neste caso simples, temos que o primeiro ponto dos grficos suaviza-

dos da parte esquerda da Figura 5.2 a contribuio mdia das quatro frequncias iniciais

(utilizou-se n = 4) para a soma de quadrados total; j o segundo ponto a contribuio

mdia das quatro frequncias iniciando-se do segundo ponto do respectivo periodograma,

e assim por diante.

Neste caso observamos padres semelhantes porm mais estveis j que o periodograma

foi suavizado. Nos testes realizados utilizando o novo mtodo de classificao - como ser

enfatizado adiante - aplicou-se estas ideias, variando tambm o valor de n, e tambm al-

gumas outras variaes.


39

Periodograma - Eletrodo 22 - Imagens 4 e 6 Periodograma + MM4 - Eletrodo 22 - Imagens 4 e 6

0 20 40 60 80 0 20 40 60 80
K K

Periodograma - Eletrodo 82 - Imagens 4 e 7 Periodograma + MM4 - Eletrodo 82 - Imagens 4 e 7

0 20 40 60 80 0 20 40 60 80
K K

Periodograma - Eletrodo 114 - Imagens 3 e 6 Periodograma + MM4 - Eletrodo 114 - Imagens 3 e 6

0 20 40 60 80 0 20 40 60 80
K K

Figura 5.2: Periodogramas e periodogramas com mdias mveis. Para o eletrodo 22, pe-
riodogramas vermelhos e verdes indicam imagens 4 e 6 respectivamente, para
o eletrodos 82, periodogramas laranjas e azuis indicam imagens 4 e 7 respec-
tivamente, e para o eletrodo 114, periodogramas roxos e amarelos indicam
imagens 3 e 6 respectivamente.
40

5.3 Introduo ao novo mtodo para discriminante de

dados de EEG.

Os grficos da Figura 5.2 so interessantes pois possvel observar padres carac-

tersticos para cada sinal emitido pelo crebro ao perceber cada imagem do experimento

em particular. De fato, a partir de agora, possvel identificar uma imagem, apenas dado

um sinal qualquer.

Por exemplo, considere a Figura 5.3. O grfico esquerda um dos apresentados

na Figura 5.2, adicionada uma linha que pode ser utilizada como discriminante, classi-

ficando algum periodograma suavizado com MM4 que possua amplitudes superiores a

linha traada entre os pontos prximos de 40 como pertencendo a imagem 6 (periodogra-

mas verdes) e como pertencendo a imagem 4, caso contrrio. Desta forma, claro que

o periodograma suavizado, apresentado no grfico direita, produzido por um sinal

gerado pela observao da imagem 6.

Periodograma + MM4 - Eletrodo 22 - Imagens 4 e 6 Periodograma + MM4 - Eletrodo 22 - Imagem desconhecida

0 20 40 60 80 0 20 40 60 80
K K

Figura 5.3: O periodograma direita pertence ao conjunto dos periodogramas gerados


pela Imagem 6 (periodogramas verdes esquerda.)

O principal problema que surge que nem todos os eletrodos produzem periodogramas

to claros, e alm disso, mesmo nos periodogramas apresentados, existem uma srie de

frequncias que no trazem nenhuma informao clara. Outro problema que no

desejvel obter o discriminante apenas de maneira visual, o que invivel em aplicaes

prticas.
41

Desta forma, necessrio desenvolver um algoritmo de classificao que automatica-

mente identifique os eletrodos relevantes e que tambm identifique as partes importantes

dentro de um conjunto de periodogramas, de forma que, em uma aplicao do tipo in-

terface entre homem e mquina por exemplo, os sinais captados sejam automaticamente

interpretados entre uma das possveis respostas.

5.4 Clculo do Discriminante

Considerando todo o texto escrito at aqui, sero introduzidos em seguida, os passos

lgicos e notaes fundamentais para o mtodo de classificao. Primeiramente, claro

que possvel melhorar o discriminante gerado pela reta da Figura 5.3 ao se considerar

um discriminante diferente para cada frequncia distinta, como ilustrado na Figura 5.4.

Decidiu-se ento utilizar, para cada um desses discriminantes, a tcnica de SVM j que

esta tem a vantagem de no assumir distribuies e considerar apenas as distncias entre

as classes. Neste caso, cada discriminante classificar um novo sinal entre duas classes

dependendo se o sinal possui periodograma maior ou menor que certo valor naquele

ponto especfico.
T o valor do perio-
Para introduzir a notao, considere duas classes A e B. Seja Jl,k
T de acordo com o
dograma no k-simo ponto para um sinal teste, classificaremos Jl,k

discriminante

1, T for classificado na classe A
se Jl,k
T
SVMl,k [Jl,k ]= , (5.13)
1, caso contrrio.

onde l = 1, ..., 128 representa o eletrodo e k representa o indicador do k-simo ponto do

periodograma ou periodograma suavizado.

5.5 Sistema de pesos

Cabe perceber que existem alguns discriminantes mais confiveis que outros. Os dis-

criminantes centrais na Figura 5.4 so claramente mais confiveis do que o ltimo dis-
42

Figura 5.4: Alguns discriminantes pontuais para k variando de 36 48 para os periodogra-


mas produzidos pelos sinais captados pelo eletrodo 22 relativos as imagens 4
e 6. Os pontos azuis representam os discriminantes.

criminante apresentado na Figura 5.4, note que este classificou 2 pontos erroneamente

enquanto aqueles classificaram todos os pontos corretamente.

Levando esse fato em considerao, introduziu-se um sistema de pesos baseado na

taxa de classificao incorreta para cada discriminante. Dessa forma, definiu-se os pesos

como

Pesol,k = [1 2 (Min{Taxa de Erro, 0.5})] , (5.14)

onde a Taxa de Erro dada entre 0 e 1, um parmetro escolhido a priori, l representa

o eletrodo sendo l = 1, ..., 128 e k o indicativo do k-simo ponto do periodograma ou do

periodograma suavizado.

Note que se a classificao perfeita ento a taxa de erro zero e, portanto, o peso vale

1, e se a classificao aloca metade dos pontos ou mais erroneamente, temos peso zero.

Observe tambm que o parmetro permite que pesos para classificaes com poucos

erros sejam proporcionalmente maiores que pesos para classificaes com muitos erros
43

com o aumento de . Por exemplo, se a taxa de erro 25% ento o peso obtido 0.5 se

= 1, 0.25 se = 2 e 0.707 se = 1/2, sendo que o peso sempre 1 para taxa de erro
0%.

Cabe aqui fazer uma observao sobre a expresso do peso. Como a classificao

binria - duas classes - no faria sentido uma taxa de erro maior que 50%, pois se

assim fosse, bastaria inverter o discriminante para obtermos taxa de erro menor que 50%.

Porm, como a tcnica de SVM usa o critrio de maximizar as margens, esse tipo de

anomalia pode ocorrer em alguns casos mais raros, por essa razo a expresso utiliza o

mnimo entre 0.5 e a taxa de erro, j que no desejvel pesos negativos.

5.6 Fase de teste ou Aplicao

Na fase de teste ou em uma aplicao prtica, temos um novo conjunto de sinais - um

sinal captado por eletrodo - para ser classificado com o discriminante obtido. Como isso

pode ser feito?

Inicialmente, o sinal de algum eletrodo - digamos o eletrodo l - escolhido. Obviamente

o prximo passo calcular o periodograma ou periodograma suavizado do sinal. Em


T ] dado em (5.13).
seguida para cada ponto k utiliza-se o discriminante SVMl,k [Jl,k

Neste ponto temos vrios discriminantes calculados e uma srie de indicadores de

classe definidos como 1 ou -1, o que fazer com isso? neste momento que entram em

cena os pesos calculados anteriormente.

l,50 [Jl,50 ] = 1 e SVMl,62 [Jl,62 ] = 1,


T ] = 1, SVM
Suponha por exemplo que SVMl,3 [Jl,3 T T

suponha tambm que Pesol,3 = 0, Pesol,50 = 1 e Pesol,62 = 1. Neste caso hipottico,

a taxa de classificao incorreta para k = 3 maior ou igual 50% enquanto que, para

k = 50 e k = 62, esta taxa vale 0%. Ou seja, mais provvel que o sinal pertena classe
B do que classe A.
Pensando desta maneira pode-se generalizar para todos os discriminantes obtidos.

Para fazer isso basta definir

m
Dl = SVMl,k [Jl,kT ] Pesol,k . (5.15)
k=1
44

Neste caso, obtm-se a deciso definida pelo eletrodo l como sendo um sinal perten-

cente classe A se Dl > 0, classe B se Dl < 0 e no existe deciso se Dl = 0.

Esse processo repetido para todos os eletrodos. Para juntar todas as decises temos

duas opes, a primeira fazer a soma

128
D= Dl , (5.16)
l=1

e decidir a favor da classe A se Dl > 0, da classe B se Dl < 0 e no decidir se Dl = 0.

A segunda considerar a deciso final como sendo a deciso dada pela maioria dos

eletrodos.

A primeira opo parece ser mais apropriada pois leva em conta o desempenho do

eletrodo na fase de treinamento, porm os resultados para os dados analisados foram

obtidos utilizando a segunda opo, pois foi a ideia que surgiu primeiro durante o perodo

de trabalho.

A seguir trs algoritmos so apresentados, o primeiro relativo a fase de treinamento,

o segundo a primeira opo da fase de testes e o terceiro a segunda opo da fase de

testes.
45

5.7 Algoritmo para o treinamento


46

5.8 Algoritmos para a fase de testes e aplicaes


47
6 Resultados

Utilizou-se o novo mtodo para fazer o discriminante dos dados disposio. Para que

o contedo desta seo fique mais claro, cabe aqui explicar novamente como formado

o conjunto de dados.

O experimento consiste em colocar um sujeito em frente a uma tela que mostra 4

repeties de um conjunto de 10 Imagens - ver Figura 4.1 - apresentadas aleatoriamente.

O sujeito usa uma touca com 128 eletrodos sendo que cada um deles capta um sinal

diferente. Desta forma temos um total de 4 10 128 sinais.

Como o mtodo desenvolvido serve para separao de apenas duas classes, o discri-

minante das imagens deve ser feito 2 a 2, o que totalizaria 45 discriminantes. Porm, como

muitas das imagens so semelhantes - ver Figura 4.1 - decidiu-se fazer o discriminante

apenas das imagens abstratas contra as imagens que apresentam operaes matemti-

cas, totalizando 16 discriminantes ao invs de 45.

Como o intuito no era apenas montar os discriminantes e sim testar a eficincia do

mtodo utilizou-se validao cruzada para aproximar a taxa de classificao correta do

mtodo. A validao cruzada foi feita da seguinte forma: para cada par de imagens

analisados excluiu-se a quarta repetio de cada imagem (independentes das demais)

para serem empregadas na fase de teste, utilizando as demais para o treinamento. Em

seguida, exclui-se a terceira repetio de cada imagem para a fase de teste, utilizando as

demais para o treinamento, e assim sucessivamente.

Portanto, no final foram testados 16 4 2 = 128 sinais na fase de teste. Note que os

sinais empregados na fase de teste no foram aplicados na montagem do discriminante

testado, sendo portanto uma anlise confivel.


49

Realizou-se diversas anlises nas quais vrias variaes foram aplicadas. Testou-se

o mtodo para valores diferentes de n, e C nas equaes (5.12), (5.14) e (3.16) res-

pectivamente e, alm disso, o mtodo foi testado em regies distintas e particulares do

crebro.

O primeiro teste realizado foi feito, naturalmente, para o periodograma tradicional (n = 1)

e, neste caso, utilizou-se = 2 e C = 1. Empregando todos os eletrodos, a taxa de

classificao correta obtida foi de 69%, que no uma taxa elevada mas mostra que o

discriminante est identificando certos padres caractersticos.

Calculou-se tambm a taxa de classificao correta por eletrodo. A Figura 6 mostra a

eficincia de cada regio cerebral. Note que a parte frontal do crebro apresenta taxas

mais elevadas em relao as demais.

Figura 6.1: Curvas de nvel para as taxas de classificao correta por eletrodo: tcnica
com periodograma, = 2 e C = 1 e tcnica com periodograma suavizado,
n = 4, = 2 e C = 1).

Mantendo-se constante = 2 e C = 1 novos discriminantes foram calculados utilizando

periodogramas suavizados para vrios valores de n. Para n = 4, obteve-se taxa de classi-

ficao correta de 80%. A Figura 6 mostra a eficincia de cada regio cerebral, note que

a parte frontal do crebro destaca-se ainda mais que antes.

No se pode deixar de observar a semelhana do grfico direita da Figura 6 com

o primeiro grfico da Figura 4.5, presente na seo 4.3. Fica evidente que parece ser
50

vlida a hiptese anterior de que a primeira componente principal, por ser a componente

que possui maior variabilidade, identificaria as regies do crebro mais ativadas no ex-

perimento e, assim, que possivelmente produziriam melhores resultados para os discri-

minantes.

Sob essas hipteses, pode-se imaginar que grande parte dos eletrodos captem apenas

rudo atrapalhando o discriminante. Como mencionado no final da seo 5.6, utilizou-se o

segundo mtodo de teste no qual todos os eletrodos possuem o mesmo peso na anlise,

dessa forma parece ser interessante descartar os eletrodos que aparentemente no nos

trazem informao til.

Para fazer isso, aplicou-se a anlise feita na seo 4.2 descartando todos os discrimi-

nantes no presentes no grupo frontal da Figura 4.4 (diviso em 4 grupos). Deste modo,

refazendo-se a anlise, obtivemos uma taxa de classificao correta de 89%.

O passo seguinte - mantendo o periodograma suavizado com n = 4 - foi variar os

parmetros e C. Testou-se discriminantes para o parmetro variando entre 1/2, 1, 2, 3

e 5 e o parmetro C em trs nveis 0.0001, 1 e 1000. Esses valores de C foram escolhidos

para atingir os extremos de pouca importncia para as variveis de folga (C = 0.0001) e

muita importncia para as variveis de folga (C = 1000).

Utilizando os eletrodos da parte frontal do crebro, o periodograma suavizado com

MM4 , e tambm = 5 e C = 1000, obteve-se uma taxa de classificao correta de 94%,


que uma taxa extremamente elevada levando-se em conta as taxas apresentadas na

literatura. Observe tambm nas tabelas 6.1 e 6.2 a taxa de classificao correta entre

imagens especficas e por eletrodo individualmente.


51

Discriminante Taxa de classificao correta


Imagem 3 x Imagem 1 1.00
Imagem 3 x Imagem 2 0.88
Imagem 3 x Imagem 5 1.00
Imagem 3 x Imagem 6 1.00
Imagem 3 x Imagem 7 0.88
Imagem 3 x Imagem 8 0.88
Imagem 3 x Imagem 9 0.75
Imagem 3 x Imagem 10 1.00
Imagem 4 x Imagem 1 1.00
Imagem 4 x Imagem 2 1.00
Imagem 4 x Imagem 5 0.75
Imagem 4 x Imagem 6 1.00
Imagem 4 x Imagem 7 1.00
Imagem 4 x Imagem 8 0.88
Imagem 4 x Imagem 9 1.00
Imagem 4 x Imagem 10 1.00

Tabela 6.1: Taxa de classificao correta para cada discriminante binrio.

Eletrodo Taxa Eletrodo Taxa Eletrodo Taxa


el1 0.59 el79 0.88 el95 0.91
el64 0.55 el80 0.88 el96 0.84
el65 0.62 el81 0.83 el97 0.62
el66 0.52 el82 0.87 el98 0.67
el67 0.65 el83 0.84 el99 0.73
el68 0.73 el84 0.70 el100 0.77
el69 0.71 el85 0.71 el101 0.78
el70 0.73 el86 0.59 el102 0.77
el71 0.75 el87 0.62 el103 0.74
el72 0.84 el88 0.73 el107 0.74
el73 0.82 el89 0.76 el108 0.76
el74 0.81 el90 0.84 el109 0.74
el75 0.73 el91 0.80 el110 0.67
el76 0.70 el92 0.82 el111 0.59
el77 0.80 el93 0.70 el114 0.76
el78 0.71 el94 0.84 el115 0.68

Tabela 6.2: Taxa de classificao correta para cada eletrodo.


7 Consideraes Finais

A classificao de dados de EEG se mostrou um desafio bastante complicado. Durante

nosso trabalho diversas tcnicas foram aplicadas e, neste ltimo captulo, apresentamos

as concluses obtidas, problemas no solucionados e sugestes de pesquisa.

Primeiramente, cabe ressaltar, que os bancos de dados de EEG so desnecessaria-

mente grandes. Em geral o sinal de um nico eletrodo em um intervalo de 5 segundos

pode ter mais de 4000 pontos. Essa quantidade enorme de informao se torna redun-

dante e complica principalmente a computao de uma grande quantidade de tcnicas

estatsticas.

Como j foi mencionado, o banco de dados utilizado neste trabalho era composto por

apenas 164 pontos por cada eletrodo e, mesmo assim, obteve-se um taxa de classificao

correta de 94%, o que reala que muita informao nos bancos de dados de EEG

redundante.

Mostrou-se tambm que o sinal emitido por eletrodos prximos bastante correla-

cionado e redundante, porm neste caso a informao sobre mais regies do crebro

definitivamente importante. Como foi feito, pode-se identificar as regies do crebro

mais ativadas com o uso de componentes principais e, portanto, a grande quantidade de

eletrodos, neste caso, bem vinda.

O uso de componentes principais e agrupamentos hierrquicos no se mostrou apenas

til na identificao da regies importantes, mas tambm fundamental para excluir as

regies do crebro que emitem rudo e que atrapalham a classificao. Destaca-se o

fato de que os eletrodos mais importantes para a primeira componente principal foram

tambm os eletrodos que obtiveram a melhor taxa de classificao.


53

No que concerne a classificao dos dados de EEG, pode-se afirmar que a aplicao

de tcnicas tradicionais por si s no adequada. Tcnicas como discriminante de Fisher,

redes neurais e mquinas de suporte vetorial, utilizadas sozinhas, no so eficientes.

O novo mtodo para o discriminante de dados de EEG se mostrou bastante eficaz para

o problema em questo. De fato, utilizando apenas 164 pontos por sinal captado por cada

um dos 48 eletrodos usados, obteve-se uma taxa de classificao correta de 94% que

uma taxa bastante elevada.

A principal vantagem do novo mtodo, alm da eficincia, o fato de que uma vez ar-

mazenados os pesos e os pontos discriminantes, o teste ou a aplicao so processados

muito rapidamente, o que importante em situaes prticas. Outra vantagem que, ao

se utilizar o periodograma, perde-se a noo do ponto inicial do sinal, trabalhando apenas

com a frequncia, isso importante pois muito difcil assegurar que o incio do sinal

coincida com o estimulo propriamente dito.

Algumas desvantagens, porm, tambm podem ser citadas. A principal desvantagem

, provavelmente, o fato de se tratar de discriminantes binrios, um fato prejudicial j que

na maioria das aplicaes prticas existiro mais que 2 classes. Outra desvantagem o

fato de que sempre necessria a mesma quantidade de pontos por sinal, j que, caso

fossem diferentes, o periodograma teria quantidade de pontos distintos e o discriminante

no seria adequado.

Portanto, necessrio principalmente desenvolver discriminantes no binrios sendo

esta a principal sugesto da pesquisa. Outras sugestes, que devem ser testadas, so

formas de contornar o problema de mesmo nmero de pontos por sinal, testar outros tipos

de periodogramas ou densidades espectrais e tambm determinar a quantidade tima de

pontos e a quantidade tima de eletrodos.

Conclumos, ento, destacando o fato de que trabalhar com este tipo de dado bastante

motivador por ser um desafio grande, e tambm por ser uma aplicao que, se bem

sucedida, pode ajudar a vida de diversas pessoas, principalmente daquelas portadoras

de necessidades especiais.
Referncias Bibliogrficas

[1] ADLAKHA, A.; EBRAHIMI, T. Single trial EEG Classification. Swiss Federal Institute

of Technology. July. 2002.

[2] BROCKWELL, P.J.; DAVIS, R.A. Introduction to Time Series and Forecasting. 2nd

ed. Colorado: Springer. 2002. Cap. 4.

[3] BRONZINO, J.D. Principles of Electroencephalography. The Biomedical Engineering

Handbook. Boca Raton: CRC Press, 1999. Cap. 15.

[4] HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning:

Data Mining, Inference, and Prediction. 2nd ed. Stanford: Springer. 2009.

[5] JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. 6th ed.

New Jersey: Pearson Prentice Hall, 2007.

[6] KARATZOGLOU, A.; MEYER, D. Support Vector Machines in R. Journal of Statistical

Software. v. 15, issue 9. April. 2006.

[7] SANEI, S.; CHAMBERS, J.A. EEG Signal Processing.1st ed. Chichester: John Wiley

& Sons, 2007.

[8] SRNMO, L.; LAGUNA, P. Bioelectrical Signal Processing in cardiac and neuro-

logical applications. 1st ed. UK: Elsevier, 2005.

[9] THEODORIDIS, S.; KOUTROUMBAS, K. Pattern Recognition. 3rd ed. San Diego:

Elsevier. 2006.
55

[10] VON BORRIES, G. F. ; COUTINHO, M.; VON BORRIES, R.F. ; MIOSSO, C.J. . Princi-

pal Component Analysis of Brain-Generated Biopotencial Measurements. Resumenes

en IX - Congreso Latinoamericano de Sociedades de Estadstica, Vinha del Mar -

Chile, 2010.

Potrebbero piacerti anche