Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
FACULDADE DE TECNOLOGIA
MANAUS
2013
UNIVERSIDADE FEDERAL DO AMAZONAS
FACULDADE DE TECNOLOGIA
MANAUS
2013
RESUMO
Palavras chave: Cncer de mama, Support Vector Machine, Wisconsin Breast Cancer
Database
LISTA DE TABELAS
1 INTRODUO.................................................................................................................6
2 MATERIAIS......................................................................................................................8
3 METODOLOGIA............................................................................................................11
4 RESULTADOS.................................................................................................................15
REFERNCIAS BIBLIOGRFICAS........................................................................................19
6
1 INTRODUO
Simara V. da Rocha et al (2000) O cncer de mama tem se tornado cada dia mais
frequente entre a populao feminina acima dos 40 anos. Somente para o ano de 2011 foram
estimados, no Brasil, 49 mil novos casos. Uma das maneiras para detectar os tumores no
palpveis que causam cncer de mama realizar uma radiografia (mamografia) das mamas. A
mamografia atualmente a melhor tcnica de deteco precoce de leses no palpveis na
mama com altas chances de ser um cncer curvel. Sabe-se que as chances de cura do cncer
de mama so relativamente altas, se detectado nos estgios inicias.
Na etapa final sero apresentados os resultados atravs da matriz de confuso, que nos
mostrar a acurcia de classificao alm de outras anlises como a sensibilidade e a
especificidade, a anlise dos resultados, concluso e trabalhos futuros.
8
2 MATERIAIS
valor mdio, erro padro, mdia de trs maiores valores. O mtodo de extrao de
caractersticas pode ser melhor entendido no artigo publicado pelos criadores Wolberg, Street
e Mangasarian,1993.
Do conjunto de dados, 212 so pacientes com tecido mamrio com cncer e 357
pacientes sem cncer. As seguintes caractersticas do ncleo celular, totalizando 10, constam
nesse banco de dados: raio, permetro, rea, compacidade, suavidade, concavidade, pontos
cncavos, simetria, dimenso fractal, textura. A seguir define-se cada uma dessas
caractersticas.
Raio
linhas radiais definida pelo centro de gravidade do contorno e os pontos indivduas do mesmo.
Permetro
rea
Compacidade
formula perimetro2 /area . Este nmero adimensional tem valor mnimo em um disco
Suavidade
Concavidade
quanto o contorno do ncleo cai dentro de cada corda. Este caracterstica afetada pelo
comprimento destas cordas, com cordas menores captura-se melhor as pequenas concavidades
(Wolberg, 1994).
Pontos cncavos
do contorno.
10
Simetria
de comprimento entre as linhas perpendicular ao eixo maior para o limite nuclear em ambas
as direes.
Dimenso fractal
Textura
3 METODOLOGIA
xi xj
Um Kernel K uma funo que recebe dois pontos e do espao de
xi xj
entradas e computa o produto escalar ( ). ( ) no espao de
xi , x j xi xj
K( ) = ( ). ( )
Tipo de Kernel
Funo K(
x i , x j ) correspondente Comentrios
Gaussiano 2
1
x ix j A amplitude
Exp( 2 2 ||)
13
VP
S
VP FN
VN
E
FP VN
14
VN VP
Ac
VP FP VN FN
4 RESULTADOS
POLINOMIAL
Confusion Matrix
98 6 94.2%
0
34.5% 2.1% 5.8%
Output Class
8 172 95.6%
1
2.8% 60.6% 4.4%
0 1
Target Class
RBF
Confusion Matrix
95 2 97.9%
0
33.5% 0.7% 2.1%
Output Class
11 176 94.1%
1
3.9% 62.0% 5.9%
0 1
Target Class
Com base na anlise dos resultados podemos ver que o kernel RBF, com taxa de acerto
de 95.4%, mostrou-se levemente superior ao kernel POLINOMIAL, com taxa de acerto de
acerto 95.1%.
18
Uma forma de analisar os resultados obtidos seria comparar nosso estudo com outros
estudos da literatura, referente ao mesmo objetivo, embora os referidos autores tenham usado
outro banco de dados.
Portanto como mostrado na Tabela 4, a acurcia deste trabalho est prximo do estudo
Ubeli, 2006 ao estudo de Akay, 2009.
19
Portanto o sistema atendeu seu objetivo inicial, podendo ser utilizado no auxlio do
diagnstico de cncer de mama.
Para futuros trabalhos podemos propor melhoria da preciso da classificao por uso
de tcnicas de seleo de caractersticas e utilizar metodologias de diviso para treinamento-
teste como 70%-30% e 80%-20, uma vez que usamos 50%-50%.
20
REFERNCIAS BIBLIOGRFICAS
HAYKIN, S. Redes Neurais: princpios e prticas; trad. Paulo Martins Engel. -2.ed.
Porto Alegre: Bookman 2001.
UBELY, Elif Derya, Implements Automated Diagnostic Systems for breast cancer
detection. Department of Electral and Electronics Engineering, Faculty of Engineering.
TOBB Ekonomi ve Teknoloji Universtesi, 06530, Ankara, Turkey, 2006.