Sei sulla pagina 1di 104

UNIVERSIDADE FEDERAL DA PARABA

CENTRO DE CINCIAS EXATAS E DA NATUREZA


PROGRAMA DE PS-GRADUAO EM MODELOS DE DECISO E SADE - DOUTORADO

UMA NOVA ARQUITETURA PARA COMBINAO DE AGLOMERADOS


ESPACIAIS E SUA APLICAO EM EPIDEMIOLOGIA

Danielly Cristina de Souza Costa Holmes

Joo Pessoa/PB
2015
DANIELLY CRISTINA DE SOUZA COSTA HOLMES

UMA NOVA ARQUITETURA PARA COMBINAO DE AGLOMERADOS


ESPACIAIS E APLICAO EM EPIDEMIOLOGIA

Tese apresentada ao Programa de Ps Graduao


em Modelos de Deciso e Sade Nvel
Doutorado, do Centro de Cincias Exatas e da
Natureza da Universidade Federal da Paraba,
como requisito regulamentar para obteno do
ttulo de doutor.

Linha de Pesquisa: Modelos de Deciso

Orientadores:
Prof. Dr. Ronei Marcos de Moraes
Prof. Dr. Rodrigo Pinheiro de Toledo Vianna

Joo Pessoa/PB
2015
H749u Holmes, Danielly Cristina de Souza Costa.
Uma nova arquitetura para combinao de aglomerados
espaciais e aplicao em epidemiologia / Danielly Cristina de
Souza Costa.- Joo Pessoa, 2015.
104f. : il.
Orientadores: Ronei Marcos de Moraes, Rodrigo Pinheiro
de Toledo Vianna
Tese (Doutorado) - UFPB/CCEN
1. Sade Modelos de deciso. 2. Mtodos de
aglomerao espaciais. 3. Votao por maioria. 4. Redes
neurais. 5. Combinao de classificadores.

UFPB/BC CDU: 614(043)


DANIELLY CRISTINA DE SOUZA COSTA HOLMES

UMA NOVA ARQUITETURA PARA COMBINAO DE AGLOMERADOS


ESPACIAIS E SUA APLICAO EM EPIDEMIOLOGIA

Joo Pessoa, 16 de dezembro de 2015

BANCA EXAMINADORA

__________________________________
Prof. Dr. Ronei Marcos de Moraes
Orientador UFPB

___________________________________
Prof. Dr. Rodrigo Pinheiro de Toledo Vianna
Orientador UFPB

___________________________________
Profa. Dra. Jordana de Almeida Nogueira
Membro Interno UFPB

___________________________________
Prof. Dr. Marcelo Rodrigo Portela Ferreira
Membro Externo UFPB

___________________________________
Prof. Dr. Regivan Hugo Nunes Santiago
Membro Externo UFRN
AGRADECIMENTOS

A Deus, por no permitir que eu perdesse a fora e o equilbrio. Quero neste momento
apenas agradecer.
Ao meu marido Rodrigo, pela pacincia e compreenso. Por estar sempre presente,
compartilhando momentos de angstias, conquistas e alegrias.
Aos meus pais, Rinaldo e Lourdes, meus pais amados, pois sem eles no seria
possvel esta conquista. A eles minha eterna gratido.
Aos meus irmos, Bruno e Jnior, obrigado pela amizade incondicional. Amo vocs.
Aos meus orientadores Ronei Marcos e Rodrigo Vianna, pela amizade e
profissionalismo depositados na elaborao deste trabalho.
professora Liliane Machado, pelos momentos vividos em todos esses anos, pelas
nossas conversas sempre voltadas para o meu crescimento acadmico e pessoal.
Ao professor Witold Pedrycz, por me receber e orientar de forma brilhante na
University of Alberta, Canad.
Ao professor Joo Agnaldo, pelas palavras de incentivo e conselhos valiosos durante
toda a trajetria deste trabalho.
banca examinadora deste trabalho, pelo tempo dedicado leitura e contribuies
para uma melhor finalizao desta pesquisa.
As minhas colegas de doutorado, Eveline, Isabella, Kerle e Maria Elma, pela
amizade, momentos de alegria e angstias vividos desde a poca do mestrado.
Aos meus colegas do Leapig/LabTEVE: Jodavid, Wanessa, Jos, Laisa, Anny,
Luana, Thase, Elaine, Thiago, Paulo, Eline sempre presentes no meu dia a dia, durante
todos esses anos. Muito obrigada pelos trabalhos em equipe, vocs so brilhantes.
A CAPES, pelo financiamento desta pesquisa.

A todos vocs, meu eterno agradecimento...


Se voc no puder se destacar pelo talento,
vena pelo esforo.

Dave Weinbaum
RESUMO

A combinao de classificadores tem por objetivo produzir resultados mais precisos para o
processo de tomada de deciso. Com isso, este estudo teve por objetivo propor uma nova
arquitetura baseada na combinao dos mtodos de aglomerao espacial e um mapa de
votao mais detalhado sobre a quantidade de votos que cada geo-objeto recebeu, aplicados
epidemiologia. Os mtodos de aglomerados espaciais, de forma geral, tem por objetivo a
identificao dos conglomerados espaciais significativos e no significativos de acordo com a
regio de estudo. Eles so combinados por regras de combinao. Neste trabalho foram
utilizadas as seguintes regras: votao por maioria e redes neurais. A nova arquitetura
proposta foi aplicada a dados do dengue no estado da Paraba, no perodo de 2009 a 2011.
Segundo a Organizao Mundial da Sade, o dengue uma doena que registra anualmente
uma mdia de 50 a 100 milhes de casos em todo o mundo, gerando grandes encargos
financeiros para o setor da sade. proposta uma nova arquitetura para a combinao dos
mtodos de aglomerados espaciais. A combinao dos mtodos de aglomerao espacial, foi
aplicados em trs estudos de casos. Em todos os trs estudos de casos a nova arquitetura
identificou com maior preciso os municpios prioritrios e no prioritrios do dengue na
Paraba. No estudo de caso 1 a regra de combinao foi a votao por maioria, no estudo de
caso 2 a regra de combinao foi das redes neurais e no estudo de caso 3 foi proposto uma
novo mapa de votao detalhado identificando a quantidade de votos que cada municpio
recebeu. Analisando os resultados do ponto de vista espacial, observou-se que a mesorregio
do Serto Paraibano apresentou uma maior quantidade de municpios prioritrios; e a
mesorregio do Litoral Paraibano, o menor nmero de municpios prioritrios. Em relao, a
pesquisa do ponto de vista epidemiolgico foi possvel verificar que a partir dos resultados
dos testes diagnsticos (sensibilidade, especificidade, valores preditivos positivos e valores
preditivos negativos) e a estatstica Kappa os modelos de combinao produziram resultados
satisfatrios. Finalizando a anlise do ponto de vista da combinao dos mtodos de
aglomerados espaciais, foi possvel observar que a nova arquitetura, apresentou resultados
satisfatrios, a partir da combinao das regras de combinao. Estes resultados do ponto de
vista epidemiolgico, podem auxiliar os gestores no processo de tomada de deciso
verificando com mais preciso as regies que realmente merecem ateno especial no
combate doena.

Palavras-chave: Mtodos de aglomerao espaciais, Votao por maioria, Redes neurais,


Combinao de classificadores.
ABSTRACT

The combination of classifiers aims to produce more accurate results to the decision-making
process. Therefore, this study had the objective of proposing a new architecture based on a
combination of spatial clustering methods and a more detailed voting map on the amount of
votes that each geo-object received, applied to epidemiology. The methods of spatial
clustering, in general, aim to identify the significant and not significant spatial clusters
according to the study area. They are combined by combination of rules. In this work, the
following rules were used: majority voting and neural networks. The new proposed
architecture was applied to dengue data in the state of Paraiba, in the period from 2009 to
2011. According to the World Health Organization, dengue is a disease that annually records
an average of 50 to 100 million cases worldwide, generating large financial burden on the
health sector. A new architecture is proposed for the combination of the methods of spatial
clustering. The combination of spatial clustering methods was applied in three case studies. In
all three case studies, the new architecture identified more precisely the priority and non-
priority municipalities in Paraiba with regards to the dengue. In the case study 1, the
combination rule was majority voting, in case study 2 the combination rule was neural
networks and in case study 3 a new detailed voting map was proposed, identifying the amount
of votes that each municipality had received. Analyzing the results from a spatial point of
view, it was observed that the mesoregion called Serto in the state of Paraiba had a greater
number of priority municipalities; and the mesoregion of the Coast in Paraiba, the lowest
number of priority municipalities. Regarding the research from the epidemiological point of
view, it was observed that from the results of diagnostic tests (sensitivity, specificity, positive
predictive value and negative predictive value) and the Kappa statistic, the combination of
models produced satisfactory results. Concluding the analysis from the point of view of the
combination of spatial clustering methods, it was observed that the new architecture presented
satisfactory results by using the combination of the combination of rules. These results, from
the epidemiological point of view, can assist managers in the decision-making process by
verifying more precisely the regions that deserve special attention in combating the disease.

DESCRIPTORS: Spatial clustering methods, Majority voting, Neural networks.


LISTA DE FIGURAS

Figura 1 - Estrutura de uma rede neural......................................................................... 38


Figura 2 - Arquitetura Sequencial.................................................................................. 51
Figura 3 - Arquitetura Hierrquica................................................................................ 52
Figura 4 - Arquitetura Paralela...................................................................................... 52
Figura 5 - Nova Arquitetura para a combinao de mtodos de aglomerao espacial........... 55
Figura 6 - Mapa das mesorregies da Paraba............................................................... 59
Figura 7 - Estudo de Caso 1........................................................................................... 61
Figura 8 - Estudo de Caso 2........................................................................................... 62
Figura 9 - Estudo de Caso 3........................................................................................... 63
Figura 10 - Mapa dos valores-p estatstica Scan do dengue na Paraba em 2009........... 67
Figura 11 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba, em 68
2009...............................................................................................................
Figura 12 - Mapa dos valores-p de Getis Ord do dengue na Paraba, em 2009............... 68
Figura 13 - Mapa do especialista do dengue na Paraba,em 2009................................... 69
Figura 14 - Mapa de deciso da combinao dos trs mtodos de aglomerados 69
espaciais do dengue na Paraba, em 2009..................................
Figura 15 - Mapa dos valores-p da estatstica Scan do dengue na Paraba, em 2010...... 71
Figura 16 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba, em 71
2010...............................................................................................................
Figura 17 - Mapa dos valores-p de Getis Ord do dengue na Paraba, em 2010............... 72
Figura 18 - Mapa do especialista do dengue na Paraba, em 2010.................................. 72
Figura 19 - Mapa de deciso da combinao dos trs mtodos de aglomerados
espaciais do dengue na Paraba, em 2010..................................................... 73
Figura 20 - Mapa dos valores-p da estatstica Scan do dengue na Paraba, em 2011...... 75
Figura 21 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba, em 75
2011...............................................................................................................
Figura 22 - Mapa dos valores-p de Getis Ord do dengue na Paraba, em 2011................. 76
Figura 23 - Mapa do especialista do dengue na Paraba, em 2011.................................. 76
Figura 24 - Mapa de deciso da combinao dos trs mtodos de aglomerados 77
espaciais do dengue na Paraba, em 2011.....................................................
Figura 25 - Matrizes de Classificao para os anos de 2009, 2010 e 2011, segundo a regra 77
de votao por maioria.............................................................................................
Figura 26 - Grfico da sensibilidade e especificidade da combinao dos trs mtodos 78
de aglomerados espaciais (estatstica Scan, mtodo Besag Newell e Getis
Ord) pela regra de votao por maioria do dengue na Paraba, no perodo
de 2009 a 2011..............................................................................................
Figura 27 - Mapa de deciso da combinao dos trs mtodos de aglomerados 80
espaciais do dengue na Paraba em 2009 pela regra das redes neurais.........
Figura 28 - Mapa de deciso da combinao dos trs mtodos de aglomerados 81
espaciais do dengue na Paraba em 2010 pela regra das redes neurais.........
Figura 29 - Mapa de deciso da combinao dos trs mtodos de aglomerados 81
espaciais do dengue na Paraba em 2011 pela regra das redes neurais.........
Figura 30 - Matrizes de Classificao de 2009, 2010 e 2011, pelas redes neurais.......... 82
Figura 31 - Grfico da sensibilidade e especificidade da combinao pela redes 83
neurais do dengue na Paraba de 2009 a 2011.............................................. 83
Figura 32 - Mapa dos valores-p da Estatstica M do dengue na Paraba, em 2009......... 85
Figura 33 - Mapa dos valores-p do Mtodo Tango do dengue na Paraba, em 2009....... 85
Figura 34 - Mapa de deciso da combinao de todos os mtodos de aglomerados 86
espaciais do dengue na Paraba, no ano de 2009..........................................
Figura 35 - Mapa dos valores-p da Estatstica M do dengue na Paraba, em 2010......... 87
Figura 36 - Mapa dos valores-p do Mtodo Tango do dengue na Paraba, em 2010....... 87
Figura 37 - Mapa de deciso da combinao de todos os mtodos de aglomerados 88
espaciais do dengue na Paraba, no ano de 2010..........................................
Figura 38 - Mapa dos valores-p da Estatstica M do dengue na Paraba, em 2011......... 89
Figura 39 - Mapa dos valores-p do Mtodo Tango do dengue na Paraba, em 2011....... 89
Figura 40 - Mapa de deciso da combinao de todos os mtodos de aglomerados 90
espaciais do dengue na Paraba, no ano de 2011...........................................
Figura 41 - Matriz de Classificao de 2009, 2010 e 2011, pela a regra de votao por 90
maioria para todos os mtodos de aglomerados espaciais espaciais.............
Figura 42 - Grfico da sensibilidade e especificidade da combinao de todos os 91
mtodos de aglomerados espaciais do dengue na Paraba, de 2009 a 2011..
LISTA DE QUADROS

Quadro 1 - Interpretao da significncia do ndice local............................................... 25


Quadro 2 - Resultados dos testes diagnsticos................................................................ 48
Quadro 3 - Interpretao da estatstica Kappa................................................................ 54
Quadro 4 - Interpretao do mapa de votao................................................................. 64
LISTA DE TABELAS

Tabela 1 - Valores preditivos positivos, valores preditivos negativos e estatstica


Kappa para o dengue de 2009 a 2011 segundo a combinao dos trs
mtodos de aglomerao espacial pela votao por maioria........................... 79
Tabela 2 - Valores preditivos positivos, valores preditivos negativos e estatstica
Kappa para o dengue de 2009 a 2011 segundo a combinao dos mtodos
de aglomerao espacial pelas redes neurais................................................... 84
Tabela 3 - Valores preditivos positivos, valores preditivos negativos e estatstica
Kappa para o dengue de 2009 a 2011 segundo a combinao de todos os
mtodos de aglomerao espacial pelo mapa de votao............................ 92
LISTA DE SIGLAS

Sigla Acrnimo
IBGE Instituto Brasileiro de Geografia e Estatstica
SIG Sistema de Informao Geogrfica
SINAN Sistema de Informao de Agravos de Notificaes
VPP Valor Preditivo Positivo
VPN Valor Preditivo Negativo
SUMRIO

1 INTRODUO........................................................................................ 17
1.1 Relevncia e Ineditismo............................................................ 19
1.1.1 Argumento de Tese................................................................................. 19
1.2 OBJETIVOS............................................................................................. 20
2 REVISO BIBLIOGRFICA............................................................... 22
2.1 MTODOS DE AGLOMERAO ESPACIAL................................... 22
2.1.1 Getis Ord................................................................................................. 22
2.1.2 Mtodo Besag Newell......................................................................... 25
2.1.3 Mtodo de Tango................................................................................. 26
2.1.4 Estatstica Scan.................................................................................. 27
2.1.5 Estatstica M............................................................................................ 29
2.2 REGRAS DE COMBINAO............................................................. 30
2.2.1 Teoria Bayesiana............................................................................... 30
2.2.2 Regra do Produto................................................................................ 31
2.2.3 Regra da Soma....................................................................................... 31
2.2.4 Derivao das regras do produto e da soma......................................... 32
2.2.5 Regra do Mximo................................................................................... 32
2.2.6 Regra do Mnimo..................................................................................... 33
2.2.7 Regra da Mediana................................................................................ 33
2.2.8 Votao por maioria.............................................................................. 33
2.2.9 Plurating Voting...................................................................................... 34
2.2.10 Bagging (Bootstrap Aggregation) ..... 34
2.2.11 Boosting.................................................................................................. 35
2.2.12 Redes neurais.................................................................. 36
2.2.12.1 Funes de ativao................................................................... 36
2.2.12.2 Estrutura das redes neurais.......................................................................... 39
2.3 MTODOS DE AGLOMERADOS ESPACIAIS APLICADOS REA
DA SADE................... 39
2.4 COMBINAO DE CLASSIFICADORES UTILIZANDO REGRAS DE
COMBINAO....... 42
2.5 MEDIDAS DE QUALIDADE E MEDIDAS DE
ASSOCIAO....................................................................................... 46
2.5.1 Sensibilidade e especificidade............................................................... 47
2.5.2 Valor Preditivo Positivo e Valor Preditivo Negativo............................. 48
2.5.3 Risco Relativo e Incidncia.................................................................... 48
2.6 ANLISE ESPACIAL DE DADOS EM SADE..................................... 49
2.7 COMBINAO DE CLASSIFICADORES............................................... 50
2.8 ESTATSTICA KAPPA........................................................................... 52
3 NOVA ARQUITETURA PROPOSTA PARA A COMBINAO DOS 54
MTODOS DE AGLOMERAO ESPACIAL
4 PERCURSO METOLGICO............................................................... 57
4.1 REA DE ESTUDO........................................................................................ 57
4.2 CARACTERIZAO DO ESTUDO E ANLISE DOS DADOS........... 58
4.2.1 Estudo de Caso 1 59
4.2.2 Estudo de Caso 2 60
4.2.3 Estudo de Caso 3 61
5 RESULTADOS E DISCUSSES............................................................ 65
5.1 RESULTADOS DO ESTUDO DE CASO 1......................................... 65
5.2 RESULTADOS ESTUDO DE CASO 2................................................... 78
5.3 RESULTADOS ESTUDO DE CASO 3..................................................... 83
6 CONCLUSO................................................................................................ 93
REFERNCIAS.......................................................................................... 96
Apndice A - Mapas do Risco Relativo do dengue na Paraba no anos de 2009 a 102
2011.
Anexo 1 - Parecer do Comit de tica..................................................... 104
Sem a curiosidade que me move, que me
inquieta, que me insere na busca, no
aprendo nem ensino.
(Paulo Freire)
17

1 INTRODUO

Um classificador definido como uma funo cujo domnio um espao de atributo


Rn; e co-domnio, um conjunto de classes de rtulo com K elementos, em que ={w1, ...,
wk} (KUNCHEVA, 2004) (BISHOP, 2006). A classificao uma rea da pesquisa presente
no reconhecimento de padres e no aprendizado de mquinas (DAMOULAS; GIROLAMI
2009). No processo de classificao, so utilizados classificadores supervisionados e
classificadores no supervisionados. Um classificador supervisionado requer um
conhecimento prvio do problema, que traduzido por uma base de dados que contm
informaes de amostras marcadas. Na literatura, so encontrados diversos classificadores
supervisionados. Alguns dentre eles so: mxima verossimilhana, k-NN e redes neurais. Um
classificador no supervisionado utiliza banco de dados de amostras no conhecidas, ou seja,
as classes das amostras so desconhecidas. Portanto, no h nenhum conhecimento prvio do
real rtulo da classe. Como exemplos de classificadores, temos: fuzzy C-means clustering
(FCM), K-Mdias, ISOSEG, entre outros (JACQUEZ, 2008).
Na literatura cientfica, so encontrados diversos casos em que a combinao de
classificadores melhora os sistemas de reconhecimento de padres (SUEN et al., 1990).
Nesse sentido, foi verificado que a combinao de vrios classificadores pode melhorar o
desempenho dos classificadores individuais (SUEN et al., 1990, NADAL; LEGAULT;
SUEN, 1990; HULL; COMMIKE, 1990; HO et al., 1990; XU et al., 1992). Tendo como
principais vantagens: a eficincia, a preciso e o desempenho no reconhecimento de padres
(BREVE et al., 2005).
Para realizar o processo de combinao, podem ser utilizadas trs arquiteturas:
sequencial, paralela e hierrquica (MORAES; MACHADO, 2012). Cada arquitetura utiliza
um regime de combinao de classificadores diferentes, tendo como objetivo fornecer uma
deciso final. Esse regime chamado de combinador. Para realizar a combinao,
necessria a escolha de uma arquitetura e de um regime de combinao, que incluem as
regras de combinao, permitindo, assim, a criao de um novo classificador (JAIN et al.,
2000).
H diversas formas de combinaes de classificadores encontrados na literatura, nas
mais diversas reas, por exemplo, reconhecimento de face e escrita, classificao de imagens,
entre outros (BREVE; PONTI; MASCARENHA, 2005) (LAN; GAO, 2013). Existem
inmeros sistemas para combinar classificadores, regresso logstica (BREVE; PONTI;
MASCARENHA, 2005), regras de votao (mximo, mnimo, produto, soma, votao por
18

maioria, mdia e mediana) (JAIN et al., 2000), teoria Dempster-Shafer (TONG, 2010), entre
outros (MORAES; MACHADO, 2012).
Na rea de anlise espacial, os mtodos de aglomerao espacial tm por objetivo
identificar regies significativas e no significativas de um evento em estudo, a partir de uma
regio geogrfica, usando informaes georreferenciadas (HOLMES; MORAES; VIANNA,
2015). O interesse est em descobrir se o evento possui uma distribuio espacial aleatria ou
se apresenta conglomerados espaciais.
Na literatura, so encontrados diversos mtodos de aglomerao espacial, tais como,
Mtodo de Tango (TANGO, 1995), Mtodo Besag Newell (BESAG; NEWELL, 1991), Getis
Ord (ANSELIN, 1992), ndice de Moran, ndice de Geary, Estatstica Scan (KULLDORFF;
NAGARWALL, 1995) e Estatstica M (ROGERSON, 2001). Na prtica, cada mtodo
trabalha com diferentes metodologias e produz resultados diferentes uns dos outros. Esses
resultados no representam, com preciso, a real distribuio desses eventos. Sendo assim,
possvel realizar estudos de forma indireta, como exemplo, os mapas de risco relativo,
comparados com os mapas dos mtodos de aglomerao espacial, para anlises de sade
pblica (MORAES; NOGUEIRA; SOUSA, 2014). Este problema pode ser solucionado a
partir da combinao dos mtodos de aglomerao espacial.
Neste trabalho, abordada a proposio de uma nova metodologia, a partir da
combinao dos mtodos de aglomerao espacial. Um dos objetivos da pesquisa a
identificao, com mais preciso, dos municpios prioritrios e no prioritrios, conhecido
como geo-objetos, para o dengue, no Estado da Paraba.
A Organizao Mundial de Sade estima uma mdia de 50 a 100 milhes de casos do
dengue no mundo (BRAT et al., 2013). No Brasil, um dos principais surtos ocorreu em 2013,
com uma mdia de dois milhes de casos notificados. A regio Nordeste a regio mais
atingida do Brasil, com o maior nmero de bitos por dengue com complicaes. No ano de
2013, foram identificadas 106 mortes. O estado da Paraba, localizado na regio Nordeste,
o quarto com o maior nmero de bitos, perdendo apenas para os Estados do Cear,
Pernambuco e Rio Grande do Norte. Uma das formas de controle da epidemia do dengue se
d a partir da identificao dos locais onde h nmero maior de casos notificados; isso se d
a partir dos estudos da distribuio espacial na regio de interesse, identificando as reas
prioritrias e no prioritrias dessa doena.
19

1.1 RELEVNCIA E INEDITISMO

A combinao de classificadores uma das maneiras de conseguir uma classificao


mais acurada e precisa. Os problemas de combinao de classificadores, podem ser
resolvidos com uma regra de combinao sobre os classificadores (PRAMERO;
CARVALHO, 1998).
Segundo Jain et al. (2000), as justificativas e relevncia em se trabalhar com a
combinao de classificadores so:
Um projetista pode ter acesso a diversos classificadores, cada um deles construdo em
um contexto diferente, mas com o mesmo objetivo. Por exemplo: reconhecimento de
pessoas por suas faces, voz, dentre outros.
Diferentes classificadores treinados nas mesmas amostras podem se diferenciar no
apenas em seu desempenho global, mas tambm podem ter regies do hiperespao em
que atuem melhor ou pior que os outros.
A partir de uma extensa pesquisa sobre a literatura cientfica, no foram encontrados
trabalhos que abordem a combinao dos mtodos de aglomerados espaciais. Nesse sentido,
o ineditismo deste trabalho para a rea de exatas a proposio de uma nova arquitetura para
combinao dos mtodos de aglomerados espaciais que pode ser aplicado a qualquer
problema de anlise de aglomerao espacial. Essa arquitetura exemplificada usando-se: a
regra de votao por maioria e a regra de combinao pelas redes neurais. Alm disso,
prope-se um novo mapa de deciso da combinao, ou seja, um mapa de votao que
construdo a partir da contagem dos votos recebidos por cada geo-objeto. Ele um
detalhamento maior dos votos que cada regio teve, ilustrando melhor o processo de deciso.
Para a rea de sade, a contribuio dessa pesquisa a aplicao dessa nova
arquitetura sobre os dados do dengue no Estado da Paraba. Essa nova abordagem pode ser
aplicada a estudo epidemiolgico espacial, identificando localidades prioritrias e no
prioritrias para esse ou qualquer outro agravo.

1.1.1 Argumento de Tese

Este trabalho defende o argumento de que a combinao dos mtodos de aglomerao


espacial produz melhores resultados do que se utilizados de forma individual. Com isso,
possvel ter resultados mais precisos e tomar decises mais acertadas sobre esse tipo de
20

problema e, em particular, na rea de Epidemiologia. Neste trabalho, foi desenvolvido o


conceito e este foi aplicado na combinao dos mtodos de aglomerados espaciais usando
dados de notificao de casos do dengue. Esta doena um grande problema de sade pblica
que acarreta uma srie de despesas aos rgos competentes.

1.2 OBJETIVOS

O objetivo deste trabalho propor uma nova arquitetura para a combinao dos
mtodos de aglomerao espacial, aplicados epidemiologia. Para alcanar tal objetivo,
recorreu-se aos seguintes objetivos especficos:

Estudar os mtodos de aglomerao espacial;


Estudar regras de combinao para mtodos de aglomerao espacial;
Propor uma nova arquitetura para combinao para mtodos de aglomerao espacial;
Avaliar a arquitetura proposta usando dados epidemiolgicos reais.
21

Ensinar no transferir conhecimento, mas criar


as possibilidades para a sua prpria produo ou a
sua construo.
(Paulo Freire)
22

2 REVISO BIBLIOGRFICA

Neste captulo sero descritos os mtodos de aglomerao espacial, seguidos dos


trabalhos que abordam a combinao de classificadores, utilizando as regras de combinao e
trabalhos utilizando os mtodos de aglomerados espaciais aplicados em diversas reas. As
regras de combinao so tambm definidos nessa seo. Os trabalhos mais relevantes
aplicados combinao de classificadores so datados da dcada de 80 e 90 do sculo XX,
apesar de existirem trabalhos atuais do sculo XXI.

2.1 MTODOS DE AGLOMERAO ESPACIAL

Os mtodos de aglomerao espacial buscam regies de risco elevado, chamados de


mtodos de deteco de conglomerados. Segundo Costa et al. (2006),

Um conglomerado espacial pode ser definido como um conjunto de reas


que apresentam um risco significativamente elevado, quando considerada a
hiptese nula de que os eventos so gerados aleatoriamente sobre a regio de
estudo. O conglomerado pode ser caracterizado como temporal, espacial ou
espao-temporal, dependendo da varivel (espao e/ou tempo) sobre a qual
realizada a anlise de contagem dos eventos.

A autocorrelao espacial est associada ideia de que os valores observados em reas


geogrficas adjacentes mostram-se mais similares do que o esperado. Desta forma, a
dependncia espacial ocorre quando reas prximas tendem a ter valores similares
(autocorrelao positiva) ou valores dissimilares (autocorrelao negativa). Alguns mtodos
de aglomerao espacial sero apresentados abaixo.

2.1.1 Getis Ord

A estatstica de Getis Ord mede a associao espacial entre as funes de dependncias


espaciais, tendo por objetivo realizar uma medio de aglomerao espacial, dado que possua
distribuio no normal. Outra caracterstica que as medidas de distncia so aplicadas
apenas nas observaes positivas (ANSELIN, 1992). Essa estatstica foi proposta com o
intuito de verificar a associao espacial local, a partir de uma matriz de vizinhana, que
apresentam valores de alto e baixo agrupamentos, diferentemente dos outros mtodos de
aglomerao espacial, que no apresentam este tipo de associao espacial (valores positivos
23

e valores negativos). Como exemplo de aplicao tem-se o trabalho de Lucena et al. (2012)
que investigou a distribuio espacial da violncia domstica para auxiliar os gestores no
processo de tomada de deciso. Essa pesquisa com o uso da estatstica de Getis Ord
identificou as reas de alta e baixa incidncia de violncia, na cidade de Joo Pessoa, capital
da Paraba, no perodo de 2002 a 2005.
As estatsticas de Getis Ord so estimadas por grupos de vizinhos da distncia crtica d
de cada rea i. A distncia crtica formada por uma matriz de proximidade W, cujos elementos
so formados em funo da distncia crtica wij(d). Com isso, foram propostas duas funes
estatsticas: a estatstica global e a estatstica local.
A estatstica global G(d) igual s medidas tradicionais de aglomerados espaciais com
apenas um valor; e as Estatsticas Locais Gi(d) e GiA(d) so medidas de associao espacial
para cada rea i (ANSELIN, 1992). A estatstica global dada por:

i j wij ( d ) x i x j
G ( d )= ,
i j x i x j

em que xi o valor observado na posio i; e wij(d) um elemento da matriz de proximidade. O


nvel de significncia definido como a probabilidade de rejeitar a hiptese nula (existncia de
autocorrelao espacial) sendo ela verdadeira, o valor-p confrontado com a significncia
adotada definindo a significncia do ndice Getis e Ord gerado. A anlise baseada no valor
do ndice e de sua significncia: o valor positivo e significativo de G(d) indica aglomerado
espacial de valores elevados; os valores negativos e significativos de G(d) indicam
aglomerados de valores pequenos (ANSELIN, 1992).
A estatstica local mede a associao em cada unidade espacial para cada observao i,
em que Gi(d) e GiA(d) mostram a posio cercada por valores altos ou baixos para a varivel.
A equao do Gi(d) para cada observao i e distncia d mostrada da seguinte forma:

j w ij ( d ) x j
G i ( d )=
j x j

em que a soma est em todas as posies de j excluindo i. Este ndice igual razo da soma
dos valores nas posies circunvizinhas pela soma dos valores na srie de dados ao todo. Na
estatstica de GiA(d), o valor em i includo (ANSELIN, 1992).
24

j wij ( d ) x j
GiA ( d )=
j x j

a soma est sobre todas as posies, inclusive do i.


O ndice local interpretado da seguinte forma: os valores padronizados positivos e
significantes (valor-p menor que 5%) informam um aglomerado espacial de valores altos. Os
valores das estatsticas padronizados negativos e significantes (valor-p menor que 5%)
indicam um aglomerado espacial de valores baixos. Segundo o quadro 1, a interpretao do
ndice local se d da seguinte forma: quanto menor o valor-p maior ser o aglomerado
espacial seja de valores positivos e negativos. Quanto maior a quantidade de asteriscos (*)
menor o valor-p, isso denota a existncia daquele aglomerado espacial com maior
probabilidade, seja de valores positivos, seja de negativos. A significncia sem asterisco,
significa que nestas regies no existem aglomeraes espaciais, nem de valores positivos e
nem de valores negativos.

Quadro 1 - Interpretao da significncia do ndice local

valor-p
Significncia Estatstica

Negativo*** Negativo p<0,005

Negativo** Negativo 0,005<p<0,025

Negativo* Negativo 0,025<p<0,05

Negativo Negativo p>0,05

Positivo Positivo p>0,05

Positivo* Positivo 0,025<p<0,05

Positivo** Positivo 0,005<p<0,025

Positivo*** Positivo p<0,005


Fonte: Elaborado pelo autor.
25

2.1.2 Mtodo Besag Newell

O mtodo foi proposto por Besag e Newell (1991) que tem por objetivo a identificao
de aglomerados de forma circular com um nmero de casos fixos. Este mtodo exige a
configurao de vrios parmetros, que podem afetar o seu desempenho (COSTA;
ASSUNO, 2006). O usurio deve informar um nmero mnimo P de casos para ento
formar um aglomerado. A identificao desses aglomerados so muito importantes para
problema de sade pblica envolvendo doenas na prtica (COSTA; ASSUNO, 2006). O
mtodo Besag Newell apresenta boa capaciadade de identificao de clusters com alta
populao, e com o propsito da possibilidade de configurar vrios parmetros. Com isso,
uma das vantagens desse mtodo a possibilidade de poder definir o nmero mnimo de
casos.
O mtodo de Besag e Newell realizado da seguinte forma: determina um raio para
que o crculo contenha pelo menos P casos no seu interior. O mtodo inicia com o crculo de
raio prximo de zero. O papel do crculo incluir um nmero P de casos. Quando o crculo
contiver P casos, o processo parado; caso isso no ocorra, o raio aumentado incluindo um
novo centroide. O procedimento executado at que haja pelo menos P casos inseridos no
crculo (BESAG; NEWELL, 1991).
A estatstica do teste baseia-se numa varivel aleatria U, definida como o mnimo de
reas prximas necessrias para que se obtenha um nmero P de casos mais prximos do
centride (BESAG; NEWELL, 1991). Seja CR o nmero total de casos na regio de estudo.
Sejam CRj(i) e Mj(i), respectivamente, o nmero de casos e a populao das j reas mais
prximas ao centroide i. A estatstica do teste baseada na varivel aleatria U, definida como
o mnimo de reas prximas do centroide. Com isso, temos (COSTA; ASSUNO, 2005)
(BESAG, NEWELL, 1991):

U=min { j : CR j ( i ) P }

Um aglomerado significativo quando o valor-p, vk(i), menor que a significncia


adotada. Portanto, a partir do valor li, observado para Li, o nvel de significncia do teste
definida por P(Li li )=1-P(Li >li ), que busca a hiptese nula, que a hiptese de ausncia de
cluster espacial. O vk(i) definido por (COSTA; ASSUNO, 2005) (BESAG; NEWELL,
1991):
26

j
M j (i ) CR
( ) M j ( i ) CR
v k ( i ) =P ( Lil i ) =1 k1
j=1
M
j!
exp ( M ) ,

em que Mj a populao observada em l reas.


Um aglomerado dito cluster se o valor-p menor que a significncia adotada. No
mtodo de Besag e Newell so produzidos apenas os crculos significativos (valor-p <0,05). A
escolha de permite testes simultneos e so valores menores que a significncia usual 0,05
ou 0,01 (COSTA; ASSUNO, 2005). Um exemplo de aplicao desse mtodo pode ser
observado no trabalho de Ferreira et al. (2012) que teve por objetivo a deteco de
conglomerados espaciais de tuberculose no estado da Paraba nos anos de 2009 e 2011, em
que foram identificados conglomerados em todo o litoral paraibano.

2.1.3 Mtodo de Tango

Este mtodo foi proposto por Tango (1995) inicialmente. Sendo que o mtodo
analisava a quantidade de observaes de cada sub-regies, no analisando a diferena entre o
nmero de observaes e o nmero esperado de observaes, levando em considerao a
populao de cada sub-regies. Neste mtodo os dados no precisam possuir distribuio
normal. O mtodo Tango tem se demonstrado um excelente teste para verificar a
heterogeneidade espacial, diferentemente dos outros mtodos (JACKSON et al, 2009).
Neste caso foram calculados os aglomerados de cada geo-objeto da Paraba. O mtodo
proposto por Tango dado pela seguinte estatstica:

Q s =( r p ) 'B ( r p )

em que r so os vetores observados, em que ri = Ni/N e N=N1+N2+ , Nm, o nmero de


casos por regies, p a proporo esperada de casos, em que pi=1 + 2 + 3 + m, pode ser as
populaes das regies, B uma matriz de n x n elementos (ROGERSON et al, 1997), onde
cada bij definido por:
d ij /
bij =e

bii =1
27

em que dij uma medida de distncia entre as regies i e j, uma medida de distncia de
valores grandes em torno de cada regio.
A esperana e varincia da varivel aleatria Qs, dadas respectivamente pelas seguintes
equaes:
1
E [ Q s ]= Tr ( BV p )
N

e
2
V [ Q s ]= 2
Tr ( BV p ) 2 ,
(N )

Tr(BVp) o trao da matriz BVp, Vp =(p) -pp', em que (p) a matriz que contm os
elementos de p (ROGERSON et al., 1997) e N o nmero de casos.
A estatstica de Tango dada pela aproximao da distribuio normal e pela
distribuio qui-quadrado. Neste trabalho abordaremos a aproximao pela distribuio qui-
quadrado, que utiliza valores baixos de . Pois, a medida que a largura da banda () se
aproxima de zero, o valor da estatstica de Tango tambm se aproxima do uso da distribuio
qui-quadrado. Na aproximao pela distribuio qui-quadrado, definimos v como sendo o
nmero de graus de liberdade, dada pela equao (ROGERSON et al, 1997) (ROGERSON et
al., 1999):

1. 5 2

v=
[ [ Tr ( BV p ) ]
[ Tr ( BV p ) ]
3
] .

2.1.4 Estatstica Scan

A estatstica Scan foi proposta por Kulldorff e Nagarwalla (1995) com o objetivo de
detectar conglomerados em unidades cuja ocorrncia de um determinado evento mais
provvel dentro de uma rea do que fora dela. Este mtodo foi proposto por potencialmente
encontra conglomerados ditos como raros em um mapa e analisar tambm a vizinhana.
Estes conglomerados podem ser prevalncia, risco relativo e incidncia de uma determinada
doena (ABRAMS; KLEINMAN, KULLDORFF, 2010). A Estatstica Scan monitora os testes
mltiplos, sem a necessidade de parmetros fornecidos pelo usurio (COSTA; ASSUNO,
2006). Ele leva em considerao vrios testes, mas fornece apenas um valor-p (COSTA;
28

ASSUNO, 2006). Esta estatstica analisa o conjunto de todos os possveis conglomerados,


dentro dos quais so sobrepostos os crculos de raio arbitrrio centrados nos centroides de
cada sub-regio de estudo (COULSTON; RITTERS, 2003). Como exemplo de aplicao, no
trabalho de S et al. (2015) foi realizado um estudo ecolgico, com o objetivo de identificar
os municpios do estado da Paraba mais vulnerveis a relao da varivel ndice de
Desenvolvimento Humano (IDH) e o acometimento do dengue. Esta verificao de seu a
partir da estatstica Scan, que permitiu verificar a distribuio espacial do dengue em relao
ao IDH, concluindo que os municpios com baixo IDH so mais vulnerveis a dengue no
estado da Paraba no perodo de 2011 a 2013.
A estatstica Scan parte da distncia de cada centroide Hi (i = 1, 2,..., u) em que u so
sub-regies (cidade, pases, bairros). Depois, colocado sobre cada centroide um crculo cujo
raio aumenta, de modo a envolver um novo centroide. Sendo que cada ponto colocado no
crculo denota o nmero de vezes do evento em anlise e o valor esperado, tendo por objetivo
detectar regies no crculo em que o valor do nmero de casos significativamente maior que
o valor esperado (NEIL et al., 2005).
Para a aplicao da estatstica Scan so utilizados dois modelos: o modelo de Poisson
e o modelo de Binomial. Para este trabalho, foi utilizado o modelo de Poisson, e um dos
motivos foi porque so utilizados para dados de contagem (KULLDORFF, 1997) e tambm
quando a probabilidade de um agravo pequena e o nmero da populao grande. Isto
acarreta uma grande vantagem a facilidade dos clculos em relao a distribuio binomial
(MORAES; MACHADO, 2015). No modelo de Poisson, a estatstica do teste definida pela
equao a seguir:

maxev E ( ev ) E ( ev )
Y= =max ev
L0 L0

em que E(ev) a probabilidade mxima de que existem aglomerados sobre todos no crculo
ev, L0 a probabilidade sobre a hiptese nula (KULLDORFF, 2001). E(ev)/ L0 definido por:

c ( ev ) Cc (ev )
E ( ev ) c ( ev ) Cc ( ev )
L0
= ( ) (
n ( ev ) Cn ( ev ) )
29

em que c(ev) o nmero observado de casos no crculo ev, n(ev) o nmero esperado de caso
no crculo ev sobre a hiptese nula, em que n(AT)=c(AT)=C, AT o total de regies do estudo
(KULLDORFF et al., 1997).
A simulao de Monte Carlo usada pra testar a hiptese nula. Todos os valores-p so
ajustados pela simulao Monte Carlo (DWASS, 1957). O teste de hiptese via Monte Carlo
gera simultaneamente dados simulados vrias vezes sob a hiptese nula e o valor-p s/
(SS+1), em que SS o nmero de ocasio dos dados de repetio, e s a classificao do teste
estatstico (ABRAMS et al., 2010).

2.1.5 Estatstica M

A estatstica M foi proposta por Rogerson (2001a) com o objetivo de detectar


aglomerados. Diferentemente, dos outros mtodos, este mtodo no recorre a simulao de
Monte Carlo. O foco foi a utilizao de valores regionais, que so distribuidos normalmente e
em seguida, usou-se o alisamento do Kernel Gaussiano, para criar as estatsticas locais,
semelhantes a Getis Ord (ROGERSON, 2001b).
A estatstica M dada por:

nj g ij b j
(
M=maxi M i =
nj wij2 ) .

no qual gij a matriz gaussiana entre as regies i e j; bj a varivel normal na regio j; Mi a


estatstica local de cada regio e espacialmente ponderada, utilizando os z-scores (bj) em
uma localidade i. Para se obter bj, podem ser utilizadas trs diferentes formas de
transformao, baseados nos observados e os esperados de cada regio j. Os mtodos so
definidos como Mtodo de Poisson, Mtodo Padro e o Mtodo de Rossi. Para este trabalho,
foi utilizado o Mtodo de Poisson, pois na essncia da estatstica local ajustada e o derivado
do Mtodo de Poisson possuem uma quantidade identica. O mtodo de Poisson dado pela
seguinte equao (ROGERSON, 2001a):

( r j p j)
b j=
rj
30

em que rj o valor observado e pj o valor esperado de cada regio j, calculado segundo a


equao abaixo:

n
j= 1 r j
p j =pop j ,
nj=1 pop j

em que popj a populao da sub-regio j. Para detectar a existncia do conglomerado


espacial a estatstica M tem um valor crtico (Ma) dada pela equao abaixo:


M a = ln ( 4 ( 1+0Y. 81 ) ) .
em que o nvel de significncia; a largura da banda; Y o nmero de sub-regies. A
hiptese nula de que no h conglomerados espaciais se d quando a estatstica M menor ou
igual que o valor crtico Ma (ROGERSON, 2001a).

2.2 REGRAS DE COMBINAO

Nesta Seo so apresentadas, a ttulo de reviso, algumas regras de combinao


encontradas na literatura cientfica. As principais so: regra do produto, regra da soma, regra
do mximo, regra do mnimo, regra da mediana e votao por maioria.

2.2.1 Teoria Bayesiana

Segundo a teoria Bayesiana so dados os vetores de medies xi, i = 1, ..., R. So


considerados um padro E que est associado a m possveis classes w1,...,wm. No padro E,
deve ser concedido a classe wk formado pela funo de densidade de probabilidade p(xi|wk). A
funo de densidade de probabilidade conjunta por p(x1, ..., xR|wk) e a probabilidade a priori
por P(wk) (KITTLER et al., 1998a) (KITTLER et al., 1998b). Em cada R classificadores
representado por um modelo dado por vetor de medio distintos.
Determinamos E wj se

P ( w jx 1 , .. . ,x R ) =max k P ( w kx 1 , .. . ,x R ) ,
31

A funo de densidade de probabilidade expressa em termos de distribuio de


medio condicional.

m
p ( x1 ,. .. ,x R ) = j=1 p ( x 1 ,. . . ,x Rw j ) P ( w j ) .

2.2.2 Regra do produto

Na Regra do Produto, presuposto que as representaes dos dados utilizados pelos


classificadores so estatisticamente independentes. A probabilidade a posteriori definida por
P(wk|x1, , xR). A funo de densidade de probabilidade conjunta definida por (KITTLER
et al., 1998a).

p ( x1 ,. .. ,x Rwk )= p ( x iw k ) ,

A regra do produto pode ser escrita como (KITTLER, et al., 1998a):

m
P ( w j ) p ( x iw j ) =max k=1 P ( w k ) p ( x iw k ) ,

ou tambm em termos de probabilidade a posteriori, produzido pelos classificadores, temos:


Determinamos E wj se

p ( R1 ) ( W j ) P ( w jx i ) =max m
k=1 P
( R1 )
( wk ) P ( wkx i ) . (22)

A regra de deciso acima tem a funo de quantificar a probabilidade de uma hiptese,


para combinar as probabilidades a posteriori produzidas pelos classificadores individuais
baseados na regra do produto (KITTLER et al., 1998a).

2.2.3 Regra da soma

A regra da Soma baseada na deciso feita pelo somatrio das probabilidades a


posteriori. Nesse processo, a deciso baseada no somatrio das probabilidades a posteriori
para cada classe. A classe cuja soma resultante for mais elevada, declarada a classe
vencedora. Segundo Kittler et al. (1998a), em determinadas situaes, a probabilidade a
32

posteriori d-se da seguinte maneira:

P ( w kxi ) =P ( wk )( 1 + ki ) ,

em que ki satisfaz ki << 1.


A regra da soma definida por (KITTLER, et al., 1998a):

R
( 1R ) P ( w j ) + i=1 P ( w jx i ) =max mk=1 [ ( 1R ) P ( w k ) + i=1
R
P ( w kx i ) ] .
(24)

2.2.4 Derivao das regras do produto e da soma

Baseado nas equaes (22) e (24) que representam as regras do produto e da soma,
respectivamente. Essas equaes so formas de combinao de classificadores, que possuem
uma relao definida por (KITTLER et al., 1998a):

1
P ( wkx i ) min Ri=1 P ( w kxi ) R Ri=1 P ( w kx i ) maxi=1
R
P ( wkx i )

A probabilidade a posteriori P(wk|xi) produz uma funo de valores binrios ki. Esta
funo utilizada na Regra de Votao da Maioria (Kittler et al, 1998a). ki {0,1}, ser 1 se

P ( w kxi ) =max mj=1 P ( w jxi )


, seno 0, caso contrrio. Os resultados dessa deciso levam as
seguintes regras: regra do mximo, regra do mnimo, regra da mediana e votao por maioria
(KITTLER et al., 1998a).

2.2.5 Regra do mximo

Considerando que as classes so a priori equiprovveis, a deciso da Regra do


Mximo baseada na classe que tiver o mximo das probabilidades a posteriori, sendo est a
classe vencedora. Iniciando a partir da Regra da Soma observado na equao 24 e
substituindo a soma pelas mximas probabilidades a posteriori (KITTLER et al., 1998a) . A
Regra do Mximo feito da seguinte forma.
33

R
max i=1 P ( w jx i ) =max m R
k=1 max i=1 P ( w kx i )

2.2.6 Regra do Mnimo

Considerando que as classes so a priori equiprovveis, a deciso baseada na classe


que tiver o mnimo das probabilidades a posteriori, sendo esta a classe vencedora. Partindo da
Regra do Produto, obtm-se a Regra do Mnimo se (KITTLER et al., 1998a) (HO, 1995).

R
mini=1 P ( w jx i ) =max k=1 min Ri=1 P ( wk x i ) .

2.2.7 Regra da Mediana

Na regra da Mediana atribudo um padro para a classe, cujo clculo feito pela
mdia das probabilidades a posteriori sobre todas as sadas dos classificadores (KITTLER et
al., 1998a).

1 R 1 R
i=1 P ( w jx i ) =max m
k=1 P ( w kxi ) .
R R i=1

Essa regra atribui um padro para a classe, cuja mdia das probabilidades a posteriori
mxima. Se na sada de um dos classificadores, a classe tiver valores muito altos, isso
poder prejudicar e indicar uma deciso errada (KITTLER et al., 1998a). Baseado nisso,
mais indicado tomar a deciso baseada na combinao da mediana das probabilidades a
posteriori e no na mdia. A regra da mediana definida por:

R
medi=1 P ( w jxi ) =max m R
k=1 med i=1 P ( w kx i )

2.2.8 Votao por maioria

A regra de votao por maioria a regra mais popular para a combinao de


classificadores (DUIN; TAX, 2000). O funcionamento da regra desse tipo de votao
definido como a classe que tiver mais da metade dos votos, sendo ela a classe vencedora. Se
no houver nenhuma classe nessa condio, ento x X logo no recebe o rtulo, que
34

funciona como uma opo de rejeio. Assim ji {0,1} o voto para a classe j registrado
pelo classificador i. Seja H uma funo de deciso que registra a classe x, ento:

em que m o nmero de classes em e R o nmero de classificadores (DUIN; TAX, 2000)


(KITTLER et al., 1998a).

2.2.9 Plurality Voting

O plurality voting similar votao por maioria quando a classificao binria,


produzindo resultados iguais (ZHOU, 2012). Nesse caso, a classe vencedora aquela que
tiver o maior nmero de votos, no sendo necessrio obter mais de 50% dos votos.

2.2.10 Bagging (Bootstrap Aggregation)

A tcnica conhecida como Bagging foi desenvolvida por Breiman (1996) e tem origem
do nome Bootstrap Aggregating. O algoritmo utiliza a combinao de vrios modelos com a
funo de realizar a classificao. O objetivo diminuir o erro aumentando a preciso de
classificao. A deciso final baseada na classe que tiver o maior nmero de votos, sendo ela
a classe vencedora (BREIMAN, 1996) (KUNCHEVA, 2004).
Este algoritmo cria preditores em amostras bootstrap. Uma amostra bootstrap
definida quando se tem um conjunto de amostras (y1, y2, , yn) e dessa amostra so retiras n
amostras com reposio. Logo essa amostra retirada chamada de amostra bootstrap Bj = .
(y*1, y*2, , y*n).. Em seguida, agrega-se ou combina-se essas amostras para gerar um novo
preditor. Espera-se que esse novo preditor seja melhor. Esse pode ser aplicado para
classificao e regresso. No caso de classificao os preditores so combinados pela votao
e, no caso de regresso, usado a mdia dos preditores.
O funcionamento se d da seguinte forma: so criados vrios conjuntos de
35

treinamento, que so formados por classificadores (rvore de deciso, redes neurais, entre
outros) construdos de forma aleatria com reposio. A sada dos classificadores combinada
pela votao por maioria. O detalhamento do algoritmo bagging se encontra abaixo
(KUNCHEVA, 2004). O processo dividido em duas grandes etapas: treinamento e
classificao (KUNCHEVA, 2004). Em que Za= {za1, ..., zaN} o conjunto de treinamento
rotulado, L so os membros dos conjuntos que podem ser treinados em diferentes processos,
se necessrio (KUNCHEVA, 2004).

1. Treinamento:
a) Variveis de entrada
A=so subconjuntos das instncias.
L, o nmero de classificadores para treinamento.
b) Para b= 1, ..., L.
Tem-se uma amostra Sb de Za.
Cria um classificador Ab usando Sb como conjunto de treinamento.
Inclui o classificador para o conjunto atual, A=A U Ab.
c) Volta A.
2. Classificao:
Faa A1, ..., AL sobre a entrada x.
A classe com o maior nmero de votos pertencente a x.
Fim

2.2.11 Boosting

O Boosting um algoritmo utilizao aps um mtodo de classificao, visando


melhorar seu o desempenho, visando diminuir seus erros de classificao. Ele concede pesos
s observaes de um conjunto de dados. Os dados que possuem preciso correta tero pesos
maiores que os dados que possuem preciso incorreta (FREUND; SCHAPIRE, 1997).
O AdaBoost um algoritmo derivado do Boosting que tenta melhorar o desempenho
de um determinado conjunto de mtodos (FREUND; SCHAPIRE, 1997). No algoritmo
AdaBoost, cada padro de treinamento recebe um peso que determina a sua probabilidade de
ser selecionado para um conjunto de treinamento de um classificador de componente
individual. Se um padro de treinamento classificado com preciso, a chance de ser usado
36

novamente em um classificador componente reduzido. Se o padro no classificado com


preciso, a possibilidade de ser utilizado novamente maior. Em cada interao k, extrado
um conjunto de treinamento de acordo com o peso e, em seguida, treinado o classificador
componente Ck sobre o padro selecionado. Depois, aumenta-se o peso do padro de
treinamento classificado errado por Ck e diminui-se o peso do padro classificao correta. O
padro escolhido, de acordo com a nova distribuio, usado para treinar o prximo
classificador, Ck+1 o processo iterated (DUDA et al., 2001).
O conjunto padro T denotado por xi e yi, ou seja Wk(i) a distribuio kth (discreto)
sobre todas as amostras de treinamento. O kmax definido como sendo o nmero de
classificadores componente. O hk(xi) uma categoria (1 ou -1) dado o padro (xi) ao
classificador componente Ck.
O procedimento do AdaBoost (DUDA et al., 2001):
Comea: T = {x1, y1, ..., xn, yn, kmax, W1(i) = 1/n, i = 1, ..., n
k 0
kk+1
Treina o classificador Ck usando T amostra de acordo com Wk(i)
Ek erro de treinamento de Ck medido sobre T usando Wk(i)
1
2 [(
ln 1Ek ) / Ek ]
k

At k=kmax
Retorna Ck e k para k=1 em kmax (conjunto de classificadores com peso)
Fim

2.2.12 Redes neurais

Uma rede neural ter por objetivo processar as informaes dos neurnios para o
reconhecimento de padres, percepo, entre outras funes e podendo ser usada para
resolver problemas de classificao complexa. As aplicaes das redes neurais so inmeras
tais como: classificao, otimizao, minerao de dados e etc (ENGELBRECHT, 2007).
Na figura 1, as entradas das redes neurais so definidas por x1, ..., xd, associadas aos
seus pesos w1, ..., wd para a sada y(x). O bias w0 representado como um peso de uma entrada
37

adicional x0 (BISHOP, 1995). O bias tem a funo de aumentar ou diminuir o grau de liberdade
da funo de ativao, podendo ser positivo ou negativo, com isso a relao entre o potencial
de ativao com a sada y(x) modificada. Ele tem a funo de fazer uma transformao na
sada y(x) (HAYBIN, 2001).

Figura 1 - Estrutura de uma rede neural

Fonte: Adaptado de Bishop, 1995.

A sada de y(x) comparada com a sada d(x) que corresponde a sada dada pelo
sistema desconhecido. Essa diferena gera um erro chamado e(x), dado pela equao abaixo
(HAYBIN, 2001):

e ( x ) =d ( x ) y ( x )

Esse erro auxilia no monitoramento dos ajustes dos pesos do neurnio (HAYBIN,
2001).

2.2.12.1 Funes de ativao

A funo de ativao (fAN) recebe o sinal de entrada e o bias e defini a sada da rede.
De acordo com a sada desejada, existem diferentes tipos de funo de ativao. Em geral, as
fAN so (ENGELBRECHT, 2007):
38

f ( ) =0 f ( ) =1
AN ou AN

e
f AN
( ) =1

As principais funes de ativao so: funo linear, funo step, funo sigmide e
funo gaussiana. Para este trabalho foi utilizado a funo sigmide. Lembrando que a sada
da rede neural influenciada pelo valor de threshold (), que identificado pela bias.

Funo Linear dada por:

f AN ( net ) = ( net )

em que uma funo de inclinao constante e =0.

Funo Step

A funo step gera uma sada com dois valores para 1 e 2 , dependendo do valor de .
Geralmente a sada binria com 1=1 e 2=0 (ENGELBRECHT, 2007). Para

Funo Sigmide

1
f AN ( net ) = ( net )
1 +e

Normalmente =1, que controla a funo de inclinao da funo (ENGELBRECHT,


2007).
39

Funo Gaussiana

2 2
( net ) /
f AN ( net ) =e

em que net- a mdia e o desvio padro da distribuio gaussiana (ENGELBRECHT,


2007).

2.2.12.2 Estrutura das redes neurais

A estrutura das redes neurais pode ser: rede de camada nica, rede de multicamadas,
redes alimentadas frente feedforward e redes recorrentes (RUSSEL; STUART, 2004):
As redes de camada nica utilizam apenas uma nica camada. Esses neurnios esto
dispostos em paralelo;
As redes de multicamadas utilizam uma ou mais camadas entre os ns de entrada at
chegar sada da rede, passando pela funo de ativao. Esta camada tem a funo de
propagar os sinais que passam at a sada dela;
As redes alimentadas frente so do tipo backpropagation. O processamento da
rede acontece em um nico sentido, ou seja, da entrada para a sada. Nesse, no temos
a realimentao;
As redes recorrentes so baseadas em pelos menos um processo de realimentao.
Isto ocorre em pelo menos um dos neurnios, este processo chamado de
autorrealimentao.

2.3 MTODOS DE AGLOMERAO ESPACIAL APLICADOS REA DA SADE

Minamisava et al. (2009) analisou a distribuio espacial das mortes por homicdios e
por acidentes de trnsito em Goinia/Gois, combinando com as variveis socioeconmicas
para jovens de 15 a 24 anos. Para a realizao do trabalho, foi utilizada a Estatstica SCAN,
sendo aplicado o modelo Poisson para identificar os grupos de setores censitrios com alta
mortalidade devido a leses intencionais e os acidentes de trnsito. Os resultados
apresentaram que, em relao ao perfil socioeconmico, a maior parte das vtimas possuem
menor escolaridade, menor renda e condies precrias de moradia. As principais vtimas de
40

acidente de trnsito foram na faixa etria dos 20 aos 24 anos. Na anlise espacial, verificou-se
que no houve conglomerados significativos no municpio de Goinia.
Em 2008, foi desenvolvido um estudo por Grubesic e Pridemore (2011), nos Estados
Unidos, que tinha por objetivo buscar associao entre o lcool e os assaltos. Foi aplicado o
ndice de Moran Local. Os resultados mostraram que os conglomerados de violncia ficam
em torno dos pontos onde vendido o lcool em Cincinnnati.
No ano de 2009, foi desenvolvido nos Estados Unidos, no perodo de 2000 a 2005, um
trabalho por Mandal et al. (2009), que tinha por objetivo determinar alguma correlao
espacial entre dois tipos de cncer (mama e prstata). Nos resultados, houve uma correlao
significativa entre cncer de mama e de prstata. A relao mais forte entre o cncer de mama
e de prstata estava na parte oriental do Centro-Oeste e Sul. Nas regies norte-sul observou-se
um padro para ambos os tipos de cncer. Os aglomerados espaciais dos municpios com altas
taxas de incidncia de cncer foram mais frequentes no Norte; e aglomerados de municpios
com taxas de incidncia baixas eram predominantemente no Sul.
Lucena e Moraes (2009) realizaram uma anlise do comportamento dos mtodos Scan
e Besag Newell, com dados do dengue na cidade de Joo Pessoa, nos anos de 2004 e 2005. O
mtodo Scan detectou conglomerados de alto e baixo risco, enquanto que o mtodo de Besag
Newell identificou conglomerados apenas de alto risco. No final da pesquisa, foi constatado
que o mtodo Besag Newell apresentou resultados melhores.
No trabalho de Arajo et al. (2008), foi realizada uma reviso sistemtica dos estudos
que utilizam geoprocessamento aplicado ao dengue no Brasil. Foram utilizadas trs bases de
dados: Pubmed, Bireme e Scielo. Os critrios de incluso foram os artigos originais sobre
dengue e a utilizao de tcnicas de geoprocessamento de 1998 a 2007, publicados em
portugus e ingls. Na pesquisa, as anlises foram feitas sobre artigos que abordaram a
espacializao dos casos do dengue, trabalhos que trataram dos vetores do dengue e tambm
os vetores juntamente com os casos. Observou-se o uso de aspectos sociais associados
distribuio espacial do dengue. Com toda essa estratgia, foi concludo que as ferramentas de
geoprocessamento foram subutilizadas, e que os aspectos socioeconmicos so importantes
para um melhor entendimento do dengue sob o ponto de vista da distribuio espacial.
O trabalho de Goujon-Bellec et al. (2011) teve por objetivo fazer uma avaliao do
desempenho de vrios mtodos conhecidos como cluster hot-spot. Esses mtodos tinham por
objetivo identificar regies de aglomerados. Os mtodos do Scan circular e os elpticos foram
utilizados para detectar aglomerados que tinham a forma regular.
41

O poder dos mtodos foi avaliado pela simulao de Monte Carlo. Nos resultados,
foram verificados que todos os mtodos falharam para detectar aglomerados pequenos com
risco relativo inferior a 3.00. Eles foram bem detectados para todos os mtodos, com os
melhores resultados os mtodos do Scan circular e elpticos. Os mtodos do Scan circular e
elpticos pareciam mais capazes de detectar os aglomerados de doenas raras em grandes
territrios. No entanto, a chances de detect-lo pequenos com risco relativo menor que 3.00
mantiveram-se baixas para todos os mtodos.
Em 2012, foi desenvolvido um trabalho por Helbich et al. (2012) que examinou o
contedo de ltio natural na gua potvel, e se est associada s taxas de suicdio. Para este
trabalho, foram utilizados mtodos de regresso espacial local e global, e autocorrelao
espacial. Os modelos espaciais utilizados foram: ndice Moran Global e Getis Ord local. O
trabalho concluiu que existem efeitos na ingesto de ltio natural sobre a sade mental e acha
necessria a explorao entre a associao espacial dessa substncia com o suicdio.
No trabalho de Queiroga et al. (2012), foi realizado um estudo da distribuio espacial
da tuberculose e sua relao com as condies de vida da populao no municpio de
Campina Grande, no perodo de 2004 a 2007. Os casos de tuberculose foram
georreferenciados e calculado o ndice de Moran Global. Os resultados da pesquisa mostraram
que a distribuio espacial da tuberculose na cidade no uniforme. A distribuio espacial
das taxas de incidncia se encontra nos bairros das regies leste e central da cidade.
A pesquisa de S et al. (2015) tinha por objetivo descrever a relao entre o ndice de
Desenvolvimento Humano (IDH) e o acometimento do dengue no Estado da Paraba, no
perodo de 2011 a 2013, segundo o mtodo da estatstica Scan. De acordo com os resultados,
os municpios com baixo ndice de Desenvolvimento Humano (IDH) foram mais vulnerveis
a contrarem dengue, facilitando, assim, a definio de polticas pblica na preveno
morbidade do dengue.
No trabalho de Pietri et al. (2008), foi criado um modelo geoespacial para analisar a
exposio nas escolas das crianas, na faixa etria dos 6 aos 8 anos, na provncia do Rio
Negro, Argentina. Nesta pesquisa foi levada em considerao a localizao das casas,
prximas a estradas de terra, com proximidade das escolas que tinham exposio ao ponto de
origem. Os resultados mostraram que os nveis de chumbo estavam associados com a
proximidade da fonte e/ou a localizao de residncias em estradas de terra. A anlise espacial
nessa pesquisa foi um mtodo complementar para analisar os pontos de risco, e indicar uma
associao positiva entre os elevados nveis de chumbo com a proximidade de se viver em
casas com estradas de terra.
42

Os trabalhos que utilizaram os mtodos de aglomerao espacial podem ser aplicados


a diversas reas na sade, desde doenas como a tuberculose, dengue, como tambm dados de
acidente de trnsito, e homicdios. A anlise espacial est cada vez mais presente na
epidemiologia, com trabalhos que busquem verificar como andam os fenmenos que afetam a
sade da populao.

2.4 COMBINAO DE CLASSIFICADORES UTILIZANDO REGRAS DE


COMBINAO

Segundo uma vasta pesquisa literria, no foram encontrados trabalhos que


abordassem a combinao de mtodos de aglomerao espacial, mas sim, aplicados a
classificadores de dados ou imagens (DUDA et al., 2001). Para esta pesquisa, sero
apresentados alguns trabalhos que utilizam mtodos de aglomerados espaciais de forma
individual e no combinada.
O trabalho de Yu et al. (1997) teve por objetivo investigar a combinao de
classificadores para a leitura labial. Com isso, foram propostos trs classificadores: Cadeia de
Markov, Redes Neurais e Transformao Fourier Unidimensional. As regras de combinao
sobre estes classificadores foram baseadas na regra da soma, regra da diferena, regra do peso
e na regra da mediana. Esses foram trabalhados com dois bancos de dados. No primeiro, os
resultados mostraram que o desempenho de um classificador, com base na transformao
Fourier unidimensional, foi bem, se comparado com os outros dois mtodos (Redes Neurais e
Modelo Markov). Segundo os resultados das taxas de classificao correta, a transformao
Fourier unidimensional produziu os melhores resultados com 90% de acerto, Modelo de
Markov com 76% de acerto e Redes Neurais com 69% de acerto. A melhor regra foi a da
mediana; no segundo, a transformao Fourier unidimensional continuou como sendo o
melhor e o classificador baseado em Redes Neurais continuou como sendo o pior. Em se
tratando das regras de combinao dos classificadores, a do peso foi a melhor. Com estes
resultados, foi observado que houve uma melhoria de preciso de classificao com a
combinao para a taxa de reconhecimento de leitura labial.
De acordo com o trabalho de Breukelen et al. (1998), o objetivo era combinar
classificadores para dgitos de manuscritos sobre dados reais. Neste, foram utilizadas as regras
da mdia, mxima, mnima, mediana, voto da maioria e a regra do produto. Os classificadores
utilizados para a combinao foram: Linear Gaussiano, Linear Fisher, Linear Karhunen-Love
e k-NN. Os experimentos finais combinaram todas as caractersticas dos dgitos dos
43

manuscritos em um conjunto nico de caractersticas. O trabalho tinha tambm o interesse de


saber se haveria um nmero ideal de classificadores. Analisando os resultados, foi observado
que a regra da mediana foi a mais robusta e trabalhou bem com o classificador k-NN. A regra
do produto apresentou bons resultados quando se trabalha com a combinao de
classificadores lineares. Combinando todas as caractersticas em um nico conjunto, resultou
menor erro de classificao.
No trabalho de Duin e Tax (2000), foi discutida a combinao de classificadores. Este
estudo inclui a combinao utilizando diferentes classificadores sobre um conjunto de
caractersticas similares, como tambm a combinao de classificadores sobre um conjunto de
caractersticas diferentes. Vrias regras de combinao foram treinadas e fixadas. As regras
utilizadas foram: mximo, mediana, mdia, produto e mnimo. Os classificadores foram:
Bayes-normal 1, Bayes normal 2, vizinho mais prximo, k-NN,Classificador Linear Fisher e
rvore de Deciso. O trabalho concluiu que no existe uma regra de combinao melhor. O
desempenho poderia melhorar, se fossem utilizados conjuntos de caractersticas diferentes e
diferentes classificadores.
Em Aksela e Laaksonen (2005), foi proposta uma nova abordagem na informao do
classificador anterior, utilizando as decises e a incorporao de um sistema para melhorar a
robustez. Neste trabalho, foi utilizado um prottipo base de classificadores para calcular as
entradas das distncias, a partir dos prottipos de cada classe. Cada classificador membro
possui um vetor de distncia, que calcula as distncias para cada classe, em que cada distncia
menor indica uma melhor adequao. As regras de combinao utilizadas foram: regra do
produto, regra da soma, regras min e regra max. Os modelos de distribuio foram: Kernel
Triangular e o Kernel Gaussiano. Nos resultados, foi observado que o kernel triangular foi um
pouco melhor do que o kernel gaussiano. As regras do produto e da soma foram superiores.
Na pesquisa de Breve et al. (2005), o objetivo era mostrar um conjunto de experincias
para reconhecer materiais em imagens multiespectrais. As imagens foram classificadas por
uma rede neural, utilizando o classificador Multilayer Perceptron e tcnicas classificadoras de
combinao (Bagging, Decision Templates e Dempster-Shafer). Nos resultados da pesquisa
foi apresentada uma comparao do desempenho dos classificadores individuais e os
combinadores. Os resultados foram avaliados por estimativas do erro e a estatstica Kappa,
para mostrar o desempenho do quadro que varia entre [-1, 1]. Para avaliar a evoluo dos
mtodos, foi analisado o erro estimado pela tcnica Hold-Out e a estatstica Kappa. O mtodo
Hold-Out divide o conjunto de dados em duas etapas. A primeira diz respeito ao treinamento
do classificador; e a segunda etapa usada para testar a obteno da taxa de erro
44

(KUNCHEVA, 2004). Segundo Kohavi (1995) este mtodo pessimista, pois usa apenas
parte dos dados disponveis para formao. Ele pode treinar apenas um nico classificador
para obter a estimativa da taxa de erro. Com isso, passa a ser uma boa escolha para avaliar
classificadores Multilayer Perceptron (BREVE et al, 2005). A estatstica Kappa foi usado para
medir, avaliar o acordo entre dois classificadores. Quanto maior for o valor de k, melhor ser
o desempenho do seu classificador. A interpretao da estatstica Kappa pode ser considerada
subjetiva, dependendo do nvel de exatido do seu problema (CONGALTON, 1991; COHEN,
1960).
No artigo desenvolvido por Alexandre et al. (2001), foi apresentado um estudo
comparativo da performance da mdia geomtrica e aritmtica, como regras para combinar
classificadores mltiplos. No trabalho, foram provados problemas com duas classes e, quando
se utilizam dois classificadores, como os classificadores k-NN, essas regras tm igual
desempenho. Porm, quando mais de dois classificadores so combinados pela mdia
geomtrica, os resultados so melhores do que a mdia aritmtica.
No trabalho de Xu et al. (1992), diz-se que a combinao de classificadores
considerado um problema geral em vrias reas de aplicao; tanto para o reconhecimento de
padres como para uma investigao sistemtica. As solues para o problema foram
divididas em trs categorias (nvel abstrato, nvel de classificao e nvel de medida), de
acordo com os nveis de informao disponvel e a partir de classificadores diferentes. Um
deles adequado para combinao de classificadores individuais, tais como: Bayesiano, k-NN
e classificadores de distncia. Foi realizado o estudo da combinao de mltiplos
classificadores no formalismo de Dempster-Shafer. O treinamento do combinador de
Dempster-Shafer calcula a proximidade entre o modelo de deciso e a sada de cada
classificador (RABINER, JUAN, 1986). Com isso, foi analisado o problema de combinao
do Tipo 1 (um), este abrange os classificadores individuais que classificam a sada (deciso),
considerando os erros dos classificadores individuais, adaptando a teoria Dempster-Shafer. A
combinao feita na situao em que o reconhecimento de substituio e a taxa de rejeio
de cada classificador individual so usados como conhecimento prvio. Essas taxas, que
normalmente representam os ndices de desempenho de um classificador, so facilmente
obtidas, pois testam os classificadores com um conjunto de amostras de teste.
Em Xu e Krzyzak (1994), foi mostrado que o problema de combinar as sadas dos
classificadores encontrados em vrias aplicaes de reconhecimento de padres recentemente
ganhou um grande interesse. Naquele trabalho, um modelo de rede neural chamado de chave
associativa, foi baseado em um novo princpio de combinao, que foi proposto para resolver
45

o problema. Os resultados mostraram que a chave associativa funciona bem e pode produzir
resultados de classificao consideravelmente melhor. Os dois princpios compartilham um
ponto comum de tentar montar ou sintetizar os resultados de todos os indivduos como
resultado final. Essa nova tcnica foi chamada de chave associativa. Os experimentos
mostram que a chave associativa pode melhorar os resultados dos classificadores individuais
consideravelmente.
O trabalho de Tax et al. (2000) teve como objetivo encontrar a classificao da regra
que minimize a probabilidade de erro. Neste trabalho, foram utilizados quatro classificadores
diferentes, so eles: classificador linear de Gauss, classificador linear de Fisher, mtodo de
classificao e percepo de multicamadas. Foram combinadas duas regras: a regra de bayes e
a regra de combinao do produto. Discutiu-se a combinao da mdia e a regra de
combinao do produto. Nas tarefas de classificao, pode ser inteligente combinar as
observaes de diferentes fontes ou origens, tendo como vantagens a diminuio do tempo de
treinamento como tambm o aumento da robustez e o desempenho da classificao. Com isso,
pode-se concluir que apenas no caso de problemas que envolvam vrias classes, com boas
estimativas de probabilidades de classe posterior regra de combinao do produto, supera a
regra de bayes. Sendo a regra da deciso bayesiana como sendo a melhor.
O artigo de Kittler et al. (1998a) foi desenvolvido um quadro terico, que tinha como
funo combinar classificadores que utilizam uma representao padro distinto e mostrar que
muitos sistemas existentes podem ser considerados como casos especiais de classificao
composto. As representaes de padres so usadas em conjuntos para tomar uma deciso.
Uma comparao experimental de sistemas de diversas combinaes de classificador
demonstra que a regra de combinaes desenvolvidas sob as mais restritivas hipteses,
mostrou que a regra da soma supera a combinao de sistemas de classificador. O problema
de combinar classificadores que utilizam diferentes representaes dos padres a serem
classificados foi estudado. Foi demonstrado que diferentes premissas e usando diferentes
aproximaes derivam comumente da combinao de classificador, usando esquemas
semelhantes como a regra do produto, regra da soma, regra do min, regra do max, regra
mediana e a votao por maioria. Os resultados mostraram que, segundo a anlise de
sensibilidade, a regra da soma torna-se mais resistente a erros de estimativa, e isso pode
fornecer uma explicao plausvel pelo desempenho superior.
O artigo de Kittler (1998b) mostrou que o problema de combinao de classificador
baseado no contexto de dois cenrios: uma funo baseada em algo idntico e em
representaes distantes. O objetivo da combinao do classificador foi melhorar a eficincia
46

na tomada de deciso, adotando regras de combinao de mltiplos estgios (regra do


produto, regra da soma, regra mnimo, regra mximo). Vrios especialistas, usando
representaes distintas, argumentaram que muitos esquemas existentes poderiam ser
considerados como casos especiais de classificao composta, na qual todas as representaes
so usadas em conjunto para tomar uma deciso. Foi abordada a questo da sensibilidade de
vrias regras de combinao de erros de estimativas, e verificou-se que as tcnicas baseadas
na soma so mais resistentes a erros do que aquelas derivadas da regra do produto.
Os trabalhos citados acima utilizaram diversas formas de combinao de
classificadores, com o intuito de melhorar as classificaes. Observou-se, tambm, que em
vrios momentos, foram comparadas as diversas formas de combinao a partir das regras,
com o objetivo de saber qual era a melhor delas. Com isso, foi possvel observar que na
grande maioria dos casos as regras de combinao vem com o intuito de melhorar o resultado
final.
Durante toda a pesquisa foi verificado que no foram encontrados artigos que abordam
a combinao dos mtodos de aglomerao espacial, por nenhuma regra de combinao. Com
isso, este trabalho vem tratar de uma nova arquitetura de combinao de aglomerados
espaciais para a epidemiologia.

2.5 MEDIDAS DE QUALIDADE E MEDIDAS DE ASSOCIAO

O estudo dos dados em sade contribui de forma positiva para uma melhor qualidade
de vida da populao. As etapas desses estudos so: coleta dos dados, processamento dos
dados, anlise e diagnsticos das doenas, que resultam em intervenes para melhor
avaliao do estado de sade desses indivduos (RUOQUAYROL; FILHO, 2003). Com os
testes diagnsticos e outras medidas associadas, possvel ter um melhor detalhamento das
doenas do ponto de vista epidemiolgico. Essas medidas so: sensibilidade, especificidade,
valor preditivo positivo (VPP), valor preditivo negativo (VPN), prevalncia, acurcia,
incidncia e risco relativo. O quadro 2 so os resultados de um teste diagnstico
47

Quadro 2 - Resultados dos testes diagnstico

Doenas

Presente Ausente

Positivo a b

Verdadeiro-positivo Falso-positivo

Testes Negativo c d

Falso-negativo Verdadeiro-
negativo

Total a+c b+d

Fonte: Medronho et al, 2009.

2.5.1 Sensibilidade e especificidade

A sensibilidade capacidade que o teste apreesenta de detectar um municpio


prioritrio dado que ele realmente prioritrio (MEDRONHO et al., 2009). A equao da
sensibilidade dada por:
a
Sensibilidade=
a+c

em que a o verdadeiro-positivo e c o falso-negativo.


A especificidade capacidade que o teste apreesenta de detectar um municpio no
prioritrio dado que ele realmente no prioritrio (MEDRONHO et al., 2009). A equao da
especificidade dada por:

d
Especificidade=
b+d

em que b falso-positivo e e d o verdadeiro-negativo.


48

2.5.2 Valor Preditivo Positivo e Valor Preditivo Negativo

O valor preditivo positivo a probabilidade de um indivduo ter o resultado positivo e


estar com a enfermidade. O valor preditivo negativo a probabilidade de um indivduo ter o
resultado negativo e no estar com a enfermidade (MEDRONHO et al., 2009). As equaes
do valor preditivo positivo e do valor preditivo negativo so dadas abaixo, respectivamente:

a
VPP=
a+b
e

d
VPN=
c+d

em que em que a o verdadeiro-positivo, b o falso-positivo, c o falso-negativo e d


verdadeiro-negativo.
Os valores preditivos esto ligados sensibilidade e especificidade do teste
(BONITA et al., 2010). Nesse sentido, quanto mais sensvel o resultado do exame, melhor
ser o valor preditivo negativo. Isso se d em funo do nmero de resultados falsos negativos
(MEDRONHO et al., 2009). Para a especificidade, quanto mais especfico o resultado do
exame, melhor ser o valor preditivo positivo, levando diminuio do nmero de falsos-
positivos.

2.5.3 Risco Relativo e Incidncia

O risco relativo uma medida de associao utilizada em epidemiologia. Do ponto de


vista epidemiolgico, o risco relativo representa a probabilidade de uma pessoa ficar doente
num dado intervalo de tempo (MEDRONHO et al., 2009). Ele definido como coeficiente de
incidncia de pessoas expostos doena (Ie) dividido pelo coeficiente de incidncia de
pessoas no-expostas doena (I0) (ROUQUAYROL; FILHO, 2003) (BONITA et al., 2010)
(ROTHMAN, 1986). O risco relativo dado pela seguinte equao:

Ie
RR=
I0
49

A incidncia definida como nmero de novos casos numa regio em um determinado


tempo dividido pela populao exposta ao risco em adquirir a doena. A equao da
incidncia definida por:
I
Inc=
PT

em que I o nmero de novos casos que surgiram e PT a populao exposta ao risco


(ROUQUAYROL; FILHO, 2003).

2.6 ANLISE ESPACIAL DE DADOS EM SADE

A pesquisa de dados espaciais em sade iniciou-se no sculo XIX, com John Snow,
que buscou analisar a epidemia da clera na regio de Soho em Londres, em 1854. Na
pesquisa, ele encontrou uma associao dos mortos por clera, e as bombas pblicas que
abasteciam a cidade, identificando com isso a causa da epidemia (MEDRONHO et al., 2009).
Com isso, as anlises espaciais em sade, em especial na epidemiologia, tm se
tornado uma grande ferramenta de pesquisa, juntamente com os mtodos estatsticos espaciais
para uma maior investigao na difuso de doenas. O uso na epidemiologia visa descrever a
difuso de doenas, identificar padres de associao espacial, com o intuito de predio e
controle das doenas (MEDRONHO et al., 2009). Os dados espaciais em sade so formados
por localizaes espaciais (latitude e longitude), ou dentro de regies especficas (dados em
rea). Alguns exemplos dessas aplicaes so: nmero de casos de uma doena por Estado,
localizao exata da ocorrncia de uma determinada doena em um municpio, entre outras.
Essas pesquisas so realizadas em cima de geo-campo e geo-objeto. O geo-campo representa
a distribuio espacial contnua de determinado fenmeno geogrfico sobre o espao
geogrfico. Exemplo de tipos de solo, vegetao so fenmenos de geo-campo. O geo-objeto
so entidades presentadas por um ponto, linha ou polgono (reas), que possuem geometrias e
topologia. Os geo-objetos podem ser representados por: ponto de nibus, trecho de logradouro
e quadras. Neste trabalho os municpios do estado da Paraba so os geo-objetos.
Todos os processos das anlises espaciais so realizadas usando os Sistemas de
Informao Geogrfica (SIG). Um SIG uma estrutura que permite capturar, manipular,
armazenar, e gerar relatrios a cerca dos dados georreferenciados. Os SIGs e os mtodos
estatsticos espaciais podem ser potencialmente utilizados em sade coletiva e epidemiologia.
Na sade coletiva, o uso dos SIGs pode ser utilizado para o planejamento e monitoramento de
50

aes em sade, localizao exata dos servios de sade, roteiro das trajetrias das
ambulncias entre outros. Na epidemiologia, o seu uso vai desde a definio de regies de
risco at a ocorrncia de doenas, analisando a distribuio espacial geogrfica de uma
epidemia, entre outras (MEDRONHO et al., 2009).
O uso dos mtodos estatsticos espaciais pode auxiliar as autoridades pblicas numa
avaliao mais rpida, confivel e vlida em sade. Tudo isso contribui para um melhor
entendimento da compreenso dos problemas de sade da atualidade (MEDRONHO et al.,
2009).

2.7 COMBINAO DE CLASSIFICADORES

A combinao de classificadores tem a proposta de desenvolver sistemas mais


confiveis para o reconhecimento de padres, e visando melhorar o desempenho dos
classificadores individuais (XU; KRZYZAK; SUEN, 1992). O reconhecimento de padres
um reconhecimento de forma automtica que descreve, classifica e agrupa padres
disponveis, em diversas reas do conhecimento: medicina, inteligncia artificial, psicologia,
entre outros (JAIN et al., 2000). O processo de reconhecimento de padres dividido em trs
processos: aquisio de dados e pr-processamento, representao dos dados e deciso (JAIN
et al., 2000).
Quando se tem um problema de aplicao especfico, cada classificador pode atingir
graus de sucesso diferentes, sendo que nenhum deles totalmente perfeito. Com isso,
necessria a integrao de resultados de diferentes classificadores para que um melhor
resultado seja obtido. Pensando nisso, o objetivo da combinao de classificadores melhorar
a eficincia na tomada de deciso (KITTLER et al., 1998). Existem vrias formas de
combinar classificadores que so baseados nas arquiteturas: sequencial, paralela e hierrquica.

Na arquitetura sequencial ou linear ocorre quando cada classificador melhora as


sadas dos classificadores anteriores.

Figura 2 - Arquitetura Sequencial

Fonte: Adaptado de Moraes; Machado, 2012.


51

Na arquitetura hierrquica, as sadas das arquiteturas anteriores podem ser


combinadas para gerar uma sada final.

Figura 3 - Arquitetura Hierrquica

Fonte: Adaptado de Moraes; Machado, 2012.

Na arquitetura paralela, as sadas dos classificadores so combinados para fornecer


uma sada final.
Figura 4 - Arquitetura Paralela

Fonte: Adaptado de Moraes, Machado, 2012.


52

Depois de escolhido, a arquitetura necessria a escolha do regime de combinao


que conhecido como combinador (JAIN et al., 2000). Os combinadores devem possuir
algumas caractersticas. So elas (MORAES; MACHADO, 2012):
Esttico: os combinadores estticos precisam de uma regra pr-definida e no
necessrio nenhum conjunto de treinamento;
Treinveis: os combinadores treinveis precisam de um conjunto de treinamento e, em
geral, atingem melhor desempenho;
Esquemas Adaptativos: alguns esquemas so adaptativos, e o combinador tem a
funo de verificar as decises dos classificadores individuais;
Informaes de sada esperada pelo combinador. Neles, so esperados trs nveis:
1) medida ou esperana: atribudo um valor numrico dito em termos de
probabilidade de uma classe especfica, um dado de entrada, 2) valor de classificao:
nesse nvel, o classificador tem a funo de atribuir uma classificao para cada classe,
estando de acordo com os dados de entrada, 3) resumo: o classificador tem a funo de
atribuir um valor (rtulo) para a classe, exibindo a melhor deciso.

2.8 ESTATSTICA KAPPA

A estatstica Kappa foi proposto por Cohen, 1960 que mede o grau de concordncia
entre variveis na classificao. Ele est no intervalo [-1,1] (EUGENIO; GLASS, 2004)
(Duda et al., 2001). A estatstica Kappa aplicado em diversas na rea de sade (McGinn et
all., 2004), dado por:

P ( A ) P ( E )
K= ,
1P ( E )

1 n
P ( A )= m
N i=1 ij

e
1 n
P ( E )= n m x nj=1 m kj ) .
2 k=1 ( j= 1 jk
N

em que P(A) a proporo de vezes em que a deciso correta; P(E) a proporo de vezes
em que a deciso incorreta; n o nmero de colunas e linhas em uma matriz de
53

classificao; mij o elemento (i, j) da matriz de classificao; e N o nmero total de


observaes.
Os clculos das propores so baseadas de acordo com a matriz de classificao. A
diagonal principal significa os elementos classificados corretamente e a diagonal secundria
os elementos classificados incorretamente. Um valor negativo indica uma concordncia ruim
e os valores positivos indica um melhor grau de concordncia (FLESS; COHEN, 1973).
O grau de concordncia depende do valor de K, se a concordncia for 1 (um), isso
indica que o modelo acerto 100%. Quanto mais prximo de 1 melhor o grau de concordncia
e quando a concordncia for 0 (zero), significa que no existem nenhuma concordncia com
os resultados. A interpretao da estatstica Kappa dada segundo o quadro a seguir (McGinn
et all., 2004):

Quadro 3 - Interpretao da estatstica Kappa

Valor Kappa Grau de concordncia

0 Nenhum

0-0,2 Leve

0,2-0,4 Bom

0,4-0,6 Moderado

0,6-0,8 Considervel

0,8-1,0 Quase perfeito

Fonte: McGinn et all, 2004.


54

3. NOVA ARQUITETURA PROPOSTA PARA A COMBINAO DOS MTODOS DE


AGLOMERAO ESPACIAL

A Figura 5 apresenta a nova arquitetura proposta para a combinao de mtodos de


aglomerao espacial. A formalizao matemtica dessa arquitetura apresentada na
sequncia. Um conjunto de dados georreferenciados contm informaes sobre as
coordenadas dos geo-objetos que compem a regio geogrfica em estudo, nmero de casos
por geo-objeto e populao por geo-objetos. Esse conjunto de dados usado como entrada
para n mtodos de aglomerao espacial, os quais produziro n mapas com valores-p que
denotam a significncia dos aglomerados para cada geo-objeto. Posteriormente, os valores-p
de cada geo-objeto presentes no intervalo de [0,1], passam por um processo de binarizao
que os transforma {0,1}, cujo significado no significativo e significativo. Logo aps, o
processo de binarizao a arquitetura vai para uma nova etapa, chamada de regra de
combinao. Nesse processo os valores em {0,1} de cada geo-objeto passam a ser
combinados visando gerar um mapa de deciso, que um produto final de toda a arquitetura
proposta.
A forma de combinao dos classificadores da Figura 5 foi do tipo paralela. Vrias
regras de combinao podem ser utilizadas nessa nova arquitetura, como por exemplo: regra
de votao por maioria e redes neurais. Vale ressaltar que esta arquitetura pode ser usada com
qualquer regra de combinao e se utilizar de qualquer mtodo de aglomerao espacial.

Figura 5 Nova Arquitetura para a combinao de mtodos de aglomerao espacial

Fonte: Elaborado pelo autor

A formulao matemtica da arquitetura proposta provida a seguir. Seja, G


pertencente a Z2, um conjunto de coordenadas no espao geogrfico, sobre o qual os geo-
objetos esto constitudos e seja D um conjunto de dados com no mnimo as seguintes
55

variveis: populao e nmero de ocorrncias (ambas subconjuntos de Z). Ento: f: G D


um mapeamento do conjunto de dados sobre as coordenadas geogrficas, ou
georreferenciados. Cada elemento de f pode ser denotado pelo par ordenado c = (g, f(g)), onde
g pertencente a G e f(g) pertence a D.

Cada um dos k mtodos, onde , k=1,..., N, de aglomerao espacial (Getis Ord,


Estatstica Scan, Mtodo Besag e Newell, Estatstica M, Mtodo de Tango, etc...) utiliza a
estrutura f como entrada para produzir k sadas que so mapeamentos dos valores-p
resultantes sobre as coordenadas geogrficas pk: G [0,1], onde k=1,2,...,N, gerando um
mapa de valores-p. Cada elemento de pk pode ser denotado pelo par c' = (g, p k (c)), onde pk (c)
pertence ao intervalo [0,1].

Um mtodo de binarizao que transforma os valores-p em dois rtulos, onde 1


significativo e 0 no significativo aplicado sobre cada elemento da estrutura p k, onde o
resultado final uma nova estrutura dada pela funo tk: G {0,1}. Cada elemento de tk
pode ser denotado pelo par c'' = (g, tk (c')), onde tk (c') pertence ao conjunto binrio {0,1}.

A seguir, as k estruturas dadas por tk so agregadas por uma regra de combinao para
produzir um nico rtulo binrio final para cada geo-objeto pertencente a estrutura de entrada
f. Essa funo denotada por h: G {d1,..., dm}, onde dm com m 2 e denota a deciso pelos
graus de prioridade que o geo-objeto deve ter do ponto de vista epidemiolgico. Nesta tese,
m=2 para todas as aplicaes realizadas. Cada elemento de h pode ser denotado pelo par (g, h
(c'')), onde a funo h tem como contra domnio o conjunto de possveis decises dado por
{d1,..., dm}, gerando um mapa de deciso. Ento, levando-se em considerao a definio de
c'', a funo h pode ser reescrita como uma funo decisria que dada por:

h(c') = [ g, t1 (c'), t2 (c'), , tk (c') ]

onde denota a regra de combinao utilizada e k=1,2,...,N.


56

S desperta paixo de aprender quem tem paixo


de ensinar.
(Paulo Freire)
57

4 PERCURSO METOLGICO

4.1 REA DE ESTUDO

rea de estudo o Estado da Paraba, situada na regio nordeste do Brasil, com uma
extenso territorial de 56.469,744 km2. A populao, segundo o censo 2010 do Instituto
Brasileiro de Geografia e Estatstica (IBGE), de 3.766.528 habitantes. O Estado da Paraba
composto de 223 municpios e 4 mesorregies (Litoral/Mata Paraibana, Agreste Paraibano,
Borborema e Serto Paraibano). As coordenadas geogrficas so 07 09'S e 36 49'W. O clima
varia de tropical na regio do litoral e semirido no interior. Na prxima pgina segue o mapa
da Paraba (Figura 6).
Em todo o estado da Paraba foram registrados 26.646 casos do dengue no perodo de
2009 a 2011. Sendo 1.597 casos em 2009, 8.678 em 2010 e 16.371 em 2011. Durante os anos
pesquisados observa-se um aumento gradativo, com pice no ano de 2011. Faze em que em
2014, comearam a surgir outras doenas transmitidas tambm pelo prprio mosquito (Aedes
Aegypti), como zika e chicungunha. Porm, para est pesquisa ser tratado apenas do dengue.
58

Figura 6 - Mapa das mesorregies da Paraba

Fonte: Secretaria do Estado da Paraba.

4.2 CARACTERIZAO DO ESTUDO E ANLISE DOS DADOS

O tipo de estudo desta pesquisa ecolgico, pois se baseia em uma anlise de uma
populao ou um grupo de indivduos que pertencem a uma regio geogrfica (MEDRONHO
et al, 2009). Nesse caso, a populao da pesquisa so todas as pessoas acometidas do dengue
no Estado da Paraba, no perodo de 2009 a 2011. Os bancos de dados foram fornecidos pelo
59

Sistema de Informao de Agravos de Notificaes (SINAN), mas disponibilizado pela


Secretria de Sade do Estado da Paraba. A varivel utilizada foi o nmero de casos do
dengue por ano em cada municpio. Os bancos de dados foram organizados em planilha
eletrnica por ano, e continham as coordenadas latitude e longitude por municpio, as
populaes por municpio, os nmeros de casos por municpio, e os cdigos por municpio.
Em seguida, foram calculadas as incidncias e os riscos relativos para todos os municpios em
todos os anos.
Na anlise espacial, foram gerados os mapas dos mtodos de aglomerados espaciais:
Estatstica Scan, Estatstica M, Mtodo Besag Newell, Mtodo Tango e Getis Ord, que
tiveram como banco de dados de entrada uma coleo G de geo-objetos mais um conjunto de
dados com populao e nmero de casos. O mapa do especialista foi oriundo do mapa do
risco relativo, sendo um municpio prioritrio (geo-objeto) aquele que apresentar risco maior
ou igual a 2 (dois). As sadas dos mapas dos mtodos de aglomerados espaciais de cada
municpio foram combinadas pela regra de votao por maioria e por redes neurais.
Um municpio, para ser identificado como prioritrio pela regra de votao por
maioria, tem que existir um conglomerado em pelos menos 2, dos 3 mapas dos mtodos de
aglomerao espacial. O mapa do especialista foi baseado no mapa do risco relativo.

4.2.1 Estudo de caso 1

No estudo de caso 1 (Figura 7), os k mtodos de aglomerados espaciais utilizados


foram: Estatstica Scan, Mtodo Besag Newell e Getis Ord, todos eles combinados pela regra
de votao por maioria, dada pela equao h(c') = [ g, t1 (c'), t2 (c'), , tk (c') ], j
mencionada acima. Desses, foram gerados quinze mapas do dengue na Paraba, no perodo de
2009 a 2011, dos quais nove deles so os mtodos de aglomerao espacial (Estatstica Scan,
Mtodo Besag Newell e Getis Ord), trs deles foram os mapas de risco do especialista e os
trs ltimos foram os mapas da combinao dos mtodos de aglomerados espaciais.
60

Figura 7 - Estudo de Caso 1

Fonte: Elaborado pelo autor

4.2.2 Estudo de caso 2

A segunda forma de combinao, presente no estudo de caso 2 (Figura 8), foi a rede
neural. A estrutura da rede neural foi dividida em trs variveis de entrada que foram os
mtodos de aglomerao espacial (Estatstica Scan, Mtodo Besag Newell e Getis Ord), com
trs camadas ocultas; a funo de ativao foi a funo sigmide e o banco de dados de
treinamento foi o mapa do especialista; e para o banco de teste, foram os resultados dos
valores-p dos mtodos de aglomerados espaciais, que so dados pela funo p k: G [0,1],
onde k=1,2,...,N, um mapa de valores-p dos mtodos de aglomerao espacial.
No estudo de caso 2 a regra utilizada para combinar os trs mtodos foi a redes
neurais. Em todos os estudos de caso, a deciso um mapa da combinao dos mtodos. Nos
resultados, foram gerados quinze mapas, dos quais nove foram os mapas dos mtodos de
aglomerao espacial (Estatstica Scan, Mtodo Besag Newell e Getis Ord); trs deles foram
61

os mapas do especialista; e por ltimo; os mapas da combinao dos mtodos de aglomerados


espaciais do dengue na Paraba, no perodo de 2009 a 2011.

Figura 8 - Estudo de Caso 2

Fonte: Elaborado pelo autor

4.2.3 Estudo de caso 3

No estudo de caso 3 (Figura 9), foram gerados vinte e um mapas, dos quais quinze
foram os mapas dos mtodos de aglomerao espacial (Estatstica Scan, Mtodo Besag
Newell, Getis Ord, Mtodo Tango e Estatstica M); trs foram os mapas do especialista e por
ltimo, os mapas da mapa da combinao dos mtodos de aglomerados espaciais do dengue
na Paraba, no perodo de 2009 a 2011. Neste estudo de caso a sada final da arquitetura a
quantidade de votos que cada geo-objeto recebeu. Para est pesquisa a quantidade de votos
de {0,5}. A diferena entre os estudos de caso 1 e o estudo de caso 3 que foram
acrescentados mais dois mtodos de aglomerao espacial (Mtodo Tango e Estatstica M) e o
62

mapa de deciso da combinao que um mapa mais detalhado, mostrando a quantidade de


votos que cada geo-objeto recebeu (Quadro 4).
Figura 9 Estudo de Caso 3

Fonte: Elaborado pelo autor


63

A proposio do novo mapa de votao tem como objetivo identificar a quantidade de


votos que cada geo-objeto recebeu. Neste mapa tem-se como entrada um conjunto de dados
georreferenciados, em que k mtodos produzem uma sada que so mapeamentos dos valores-
p, onde passam por um processo de binarizao e geram uma sada que so combinadas por
regras de combinao e o produto final um mapa de deciso, que podem ser melhor
observadas na Figura 9.
Ele pode facilitar a anlise mais detalhada do fenmeno a ser estudado. A interpretao
do nova mapa pode ser vista no Quadro 3 e o novo mapa no estudo de caso 3 (Figura 40).
Por exemplo, no caso de uma combinao de 5 mtodos, o novo mapa apresenta a
quantidade de votos que cada geo-objeto recebeu. A partir, disso possvel definir um
municpio como prioritrio ou no-prioritrio, como pode ser observado no Quadro 4. De
acordo com ele, um geo-objeto se torna prioritrio quando ele recebe a partir de 3 votos e no
prioritrio entre 0 a 2 votos. Neste estudo de caso foram utilizados 5 mtodos de aglomerao
espacial, mas essa quantidade pode ser diminuida ou aumentada de acordo com o estudo.

Quadro 4 - Interpretao do mapa de votao para 5 mtodos

Quantidade de Votos Deciso

0 - 2 votos No prioritrio

3- 5 votos Prioritrio
Fonte: Elaborado pela autora
64

Quem ensina aprende ao ensinar e quem aprende


ensina ao aprender.
(Paulo Freire)
65

5 RESULTADOS E DISCUSSES

Nesta seo, so mostrados os resultados e as discusses do dengue no Estado da


Paraba, no perodo de 2009 a 2011, que foi dividida em trs estudos de caso. A combinao
dos mtodos de aglomerao espacial se deu pela regra de votao por maioria e pelas redes
neurais.

5.1 RESULTADOS DO ESTUDO DE CASO 1

No mapa dos valores-p da estatstica Scan (Figura 10), para o ano de 2009, foram
identificados 32 municpios (geo-objeto) significativos (valor-p < 0,05) dos quais 28 deles
estavam presentes no mapa de deciso da combinao (Figura 14) e 4 municpios foram
identificados como no prioritrio. Observa-se que os conglomerados espaciais significativos
esto distribudos em todas as mesorregies do Estado da Paraba.
No mapa do mtodo dos valores-p do mtodo Besag Newell (Figura 11), em 2009, se
comparado com a Figura 9, foram identificados 7 conglomerados espaciais a mais. Entre as
mesorregies da Litoral Paraibano e Agreste, observou-se uma concentrao de
conglomerados espaciais; nas demais mesorregies, os conglomerados esto distribudos em
todo o Estado. Na Figura 11, foram constatados 35 municpios significativos, dos quais 25
estavam presentes no mapa de deciso, ou seja, pela regra de votao por maioria, eles
estavam presentes no mapa dos valores-p da estatstica Scan ou no mapa dos valores-p de
Getis Ord.
No mapa dos valores-p de Getis Ord (Figura 12), do ano de 2009, foram identificados
aglomerados espaciais de valores positivos e negativos. Verifica-se uma presena maior de
aglomerados espaciais de valores negativos em toda a regio. Nos aglomerados espaciais de
valores positivos, foram identificados em 20 municpios, dos 223, sendo que apenas 2
municpios apresentaram aglomerados espaciais significativos de valores positivos (valor-p <
0,05); os demais possuem valor-p > 0,05, logo no so aglomerados espaciais.
No mapa do especialista (Figura 13), um municpio dito prioritrio para o dengue se
ele possuir risco relativo maior e igual a 2.00. Com isso, foram identificados 28 municpios
com risco relativo maior e igual 2.00, os demais apresentam risco inferior a 2.00. O mapa do
especialista comparado com o mapa de deciso para que, juntos, possam tomar decises
mais acertadas dos municpios prioritrios e no prioritrios para o dengue na Paraba.
O mapa de deciso da combinao (Figura 14) foi combinado pela regra de votao
66

por maioria. Nesse mapa, para um municpio ser nomeado como prioritrio, o mesmo deve ser
um conglomerado significativo em pelo menos 2, dos 3 mapas de aglomerao espacial
(estatstica Scan, mtodo Besag Newell e Getis Ord). A figura 14 representa o mapa que
melhor representou o mapa do especialista, verificando com mais preciso os municpios
prioritrios.
Depois de uma vasta pesquisa na literatura, no foram encontrados trabalhos que
abordem a combinao de mtodos de aglomerados espaciais. O objetivo foi mostrar que a
combinao dos mtodos de aglomerados espaciais produzem melhores resultados do que se
forem analisados de forma individual.
No trabalho de Lucena e Moraes (2009), foi realizada uma pesquisa para observar o
comportamento dos mtodos Besag Newell e o mtodo Scan na cidade de Joo Pessoa,
Paraba, nos anos de 2004 e 2005, para o dengue. Nessa pesquisa, foi identificado que ambos
os mtodos verificaram conglomerados espaciais, principalmente as regies norte e sudeste do
municpio. Os resultados mostraram que ambos os mtodos apresentaram resultados
parecidos. Em outro trabalho de Ferreira, Moraes (2013), foi utilizado o mtodo Scan na
regio de estudo o Estado da Paraba, com dados de 2011, que tinha por objetivo identificar
conglomerados por sexo (masculino e feminino). O trabalho concluiu que os conglomerados
espaciais do dengue esto distribudos de forma heterognea em todas as mesorregies do
Estado.
Figura 10 Mapa dos valores-p da estatstica Scan do dengue na Paraba no ano de 2009
67

Figura 11 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba no ano de 2009

Figura 12 - Mapa dos valores-p de Getis Ord do dengue na Paraba no ano de 2009
68

Figura 13 - Mapa do especialista do dengue na Paraba no ano de 2009

Figura 14 - Mapa de deciso da combinao dos trs mtodos de


aglomerados espaciais do dengue na Paraba no ano de 2009

No mapa dos valores-p da estatstica Scan (Figura 15), para o ano de 2010, foram
identificados 51 conglomerados espaciais, enquanto em 2009, foram 28 conglomerados.
69

Comparando a Figura 14 com o mapa de deciso da combinao (Figura 19), dos 51


conglomerados espaciais significativos, apenas 31 esto presentes no mapa de deciso da
combinao. A mesorregio do Litoral Paraibano apresentou o menor nmero de
conglomerados enquanto que a mesorregio do Serto Paraibano possui os maiores nmeros
de conglomerados.
O mapa dos valores-p do mtodo Besag Newell (Figura 16), para 2010, os
conglomerados espaciais esto mais concentrados nas mesorregies do Serto Paraibano e da
Borborema. Na mesorregio do Litoral, no foram identificados conglomerados. No total,
foram apresentados 30 municpios significativos. Confrontando a figura 16 com a figura 18,
dos 30 conglomerados significativos, 26 esto presentes no mapa de deciso da combinao
(Figura 17). A figura 15 ficou mais similar ao mapa de deciso do que a figura 18.
Segundo os resultados do mapa dos valores-p de Getis Ord (Figura 17), para o ano de
2010, no foram constatados aglomerados espaciais negativos no intervalo entre (valor-
p<0,005 e 0,005<p<0,025) e para os aglomerados espaciais positivos, no intervalo entre
(valor-p>0,05 e 0,025<p<0,05). Os aglomerados espaciais negativos esto distribudos de
forma heterognea em todo o Estado da Paraba, enquanto que os aglomerados espaciais
positivos esto localizados na mesorregio do Serto Paraibano e em nmero bem menor.
No mapa do especialista (Figura 18), para 2010, foi identificado quais os municpios
so prioritrios, baseando-se no mapa do risco relativo. No total, foram verificados que 33
municpios Paraibanos apresentaram risco maior e igual a 2.00, os demais foram
representados como no prioritrio, pois apresentaram risco menor que 2.00. Avaliando o
mapa da Figura 17, em relao ao mapa da figura 18, dos 33 municpios prioritrios presentes
na Figura 17, 29 deles esto presentes no mapa de deciso da combinao (Figura 19). Isso
mostra que o mapa de deciso da combinao o que mais se assemelha com o mapa do
especialista.
O mapa de deciso (Figura 19) a combinao dos mtodos de aglomerados espaciais
pela regra de votao por maioria para o ano de 2010, do qual identificou de forma mais
precisa os municpios prioritrios para o dengue, analisando-os de forma combinada e no de
forma individual. Analisando os mtodos de aglomerados de forma individual foi possvel
verificar que eles no representaram com preciso a distribuio espacial dos municpios
prioritrios para o dengue no Estado da Paraba, identificando um grande nmero de
municpios que resultaram como conglomerados. A deciso de um municpio ser ou no
prioritrio baseado nos mapas de deciso da combinao e tambm no mapa do especialista.
70

Figura 15 - Mapa dos valores-p da estatstica Scan do dengue na Paraba no ano de 2010

Figura 16 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba no ano de 2010
71

Figura 17 - Mapa dos valores-p de Getis Ord do dengue na Paraba no ano de 2010

Figura 18 - Mapa do especialista do dengue na Paraba no ano de 2010


72

Figura 19 - Mapa de deciso da combinao dos trs mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2010

Segundo o mapa dos valores-p da estatstica Scan (Figura 20), do ano de 2011, foram
identificados 48 conglomerados espaciais significativos distribudos em todas as mesorregies
do Estado. Comparando a figura 20 com o mapa de deciso da combinao (Figura 24), dos
48 conglomerados presentes na figura 18, 35 municpios foram identificados como
prioritrios na figura 24. Comparando os mapas dos valores-p da estatstica Scan com todos
os outros dos anos anteriores (2009 e 2010), o ano de 2011 foi o segundo que mais apresentou
conglomerados espaciais significativos perdendo apenas para 2010.
No mapa dos valores-p do mtodo Besag Newell (Figura 21), foram verificados
apenas 20 municpios como conglomerados, dos quais apenas 1 (um) municpio no est no
mapa de deciso da combinao (Figura 24). Na mesorregio do Litoral Paraibano, apenas 1
(um) municpio foi identificado como conglomerado, os demais esto distribudos nas outras
mesorregies.
Na figura 22 tem-se o mapa dos valores-p de Getis Ord de 2011 no qual esto
distribudos aglomerados espaciais de valores positivos e negativos, sendo que no foi
identificado nenhum aglomerado espacial de valores positivos na mesorregio do Litoral
Paraibano. Observa-se que h um nmero maior de aglomerados espaciais de valores
negativos do que de valores positivos. Em comparao com o mapa de deciso, os municpios
73

prioritrios esto mais relacionados com os aglomerados de valores negativos do que os de


valores positivos.
No mapa do especialista (Figura 23), de 2011, foram identificados 35 municpios
prioritrios, dos 223. Comparando com o mapa de deciso dos 35 municpios prioritrios,
apenas 9 (nove), no esto presentes na figura 24. Isso mostra que o mapa do especialista
similar ao mapa de deciso da combinao.
No mapa de deciso da combinao (Figura 24), foram constatados 37 municpios
prioritrios distribudos em todas as mesorregies do Estado da Paraba. Como foi dito em
outros momentos, um municpio nomeado como prioritrio quando, segundo a regra de
votao por maioria, ele estiver presente em 2, dos 3 mapas analisados. De acordo com esse
estudo de caso, nos trs mapas analisados, tivemos: estatstica Scan, mtodo Besag Newell e
Getis Ord.
Em diversos trabalhos encontrados na literatura, o dengue um grande problema de
sade pblica. O trabalho de Resendes et al., (2010) teve por objetivo identificar as regies de
risco de transmisso do dengue, no municpio de Niteri, Rio de Janeiro, atravs da anlise de
cluster. Nessa pesquisa, a anlise de cluster utilizada foi o mtodo de k-mdias e o clculo da
incidncia do dengue, sendo possvel o reconhecimento de reas prioritrias.
Em outro trabalho de Honorato et al., (2014) o objetivo foi de verificar a relao entre
o risco do dengue com algumas variveis sociodemogrficas, utilizando um modelo de
regresso espacial do tipo Bayesiano. Com isso, foi possvel identificar a relao do dengue
com fatores externos ao setor sade, e tambm localizar as reas com risco da doena.
74

Figura 20 - Mapa dos valores-p da estatstica Scan do dengue na Paraba no ano de 2011

Figura 21 - Mapa dos valores-p do mtodo Besag Newell do dengue na Paraba no ano de 2011
75

Figura 22 - Mapa dos valores-p de Getis Ord do dengue na Paraba no ano de 2011

Figura 23 - Mapa do especialista do dengue na Paraba no ano de 2011


76

Figura 24 - Mapa de deciso da combinao dos trs mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2011

Na figura 25 tem-se a matriz de classificao A, tm-se 196 municpios que foram


classificados de forma correta, enquanto que 27 municpios foram classificados
incorretamente. Na diagonal principal, tm-se as instncias classificadas corretamente. Nessa
matriz, a classificao se deu pela regra de votao por maioria, no ano de 2009, num total de
223 municpios paraibanos, com apenas 27 classificados incorretamente.
Na matriz de classificao B, foram classificados 210 municpios de forma correta e
13 incorretas. Comparando a matriz A com a matriz B, o nmero de municpios classificados
corretos da matriz B maior que a matriz A. Logo, o mapa de deciso da combinao de 2010
(Figura 18) melhor que o mapa de deciso de 2009 (Figura 14).
Em 2011, segundo a matriz de classificao C, foram classificados 196 municpios de
forma correta, igual matriz A, e 27 de forma incorreta. Comparando as trs matrizes, a
matriz B apresentou o maior nmero de municpios classificados corretamente enquanto as
matrizes A e C apresentaram as mesmas quantidades de classificaes corretas e incorretas.

Figura 25 - Matrizes de Classificao para os anos de 2009, 2010 e 2011,


segundo a regra de votao por maioria
77

No ano de 2009, segundo a figura 26, a sensibilidade apresentou um percentual igual a


95,65%, ou seja, mede a probabilidade de o municpio ser prioritrio dado que de fato ele
prioritrio para o dengue no Estado da Paraba. A especificidade foi de 51,28%, em que mediu
o percentual de um municpio no ser prioritrio dado que ele realmente no prioritrio.
negativo.
Em 2010, a sensibilidade foi de 100% e o da especificidade de 68,29%. Comparando
com os anos de 2009 e 2010, os percentuais de sensibilidade e especificidade de 2010 foram
melhores que 2009, ou seja, medem as chances de os municpios serem prioritrios para o
dengue, e no ser prioritrios.
Para 2011, o percentual da sensibilidade foi inferior aos anos de 2009 e 2010, com
88,94% para a sensibilidade e 73,33% para a especificidade. O valor da especificidade para
2011 foi melhor que 2009 e 2010. Estes so os resultados dos testes diagnsticos para o
dengue na Paraba que se mostraram satisfatrios, pois apresentaram um acerto acima de 85%
(para a sensibilidade), para todos os anos, segundo a regra de votao por maioria. Isso mostra
que os mapas de deciso da combinao apresentaram, com propriedade, os municpios que
so prioritrios e no prioritrios para o dengue.

Figura 26 - Grfico da sensibilidade e especificidade da combinao dos trs mtodos de aglomerados


espaciais (estatstica Scan, mtodo Besag Newell e Getis Ord) pela regra de votao por maioria do
dengue na Paraba, no perodo de 2009 a 2011

Na tabela 1, os valores dos testes preditivos positivos e negativos para o ano de 2009
foi de 90,25% e 71,42%, respectivamente. O valor preditivo positivo foi de 90,25%, ou seja,
78

dado que o municpio prioritrio e realmente ser prioritrio, nesse caso para o dengue. Em
2009, a estatstica Kappa foi de 0,8788 (87,88%), com grau de concordncia excelente. Ele
mede a confiabilidade e a preciso do modelo. Com esses resultados, pode-se concluir que,
segundo a regra de votao por maioria, a deciso dos municpios prioritrios para o ano de
2009 foi excelente. Estes resultados podem ser mais bem visualizados em forma de mapa na
figura 12.
No ano de 2010, o valor preditivo positivo foi melhor que 2009 com 93,33%,
enquanto que o valor preditivo negativo de 2009 foi pior que o ano de 2010, com 71,42%. Em
2010, a estatstica Kappa apresentou grau de concordncia excelente com 0,9415 (94,15%).
Em 2011, o valor preditivo positivo foi melhor que os anos de 2009 e 2010 com
97,88%, e o valor preditivo negativo foi melhor no ano de 2010 com 100%. Analisando a
estatstica Kappa, em 2011, o grau de concordncia foi igual ao ano de 2009 com 87,88%.

Tabela 1 - Valores preditivos positivos, valores preditivos negativos e estatstica Kappa para o dengue
de 2009 a 2011 segundo a combinao dos trs mtodos de aglomerao espacial pela votao por
maioria

Anos VPP VPN Estatstica Kappa

2009 90,25% 71,42% 87,88%

2010 93,33% 100% 94,15%

2011 97,88% 32,35% 87,88%

5.2 RESULTADOS DO ESTUDO DE CASO 2

No estudo de caso 2 (dois), a regra de combinao foi a das redes neurais, e foram
utilizados os mesmos mtodos de aglomerados espaciais que o estudo de caso 1 (um), e os
anos pesquisados (2009, 2010 e 2011) tambm foram iguais. Neste estudo de caso, foi
discutida a combinao dos mtodos de aglomerados espaciais com os resultados dos testes
diagnsticos e a estatstica Kappa.
No ano de 2009, segundo a figura 27, que representa a combinao segundo as redes
neurais, foram identificados 32 municpios prioritrios que se encontram distribudos de
forma heterognea em todo o Estado. Comparando com o mapa do especialista (Figura 13),
dos 32 municpios considerados prioritrios na figura 26, 23 deles esto presentes na figura
79

12.
Em 2010 (Figura 28), foram identificados 39 municpios prioritrios, 7(sete)
municpios a mais se comparados com 2009. Desses 39 municpios, 29 esto presentes no
mapa do especialista em 2010 (Figura 18). Os municpios prioritrios da figura 28 esto em
maior nmero localizado nas mesorregies do Serto Paraibano, Agreste Paraibano e
Borborema. Na mesorregio da Mata Paraibana, apenas um municpio foi considerado
prioritrio para o dengue em 2010.
O ano de 2011 (Figura 29) foi o perodo com o maior nmero de regies com uma
mdia de 49 municpios prioritrios, segundo a regra das redes neurais. Estes municpios se
encontram distribudos de forma heterognea em todo o Estado da Paraba, porm uma
concentrao maior de conglomerados espaciais nas mesorregies do Serto Paraibano e
Borborema.

Figura 27 - Mapa de deciso da combinao dos trs mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2009 pela regra das redes neurais
80

Figura 28 - Mapa de deciso da combinao dos trs mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2010 pela regra das redes neurais

Figura 29 - Mapa de deciso da combinao dos trs mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2011 pela regra das redes neurais
81

De acordo com a figura 30, tm-se as matrizes de classificao dos anos de 2009 a
2011, segundo a regra das redes neurais. A matriz Q representa o ano de 2009, com 209
municpios classificadores corretamente, e 14 classificados incorretamente. Em 2010,
representado pela matriz. E o nmero de municpios classificados de forma correta foi de 212,
trs nmeros acima se comparado com a matriz Q, que representa o ano de 2009. No ano de
2011 (Matriz F), foi o perodo com o menor nmero de municpios classificados
corretamente, com apenas 201, e o maior com classificaes incorretas 22 municpios.
Comparando as matrizes de classificao do estudo de caso 1, que representa os
mtodos de aglomerados espaciais combinados pela regra de votao por maioria. Em todos
os anos de 2009 a 2011, a combinao, segundo as redes neurais, produziu melhores
resultados do que a regra de votao por maioria. O ano de 2010 foi o perodo com maior
nmero de municpios classificados corretamente, tanto para o estudo de caso 1, quanto para o
estudo de caso 2.

Figura 30 - Matrizes de Classificao para os anos de 2009, 2010 e 2011,


segundo as redes neurais

De acordo com a figura 31, os resultados dos testes diagnsticos para a sensibilidade
foram superiores especificidade para todos os anos. Em 2009, o percentual da sensibilidade
foi de 97,38%; e da especificidade 71,87%. O resultado da sensibilidade mostra que 97,38%
dos municpios so prioritrios; quando, de fato, ele prioritrio, gira em torno de quase
100%. Em 2010, a sensibilidade ficou em 100%, ou seja, todas as regies da Paraba que so
foram diagnosticadas como prioritrias; de fato, todas so prioritrias. Para 2011, a
sensibilidade ficou em 97,70% melhor que o ano de 2009.
Em relao especificidade, o ano de 2009 apresentou um melhor resultado com
71,87%, bem prximo ao ano de 2010 com 71,79%, ou seja, mostra que, de fato, quando um
municpio no prioritrio, ele realmente no prioritrio, segundo a regra das redes neurais.
Em 2011, a especificidade foi de 63,25%, a menor se comparados com os anos de 2009 a
2010.
82

Figura 31 - Grfico da sensibilidade e especificidade da combinao pela


redes neurais do dengue na Paraba no perodo de 2009 a 2011

Na tabela 2, tm-se os valores preditivos positivos e negativos e o estatstica Kappa,


segundo a regra das redes neurais, para os anos de 2009 a 2011. Para os valores dos preditivos
positivos, os melhores percentuais foram no ano de 2009, seguido de 2010 e 2011. Em 2009,
o VPP foi de 95,38%, em 2010 de 93,87% e 2011 de 90,42%. Em relao ao VPN, o ano de
2010 representou 100%, ou seja, quando um municpio dito no prioritrio, ele realmente
no prioritrio acertando em 100%.
Os resultados da estatstica Kappa mostraram que, em todos os anos, o percentual de
acerto foi acima de 90,00%. Isso mostra que o grau de concordncia, em todos os anos, foi
quase perfeita. Por exemplo, em 2009, o percentual foi de 93,79%; em 2010 de 95,05%; e
2011 de 90,12%. Com isso, pode-se concluir que a combinao dos mtodos de aglomerados
espaciais para todo o perodo estudado, segundo a regra das redes neurais, apresentaram bons
resultados, para a identificao dos municpios prioritrios e no prioritrios para o dengue na
Paraba.
83

Tabela 2 - Valores preditivos positivos, valores preditivos negativos e estatstica Kappa para o dengue
de 2009 a 2011 segundo a combinao dos mtodos de aglomerao espacial pelas redes neurais

Anos VPP VPN Estatstica Kappa

2009 95,38% 82,14% 93,79%

2010 93,87% 100% 95,05%

2011 90,42% 88,57% 90,12%

5.3 RESULTADOS DO ESTUDO DE CASO 3

No estudo de caso 3 (trs) foram acrescentados dois mtodos de aglomerados espaciais


(estatstica M e mtodo Tango). No mapa de deciso das combinaes, observa-se que ele
um mapa detalhado, identificando a quantidade de votos que cada municpio (geo-objeto)
recebeu.
Nesse caso, segundo a figura 32, que representa o mapa da estatstica M para o ano de
2009 na Paraba, foram identificados 26 conglomerados. Destes, 5 (cinco) no esto presentes
no mapa do especialista de 2009. A figura 32 representa o mapa de deciso da combinao,
o mapa de votao. Nesse sentido, a figura 32 representa a quantidade de votos que cada
municpio teve para o dengue. Com isso, todos os municpios que apresentaram 5 (cinco)
votos esto presentes como conglomerados na figura 32, e nenhum municpio identificado
como conglomerado apresentou 0 votos.
No mapa do mtodo Tango, para o ano de 2009 (Figura 33), foram identificados 20
conglomerados espaciais significativos, 6 (seis) a menos se comparado com a figura 32. A
maioria dos conglomerados esto concentrados na mesorregio do Serto Paraibano e as
menores concentraes nas mesorregies da Borborema e do Litoral Paraibano.
A figura 34 identificou que a maioria dos municpios paraibanos apresentaram apenas
1(um) voto, ou seja, ele esteve presente apenas em um dos cinco mtodos de aglomerados
espaciais. Os municpios que apresentaram a menor quantidade de votos foram com 3 e 5
votos. A mesorregio do Serto Paraibano apresentou a maior concentrao de municpios que
receberam 4 votos.
84

Figura 32 - Mapa dos valores-p da Estatstica M do dengue na Paraba no ano de 2009

Figura 33 - Mapa dos valores-p do Mtodo Tango do dengue na Paraba no ano de 2009
85

Figura 34 - Mapa de deciso da combinao de todos os mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2009

A figura 35 apresentou um nmero fora da realidade de conglomerados espaciais,


comparados com os outros mtodos, sendo eles distribudos em todas as mesorregies. Estes
resultados podem ter sido resultantes do nmero de casos identificados para esse perodo, com
8.678 casos notificados. Mas para saber mais detalhes, necessrio realizar pesquisas acerca
desses resultados.
Na figura 36, segundo o mtodo do Tango para o mesmo ano, o nmero de
conglomerados bem menor do que a figura 34 que representa o mtodo da Estatstica M. A
concentrao desses conglomerados se d nas mesorregies do Serto e da Borborema. O
Litoral Paraibano apresentou apenas um municpio como conglomerado espacial.
Segundo a figura 37, foram identificados 14 municpios que receberam 5 (cinco)
votos, ou seja, municpios altamente prioritrios para o dengue e uma mdia de 22 municpios
com 0 votos. A maioria dos municpios ficaram com 1 (um) ou 2 (dois) votos. Em
comparao com a figura 33, que representa o ano de 2009, observa-se um nmero menor de
regies que apresentam 4 (quatro) e 5(cinco) votos, ou seja, o nmero de conglomerados
espaciais significativos menor se comparados com os outros anos. Porm, no ano de 2011
(Figura 39), observou-se apenas um municpio com 5 (cinco) votos.
86

Figura 35 - Mapa dos valores-p da Estatstica M do dengue na Paraba no ano de 2010

Figura 36 - Mapa do Mtodo Tango do dengue na Paraba no ano de 2010


87

Figura 37 - Mapa de deciso da combinao de todos os mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2010

Na figura 38, foram identificados 126 conglomerados espaciais significativos para o


ano de 2011, segundo a estatstica M. Os conglomerados esto distribudos em todas as
mesorregies do Estado da Paraba. No ano de 2010, foram 121 conglomerados espaciais,
segundo a Figura 34.
No mapa dos valores-p do mtodo Tango, para o ano de 2011 (Figura 39), o nmero de
municpios que so conglomerados caiu para 45. Todos eles esto mais concentrados na
mesorregio do Serto Paraibano, e em menor concentrao na mesorregio do Litoral. O
nico municpio que possui 5 (cinco) votos tambm encontra-se presentes na figura 38, como
tambm na figura 38.
O mapa de deciso da combinao oriundo do mapa de votao, por maioria do ano de
2011, est representado pela figura 39. Nele, observa-se uma distribuio maior de municpios
com 1 (um) e 2 (um) votos, e 11 municpios com 4 (quatro) votos. Analisando sob o ponto de
vista das mesorregies, as mesorregies do Agreste e do Litoral apresentaram as maiores
concentraes de municpios com 2 (dois) e 4 (quatro) votos.
88

Figura 38 - Mapa dos valores-p da Estatstica M do dengue na Paraba no ano de 2011

Figura 39 - Mapa do Mtodo Tango do dengue na Paraba no ano de 2011


89

Figura 40 - Mapa de deciso da combinao de todos os mtodos de aglomerados


espaciais do dengue na Paraba no ano de 2011

Na figura 41 tem-se as matrizes de classificao W, H e I, em que observou-se o


nmero de municpios classificados correta e incorretamente. Na diagonal principal, so as
classificaes corretas; e na diagonal secundria, as classificaes incorretas. Na matriz W (no
ano de 2009), segundo a regra de votao por maioria, foram combinados os cinco mtodos
de aglomerados espaciais, diferentemente do estudo de caso 1 (um) em que foram utilizados
trs mtodos; foram constatados 209 municpios classificados corretamente, dos 223
estudados. Na matriz H, segundo o ano de 2010, foram classificados 204 municpios de forma
correta e 16 de forma incorreta. Em 2011, foram classificados 208 municpios corretamente, e
apenas 15 incorretamente. O ano com maior nmero de municpios classificados de forma
correta foi o ano de 2009 (n=209), e o ano de 2010 apresentou o maior nmero de municpios
classificados de forma incorreta (n=16).

Figura 41 - Matriz de Classificao para os anos de 2009, 2010 e 2011, segundo o mapa de votao
para todos os mtodos de aglomerados espaciais

De acordo com a figura 42, foi observado o grfico da sensibilidade e especificidade,


segundo o mapa de votao, no perodo de 2009 a 2011. O ano de 2009 apresentou
90

sensibilidade de 95,47% e especificidade de 79,16%. Em 2010, a sensibilidade chegou a


100% igual ao mesmo perodo; segundo a regra das redes neurais, a especificidade foi de
63,63%. A sensibilidade em 2011 foi de 96,25%, e especificidade de 77,77%.
Comparando a figura 31 com a figura 42, ambos no ano de 2010, estas apresentaram
sensibilidade em 100%. Na figura 31, o ano de 2009 apresentou o menor percentual para a
sensibilidade com 95,47%, segundo a regra das redes neurais. Analisando a especificidade no
ano de 2009, segundo a figura 30, foi observado que o maior percentual foi de 79,16% e o
menor tambm em 2009, com 63,26%.

Figura 42 - Grfico da sensibilidade e especificidade da combinao de todos os mtodos de


aglomerados espaciais do dengue na Paraba, no perodo de 2009 a 2011

De acordo com os resultados da tabela 3, no ano de 2009, observa-se o melhor


resultado do valor preditivo positivo com 97,43%; e do valor preditivo negativo, em 2010,
com 100%. Os menores resultados dos VPP foi em 2010, com 91,79%; e em 2009, o VPN foi
de 67,85%. Comparando com os outros resultados dos estudos de caso 1(um) e 2 (dois), os
valores do VPN foram iguais a 100% para o ano de 2010. Os resultados se mostraram bons,
pois identificou que o processo de combinao se deu de forma satisfatria.
Em relao aos resultados do estatstica Kappa, os melhores graus de concordncia
foram no ano de 2009, com 93,79; seguido de 2011, com 93,26%; e 2010, com 92,81%. Em
todos os anos, o grau de concordncia foi excelente. Isso mostra que a preciso dos modelos
de combinao satisfez as expectativas em relao combinao dos mtodos de aglomerados
espaciais.
91

Tabela 3 - Valores preditivos positivos, valores preditivos negativos e estatstica Kappa


para o dengue de 2009 a 2011 segundo a combinao de todos os mtodos
de aglomerao espacial pelo mapa de votao

Anos VPP VPN Estatstica Kappa

2009 97,43% 67,85% 93,79%

2010 91,79% 100% 92,81%

2011 95,74% 80% 93,26%


92

Educao transforma pessoas. Pessoas


transformam o mundo.
(Paulo Freire)
93

6 CONCLUSO

Neste trabalho foi proposta uma nova forma de arquitetura para a combinao dos
mtodos de aglomerados espaciais. Esta arquitetura indita, pois o que foi encontrado na
literatura cientfica abordam a combinao a partir de classificao de imagens e classificao
de dados. Esta nova arquitetura permite a combinao de um nmero qualquer de mtodos de
aglomerados espaciais e foi formalizada matematicamente.
Para demonstrar a validade da nova arquitetura, foram realizados trs estudos de casos,
no estado da Paraba no perodo de 2009 a 2011. Sua flexibilidade permite a utilizao de
qualquer regra de combinao e a ttulo de exemplo foram aplicados as regra de votao por
maioria e redes neurais. Igualmente, permite a utilizao de vrios mtodos aglomerao
espacial simultaneamente e nos estudos de casos foram utilizados de 3 a 5 mtodos. Foram
realizados a estatstica Kappa e medidas de validade e de associao que mostraram que os
resultados obtidos so satisfatrios nos trs estudos de caso.
Uma outra contribuio deste trabalho a proposio de um novo mapa de votao
mais detalhado. Neste mapa so identificados a quantidade de votos que cada geo-objeto
recebe durante o processo de votao. Essas informaes so teis para um melhor
entedimento do proceeso e auxilia a tomada de deciso sobre os geo-objeto.
Contribuies advindas da aplicao da nova metodologia sobre os dados reais
utilizados. Do ponto de vista da anlise espacial, foi possvel identificar os geo-objetos
(municpios) e suas regies (mesorregies ) como prioritrias e no prioritrias para o
combate ao dengue em todo o estado paraibano. A mesorregio do Serto Paraibano
apresentou as maiores concentraes de aglomerados do dengue no estado e a mesorregio do
Litoral/Mata Paraibana as menores concentraes de aglomerados. Foram tambm
identificados os municpios com os maiores e menores risco relativo do dengue. O municpio
de Monteiro apresentou alto risco relativo e o municpio de Baa da Traio apresentou risco 0
(zero) em todos os anos estudados. Anlise similar pode ser realizada em qualquer outra
regio do pas ou do mundo e tambm sobre outros agravos, como tuberculose, sndrome da
imunodeficincia adquirida (aids), causas externas, etc.
Com relao epidemiologia, os resultados das medidas de validao e da estatstica
Kappa, comprovaram que a combinao dos mtodos de aglomerados espaciais apresentaram
resultados com grau de concordncia quase perfeito para todos os anos. A identificao de
regies prioritrias e no-prioritrias, oriundas da combinao dos mtodos de aglomerao
espacial, pode auxiliar os gestores pblicos numa anlise mais aprofundada dos municpios
94

que realmente devem ter preferncias aos programas especficos no combate dessa doena.
Com isso, possvel ter uma grande otimizao dos recursos, em funo da prioridade das
regies. No Brasil foram notificados aproximadamente 2 milhes de casos no ano de 2013,
sendo considerado o maior surto da doena no Brasil. Esta doena tem se tornado um
problema de sade plbica.
95

PRODUO BIBLIOGRFICA RELACIONADA A ESTE


TRABALHO:

Trabalhos completos publicados em anais de congressos:


1.HOLMES, D. C. S. C.; MORAES, R. M. Mtodos de combinao de classificadores.
XII Safety, Health and Environment World Congress (2012 SHEWC), July 22-25, So
Paulo, 2012.
2. HOLMES, D. C. S. C.; MORAES, R. M.; VIANNA, R. P. T. A rule for combination
of spatial clustering methods. The Seventh International Conferences on Pervasive
Patterns and Applications (PATTERNS 2015), March 22-27, France, 2015.

Trabalhos submetidos a revistas cientficas:


1. HOLMES, D. C. S. C.; MELO, J. C. S.; VIANNA, R. P. T.; MORAES, R. M.
Anlise Espacial do dengue por mesorregies do estado da Paraba usando o mtodo Besag
Newell no perodo de 2010 a 2013. Revista Hygeia.
2. HOLMES, D. C. S. C.; MELO, J. C. S.; VIANNA, R. P. T.; MORAES, R. M.
Combination of Spatial Clustering Methods Based on Majority Voting. International
Journal of Geographical Information Science, 2015.
96

REFERNCIAS

ABRAMS, A. M.; KLEINMAN, K.; Kulldorff. M. Gumbel based p-value approxima-tions


for spatial scan statistics, International Journal of Health Geographics, v.9, December, p.1-
12, 2010.

ALEXANDRE, L. A.; CAMPILHO, A. C.; KAMEL, M. On Combining Classifiers Using


Sum and Product Rules. Pattern Recognition Letters,v.22, p.1238-1289, 2001.

ANSELIN, L. Spatial data analysis with GIS: an introduction to application in the social
sciences. National Center for Geographic Information end Anlisis. University of California -
Santa Barbara. August, 1992.

AKSELA, M.; LAAKSONEN, J. Adaptive combination of adaptive classifiers for


handwritten character recognition, Pattern Recognition, v.28, p.136-143, 2007.

ARAJO, J. R.; FERREIRA, E. F.; ABREU, M. H. N. G. Reviso sistemtica sobre estudos


de espacializao da dengue no Brasil. Revista Brasileira Epidemiologia, v.11, n.4, p.696-
708, 2008.

BESAG, J.; NEWELL, J. The detection of clusters in rare diseases. Journal of the Royal
Statistical Society, v.154, p.143-155, 1991.

BISHOP, C. M. Neural Networks for Pattern Recognition, Oxford, New York, 1995.

BISHOP, C. M. Pattern Recognition and Machine Learning. Spring, London, 2006.

BONITA, R.; BEAGLEHOLE, R.; KJELLSTROM, T. Epidemiologia Bsica. 2ed,editora


Santos, So Paulo, Santos, 2010.

BRATT, S.; GETHING, P. W.; BRADY, O. J.; MESSINA, J. P.; FARLOW, A. W.; MOYES,
C. L.; DRAKE, J. M.; BROWNSTEIN, J. S.; HOEN, A. G.; SANKOH, O.; MYERS, M. F;
GEORGE, D. B.; JAENISCH, T.; WILLIAM WINT, G. R.; SIMMONS, C.P.; SCOTT, T. W.;
FARRAR, J. J.; HAY, S. I. The global distribution and burden of dengue. Nature, v. 496, p.
504-507, 2013.

BREIMAN, L. Bagging Predictors, Machine Learning, v.26, n.2, p.123-140, 1996.

BREUKELEN, M. V.; DUIN, R. P. W.; TAX, D. M. J.; HARTOG, J. E. D. Handwritten


Digit Recognition by Combined Classifiers. v.34, n.4, p.381-386, 1998.

BREVE, F.A.; PONTI, M. JR. P.; MASCARENHAS, N. D. A. Combining Methods to


Neural Network-Based Classifiers. Proceding of the XVIII Brazilian Symposium on
Computer Graphics and Image Processing, 2005.

COHEN, J. A. Coefficient of Agreement for Nominal Scales. Educational and


Psychological Measurement. v.20, n.1, p.37-46, 1960.

COSTA, M. A.; SCHRERRER, L. R.; ASSUNO, R. M. Deteco de conglomerados


97

espaciais com geometria arbitrria. Informtica Pblica, v.8, p.2334, 2006.

COSTA, M. A.; ASSUNO, R. M. A fair comparison between the spatial scan and the
Besag-Newell Disease Clustering Tests. Environmental and Ecological Statistics, v.12, p.
301-319, 2005.

COULSTON, J. W.; RITTERS, K. H. Geographic analysis of forest health indicators using


spatial scan statistics. Environmental Management, v.31, n.6, p.764-773, 2003.

CONGALTON, R.G. A Review of Assessing the Accuracy of Classifications of Remotely


Sensed Data, Remote Sensing Environment, v.37, p.35-46, 1991.

DAMOULAS, T.; GIROLAMI, A. M. Combining Feature Spaces for Classification.


Pattern Recognition, v. 42, p.2671-2683, 2009.

DWASS, M. Modified Randomization Tests for Nonparametric Hypotheses. The Annals


of Mathematical Statistics, v.28, n.6, p.181-187, 1957.

DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification, 2nd ed John Wiley &
Sons, NY, 2001.

DUIN, R.P.W.; TAX, D.M.J. Experiments with Classifier Combining Rules. Pattern
Recognition Group, LNCS 1857, p.16-29. 2000.

ENGELBRECHT, A. P. Computational Intelligence: an Introduction. 2nd ed, John Wiley


& Sons, Ltd, 2007.

EUGENIO, B. D.; GLASS, M. The Kappa Statistic: A Second Look. Computational


Linguistics, v.30, n.1, 2004.

FLEISS, J. L.; COHEN, J. The equivalence of weighted kappa and the intraclass
correlation coefficient as measures of reliability. Educational and Psychological
Measurement, v.33, p.613-619, 1973.

FERREIRA, J. A.; MORAES, R. M. Anlise do Padro Espacial do Dengue em 2011 no


Estado da Paraba. XIII Safety, Health and Environment World Congress (SHEWC 2013).
7-10, Julho, Porto, Portugal, p.216-220, 2013.

FERREIRA, J. A.; FREIRE, D. T. G.; MORAES, R. M. Deteco de conglomerados


espaciais de tuberculose no estado da Paraba utilizando o mtodo Besag e Newell. I
Simpsio de Matemtica e Estatstica do Delta, Parnaiba-PI, 2012.

FREUND, Y.; SCHAPIRE, R. E. A Decision-Theoretic Generalization of On-Line


Learning and an Application to Boosting. Journal of computer and system sciences 55,
p.119-139, 1997.

GOUJON-BELLEC. S.; DERMOURY, C.; GUYOT-GOUBIN, A.; HMON, D.; CLAVEL, J.


Detection of clusters of rare disease over a large territory: performance of cluster
detection methods. International International Journal of Health Geographics, p. 2-12, 2011.
98

GRUBESIC, T. H.; PRIDEMORE, W. A. Alcohol outlets and clusters of violence.


International Journal of Health Geographics. p.1-12, 2011.

HAYKIN, S. Redes Neurais Princpios e Prtica. 2 Edio, Traduo: Dr. Paulo Martins
Engel, Editora Artmed Editora S.A.

HELBICH, M., LEITNER, M.; KAPUSTA, N. D. Geospatial examination of lithium in


drinking water and suicide mortality. International Journal of Health Geographics, p.11-19,
2012.

HO, T. K. Random Decision Forests. Third Intl Conf. Document Analysis and Recognition,
Montreal, p.278-282, 1995.

HO, T.K.; HULL, J.J.; SRIHARI, S.N. Combination of Structural Classifiers. In Proc. 1990
IAPR Workshop on Syntactic and Structural Pattern Recognition, p.123-137, 1990.

HOLMES, D. C. S. C.; MORAES, R. M.; VIANNA, R. P. T. A Rule for Combination of


Spatial Clustering Methods. The Seventh International Conferences on Pervasive Patterns
and Applications (PATTERNS 2015). 22-27 Maro, Nice, Frana, p. 55-59, 2015.

HONORATO, T.; LAPA, P. P. A.; SALES, C. M. M.; SANTOS, B. R.; S, R. T.;


BERTOLDE, A. I.; MACIEL, E. L. N. Anlise espacial do risco de dengue no Esprito
Santos, Brasil, 2010: uso de modelagem completamente Bayesiana. Revista Brasileira
Epidemiologia Suplementar. p. 150-159, 2014.

HULL, J.J.; COMMIKE, A.; HO, T.K. Multiple Algorithms for Handwritten Character
Recognition. In Frontiers in Handwriting Recognition, Ed. Montreal: Concordia University,
p.117-129, 1990.

JACQUEZ, G. M. The Handbook of Geographic Information Science. Black-well


Publishing Ltd, 2008.

JAIN, A, K.; DUIN, R. P. W.; MAO, J. Statistical Pattern Recognition: A Review. IEEE
Transaction On Pattern Analysis and Machine Intelligence, v.22, n.1, 2000.

KITTLER, J.; HATEF, M.; DUIN, R. P. W.; MATAS, J. On Combining Classifiers. IEEE
Transaction on Pattern Analysis and Machine Intelligence. v.20, n.3, p.226-239, 1998a.

KITTLER, J. Combining Classifiers: A Theoretical Framework. Pattern Analysis &


Applic, v.1, p.18-27, 1998b.

KOHAVI, R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and


Model Selection. Proc. of the 14th Int. Joint Conf. on A. I, v.2, p.1137-1143, 1995.

KULLDORFF, M. A spatial scan statistic. Commun.Statist-Theory Meth. v.26, n.6, p.1481-


1496, 1997.

KULLDORFF, M. Prospective time-periodic geographical disease surveillance using a


scan statistic. Journal of the Royal Statistical Society, A164, p.61-72, 2001.
99

KULLDORFF, M; NAGARWALLA, N. Spatial disease clusters: detection and inference.


Statistics in Medicine,v.14, p.799-810,1995.

KUNCHEVA, L. I. Combining Pattern Classifiers: Methods and Algorithms. Wiley-


Interscience, 2004.

LAN, Y. D.; GAO, L. A new model combining multiple classifiers based on neural
network. Fourth International Conference on Emerging Intelligent Data and Web
Tecnologies, pp. 154-159, 2013.

LUCENA, S. E. F.; MORAES, R. M. Anlise do Desempenho dos Mtodos Scan e Besag e


Newell para Identificao de Conglomerados Espaciais do Dengue no Municpio de Joo
Pessoa entre os Meses de Janeiro de 2004 e Dezembro de 2005. Boletim de Cincias
Geodsicas, v.15, n.4, p.544-561, 2009.

LUCENA, K. D. T.; SILVA, A. T. M. C.; MORAES, R. M.; SILVA, C. C.; BEZERRA, I, M.


P. Anlise espacial da violncia domstica contra a mulher entre os anos de 2002 e 2005
em Joo Pessoa, Paraba, Brasil. Caderno Sade Pblica, v.28, n.6, p.1111-1121, 2012.

MANDAL, R.; ST-HILAIRE, S.; KIE, J. G.; DERRYBERRY, D. Spatial trends of breast
and prostate cancers in the United States between 2000 and 2005. International Journal of
Health Geographics, p.1-10, 2009.

McGINN, T.; WYER, P. C.; NEWMAN, T. B.; KEITZ, S.; LEIPZIG, R.; GUYATT, G. Tips
for learners of evidence-based medicine: 3. Measures of observer variability (kappa
statistic). Canadian Medical Association or its licensors.vol.171, pp.1369-1373, 2004.

MEDRONHO, R. A.; BLOCH, K. V.; LUIZ, R. R.; WERNECK, G. L. Epidemiologia. 2ed,


Atheneu, 2009.

MINAMISAVA, et al. Spatial conglomerados of violent deaths in a newly urbanized


region of Brazil: highlighting the social disparities. International Journal of Health
Geographics, v.8, n.66, p.1-10, 2009.

MORAES, R. M.; MACHADO, L. S. A New Class of Assessment Methodologies in


Medical Training Based on Combining Classifiers, in Proceedings of XII Safety, Health
and Environment World Congress (SHEWC 2012), 22-25 July, p. 91-95, 2012.

MORAES, R. M.; NOGUEIRA, J. A.; SOUSA, A. C. A. A New Architecture for a Spatio-


Temporal Decision Support System for Epidemiological Purposes, in Proceedings of the
11th International FLINS Conference on Decision Making and Soft Computing (FLINS2014),
17-20 Agosto, Brazil, p. 17-23, 2014.

NADAL, C.; LEGAULT, R.; SUEN, C.Y. Complementary Algorithms for the Recognition
of Totally Unconstrained Handwritten Numerals. In Proc. 10th Int. Conf. on Pattern
Recognition, v.1, p.434-449, 1990.

NEIL, D. B.;MOORE, A. W.; SABHNANI, M. Morbidity and mortality weekly report.


Detecting Elongated Disease Clusters, v.545, p.197, 2005.
100

PRAMERO, P.; CARVALHO, A. Recognition of Vehicles Using Combination of


Classifiers. Proceedings of the IEEE World Congress on Computational Intelligence,
WCCI'98, Anchorage, USA, 1998.

PIETRI, D. E. D.; GARCIA, S.; RICO, O. Modelos geo-espaciale para la vigilancia local
de la salud. Revista Panamericana de Salud Pblica, v. 23, n. 6, p. 394-402, 2008.

QUEIROGA, R. P. F.; S, L. D.; NOGUEIRA, J. A.; LIMA, E. R. V.; SILVA, A. C. O.;


PINHEIRO, P. G. O. D.; BRAGA, J. U. Distribuio espacial da tuberculose e a relao
com condies de vida na rea urbana do municpio de Campina Grande - 2004 a 2007.
Revista Brasileira de Epidemiologia, v. 15, n. 1, p.222-232, 2012.

RABINER, L. R.; JUANG, B. H. Introduction to hidden Markov models. IEEE ASSP


Mag., v.3, n.1, p.4-16, 1986.
RESENDES, A. P. C.; SILVEIRA, N. A. P. R.; SABROZA, P. C.; SANTOS, R. S.
Determinao de reas prioritrias para aes de controle da dengue. Revista Sade
Pblica. v. 44, n. 2, p.274-282, 2010.

ROGERSON, P. A. Spatial monitoring of geographic patterns: an aplication to crime


analysis. Computes, Environment and Urban Systems, v.25, p. 539-556, 2001.

ROGERSON, P. A. A Statistical Method for the Detection of Geographic Clustering.


Geographical Analysis, v.33, n.3, 2001b.

ROGERSON, P. A. The Detection of Clusters Using a Spatial Version of the Chi-Square


Goodness-of-Fit Statistic. Geographical, v.31, n.1, Jan. 1999.

ROGERSON, P. A. Surveillance systems for monitoring the development of spatial


patterns. Statistics in Medicine, v.16, p.2081-2093, 1997.

ROTHMAN, K. J. Modern Epidemiology. Boston: Little, Brown, p.299-304, 1986.

ROUQUAYROL, M. Z.; FILHO, N. A. Epidemiologia e Sade. 6 ed. Rio de Janeiro:


MEDSI, 2003.

S, L. R.; MELO, J. C. S.; VIANNA, R. P. T.; MORAES, R. M. Influncia do ndice de


Desenvolvimento Humano na Distribuio Espacial da Dengue. In: XVIII Congresso
Brasileiro dos Conselhos de Enfermagem. Joo Pessoa, PB, 15 a 18 de setembro, 2015.

SUEN, C. Y.; NADAL, C.T. A.; MAI, R.L; LAM, L. Recognition of totally unconstrained
handwritten numerals based on the concept of multiple experts. Frowiers in Handwriting
Recognition, in Proc. Int. Workshop on Frontiers in Handwriting Recognition, Montreal,
Canada, Apr, v.2, n.3, p.131-143, 1990.

TANGO, T. A class of tests for detecting 'general' and 'focused' clustering of rare
diseases. Statistics in Medicine, v.14, p.2323-2334, 1995.

TAX, D. M. J.; BREUKELEN, M, V.; DUIN, R. P. W.; KITTLER, J. Combining Multiple


Classifiers by Averaging or by Multiplying. Pattern Recognition, v.33, p.1475-1485, 2000.
101

TONG, X. G. L. Learning Opponents Indifference Curve in Multi-issue Negotiation


Combining Rule Based Reasoning with Bayesian Classifier, in Proceedings of 6th
International Conference on Natural Computation, vol. 6, pp. 2916-2920, 2010.

XU, L.; KRZYZAK, A.; SUEN, C.Y. Methods of Combining Multiple Classifiers and their
Applications to Handwriting Recognition. IEEE Transcation on Systems Man and
Cybernetics, p.418-435, 1992.

XU, L.; KRZYZAK, A. Associative Switch for Combining Multiple Classifiers. Journal of
Artificial Neural Networks, v.1, n.1, p.77-100, 1994.

YU, K.; JIANG, X.; BUNKE, H. Lipriading: A classifier combination approach. Pattern
Recognition Letters, v.18, p.1421-1426, p.1997.

ZHOU, Z. H. Ensemble Methods: Foundations and Algorithms. CRC Press, Boca Raton,
2012.
102

Apndice A - Mapa do Risco Relativo do dengue na Paraba no ano de 2009

Mapa do Risco Relativo do dengue na Paraba no ano de 2010


103

Mapa do Risco Relativo do dengue na Paraba no ano de 2012


104

Anexo 1 - Parecer do Comit de tica

Potrebbero piacerti anche