Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Belo Horizonte - MG
Agosto / 2011
Tese apresentada ao Departamento de Estatstica do Instituto de Cincias Exatas da Universidade Federal de Minas Gerais, como requisito
parcial para obteno do ttulo de Doutor em
Estatstica.
Orientador:
Belo Horizonte MG
Agosto / 2011
ii
Agradecimentos
nanceiro.
iii
Resumo
Nesta tese de doutorado, ns desenvolvemos novos mtodos baseados em uma abordagem
adaptativa para deteco e monitoramento estatstico de mudanas no padro espao-temporal de
um processo estocstico. Essencialmente desenvolvemos: Razo de Verossimilhana Adaptativa,
Fator de Bayes Adaptativo e processo a posterioi adaptativo. O Foco das aplicaes a deteco
de cluster emergentes no espao-tempo, onde a classe dos possveis candidadatos a cluster
excessivamente grande o que pode dicultar a performance de qualquer mtodo desenvolvido com
este propsito. Nossos resultados mostraram que a abordagem adaptativa melhora os mtodos
em dois aspectos. Primeiro aumenta a velocidade na deteco e segundo diminui o espao dos
candidatos a cluster tornando o algoritmo mais eciente. A vantagem da abordagem adaptativa
no espao dos cluster que a cada tempo precisamos avaliar um nmero pequeno de candidatos
e ainda assim controlamos a taxa de falsos alarmes. Os mtodos propostos so aplicados a dados
reais e vrios estudos com dados simulados tambm so conduzidos. Os resultados destes estudos
sugerem que a abordagem adaptativa bastante eciente para solucionar o problema de deteco
de cluster emergentes.
Resumo
iv
Abstract
New adaptive based methods to the detection and statistical monitoring of changes in the
spatial-temporal pattern of a stochastic process are developed in this thesis. Namely, this study
focuses on the following methodologies: Adaptive Likelihood Ratio, Adaptive Bayes Factor,
and Adaptive Posterior Process. The applications aim to detect emerging space-time clusters,
where the collection of possible cluster candidates is excessively large, which could result in a
very inecient method. Results are presented, showing that the adaptive approach improves the
performance in two aspects: rst, decreasing the computation to detect emerging clusters at each
time, and second, reducing the size of the candidate clusters conguration space. Using the
adaptive approach, the evaluation of only a relatively small number of candidates is necessary.
Additionally, the false alarm rate can be controlled. Real data and simulated data are used
to demonstrate the usefulness and the practicality of the methods. Those results conrm the
theoretical advantages of the proposed methodologies to detect emerging clusters.
vi
Sumrio
Lista de Figuras
p. x
Lista de Tabelas
p. xii
1 Introduo
p. 1
p. 1
p. 4
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 4
p. 5
p. 6
p. 6
2.1.1
p. 7
2.1.2
p. 8
2.1.3
p. 9
2.1.4
p. 9
2.1.5
Mtodo Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 11
2.2.2
2.2.3
2.2.4
Mtodos Adaptativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 16
2.2.5
Mtodo Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17
Sumrio
vii
2.3.1
2.3.2
2.3.3
2.3.4
p. 24
3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 24
3.2 Formulao, Notao, LR e ALR para deteco de clusters no espao-tempo . . p. 24
3.2.1
3.2.2
Notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 25
3.2.3
3.2.4
3.2.5
3.2.6
3.3 Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 33
3.4 Extenses para abordagem Adaptativa no espao dos clusters . . . . . . . . . . p. 37
3.5 Estudo com dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40
3.5.1
3.5.2
3.6 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43
p. 45
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
4.2 Anlise Sequencial de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 45
4.2.1
4.2.2
Sumrio
viii
4.3.2
4.3.3
Modelo Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 52
4.4.2
Modelo Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54
4.7.2
Dados Simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68
4.9.2
4.10 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 73
p. 75
5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 75
5.2 Construo hierrquica do modelo . . . . . . . . . . . . . . . . . . . . . . . . . p. 75
5.3 Distribuies a posteriori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 77
5.4 Tempo de alarme baseado no processo a posteriori . . . . . . . . . . . . . . . . p. 80
5.5 Deteco de cluster emergente usando processo a posteriori adaptativo . . . . . p. 84
5.6 Escolha da distribuio a priori para regio e ponto de mudana . . . . . . . . . p. 85
5.7 Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 87
5.7.1
5.7.2
5.7.3
Sumrio
ix
Dados simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 95
5.8.2
5.9 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 97
6 Concluso
Referncias Bibliogrcas
p. 99
p. 101
Lista de Figuras
2.1 Exemplo visual do uso do mtodo GAM mostrando clusters de reas por emaranhados de crculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
p. 8
zonas(em azul), segundo o ms, nas cidades: Manaus(em verde), Humait (em
vermelho) e Itacoatiara (em preto) . . . . . . . . . . . . . . . . . . . . . . . . . p. 65
4.5 Mapa do Estado do Amazonas com os municpios espacialmente representados
pelas coordenadas de seus centrides. . . . . . . . . . . . . . . . . . . . . . . . . p. 66
Lista de Figuras
xi
4.6 Monitoramento on-line usando Fator de Bayes Sequencial Adaptativo com janela
w = 3, = 0, 05
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 68
4.7
t [15, 17]
. . . . . . . . . . . . p. 68
4.8
t [16, 18]
. . . . . . . . . . . . p. 69
xii
Lista de Tabelas
3.1
Deteco de clusters emergentes de casos de cncer da tireide em homens que ocorreram no Novo
Mxico, usando o MIX-ALR e WEIGHT-ALR nos ltimos cinco anos.
. . . . . . . . . . . . . p. 37
3.2 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e
Atraso (ADD) com diferentes valores para t,j , diferentes taxas aceitveis de
alarmes falsos () usando o GMIX e GWEIGHT-ALR. . . . . . . . . . . . . . . p. 42
4.1 Interpretao do Fator de Bayes (Kass e Raftery, 1995) . . . . . . . . . . . . . . . . p. 52
4.2 Percentual de rea de uma elipse que tambm parte de qualquer outra elipse com o
mesmo centro, forma e tamanho,porm com quantidades (#) diferentes de ngulos . . p. 59
4.3 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP)
e Atraso (ADD) com diferentes valores para , diferentes probabilidades de
alarmes falsos () usando o Fator de Bayes Adaptativo Eliptico com janela w=3. p. 72
5.1 Valores para p de acordo com o valor de w e p0 = 0.5. . . . . . . . . . . . . . . p. 91
5.2 Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP)
e Atraso (ADD) usando o processo a posteriori adaptativo com janela w=6,
diferentes valores para e duas distribuies para G0 : Weibull(2,1.414) e Uni(0,2) p. 97
1 Introduo
Assuno, 2004; Tango, 2005; Kulldor et all., 2006; Gangon and Klayton, 2007; Duczmal et
all., 2007),tm sido desenvolvidos para detectar e estimar a localizao do cluster. Estes mtodos
no levam em considerao a incerteza sobre o tamanho e localizao do cluster.
Na escala temporal, a deteco de uma mudana na taxa de ocorrncia dos eventos em um
cluster (grupo) de observaes pode ser realizada usando mtodos desenvolvidos para monitoramento de processos industriais como por exemplo o mtodo CUSUM (Page, 1954), ShiryayevRoberts (Roberts, 1966) ou mistura de razes de verossimilhanas (Pollak, 1987). Uma boa
reviso sobre estes mtodos e suas variaes pode ser vista em Lai (1995). Usualmente esses
mtodos assumem que no estado de controle do processo, existe uma taxa padro conhecida 0
de eventos, e sob a suposio de um ponto de mudana no processo, a taxa muda para 1 tambm
assumida conhecida. Na prtica essas suposies nunca so satisfeitas e uma alternativa usar
mtodos adaptativos (Lorden e Pollak, 2005; Tartakovsky, 2006) ou dinmicos (West, 1986).
Na escala espao-temporal, a deteco de cluster pode ser entendido como um problema
de deteco de regio e ponto de mudana no espao-tempo. Estatsticamente este problema
descrito da seguinte forma: Denote por S uma regio de estudo particionado em L-reas Al
contguas identicadas por um ponto sl . Onde, por exemplo, S um mapa e sl representa o
centride do polgono que delineia a rea Al . Consider sobre S o monitoramento (ou a vigilncia)
estatstico(a) de um processo estocstico X = {Xt (sl ), t = 1, 2, ... e l = 1, 2, ...L}. A cada
tempo discreto t 1 observamos um vetor L-variado Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em
que Xt (sl ) representa alguma valor observado na l-sima rea. Sejam = {sl S : sl }
um conjunto conexo de localizaes espaciais em S , Hn = {X1 , ..., Xn } o conjunto de dados
acumulados at o instante n. O objetivo da monitoramento vericar se existe algum cluster
emergente em S . O interesse detectar um cluster que comeou em um tempo desconhecido
k n e que est presente at o estgio atual n. O cluster no espao-tempo expresso em funo
emergente.
Para solucionar o problema de deteco de cluster emergente no espao-tempo alguns mtodos tm sido propostos. Kulldor(2001) usa a estatstica scan espao-tempo para monitoramento
de casos de doenas. No entanto, essa estatstica no controla adequadamente o erro tipo I, para
todas as anlises sequenciais realizadas. Rogerson(2001), props o uso de uma estatstica de
Knox local (Knox, 1963) combinada com mtodos de somas cumulativas (CUSUM) usando aproximaes pela distribuio normal para monitoramento de cluster em processos pontuais. Marshall(2007) discute vrios problemas ao se ultilizar estas aproximaes e sugere que este mtodo
no seja usado. Variantes da Estatstica Scan espao-temporal so apresentadas em Neill (2006).
Sonesson (2007) usa a estatstica CUSUM para deteco de cluster no espao-tempo em dados
de rea. Porter (2007) ultiliza verses adptativas dos mtodos CUSUM e Shiryayev-Roberts
1.3 Objetivos
Esta tese de doutorado teve como objetivo geral o estudo dos mtodos estatsticos para
deteco de clusters no espao-tempo, assim como o desenvolvimento de novos mtodos. Como
objetivos especcos tivemos:
1. Desenvolvimento de um novo mtodo estatstico baseado em estatstica bayesiana ou clssica para deteco e vigilncia de cluster no espao-tempo em dados de rea e processos
pontuais.
2. Utilizar o mtodo desenvolvido como parte de um sistema de vigilncia em alguns tipos de
eventos como, por exemplo, os casos de Hansenase no estado do Amazonas.
Com o desenvolvimento destas novas metodologias para deteco de cluster no espao-tempo,
esperamos dar as seguintes contribuies:
Estabelecer novas metodologias tcnico-cientcas para vigilncia no espao-tempo de even-
tos.
Desenvolvimento de mtodos estatsticos que ajudem e identiquem rapidamente as reas
prioritrias onde ocorram clusters de eventos para que aes preventivas sejam tomadas o
mais rpido possvel.
cluster no espao-tempo tambm discutida. No Captulo 3, Ao combinarmos algoritmos usados para deteco de clusters espaciais com tcnicas de estimao adaptativa, ns generalizamos
para detco de clusters no espao-tempo algumas funes de monitoramento baseadas na razo
de verossilhana e que antes eram usadas para monitoramento somente na escala temporal. No
Captulo 4, ns extendemos para deteco de cluster no espao-tempo com janela temporal variavvel o Fator de Bayes Sequncial. Neste caso ns impomos tambm uma estimao adaptativa
no espao dos cluster e realizamos uma varredura no espao-tempo atravs de cilindros com base
eliptica. No Captulo 5, incorporamos a incerteza sobre a localizao espacial e sobre o tempo
de mudana atravs de uma distribuio a priori para o cluster, e realizamos uma anlise a
Onde uma taxa de ocorrncia global dos eventos e N (sl ) representa o nmero total da
populao em risco habitando em Al .
Muitos mtodos para a deteco de clusters espaciais tm sido desenvolvidos com diferentes
propsitos. Uns avaliam a existncia de um cluster global, sem especicar sua localizao. Outros
determinam a localizao e avaliam a signicncia estatistica do cluster. Estes mtodos usam
tcnicas computacionalmente intensivas como permutao aleatria, Monte Carlo, etc. Os mais
usuais, entre estes mtodos, assumem que temos a disposio um mapa S de reas , cada uma
com populao de risco e um certo nmero de eventos observados. Eles utilizam janelas espaciais
que superpe conjuntos conexos, com algum formato geomtrico (crculo, quadrado, elipse), sobre
as reas de estudo e contam o nmero de eventos que ocorrem nas regies cujos os centrides
caem dentro de cada janela espacial. Um problema comum na deteco de cluster o ajuste para
mltiplas comparaes. Este problema acontece quando listados todas os conjuntos conexos que
em princpio podem representar um cluster (ou candidadto a cluster) e para cada um deles
testado se sua taxa de ocorrncia de eventos difere de forma signicativa daquela associada com
o restante do mapa. Aqueles conjuntos em que o teste fosse signicativo seriam considerados
um agregado de taxa acima (ou) abaixo do esperado. Este procedimento inadequado para esta
situao pelo seguinte fato: suponha que vrios testes so realizados com nvel de signicncia
global . Ento, vrios teste sero signicativos mesmo que a hiptese nula seja verdadeira em
todos eles. Isto ocorre porque achamo que o valor usado individualmente continua o mesmo.
Na verdade, para o conjunto de todos os testes, este nvel de signicncia ser muito maior que
o valor nominal para os testes individuais. Esta situao s vlida, quando consideramos todos
os testes simultaneamente. O resultado da prtica desse fato que muitos falsos cluster seriam
detectados por este mtodo. Vejamos, agora, alguns mtodos para deteco de cluster.
2.1.1
Para a deteco de cluster espacial, Openshaw et al. (1988) propuseram um mtodo computacionalmente intensivo com grande apelo visual chamado Geographical Analysis Machine,
abreviado por GAM. Neste mtodo, assuma que X(sl ) representa o nmero de eventos que
ocorrem na rea Al com o valor esperado, sob H0 dado por N (sl ). Associe os valores observados de cada rea aos seus centrides (centro do polgono que delineia a rea Al ) denotados por
sl . O procedimento
L
X
e Nlr =
l=1
L
X
l=1
Figura 2.1: Exemplo visual do uso do mtodo GAM mostrando clusters de reas por emaranhados de crculos
Embora cada crculo seja julgado individualmente signicativo ao nvel 0.002, um nvel de
signicncia para todos os crculos simultaneamente no conhecido. O motivo o uso de testes
simultneos no independentes que, neste caso, so devidos a comparao de um imenso nmero
de crculos sobrepostos.
2.1.2
que rea Al possui pelo menos um caso. Seja L a varivel aleatria que conta o nmero de outras
PL
l=1 X(sl )
eN=
PL
reas (ou centrides) necessrias para acumular os y primeiros casos mais prximos de sl . Seja l
e N o total da populao nessas l reas. Sob a hiptese nula (a mesma do
o valor observado de L
l
mtodo GAM), Xl o nmero de eventos nessas l reas segue uma distribuio de Poisson com
l) = 1 P (L
> l + 1) representa
valor esperado dado por Nl X/N . Agora, notando que P (L
1 menos probabilidade de as l primeiras reas possuam menos que y eventos. Ento o valor-p
para um crculo Cly centrados em sl contendo y eventos dado por,
ply = 1
y1
X
P (Xl = j) = 1
j=1
j=1
2.1.3
y1
X
(NX/N )j
j!
eNl X/N .
Cuzick e Edwars(1990) zeram uma proposta que representa uma pequena variao em
relao aos mtodos de Besag e Newel (1991). Como em Besag e Newel (1991), inicia-se xando
o nmero de eventos y . A seguir, em torno do centride de cada rea Al que possui pelo menos um
evento, traa-se um crculo que vai se expandindo por aumentarmos o seu raio at que o crculo
contenha uma populao para qual espera-se observar y eventos. Depois, verica-se quantos
eventos Xl foram de fato observados e calcula-se a estatstica
Uy =
L
X
l=1
Cuzick e Edwards (1990) derivaram as frmulas dos momentos desta estatstica sob a hiptese
nula e mostraram que ela possui uma distribuio assintoticamente normal possibilitando assim
calcular o valor-p para o teste.
2.1.4
10
para todo si S
H0 : p0 > p1 ,
para todo si
e
Observe que sob H0 a probabilidade de ocorrncia de um evento a mesma em qualquer rea.
Sejam, respectivamente, N () o nmero de indivduos e X() o nmero de eventos em , e
ainda, N e X o nmero total de indivduos e eventos na regio. A funo de verossimilhana
para o parmetro (, p0 , p1 ) dada por,
x()
L(, p0 , p1 ) = p0
xx()
(1 p0 )N ()x() p1
(1 p1 )N N ()x+x() .
RV () =
p0 >p1
sup L(, p0 , p1 )
p0 , p1 (0, 1).
p0 =p1
Ento a estatstica Scan denida como T = maxRV (), e o cluster espacial estimado =
Figura 2.2: Examplo visual do uso do mtodo de Varredura Espacial - Scan circular
11
Mtodo Bayesiano
e
j |X(s), gama(a + Xj , b + Nj ), j = 1, 2, ..., c.
onde, Xj =
PL
PL
f (X(s)|)(|)d
() exp
c
X
Sj ,
j=1
12
13
hiptese de que no houve nenhuma mudana. Quando o processo est sob controle, todos
os alarmes so falsos. A distribuio do alarme falso geralmente resumida pelo ARL0 ,
denido por
ARL0 = E0 [ ].
mudanas reais podem no ser muito bem detectadas. Da mesma forma, para valores
pequenos de ARL0 , as mudanas reais geralmente sero detectadas, mas alarmes falsos
tambm sero mais frequentes.
2. Delay (atraso): expressa a velocidade com que um mtodo detecta uma mudana no
processo. O atraso pode ser expresso de duas formas: CED (conditional expected delay) o tempo mdio de atraso at que o alarme soe dado que realmente ocorreu uma mudana
no processo, uma medida equivalente ao poder de deteco. Esta medida caracteriza
o comportamento de um processo fora de controle. uma medida pontual, depende do
ponto em que ocorreu a mudana, denido por
CED(k) = Ek [ | = k],
em que Ek o valor esperado sobre a hiptese de que ocorreu uma mudana no ponto
= k . Se possui uma distribuio de probabilidade, ento podemos considerar o atraso
( = k)P ( k)CED(k).
k=1
Existe uma extensa literatura estatstica sobre mtodos de monitoramento no tempo com
importantes aplicaes, onde o interesse a deteco rpida e, a preveno de vrios eventos
adversos ao intesse do processo em estudo. Nas sees seguintes, ns descreveremos alguns
deles. Uma lista de referncias sobre suas aplicaes em variados problemas envolvendo vigilncia
epidemiolgica podem ser encontrados em Sonesson and Book, 2003. Chamamos a ateno para
nossa notao sobre o tempo de alarme para os mtodos descritos a seguir. Por exemplo,
denotamos por CU SU M o tempo de alarme associado ao procedimento conhecido na literatura
como somas cumulativas ou mtodo CUSUM. A mesma notao feita para o tempo de alarme
dos outros procedimentos apresentados.
Considere nesta seo que {Xt }t1 uma sequncia de variveis aleatrias tal que para
t < , X1 , X2 , ...X1 so i.i.d com densidade completamente especicada f0 , e depois de ,
14
corrente e se no houve mudana na sequncia dizemos que > n e denotamos pelo evento
{ = }.
2.2.1
n 1 : M ax
n
X
1kn
(2.1)
t=k
onde BCUSUM selecionado de modo que ARL0 (CU SU M ) = BCUSUM . Se no h mudanas denimos inf {} = . Quando f parcialmente especicada, pertencente a uma famlia paramtrica,
Lorden (1971) prope a generalizao do CUSUM,
(
GCUSUM = inf
n 1 : M ax Sup
1kn
n
X
)
log(f (Xt )/f0 (Xt )) > BGCUSUM
(2.2)
t=k
Neste caso, apenas propriedades assintticas podem ser derivadas, tal como, ARL0 (GCU SU M )
BCUSUM .
2.2.2
(2.3)
Pode ser mostrado (Pollak, 1985) que a probabilidade a posteriori de que tenha ocorrido uma
mudana at o tempo corrente n, dada por
P ( n|X1 , ..., Xn ) =
em que,
Sp,n =
n Y
n
X
k=1 t=k
Sp,n
,
Sp,n + p1
f1 (Xt )
.
(1 p)f0 (Xt )
15
Seja,
SRn = lim Sp,n =
p0
(2.4)
n Y
n
X
f1 (Xt )
k=1 t=k
f0 (Xt )
(1985) mostra que este procedimento atinge, assintoticamente, o risco de Bayes quando p 0.
Borovkov (1998) mostra que este resultado pode ser obtido para uma classe de distribuies a
priori, na qual a geomtrica com parmetro p pequeno, mas p > 0, est inserida.
2.2.3
n
Y
f (Xt )
f0 (Xt )
(Z
n 1 : M ax
1kn
BCUSUM
dH()
>e
(2.6)
t=k
n1:
(Z
n
X
k=1
n
Y
f (Xt )
f0 (Xt )
)
dH()
)
> BSR
(2.7)
t=k
Uma nota importante sobre as expresses (2.6) e (2.7) que se substituirmos a notao
f (Xi ) por f (Xt |) e dH() por h()d. Ento, para um k xo temos que
(Z
!
)
n
Y
f (Xi |)
h()d
f (Xt |0 )
t=k
(2.8)
16
Mtodos Adaptativos
bem conhecido na literatura,( veja por exemplo, Lai(1998)) que quando a sequncia
X1 , X2 , ... formada por variveis i.i.d., sob a hiptese de que no houve mudana a razo
n
Y
f1 (Xt )
f0 (Xt )
(2.9)
t=k
um martingal com valor esperado igual a 1 para todo n k. Esta propriedade preservada
pela mistura de razo de verossimilhanas
(Z
n
Y
f (Xt )
f0 (Xt )
)
dH()
t=k
Isto permite mostrar que ARL0 (MLRSR ) BSR . No entanto, Lorden e Pollak (2005) argumentam
que difcil uma escolha para no caso multidimensional, ento eles sugerem uma abordagem
alternativa denindo,
n f
Y
t1 (Xt )
n,k =
t=k
f0 (Xt )
em que t1 um estimador para baseado nas observaes X1 , ..., Xt1 . Desde que t1 um
valor conhecido no tempo t, ento so vlidas as propriedades de (2.9). O mtodo adaptativo,
no sentido de que para cada tempo t, estimado com os dados obtidos at o tempo t 1. Desta
forma, so denidos dois novos procedimentos de vigilncia. O CUSUM-Adptatitivo (AdC) dado
por,
(
AdC = inf
n 1 : M ax
1kn
n
X
)
log(ft1 (Xt )/f0 (Xt )) > BCUSUM
(2.10)
t=k
n1:
n
n f
X
Y
t1 (Xt )
k=1
i=k
f0 (Xt )
)
> BSR
(2.11)
17
Mtodo Bayesiano
p1 (Xt |Ht1 )
.
p0 (Xt |Ht1 )
(2.12)
Um valor F B t > 1 implica em uma melhor performance preditiva de M1 indicando uma possvel
mudana no processo. Chamamos a ateno para o fato que em West(1986) o Fator de Bayes
denido como F B t = p0 (Xt |Ht1 )/p1 (Xt |Ht1 ). No entanto, para mantermos uma certa coerncia nas denies usadas neste texto, ns realizamos esta inverso na notao de West(1986).
Para deteco de mudanas no grupo formado pelas ltimas k observaes, West(1986) usa o
Fator de Bayes sequncial,
n
Y
F Bt ,
k = 1, 2, ..., n.
t=nk+1
n 1 : M ax F Bn,k BF B .
1kn
18
Maiores detalhes sobre propriedades, escolha das distribuies a priori para t e uma variedade
de aplicaes pode ser vista em West(1986) e West e Harrison(1986).
tride do polgono que delineia a rea Al . Considere sobre S o monitoramento (ou a vigilncia)
estatstico(a) de um processo estocstico X = {Xt (sl ), t = 1, 2, ... e l = 1, 2, ...L}. A cada
tempo discreto t 1 observamos um vetor L-variado Xt = (Xt (s1 ), Xt (s2 ), ..., Xt (sL ))0 , em que
Xt (sl ) representa alguma valor observado na l-sima rea. Sejam = {sl S : sl } um con-
19
emergente.
tempo e localizada em .
Pela denio 1, um algoritmo para deteco e localizao de um cluster no espao-tempo
tem que computar um par {, } baseado em Hn , e trs erros podem ocorrer:
1. Atraso: Se o cluster detectado e localizado corretamente ( = ) depois de tal que
o tempo de alarme para , verdadeiro. Ento o atraso na deteco localizada
[
].
2. Falso alarme: Se o tempo da mudana detectado < . Ento teremos uma deciso
nal incorreta com =
6 .
3. Falsa localizao: O cluster detectado e localizado depois de ( verdadeiro)
porm = mas 6= .
Dado estes erros, muito difcil (ou at impossvel) determinar um mtodo que possa minimizar
uma perda baseada nestes trs tipos de erros. Na prxima seo, apresentamos alguns mtodos
propostos na literatura que usam como medida de evidncia em favor do cluster emergente o valorp do teste que no ajustado para o problema de testes mltiplos. Estes testeS representam
extenses e variaes da estatstica Scan descrita na seo 2.1.4.
2.3.2
Para detco de cluster emergente, Kulldor (2001) usa uma verso estendida da estatstica
Scan espacial descrita na seo 2.1.4. Para construir a estatstica de Kulldor(2001) considere
que o interesse a deteco de cluster em intervalo temporal Ik = [k, n], k = 1, 2, ..., n, onde n
chamado de tempo corrente ou atual. Assuma que Xt (sl ) P oisson (t (sl ) t (sl )), Onde
t (sl ) denota uma medida desconhecida de risco relativo na l-sima rea no tempo t e t (sl )
20
S . Este valor esperado condicional geralmente expresso por t (sl ) = Nt (sl ), onde taxa
global de eventos e Nt (sl ) representa o total de indivduos em risco no tempo t na l-sima. Est
implcito neste modelo que o processo mutuamente independente no espao-tempo. Ou seja
eventos que ocorrem no tempo t so considerados independentes de qualquer outro evento que
tenha ocorrido no tempo t 1, mesmo que tenham ocorrido na mesma rea. Seja um conjunto
de localizaes espaciais, como denido na seo 2.3.1. Para a estatstica scan espao-tempo
assumido que,
t (sl ) =
(W ) = 0 se (sl , t) W = Ik ,
(W ) = 1 caso contrrio.
onde W denota todo o domnio de estudo no espao-tempo exceto W que representa uma janela
espao-temporal. As hipteses consideradas so que para todo W = Ik ,
H0 : 0 = 1
e H1 : 0 > 1 .
(2.13)
onde I{} a funo indicadora, X o nmero total de eventos observados no espao tempo e
X(W ) e (w) denotam, respectivamente, o nmero de eventos e o valor esperado para W dados
por:
X(W ) =
X
(sl ,t)W
Xt (sl ) e (W ) =
t (sl ).
(sl ,t)W
o cluster emergente mais provvel. Como no caso de deteco de clusters espaciais, a signicncia
estatstica do cluster detectado feita atravs da simulao de Monte Carlo da seguinte forma:
A cada tempo de anlise t, um conjunto (por exemplo, 1000 rplicas) de dados aleatrios so
gerados sob a hiptese H0 com os eventos simulados distribudos de forma independente no
espao e no tempo. Ento o valor-p emprico (Dwass, 1957) para o teste calculado e no
momento atual, um cluster emergente observado estatisticamente signicativo ao nvel se
seu valor-p menor que . Desta forma o ajuste feito somente para os cilindros W = Ik
atuais. No entanto se o monitoramento for continuado por um longo perodo de tempo, o teste
no controla corretamente o valor de para todas as anlises anteriores. Com isso o mtodo scan
espao-tempo para deteco de clusters emergentes pode apresentar alguns cilindros signicativos
mesmo que a hiptese nula seja verdadeira. Para entedermos uma varredura espao-temporal
21
atravs de cilindros, considere a gura 2.3. Imagine uma pilha de mapas onde cada camada
da pilha representa um tempo diferente. A base da varredura do cilindro representa espao
geogrco formado pelo conjunto de localizaes espacias em e a altura do cilindro representa
o tempo.
Figura 2.3: Examplo visual do uso do mtodo de Varredura espacial-temporal - Scan espaotempo
2.3.3
A estatstica scan espo-tempo de kulldor (2001) usa um valor esperado t (sl ) condicional
que estimado com os dados do tempo atual. Neill et al.(2005) observou empiricamente que
este fato pode diminuir o poder do teste para detectar cluster grandes (com muitas localizaes
espaciais) e tambm esta estimativa no robusta na presena de tendncia temporal ou sazonalidade. Para corrigir este problema, Neill (2009) props o uma estatstica scan espao-tempo
baseada em uma janela temporal limitada Iw = [n w + 1, n] onde w o mximo valor pr
especicado para a altura do cluster. Assim, o scan espao-tempo baseado no valor esperado
usado em dois passo: 1) O valor esperado t (sl ) estimado para cada localizao espacial sl
com os dados acumulados at n w. 2) utiliza a estatstica scan espao-tempo sobre o intervalo
Iw = [n w + 1, n] para detectar mudanas no valor esperado (da o nome scan espao-tempo
22
onde,
(xt (sl ) + t (sl ))
P0 (Xt (sl )) = P (Xt (sl ) = xt (sl )) =
(t (sl ))xt (sl )!
t (sl )
t (sl ) + t (sl )
t (sl )
t (sl )
t (sl ) + t (sl )
xt (sl )
(2.14)
e por analogia,
(xt (sl ) + t (sl ))
P1 (Xt (sl )) =
(t (sl ))xt (sl )!
t (sl )
t (sl )t (sl ) + t (sl )
t (sl )
t (sl )t (sl )
t (sl )t (sl ) + t (sl )
xt (sl )
(2.15)
onde a sobredisperso temporal t (sl ) = 1 + t (sl )/t (sl ). O par (t (sl ), t (sl )) estimado
com os dados acumulados at o tempo n w e assumido conhecido em Iw = [n w + 1, n], o
parmetro t (sl ). Para detectar e localizar clusters emergentes, assumido que
t (sl ) =
caso contrrio
onde h(u) denota o risco relativo no tempo t = n w um risco inicial. Depois do tempo n w
temos,
t (sl )
t
= W h0 (u).
t=nw
com h(.) denotando qualquer funo monotona crescente e satisfazendo, h(u) = 1 e o par (h0 (.),
h00 (.)) considerado nito. Deste modo o teste de hiptese ca a reduzido a testar sobre todos os
H1 : W > 0.
Y Y
P1 (Xt (sl ))
tIw sl
(sl ,t)W
/
Com P0 (Xt (sl )) e P1 (Xt (sl )) dados, respectivamente, em 2.14 e 2.15. A estatstica scan baseada
no teste escore para a hiptese nula H0 : W = 0 obtido da seguinte forma: 1) Encontra-se a
funo escore e a informao de Fisher observada no ponto W = 0, ou seja
logL(W )
U (0) =
W
2 logL(W )
J(0) = E
2
W
,
W =0
W =0
23
S = sup S(W )
W W
tIw
sl (Xt (sl )
qP
tIw
sl
Para calcular o valor-p do teste use a aproximao (Tango, 2010) S N (0, 1).
24
3.1 Introduo
Uma forma possvel de monitoramento e deteco de cluster no espao-tempo, denir uma
ampla classe de possveis candidatos a cluster espacial e aplicar os mtodos de natureza puramente
temporal em cada um desses possveis candidatos. No entanto, este procedimento pode levar ao
problema de mltiplos testes e qualquer mtodo desenvolvido deve ser ajustado para as mltiplas
comparaes no espao-tempo. Com este propsito, ns desenvolvemos e apresentamos neste
captulo alguns novos mtodos baseados nas razes de verossimilhanas (LR) adaptativas para
a hiptese nula de ausncia de cluster contra a hiptese alternativa que reete a presena de
um cluster emergente na regio. Ao usarmos o fato de que a razo de verossimilhana adptativa
(ALR) preserva a estrutura martingal da razo de verossilhana regular, ns encontramos uma
cota superior para a taxa de falsos alarmes dos mtodos propostos que depende somente da
quantidade de candidatos avaliados. Isto implica que estes mtodos no requerem procedimentos
computacionais intensivos para determinao do ponto de corte que controla a taxa de alarmes
falsos e por isso podem ser aplicado para deteco de clusters emergentes em qualquer mapa.
Os mtodos desenvolvidos podem ser entendido como uma extenso para o espao-tempo dos
mtodos descritos na seo 4.4.2.
25
Notao
26
t : s S},
em que a hiptese H0 tal que o padro normal de eventos corresponde a t = {0,l
l
t.
3.2.3
f0 (Xt ) =
para todo t 1.
sl S
fk,j (Xt ) =
sl S
ft (Xt (sl ))
sl j
ft (Xt (sl ))
se t < k
0,l
1,l
sl
/ j
ft (Xt (sl )) se t k
0,l
qualquer j
Y
ft (Xt (sl )) =
sl j
0,l
0,l
sl S
ft (Xt (sl ))
sl
/ j
temos que a razo de verossimilhaas (LR) para os dados Hn entre as hipteses Hk,j e H0 dada
por
j
LRn,k
Qn Q
t (Xt (sl ))
t=k
sl j f1,l
P(Hn |Hk,j )
=
= Qn Q
,
P(Hn |H0 )
t=k
sl j ft (Xt (sl ))
k n.
(3.1)
0,l
j
t , t ) xos, sob F a
Uma propriedade importante de LRn,k
, que para quaisquer j e (0,l
0
1,l
j
sequncia {LRn,k
, n k} um processo martingale com valor esperado igual a 1. Para mostrar
j
essa propriedade, observe primeiramente que LRn,k
pode ser escrita como
Qn
j
LRn,k
t=k
Q
Qn
t (Xt (sl ))
ft (Xt (sl )) sl
/ j f0,l
fk,j (Xt )
1,l
Qn Q
= Qt=k
n
t=k
sl S ft (Xt (sl ))
t=k f0 (Xt )
sl j
0,l
sl j
Q
t (Xt (sl ))
ft (Xt (sl )) sl
/ j f0,l
1,l
Q
.
sl S ft (Xt (sl ))
0,l
27
sl j
xt
Q
!
t (xt (sl ))
ft (xt (sl )) sl
/ j f0,l
1,l
Q
f0 (xt ) .
sl S ft (xt (sl ))
(3.2)
0,l
onde a soma em (3.2) realizada sobre todos os possveis valores para o vetor Xt . Mas,
Y
f0 (Xt ) =
sl S
de modo que,
E0 [jt ] =
X Y
ft (xt (sl ))
ft (xt (sl )) =
1,l
xt sl j
0,l
t k.
fk,j (xt ) = 1,
(3.3)
xt
sl
/ j
= E0
n
Y
#
jt
t=k
n
Y
E0 [jt ] = 1.
t=k
j
j
jn+1 |Xn , ..., Xk ]
|Xn , ..., Xk ] = E0 [LRn,k
E0 [LRn+1,k
j
E0 [jn+1 |Xn , ..., Xk ]
= LRn,k
j
= LRn,k
E0 [jn+1 ] (pela independncia)
(por (3.3)).
j
,
= LRn,k
j
}nk um processo martingal com mdia 1. Esta
Portanto, por (3.3) e (3.4), segue que {LRn,k
j
LRnj = max LRn,k
1kn
de modo que LRnj representa o mximo para a LR sobre todos os possveis pontos no tempo para
o qual tenha ocorrido uma mudana em j . Seja kj = arg[LRnj ], ento os possveis candidatos
a clusters emergentes so 1n,k1 , ..., Jn,kJ , e como estratgia para deteco considere os seguintes
procedimentos:
Procedimento 1: MAX-LR.
(
1 (B) = min n 1 : J 1
)
max
n,k
n,k1
,...,J J }
{1
j
LRn B
(3.6)
28
max
n,k1
{1
n,kJ
,...,J
j
j
LRn = J 1 max max LRn,k
j 1kn
excede o valor B que controla a taxa de alarmes falsos (FAR). bom ressaltar que 1 (B)
uma natural escolha para deteco de clusters emergentes (Sonesson, 2007) pois diferentes
regies podero ter diferentes pontos de mudana. Note que o limite de controle B assumido igual para todos os candidatos a cluster emergente. O fato que o valor de B depende da
taxa de alarmes falsos e um valor B comum para todosos candidatos garante que esta taxa
h
seja igual para todos. Se existe um n tal que o evento J 1 max{n,k1 ,...,n,kJ } LRnj B
1
n,k
!
= arg J 1
max
n,k
n,k1
,...,J J }
j
LRn
{1
Caso contrrio, dena 1 (B) = para min{}. A escolha n,k baseada no fato de que,
se o cluster comeou no tempo k e terminou em n0 < n ele deveria ter sido detectado pelo
mtodo em n0 . Desde de que 1 (B) baseado no valor mximo de LRnj , ele denominado
MAX-LR.
Procedimento 2: MIX-LR.
X
1
j
2 (B) = min n 1 : J
LRn B .
(3.7)
j=1
LRnj =
j=1
1
2
J
max LRn,k
+ max LRn,k
+ ... + max LRn,k
.
1kn
1kn
1kn
(3.8)
1
2
J
= LRn,k
+ LRn,k
+ + LRn,k
.
1
2
J
onde kj = arg[LRnj ].
j
Ento, grandes valores de LRnj = max LRn,k
possuem maior contribuio para que soe o
1kn
n,kj = argmax J 1
J
X
j=1
j
j=1 LRn B
PJ
LRnj .
ocorre, estime
29
Procedimento 3: WEIGHT-LR
X
3 (B) = min n 1 :
wj LRnj B .
(3.9)
j=1
Caso contrrio, dena 3 (B) = para min{}. Onde wj so valores conhecidos, representam pesos de evidncias em favor do candidato a cluster n,kj e
PJ
j=1 wj
= 1. Neste caso
podemos usar a idia de atualizao de informao. Diferentes pesos podem ser atribudos
basedo na informao a prior que dispomos sobre todos os possveis candidatos. Os pesos
podem ser atualizados quando uma nova informao obtida. Observe que 2 (B) um
caso de particular de 3 (B) com wj = J 1 . Neste caso, o cluster emergente estimado por
n,kj = arg J 1
J
X
wj LRnj .
j=1
Observe que este cluster estimado pode ser diferente do obtido com o tempo de alarme 2.
(3.10)
i = 1, 2, 3.
(3.11)
n
X
j
LRn,k
,
j = 1, 2, ..., J
k=1
Note que jn a estatstica de Shiryayev-Roberts denida na seo 2.2.2 para cada j . Como sob
j
F0 a sequncia {LRn,k
, n k} um martingal com valor esperado igual a 1, temos que {(jn
P
n)}n1 um martingal com mdia zero. Isto implica que sob F0 a sequncia {J 1 Jj=1 jn
n}n1 tambm um martingal com mdia zero. Agora, considere dois outros procedimentos
30
X
4 (B) = min n 1 : J 1
jn B .
(3.12)
X
5 (B) = min n 1 :
wj jn B .
(3.13)
j=1
e,
j=1
Ento,
J
X
0 = E0
wj j5 (B) 5 (B) B E0 [5 (B)]
j=1
e E0 [3 (B)] E0 [5 (B)] B
Para mostrar que este resultado vlido tambm para 2 (B), basta observar que 2 (B) um
caso particular de 3 (B). O importante desse resultado apresentado no lema a seguir:
Lemma 3 Seja
i (B) ,
i = 1, 2, 3.
onde 0 < < 1 a taxa aceitvel de alarmes falsos para o procedimento basedo em i (B).
Por exemplo, se o interesse detectar clusters emergentes usando o procedimento i (B) com uma
taxa de alarmes falsos inferior a 0.05, faa B = 20.
3.2.4
praticamente impossvel. Para contornar este problema, usamos uma abordagem adapta[k,t1] [k,t1]
t , t )
tiva(Lorden and Pollak, 2005). Seja (0,l
, 1,l ) uma estimativa razovel para (0,l
1,l
baseado em {X1 = x1 , ..., Xt1 = xt1 } e dena a razo de verossimilhana adaptativa (ALR)
por
Qn
j
ALRn,k
= Qn
t=k
t=k
sl j
(3.14)
0,l
[k,n] [k,n]
, 1,l ) no dependa de Xn temos que (Lorden and Pollak, 2003) sob F0 ,
Por requerer que (0,l
a sequncia
n
o
j
ALRn,k
,n k
(3.15)
31
preserva a estrutura martingal de (3.1), de forma que o limite superior para a taxa de alarmes
falsos dado em (3.11) pode ser utilizado pelos procedimentos para deteco de clusters emergentes
representados por i (B) com i = 1, 2, 3. Onde o procedimento i (B) obtido atravs de i (B)
j
j
pela simples substituio de LRn,k
por ALRn,k
. O fato importante desta abordagem que para
cada valor xado do parmetro no tempo t, assumimos que o par (f[k,t1] , f[k,t1] ) uma boa
0,l
1,l
j
j
t , f t ) de modo que LR
aproximao para (f0,l
n,k aproximada por ALRn,k .
1,l
corte, o que evitaria qualquer ganho em tempo de deteco devido estimativa um pouco melhor
t , t ). Embora em (B) os valores para w sejam assumidos conhecidos, na prtica eles
de (0,l
3
j
1,l
wj
[n2]
= (1 )wj
j
ALRn1
+ PJ
j
j=1 ALRn1
onde 0 < 1 um fator adptativo usado para aumentar a sensibilidade do mtodo quando
pequenas mudanas surgem em um passado bem recente. Desde de que wj conhecido no tempo
n, o procedimento
X
3 (B) = min n 1 :
wj ALRnj B .
(3.16)
j=1
tambm pertence a classe com wj subtitudo por wj[n1] . Note que sob esta formulao, os
pesos wj so atualizados sequencialmente a medida que dispomos de uma nova informao.
3.2.5
Em uma estrutura geral, considere que S = {s1 , s2 , ..., sL } um mapa particionado (como
na gura 3.1) em L reas conexas em que sl = (s1l , s2l ) um vetor de coordenadas geogrcas do
centride da l-sima rea. Para construirmos o espao dos clusters , primeiramente considere
uma matriz de adjacncias,
Il,j =
c se sc
se j = 1
o j-simo centride mais prximo de sl
32
Suponha que a proximidade medida pela distncia Euclidiana entre os centrides sl e sc . Cada
linha desta matriz representa um vetor de adjacncias (l1 , l2 , ..., lL ) em que, l1 = j e nas outras
celas desta matriz, os elementos so alocados de acordo com a proximidade espacial em relao
ao centride sl . Por exemplo, suponha que L = 5. Se a linha 1 o vetor (1, 5, 4, 3, 2). Isto implica
que o centride s5 o segundo mais prximo de s1 , s4 o terceiro centride mais prximo de s1 e
assim sucessivamente. Nesta representao esta implicto que "todo centride o mais prximo
de si mesmo". Centrado em sl (que corresponde a l-sima linha de Il,j ), idenque um cluster por
um vetor li = (l[i,1] , l[i,2] , ..., l[i,L] ) construdo da seguinte forma:
1) Dena l[i,j] = 1 se l = j , i = 1, 2, ...L e j = 1, 2, ..., L.
2) Dena l[i,Il,j ] = 1, se sIl,j um dos j centrides mais prximos de sl e j i. Caso
Observe que a cada valor de j , li recebe o valor 1 no ndice do vizinho mais prximo de sl em sua
posio original no espao. Esta representao unica a menos do cluster lL que surge L vezes
diferenciado apenas pelo seu centride. Para vericarmos que de fato esta a representao
dos clusters, exemplicamos a formao da representao de 12 . Neste caso l = 1, i = 2 e
j = 1, 2, ..., L.
1) Quando j = 1, l = j e portanto 1[1,1] = 1
2) Quando j = 2. I1,2 =5, e s5 o segundo (i=2) centride mais prximo de sl e tambm,
j = 2 2 = i. Portanto, 1[1,5] = 1. Agora note que para todo j 3 temos que j > i.
(3.17)
onde (< . >) denota o produto interno entre dois vetores e a um valor xo, que representa uma
restrio na quantidade (tamanho do cluster) de localizaes espaciais em li . Esta restrio
imposta porque muitas vezes no h interesse em detectar clusters geogrcos com um nmero
de reas maior que a. Por exemplo, se a = L/2, ento o maior nmero de localizaes espaciais
3.3 Aplicao
33
si li
3.2.6
Aps a formulao da estrutura dos espao dos cluster, podemos usar o seguinte algoritmo
para deteco e monitoramento de cluster no espao tempo:
Algoritmo
1. no tempo n = 0, Escolher um centride no mapa.
2. Calcular as distncias para os outros centrides. Ordene estas distncias em ordem
crescente e depois guarde-as em um vetor de distncias (este vetor de distncias um
vetor de adjacncias).
3. Para cada centride do mapa repetir os passos 1 e 2 e ento construa a matriz de
adjacncias de acordo com a explicao dada na seo 3.2.5.
4. Escolher novamente um centride sl na regio. Centrado em sl contrua li , i =
1, 2, ..., L como explicado na seo 3.2.5.
6. Para cada n 1 especique um valor para e calcule o par (f (ALRn ), B), onde f
qualquer funo de monitoramento descrita na seo 3.2.4.
7. Se f (ALRn ) B , declare que existe um cluster emergente no mapa e o estime
pelo argmax [f (ALRn )] como dado na seo 3.2.3 . Caso contrrio, incremente uma
unidade no tempo e volte ao passo 6.
3.3 Aplicao
Para um melhor entendimento do funcionamento dos mtodos propostos eles so aplicados a um conjunto de dados reais. Os dados so referentes ao nmero de casos de cncer da
tireide em homens que ocorreram no Novo Mxico durante o perodo de tempo 1973-1992. Os
dados usados nesta anlise (Kulldor, 2001) foram agregados em 32 reas. A incidncia de casos
de 2.4 para cada grupo de 100000 pessoas-ano no Novo Mxico, porm variando entre as reas
de acordo com idade e raa. O objetivo desta anlise a deteco de clusters emergentes de
cncer da tireide na regio do Novo Mxico cujo a partio apresentado na gura 3.1.
3.3 Aplicao
34
t1
sl S
e sob Hk,j
fk,j (Xt ) =
Xt (sl )
Y
I{tk,sl j }
I{tk,sl j }
exp t (sl )t,j
/Xt (sl )!.
t (sl )t,j
sl S
Onde I{A} a funo indicadora do evento A . Ou seja, sob a ausncia de cluster Xt (sl ) tem
valor esperado t (sl ) para todo sl S e t 1, e depois de um tempo desconhecido = k,
1 k n, o processo muda para um novo estado com nvel mdio t,j t (sl ) em um conjunto
j . A quantidade t,j > 1 representa o risco relativo ou a intensidade da mudana na regio do
t = (s ) e t = (s ). Usando (3.14) ,a LR adaptativa
cluster j . Observe, ainda, que 0,l
t,j t l
t l
1,l
n
Y
[k,t1] Xt (j)
[k,t1]
exp{j
[k,t1]
(j
1)}.
(3.18)
t=k
onde,
Xt (j) =
X
sl
Xt (sl ) t (j) =
t (sl ).
sl j
[k,t1]
e ([k,t1]
, j
) representam as estimativas para (t (j), t,j ) que dependem dos dados atravs
j
3.3 Aplicao
35
[t1]
j
1
=
t1
t1
X
!
Nm (j)m
m=1
t1
1 X [m]
,
j .
t1
(3.19)
m=1
sl S
xm,i,r (sl )/
sl S
Nm,i,r (sl )m,i,r representa uma estimativa para o nmero de casos esperados no tempo m na
classe de idade i e raa r sob a hiptese de que no existe cluster no espao-tempo. Portanto,
uma estimativa para o nmero total de casos esperados na l-sima rea no tempo m dado por
[m] (sl ) =
P P
i
[m]
sl j
[m] (sl ).
Para obtermos uma estimativa para t,j , notamos que sob Hk,j , o estimador de mxima
verossimilhana de t,j dado por Xt (j)/t (j) e quando t,j = j este estimador dado por
Pt
m=k
Xm (j)/
Pt
m=k
n
o
[t1]
= max 1, xt1 (j)/j
ou
[k,t1]
j
= max 1,
t1
X
xm (j)/
m=k
t1
X
)
[m]
j
m=k
quando t,j = j . No entanto, consideramos como estimativa para t,j uma verso suavizada da
estimativa de mxima verossimilhana dada por
[k,t1]
n
o
[k,t1]
[k,t1]
= max 1, x
j
/
j
.
x
j
[k,t2]
= xt1 (j) +
xj
[k,t1]
[t1]
= j
[k,t2]
+
j
[k,t1]
[k,k1]
Caso contrrio, x[k,t1]
=
j
= 0 e j
= 1. A quantidade 0 1 um parmetro de
j
3.3 Aplicao
36
n
o
[t1]
= max 1, xt1 (j)/j
e quando = 1,
(
[k,t1]
j
= max 1,
t1
X
m=k
xm (j)/
t1
X
)
[m]
j
m=k
A suavizao introduzida para reduzir o efeito das observaes de um passado muito distante na
estimativa atual de t,j . Quando pequeno, poucas observaes contribuiro para a estimativa
de t,j de modo que usamos = 0.8.
Resultados Obtidos
Ao aplicarmos os mtodos propostos para deteco e vigilncia de clusters de cncer,
obtemos o grco de monitoramento apresentado na gura (3.2) com valor de B igual a 20 e
= 0.8. Neste caso, a taxa de alarmes falsos para qualquer um dos mtodos no mximo
cluster estimada por = {LosAlamos, M ora, Sandoval, SantaF e} com uma parte temporal
[1986, 1990], ALR = 48.01 e
[1986,1990]
j
[1986,1990]
MIX-ALR e o WEIGHT-ALR representam uma soma sobre vrios candidatos a clusters que so
possvelmente correlacionados. Uma sntese dos resultados obtidos para os ltimos cinco perodos
de vigilncia apresentada na tabela 3.2. O importante so os resultados referentes ao tempo
atual denotado por n = 1992. O valor obtido para o MIX-ALR (WEIGHT-ALR) no tempo atual
42.672 (59.529) que um grande valor quando B=20. Neste caso a regio que dispara o alarme
estimada por = {LosAlamos}. O tempo estimado de incio do cluster k{LosAlamos} = 1987.
Ento o cluster no espao-tempo estimado representado por {LosAlamos}[1992,1987] . O cluster
estimado pela Estatistica Scan em Kulldor(2001) {LosAlamos}[1992,1989] . Note que embora a
localizao espacial seja a mesma, o tempo de durao do cluster diferente.
Tabela 3.1:
37
Deteco de clusters emergentes de casos de cncer da tireide em homens que ocorreram no Novo Mxico,
usando o MIX-ALR e WEIGHT-ALR nos ltimos cinco anos.
Alarm Function
MIX-ALR
WEIGHT-ALR
[k,n1]
years([k,n])
ARLn
SantaFe
[1980,1988]
2.34
7.41
[1986,1989]
2.29
159.42
[1980,1990]
2.27
308.29
[1980,1991]
2.23
331.15
LosAlamos
[1987,1992]
6.98
866.88
[1979,1988]
2.16
5.87
[1986,1989]
2.29
159.42
[1986,1990]
2.89
48.01
[1980,1991]
2.23
331.15
LosAlamos
[1987,1992]
6.98
866.88
usando
MAX,
MIX
and
WEIGHT-ALR
com
melhor ser a estimativa do cluster mas, maior ser sua cardinalidade. Isto implica que os valores
obtidos para o MAX e MIX-ALR sero pequenos de modo que o alarme pode no soar mesmo na
presena de um cluster emergente no mapa. Para solucionar este problema, ns recomendamos
o uso de uma abordagem adaptativa tambm no espao dos clusters .
Para elaborarmos esta abordagem considere uma classe inicial de distintos candidatos a
cluster 0 = l , l = 1, 2, ..., L com cardinalidade J 0 . Onde l = {l1 , ..., lL }. Por exemplo, l
pode representar o conjunto de todos os crculos centrados em sl cujo raio cresce continuamente
38
at que contenha 50% das localizaes espaciais do mapa. Para todo n > 1, dena
[n1]
j
= {lj : ALRn1
C,
j = 1, 2, ...L} e [n1] = l
[n1]
, l = 1, 2, ..., L.
para algum valor C > 1, ento no tempo atual n, a varredura espacial para deteco de cluster
emergente realizada sobre os candidatos pertencente a classe [n1] 0 que possui cardinalidade J [n1] . O fato que se no tempo n 1 a razo de verossimilhana adaptativa
l
j
ALRn1
=
P(Hn1 |Hk,lj )
1kn1 P(Hn1 |H0 )
max
possui valor menor ou igual a C , ento ela deve ser retirada da anlise no tempo n e [n1]
funciona como uma estimativa para o espao dos clusters no tempo n 1. Quando [n1]
=
l
para todo l, dena arbitrariamednte [n1] = 0 . Ou seja, quando no tempo n 1 nenhum lj
l
j
possuir ALRn1
maior que C , o processo de varredura espacial deve ser inicializada no tempo n
lj
= {lj : lj = argmax[ALRn1
]}
max
ALRnj B
J [n1] {lj [n1] }
1
2 (B) = min n 1 : [n1]
X
{lj
[n1] }
ALRnj B
(3.20)
(3.21)
: GWEIGHT-ALR
X
lj
3 (B) = min n 1 :
wlj ALRn B .
{ [n1] }
(3.22)
lj
Algoritmo
39
6. Para cada n 1, atualizamos a classe n1 como explicado nesta seo. Especicamos um valor para e calcule o par (f(ALRn ), B). Onde f qualquer funo de
monitoramento descrita nesta seo: GMAX-ALR, GMIX-ALR ou GWEIGHT-ALR.
7. Se f(ALRn ) B , declare que existe um cluster emergente no mapa e o estime
pelo argmax [f (ALRn )] como dado na seo 3.2.3 . Caso contrrio, incremente uma
unidade no tempo e volte ao passo 6.
Para compararmos as funes de alarme GMAX e GMIX-ALR com MAX e MIX-ALR,
respectivamente, ns usamos estas funes na aplicao descrita na seo 3.3. Usamos [n1]
=
l
lj
]}. Nota-se na gura 3.3(a) que neste caso, o GMAX-ALR dispara
{lj : lj = argmax[ALRn1
40
cluster assumimos que t (sl ) = 0 Nt (sl ), t = 1, 2, ...10. Onde 0 uma taxa de referncia global
para a doena. Para o processo com um cluster emergente, quando t = 11, ..., 20, supomos um
cluster em j com valor esperado t,j t (sl ) para todo sl em j . Observe que o incio do cluster
o ponto k = 11. Em nossas simulaes usamos:
Sob a hiptese H0 , E0 [Xt (sl )] = 0 Nt (sl ) para todo sl S e t 1, de modo que o nmero
localizao estimada do cluster dada por (parte espacial de n,k ), pode ocorrer que contenha
localizaes que no pertenam a j ou deixe de incluir localizaes que pertencen a j de modo
que o evento { = j } pode ocorrer raramente. Ento, denimos duas medidas para avaliarmos
a preciso do cluster detectado:
Sensitividade Condicional de um alarme SSCk,j [ ]- representada pela proporo de local-
izaes espaciais pertecentes a j que foram corretamente localizadas pelo cluster detectado
41
#{j }
I{ k}
PQ
q=1 I{ k}
#{(q) }
I{ k}
PQ
q=1 I{ k}
As medidas, SSCk,j [ ] e VPPk,j [ ], avaliam o desempenho do mtodo em relao a localizao espacial estimada dado que o alarme verdadeiro. Se = j temos que SSCk,j [ ] =
VPPk,j [ ] = 1.
SSCk,j [ ] VPPk,j [ ]. O ideal que estas medidas sejam prximas de 1 indicando que o
cluster emergente no mapa (condicional average detection delay). Esta medida expressa por
ADDk,j [ ] = E( k|Hk,j , k).
q=1 ( k)I{ q =j , k}
.
PQ
q = , k}
I
{
q=1
j
Independente da localizao estimada para o cluster, podemos usar o atraso mdio, que pode ser
estimado por
PQ
ADD[
]=
3.5.2
q=1 ( k)I{ k}
.
PQ
q=1 I{ k}
Os resultados para as medidas de perfomance esto descritos na tabela 3.2. e so apresentados apenas para os mtodos GMIX e GWEIGHT-ALR. Pois estes obtiveram melhor de ) na deteco
sempenho nas simulaes. Como esperado, em ambos os mtodos o atraso (ADD
decresce e a preciso na localizao cresce quando aumenta o valor de t,j . Por exemplo, quando
t,j = 2, = 0.05 o atraso estimado para o GWEIGHT-ALR (GMIX) igual a 2.366 (2.490)
42
que pode ser considerado pequeno, pois o cluster foi detectado logo no seu incio. A preciso na
localizao medida pela SSC 0.791 (0.871) enquanto que o VPP=0.719 (0.718). Observe na
tabela que a SSC > 0.7 e o VPP > 0.6 . A SSC sempre maior que o VPP implicando que o
cluster localizado tende a ser maior que o verdadeiro cluster, porm com uma boa preciso.
De uma forma geral, o GWEIGHT-ALR mais rpido (possui menor atraso) porm menos
preciso (possui menor SSC). O fato que se o GMIX demora mais tempo para soar o alarme e
ento, ele realmente deveria ser mais preciso pois com o passar do tempo o cluster vai cando mais
evidente. Uma visualizao da relao atraso versus preciso mostrada atravs de histogramas
bivariados nas guras 3.5 e 3.6. Nestas guras pode-se observar que mesmo quando o atraso
baixo a sensitividade e o valor predito positivo so elevados. Uma amostra do funcionamento
on-line do GMIX e GWEIGHT-ALR com dados simulados apresentado na gura (3.4).
Tabela 3.2: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) com diferentes valores para t,j , diferentes taxas aceitveis de alarmes falsos
() usando o GMIX e GWEIGHT-ALR.
Medidas de Perfomance
= 0.05
t,j
SSC
VPP
ADD
1.50
0.791
0.644
4.914
2.00
0.871
0.718
2.490
1.3t11+1
0.861
0.750
3.198
1.50
0.864
0.722
6.049
2.00
0.910
0.765
3.076
1.3t11+1
0.921
0.814
3.604
1.50
0.729
0.616
4.197
2.00
0.791
0.664
2.366
1.3t11+1
0.805
0.681
3.017
1.50
0.811
0.687
5.289
2.00
0.861
0.719
2.830
1.3t11+1
0.885
0.755
3.406
GMIX-ALR
= 0.01
= 0.05
GWEIGHT-ALR
= 0.01
3.6 Discusso
43
Figura 3.4: Amostra de uma simulao do processo para GMIX and GWEIGHT-ALR na escala
logartmica com log(B)=(threshold)=log(20).
Figura 3.5: Histograma Bivariado para o GMIX-ALR: Sensitividade (Sensitivity) versus atraso
(Delay) em (A) e Valor Predito Positivo (PPV-Positive Predicted Value) versus Delay(atraso) em (B).
3.6 Discusso
Neste captulo desenvolvemos novos mtodos para a vigilncia estatstica em mapas
de doenas em que o foco principal a deteco de clusters emergentes no espao-tempo. Ao
combinarmos tcnicas de vigilncia na escala temporal com estimao adaptativa e algortmos
3.6 Discusso
44
45
4.1 Introduo
No contexto no-bayesiano, a deteco de mudana no espao-tempo, tem sido abordada
na literatura atravs de teste de hipteses. Uma suposio implicita nestes testes que o processo
observado composto por componentes mutuamente independentes no espao-tempo. Porm,
esses componentes podem ser correlacionados, no-estacionrios ou ambos. Isto implica que as
propriedades obtidas para estes testes podem estar sendo violadas. Neste caso, uma alternativa
usar procedimentos bayesianos que possam acomodar esses problemas.
Do ponto de vista bayesiano os testes de hipteses so encarados como um problema de
comparao de dois modelos M0 e M1 , onde cada modelo pode representar, por exemplo, uma
hiptese estatstica de mudana ou no-mudana no padro dos dados observados. Uma forma
conveniente de resumir a evidncia nos dados em favor de um dos modelos atravs do uso do
fator de Bayes. Este tem sido usado por Gangnon e Klayton (2007) para deteco de mudanas
no espao e por West(1986) em monitoramento na escala temporal. Neste captulo, ns propomos o uso de um Fator de Bayes seqencial local para deteco de mudanas no espao-tempo.
Estas mudanas so detectadas atravs da comparao entre as densidades preditivas para o
modelo padro, contra as preditivas para um conjunto de modelos alternativos. Estes modelos
so atualizados no tempo. Essencialmente, os modelos alternativos possuem forma similar ao
modelo padro porm, permitem mudanas nos valores dos parmetros que caracterizam o modelo padro. A abordagem apresentada neste captulo, pode ser entendida como uma extenso da
abordagem de West(1986) discutida resumidamente na seo 2.2.5.
Seja S uma regio em estudo particionada em L-reas contguas indexadas pelo ponto
sl . Usualmente, S um mapa (de muncipios, bairros, etc...) e sl o centride do polgono que
46
daquela obtida com as observaes do processo. Por exemplo, In pode incluir valores de possveis
covriaveis conhecidas. Caso a nica informao adicional obtida em cada tempo n seja xn , ento
Hn = {Hn1 , xn }.
Assuma que sob condies normais de funcionamento, o processo Xt representado estatisticamente por um modelo padro (ou de referncia) para Xt dado por:
Mt,0 = {f (Xt | t ), g0 ( t |Ht1 ), p0 (Xt |Ht1 )}.
sl S
dependendo de um parmetro t = (t (s1 ), ..., t (sL )), ou seja, os componentes de Xt so condicionalmente independentes; (b) Uma distribuio a priori para t ,
g0 ( t |Ht1 ) =
(l)
sl S
(4.1)
pertencente a uma classe M = {Mt, , }, e que possui densidade preditiva p (xt |Ht1 ). O
modelo Mt, construdo de modo a representar uma possvel mudana na distribuio do subprocesso {Xt (sl ) Xt : t k, sl j } para algum par (k, ) desconhecido. Ns chamamos esta
)
indicando
mudana de cluster no espao-tempo (ou cluster emergente) e o denotamos por (k,
47
p (xt |Ht1 )
.
p0 (xt |Ht1 )
(4.2)
Um valor FBt () > 1 implica uma melhor performance preditiva de Mt, indicando uma possvel
mudana no processo.
4.2.2
I({tk,sl })
(4.3)
Onde I({A}) a funo indicadora do evento A e t, um valor positivo. Logo, se t < k temos
F Bt () = 1 e para t k ,
R
f (Xt | t )g ( t |Ht1 )d t
p (xt |Ht1 )
=R
FBt () =
p0 (xt |Ht1 )
f (Xt | t )g0 ( t |Ht1 )d t
RQ
FBt () =
Q
=
(l)
sl
sl
(l)
Onde,
(l)
pt, (Xt (sl )|Ht1 (l))
(l)
t k.
Z
=
(4.4)
ct, f (Xt (sl )|t (sl ))gt,0 (t (sl )|Ht1 (l))t, dt (sl )
(l)
(4.5)
(l)
(4.6)
(l)
e c(l)
t, uma constante de normalizao.
Observe que quando t k, FBt () depende somente dos dados observados em . O valor
t, explicado na seo 4.4.2. Para cada , o fator de Bayes FBt () similar ao descrito em
West (1986). Agora, para uma sequencia de observaes x1 , ..., xn , n 1, denote por P0 (P0 ) a
densidade (distribuio) preditiva conjunta sob {Mn,0 }n1 e Pk, (Pk, ) densidade(distribuio)
48
preditiva conjunta para {Mn, }n1 com ponto de mudana em um tempo k n. Ento a razo
de verossimilhana preditiva conjunta dada por
Pk, (xn , ..., x1 |H0 )
P0 (xn , ..., x1 |H0 )
Pk, (xn |xn1 , ..., x1 , H0 )Pk, (xn1 , ..., x1 |H0 )
=
P0 (xn |x1 , ..., xn1 , H0 )P0 (xn1 , ..., x1 |H0 )
p (xn |Hn1 )Pk, (xn1 , ..., x1 |H0 )
=
p0 (xn |Hn1 )P0 (xn1 , ..., x1 |H0 )
n
Y
= FBn () FBn1,k () =
FBt ().
FBn,k () =
(4.7)
t=k
FBn,k () uma funo que pode ser usada para localizar possveis mudanas nas mais recentes
n k + 1 observaes no conjunto de localizaes espaciais. Uma propriedade importante de
FBn,k (), que para quaisquer xo, sob a distribuio preditiva P0 a sequncia {FBn,k (), n
k} um martingal de valor esperado igual a 1. Para mostrar essa propriedade, observamos que
(4.8)
e ainda,
Z
E0 [FBn,k ()] =
Z
=
P0 (xn , ..., x1 |H0 )dx1 dxn
(4.9)
max
FBn,k ().
nw+1kn
49
(4.10)
Ou seja, o tempo de alarme, o primeiro momento no tempo tal que a estatstica FBn excede
o valor B que controla a probabilidade (ou a taxa) de alarmes falsos. Na linguagem de
anlise sequncial n w + 1 pode ser interpretado como o maior valor permitido para o atraso
na deteco da mudana. Um exemplo para esta situao a deteco de clusters emergentes
de doenas infecciosas onde uma epidmia pode ser evitada se o cluster for detectado em um
intervalo de tempo com comprimento menor ou igual a w 1. Note que o limite de controle
B assumido igual para todos os candidatos a clusters emergentes. O fato que o valor de
B depende da probabilidade (ou taxa) de alarmes falsos e um valor B comum para todos
os
candidatos garante que esta taxa seja igual para todos. Se existe um n tal que o evento
max max FBn,k () B ocorre, estime o cluster no espao-tempo por
nw+1kn
n,k
= arg max max FBn,k () .
nwkn
Caso contrrio, dena = para min{}. A escolha n,k baseada no fato de que, se o cluster
comeou no tempo k e terminou em n0 < n ele deveria ter sido detectado pelo mtodo em n0 .
Desde de que baseado no valor mximo de FBn,k (), ele denominado MAX-FB.
4.3.2
P0 ( + w 1)
Esta medida signica que se a sequncia de modelos {Mt,0 , t } adequada para os dados,
ento a probabilidade de um falso alarme em qualquer janela temporal de comprimento w
menor ou igual a um nvel pr-especicado 0 < < 1.
= 2Jw/. Entao
: P0 ( + w 1) },
Este teorema nos diz que se um nvel aceitvel para a probabilidade de um falso alarme e se o
interesse detectar mudanas emergentes na sequncia {Mt,0 } usando o procedimento MAX-FB
50
com um nvel de alarme falso inferior a 0.05, faa B = 2Jw/0.05. Para provar o teorema 4,
observamos que = {1 , 2 , ..., J } e o evento
max
max
FBn,k (j ) B
j nw+1kn
ocorre, se An,k (j) , {FBn,k (j ) B } ocorre para algum n k e j = 1, 2, ...J . Como sob a
distribuio preditiva P0 a sequncia {FBn,k (j ), n k} um martingal de valor esperado igual
a 1 para todo j = 1, 2, ..., J . Ento,
P0 (An,k (j)) 1/B
e
P0 max
max
FBn,k (j ) B
j nw+1kn
= P0
J
[
n
[
j=1 k=nw+1
J
X
n
X
An,k (j)
P0 (An,k (j)) .
j=1 k=nw+1
J
X
+w1
X
j=1 k=w+1
A cada n , uma grande diculdade que pode tornar invivel a utilizao do procedimentos
MAX-FB a cardinalidade J da classe M = {Mn, , }, pois esta igual a cardinalidade de
. Quanto mais exvel em termos de forma geomtrica e tamanho for a classe , melhor ser a
localizaes espaciais com centro em sl . Por exemplo, jl pode representar um caminho aleatrio
51
= arg
max
max
jl l nwkn1
[FBn1,k (jl )] ,
(4.12)
e
(n1)
(n1) = {1
(n1)
, ..., L
}.
Seja
n
o
(n1)
(n1)
(n) = l
(n1) : FBn1 (l
) > C
para alguma constante C 1. Se no existe um l(n1) tal que FBn1 (l(n1) ) > C , dena
(n) = (n1) . Finalmente, construa a classe de modelos alternativos por
M(n) = {Mn,l , l (n) }.
com cardinalidade J (n) L. Note que neste caso, se l = ln1 n . Ento usando (4.7) e
(4.12),
pl (xn |Hn1 )Pk,l (xn1 , ..., x1 |H0 )
p0 (xn |Hn1 )P0 (xn1 , ..., x1 |H0 )
Pk,l (xn1 , ..., x1 |H0 )
n1
max
= FBn (l ) max
P0 (xn1 , ..., x1 |H0 )
l (n1) nwkn1
FBn,k (l ) =
(4.13)
Ou seja, a classe Mn formada por todos os modelos Mn,l com maior densidade preditiva no
tempo n 1, dentre todos os modelos que so construdos a partir do ponto sl , (l = 1, 2, ..., L)
e ainda, a anlise sequncial sobre os dados acumulados ao longo do tempo repetida somente
sobre estes modelos. Aps observar (x1 , ..., xn ) considere F BA como o Fator de Bayes Adaptativo
para comparar a perfomance preditiava de Mn,l versus Mn,0 dado por
FBAn,k (ln1 ) =
como n1 = n1 (xn1 , ..., x1 ) mensurvel a (x1 , ..., xn1 ) e portanto conhecido no tempo n,
temos que FBAn,k preserva a propriedade martingal de FBn,k para qualquer conjunto . Agora,
denimos
FBAn = max
n
max
FBAn,k ().
nw+1kn
e como estratgia para deteco de cluster emergente considere o tempo de alarme dado por
n
o
= (B (n) ) = min n 1 : FBAn B (n) .
(4.14)
Se B (n) = 2J (n) w/ ento . Para mostra que , no teorema 4 substitua J por J (n)
e use o fato que FBAn,k preserva a propriedade martingal de FBn,k .
Esta abordagem adaptativa no sentido que a classe M(n) e o limite de controle B (n) so
52
construdos com dados obtidos at o tempo n 1. A vantagem desta abordagem que o uso
do Fator de Bayes Adaptativo previne que a cada n, avaliaes desnecessrias sobre modelos
com pobre perfomance preditiva no tempo anterior, tornando rpido o algortimo de busca sobre
cluster emergentes e diminuindo o atraso na deteco uma vez que diminui a cardinalidade de .
Um guia para a escolha de C usar a escala para o Fator de Bayes descrita em Kass e Raftery
(1995). Em uma anlise no sequencial, ou seja a tempo xo, se (J +1) modelos, M0 , M1 , ..., MJ ,
esto sendo considerados e M1 , ..., MJ so comparadas com M0 , Kass e Raftery (1995) sugeriram
a seguinte interpretao:
Tabela 4.1: Interpretao do Fator de Bayes (Kass e Raftery, 1995)
Interpretao do Fator de Bayes
FB
log(F B)
Evidncia contra M0
(0, 1]
(, 0]
Negativa
(1, 3]
(0, 1]
Fraca
(3, 20]
(1, 3]
Positiva
(20, 150]
(3, 5]
Forte
(150, )
(5, )
Muito Forte
Usando esta escala ns usamos C = 3 que parece um valor razovel para uma anlise
preliminar no espao . Em nossas simulaes apresentadas no nal deste captulo este valor
considerado adequado para nossa aplicao.
Por m, aps a anlise dos dados, se um alarme de cluster for disparado, estime o cluster
emergente pelo par (n , k(n )), onde:
n = max
max
FBAn (l )
(4.15)
max
n
FBAn,k ( )
(4.16)
l (n) nw+1kn
e
k(n ) = arg
nw+1kn
Modelo Padro
Para construrmos o modelo padro Mt,0 , assumimos que no tempo t, o processo observado sob condies normais de funcionamento. Seja Xt (sl ) a varivel aleatria de interesse
medida em sl e suponha que a sua densidade condicional a t (sl ) pertencente a famlia expo-
53
(4.17)
com parametro natural desconhecido t (sl ) e parmetro de preciso conhecido t (sl ). Esta famlia
de densidades tem a seguinte propriedade:
E0 [Xt (sl )|t (sl )] =
e
V0 [Xt (sl )|t (sl )] =
q(t (sl ))
= q 0 (t (sl ))
t (sl )
1
1 2 q(t (sl ))
=
q 00 (t (sl ))
2
t (sl ) t (sl )
t (sl )
(4.18)
(4.19)
Esta dene uma transformao 1 a 1 t (sl ) = z(t (sl )) (com inversa t (sl ) = z 1 (t (sl )) )
do espao do parmetro t (sl ) em um outro conjunto E R que representa o espao do
valor mdio para a distribuio condicional de [Xt (sl )|t (sl )]. Introduzindo t (sl ) em (4.18),
expressamos a varincia da distribuio de [Xt (sl )|t (sl )] como uma funo do valor mdio,
tambm chamada funo de varincia, atravs de
V (t (sl )) = q 00 (z 1 [t (sl )]).
(4.20)
Uma famlia na distribuio exponencial com parmetro natural unicamente determinada por
sua funo de varincia e vice-versa (Morris, 1982). Isto , dada uma funo de varincia temse uma classe de distribuies correspondenetes. Para entender a importncia da funo de
varincia em nosso modelo padro, suponha que
(l)
(4.21)
(l)
Ou seja, gt,0
(t (sl )|Ht1 (l)) a densidade a priori de uma distribuio conjugada (Migon e
Gamermam, 1999) para t (sl ). Esta densidade a priori ser denotada por (t (sl )|Ht1 (l))
P C[at (sl ), bt (sl )] e, completamente especicada pois o par [at (sl ), bt (sl )] assumido conhecido
e funo de Ht1 (l). Assuma neste trabalho que V (t (sl )) uma funo no mximo quadrtica,
distribuies que satisfazem esta suposio so: Normal, Gama, Poisson, Binomial e Binomial
negativa. Ento, o par [at (sl ), bt (sl )] tem uma simples interpretao em termos de t (sl ) =
z(t (sl )) (Gutires e Smith, 1995):
E0 [t (sl )|Ht1 (l)] = at (sl )/bt (sl ),
54
e
b1
t (sl ) =
(4.22)
(l)
(l)
exp {[at (sl ) + t (sl )Xt (sl )]t (sl ) [bt (sl ) + t (sl )]q(t (sl ))} dt (sl )
=
(4.23)
Esta a forma da densidade preditiva que serve de base para avaliar o ajuste da distribuio
[Xt (sl )|Ht1 (l)] sob o modelo padro Mt,0 . Temos, ainda,
E0 [Xt (sl )|Ht1 (l)] = E0 ([E0 [Xt (sl )|t (sl )]|Ht1 (l)) = E0 [t (sl )|Ht1 (l)] = at (sl )/bt (sl ).
e
V0 [Xt (sl )|Ht1 (l)] = E0 (V0 [Xt (sl )|t (sl )]|Ht1 (l))
+ V0 (E0 [Xt (sl )|t (sl )]|Ht1 (l))
1
V0 [Xt (sl )|Ht1 (l)] = E0
V0 (t (sl )|Ht1 (l)) + V0 (t (sl )|Ht1 (l))
t (sl )
1
= E0
V0 (t (sl )|Ht1 (l)) + b1
t (sl )E0 [V0 (t (sl ))|Ht1 (l)]
t (sl )
1
1
=
+
E0 [V0 (t (sl ))|Ht1 (l)].
t (sl ) bt (sl )
4.4.2
1
1
+
t (sl ) bt (sl )
Modelo Alternativo
Observa-se na expresso para a varincia da distribuio de [Xt (sl )|Ht1 (l)], que esta
1
depende da distribuio a priori atravs de bt (sl ); a quantidade 1
t (sl ) + bt (sl ) representa uma
55
medida de preciso da densidade preditiva que tem valor esperado at (sl )/bt (sl ). Logo xando
mt = at (sl )/bt (sl ) e decrescendo bt (sl ) obtemos uma densidade preditiva mais difusa e crescendo
bt (sl ) o efeito reverso. Ento, uma densidade preditiva apropriada para deteco de mudanas
em Mt,0 depois de um tempo k em algum conjunto , pode ser construda por substituir em
(4.23) bt (sl ) por outro valor menor que bt (sl ) para todo t k e sl . Esta substituio
feita diretamente por usarmos a distribuio a priori do tipo lei de potncia dada em (4.3)
com 0 < t, < 1. Para esta distribuio a priori em (4.3) obtemos a densidade preditiva para
[Xt (sl )|Ht1 (l)] sob o modelo Mt, por pt, (Xt (sl )|Ht1 (l)) em (4.5). Neste caso a distribuio
(l)
(l)
que representa a distribuio a priori para t (sl )|Ht1 (l) sob Mt, . Combinando (4.17) com
(4.24) obtenha que,
Z
(l)
(l)
exp {[t, at (sl ) + t (sl )Xt (sl )]t (sl ) [t, bt (sl ) + t (sl )]q(t (sl ))}
=
(4.25)
Neste caso a densidade (4.25) obtida pela substituio do par [at (sl ), bt (sl )] por [t, at (sl ), t, bt (sl )]
em (4.23). Por usar este fato, obtenha diretamente que,
Ek, [Xt (sl )|Ht1 (l)] = E0 [Xt (sl )|Ht1 (l)] = at (sl )/bt (sl ).
e
1
1
Vk,j [Xt (sl )|Ht1 (l)] =
+
E0 [q 00 (t (sl ))|Ht1 (l)]
t (sl ) t, bt (sl )
> V0 [Xt (sl )|Ht1 (l)], para 0 < t, < 1.
(4.26)
Onde Ek, e Vk,j representam, respectivamente, o valor esperado e a varincia de uma varivel
aleatria sobre o modelo Mt, para t k. Nota-se ento que: 1) o valor esperado para as
distribuies preditivas o mesmo sob os modelos Mt,0 e Mt, . 2) O spread
da densidade preditiva sob Mt, maior que a preciso
sob Mt,0 . Isto signica que
(l)
pt,0 (Xt (sl )|Ht1 (l))
(l)
pt, (Xt (sl )|Ht1 (l))
1
t (sl )
1
bt (sl )
1
t (sl )
1
t, bt (sl )
da distribuio preditiva
Mt, d maior probabilidade a regies no favorecidas pela densidade do modelo padro Mt,0 e
ser mais difusa em regies com alta densidade preditiva sob Mt,0 . Para que a distribuio a
56
priori t (sl ))|Ht1 (l) seja completamente especicada sobre o modelo Mt, precisamos especicar
o valor de t, . Para isso suponha inicialmente que para cada sl determinanos um valor t,l .
Ento usamos
1 X
t,l
||
t, =
sl
para algum 0 < < 1 xo. Esta escolha implica que a preciso relativa entre as densidades
preditivas sob os modelos padro e alternativo constante no tempo e expressa por
1
t (sl )
1
t (sl )
1
t,l bt (sl )
1
bt (sl )
=
1
.
(4.27)
1
t (sl )
1
t (sl )
1
t,l bt (sl )
1
bt (sl )
1
.
(4.28)
Ento podemos dizer que o desvio padro preditivo em Mt, um fator 1/ vezes maior que
o desvio padro preditivo em Mt,0 . Para (0.11, 0.44) este fator pertence ao intervalo (1.5, 3)
West(1986) tem recomendado valores no intervalo (0.1, 0.3) e ns usamos = 0.2 de modo que
1/ 2. Para nalizar esta seo, combinamos (4.25) com (4.23) e (4.4), obtemos que para
qualquer com estrutura de modelo de cluster dado nesta seo o Fator de Bayes expresso por:
FBt () =
Y
sl
v([at (sl ) + t (sl )Xt (sl )], [bt (sl ) + t (sl ))]
u(Xt (sl ), t (sl )) v(at (sl ), bt (sl ))
Y v(t, at (sl ), t, bt (sl ))
v(at (sl ), bt (sl ))
sl
v([at (sl ) + t (sl )Xt (sl )], [bt (sl ) + t (sl )])
v([t,j at (sl ) + t (sl )Xt (sl )], [t, bt (sl ) + t (sl )])
t k.
(4.29)
57
Figura 4.1: Uma possvel representao para as densidades preditivas em relao aos modelos
padro e alternativo.
como as denidas na seo 2.1 (Openshaw et al.,1988; Besag e Newel, 1991; Kulldor, 1997).
No entanto, a mudana pode ter ocorrido em um conjunto de localizaes espaciais com formato
irregular igual ao descrito em Duczmal and Assuno (2004). Na prtica, um conjunto
determinado por uma estimativa ou aproximao fornecida pelos dados. Quanto mais exvel,
em termos de formato geomtrico for a classe , melhor ser essa aproximao. Essa exibilidade
pode torna a cardinalidade de excessivamente grande, mas ao usarmos a abordagem adaptativa
na classe ns podemos controlar o valor de sua cardinalidade o que permite o uso de outros
algoritmos para a representao espacial do cluster. Por isso neste captulo ns usamos uma
representao elptica (Kulldor et al., 2006) para a localizao espacial do cluster
Para construo de considere que possui forma, tamanho e direo desconhecida. Uma
classe de representaes geomtricas pode ser denida atravs de elipses. Primeiramente
observe a gura 4.2. Esta gura apresenta uma elipse com orientao arbitrria centrada em
um ponto especifco s, que representa o centride de uma rea do mapa. Nesta elipse temos os
seguintes elementos:
a e b so os semi-eixos da elipse. "a" o semi-eixo maior e "b" o menor.
"e" a excentricidade.
F1 e F2 so os focos dessa elipse.
Uma elipse centrada em um ponto s pode ser unicamente denida por trs parmetros:
excentricidade, "e", parmetro de forma; ngulo=% , dene a direo da elipse; o tamanho
58
59
estreita elipse ( grande e pequeno), uma pequena mudana no ngulo resutar em muitos
conjuntos com centrides diferentes. Desta maneira, parece lgico que devemos usar uma grande
coleo de ngulos quando grande e pequeno. Neste caso podemos fazer um renamento
a priori no espao dos cluster para avaliar suaves valores para o parmetro %. Podemos calcular,
por exemplo, o percentual de interseco entre duas elipses centradas no mesmo ponto sl , com
os mesmos parmetros de forma e tamanho porm, com ngulos e quantidades de ngulos
diferentes. A partir deste renamento, podemos eliminar as elipses que possuem valores de % que
no so de interesse cientifco, ou no fazem sentido serem avaliados. Na tabela 4.2, por exemplo
apresentado o percentual de rea de uma elipse que tambm parte de qualquer outra elipse com
o mesmo centro (sl ), forma () e tamanho ( ), porm com quantidades (#) diferentes de ngulos.
Segundo a sugesto apresentada em Kulldor(2006), usaremos o nmero de ngulos escolhidos
de forma que duas elipses de mesma forma, centro e tamanho, com ngulos consecutivos tenham
interseco de no minmo 70% de suas reas. Assim (ver tabela 4.2) tomamos dois ngulos para
elipses com = 1.5, seis ngulos para elipses com = 2.0, etc...
Tabela 4.2: Percentual de rea de uma elipse que tambm parte de qualquer outra elipse com o mesmo
centro, forma e tamanho,porm com quantidades (#) diferentes de ngulos
parmetro de forma
de ngulo
1.5
2.0
4.0
6.0
8.0
2 (90 )
75
59
31
21
16
4 (45 )
82
67
41
29
22
87
77
52
38
30
9 (20 )
91
84
64
50
41
12 (15 )
93
88
71
59
49
15 (12 )
94
90
76
65
56
18 (10 )
95
92
80
70
62
24 (7.5 )
95
94
85
77
70
30 (6 )
97
95
88
81
75
98
95
90
84
79
45 (4 )
98
97
92
87
83
99
98
94
90
87
90 (2 )
99
98
96
94
91
100
99
98
97
96
100
100
99
98
98
6 (30
36 (5
60 (3
180(1
360(0.5 )
4.6 Exemplo
60
4.6 Exemplo
Para entendermos melhor a estrutura dos modelos discutidos na seo 4.4.1, suponha que
monitoramos o processo {Yt (sl ) : l = 1, 2, ..., L e t = 1, 2, ...} com realizao yt = (yt (sl ), yt (sl ), ..., yt (sl ))0 .
Em que, yt (sl ) representa o nmero de casos observados de uma determinada doena no tempo
t em sl . Para a distribuio do nmero de casos, assumimos que,
(Yt (sl )|t (sl )) P oisson (et (sl ) t (sl ))
(4.30)
com,
f (yt (sl )|t (sl )) = (yt (sl )!)
et (sl )
yt (sl )
yt (sl )
exp et (sl )
logt (sl ) t (sl )
.
et (sl )
u(Xt (sl ), et (sl )) = (Yt (sl )!)1 , et (sl )Yt (sl ) .
Notamos ainda que pelas denies em (4.19) e (4.20) obtemos que a mdia de (Xt (sl )|t (sl ))
t (sl ) = z(t (sl )) = q 0 (t (sl )) = exp{t (sl )} = t (sl )
4.6 Exemplo
61
(l)
(4.31)
Usando para (t (sl )|Ht1 (l)) uma distribuio a priori padro na famlia conjugada Gama(at (sl )+
1, bt (sl )) com mdia [at (sl ) + 1]/bt (sl ) e varincia [at (sl ) + 1]/b2t (sl ) obtemos que,
(l)
(4.32)
que tem a mesma estrutura de (4.31). Ento, a priori para o modelo alternativo descrita em
4.24 pode ser aplicada usando uma distribuio a priori para t (sl ) ou t (sl ). No primeiro, caso os
parmetros (at (sl ), bt (sl )) da distribuio a priori padro so subtituidos por (t, at (sl ), t, bt (sl )).
No segundo caso, a substituio feita por (t, (at (sl ) + 1), t, bt (sl )). O segundo caso usado
at o nal desta seo. Usando, ento, a distribuio a priori para (t (sl )|Ht1 (l)), obtemos que
o valor esperado e a varincia para distribuio preditiva de Xt (sl ) = Yt (sl )/et (sl ) sob o modelo
padro so:
E0 (Xt (sl )|Ht1 (l)) = E0 E0
=
Yt (sl )
|t (sl ) |Dt1
et (sl )
1
[at (sl ) + 1]
E0 (et (sl )t (sl )|Ht1 (l)) = E0 (t (sl )|Ht1 (l)) =
.
et (sl )
bt (sl )
e,
Yt (sl )
Yt (sl )
V0 (Xt (sl )|Ht1 (l)) = E0 V0
|t (sl ) |Dt1 + V0 E0
)|t (sl ) |Dt1
et (sl )
et (sl )
1
=
E0 [t (sl )|Dt1 ] + V0 [t (sl )|Dt1 ]
et (sl )
[at (sl ) + 1] [at (sl ) + 1]
1
1
[at (sl ) + 1]
+
+
.
(4.33)
=
=
2
et (sl )bt (sl )
et (sl ) bt (sl
bt (sl )
bt (sl )
Substituindo os parmetros (at (sl ) + 1, bt (sl )) da distribuio a priori padro por (t, (at (sl ) +
1), t, bt (sl )) na distribuio a priori alternativa, obtenha diretamente que:
Ek, [Xt (sl )|Ht1 (l)] = E0 [Xt (sl )|Ht1 (l)] =
[at (sl ) + 1]
.
bt (sl )
e
1
1
Vk,j [Xt (sl )|Ht1 (l)] =
+
et (sl ) t, bt (sl )
> V0 [Xt (sl )|Ht1 (l)],
[at (sl ) + 1]
bt (sl )
para 0 < t, < 1.
(4.34)
4.6 Exemplo
62
1
et (sl )
1
et (sl )
1
t,l bt (sl )
1
bt (sl )
=
1
.
(4.35)
Ento, comparando 4.27, 4.28 e 4.35, conclua que usando a distribuio a priori para t (sl ) ou
t (sl ) o resultado da anlise no se altera.
Para calcularmos o Fator de Bayes, usamos o fato que (t (sl )|Ht1 (l)) gamma(at (sl ) +
1, bt (sl )). Ento
(l)
(4.36)
(4.37)
Substituindo 4.37 em 4.29 com t (sl )) = et (sl )) e Xt (sl ) = Yt (sl )/et (sl ). Obtemos que Fator de
Bayes em 4.29 igual a
FBt () =
(4.38)
sl
t, bt (sl ) + et (sl )
t, bt (sl )
t, bt (sl ) + et (sl )
e,
([at (sl ) + 1] + Yt (sl ))
P G (bt (sl ), at (sl )) =
([at (sl ) + 1])Yt (sl ))!
Yt (sl )
et (sl )
bt (sl ) + et (sl )
bt (sl )
bt (sl ) + et (sl )
Ento, neste caso, aps observar uma sequncia de vetores (y1 , ..., yn ), comparar a sequncia
de modelos {Mn,0 }n1 com a sequncia {Mn, }n1 equivalente a comparar uma sequncia de
razes de densidades preditivas na famlia de densidades Poisson-Gama.
Agora assuma que no tempo inicial a classe de conjuntos de localizaes espaciais igual a
0 . Ento, aps observar o processo n vezes e atualizar n como explicado na seo 4.3.3. O
4.6 Exemplo
63
n1
Y
t=k
P G t,n1 bt (sl ), t,n1 at (sl )
l
sl ln1
max
FBAn,k (ln1 ).
ln1 n nw+1kn
(4.39)
e, tempo de alarme
n
o
= (B (n) ) = min n w : FBAn B (n) .
(4.40)
com B (n) = 2J (n) w/, para algum par (w, ) xo. Aps o cmputo destas quantidades, use
o algoritmo seguinte para a deteco de mudanas no espao-tempo, usando o fato que tem
representao elptica.
da relao e2j = 1 2
j . Quando ej = 0, temos que lj um crculo. O semi-eixo
menor da elipse 1
j j .
? o ngulo %j da elipse lj denido como o ngulo entre a linha horizontal leste-
Onde nang e nex representam, respectivamente, o nmero de ngulos e de excntricidade utilizados. Neste caso, c o maior nmero de localizaes espaciais em li que
possui semi-eixo maior ( ) igual a d(sl , sc ).
64
65
municpios uma vez que ela est associada a condies de vida da populao, de modo que a
nvel local os componentes de uma srie temporal, como tendncia e sazonalidade podem ser
ignorados na anlise.
Figura 4.4: Coeciente de Deteco de Hansenase (por 10000 ml hab) no Estado do Amazonas(em azul), segundo o ms, nas cidades: Manaus(em verde), Humait (em vermelho) e Itacoatiara (em preto)
4.7.2
66
Figura 4.5: Mapa do Estado do Amazonas com os municpios espacialmente representados pelas
coordenadas de seus centrides.
estimar o valor esperado), veja por exemplo, Banerjee et al, (2004). Geralmente a abordagem
via padronizao externa a melhor (Zhou e Lawson, 2008) pois evita o uso dos dados corrente
para estimarmos quantidades que em teoria deveriam ser conhecidas. Uma forma de usar a
padronizao interna sem utilizar os dados correntes usar mtodos (como o Fator de Bayes usado
aqui) com janela temporal w que permitem que o valor esperado et (sl ), quando desconhecido,
possa ser estimado com os dados observados no intervalo de tempo t = 1, 2, ..., n w. Este tipo
de abordagem muito importante principalmente quando a srie de dados observada possui,
por exemplo, tendncia ou sazonalidade o que no o caso dos dados de Hasenase e portanto,
usamos ento uma padronizao interna tal que et (sl ) = Nt (sl ) tw , t w. Ou seja, o nmero
de casos esperados et (sl ) proporcional a populao em risco e ajustado por um fator tw o
qual representa uma taxa de referncia global no mapa obtida com os dados acumulados at o
tempo t w. Para todo usamos
Pt
t =
T =1
s S YT (sl )
.
Pt P l
T =1
sl S NT (sl )
(l)
No tempo t e municpio l = 1, 2, ..., 62, uma distribuio a priori gt,0
(t (sl )|Ht1 (l)) e um
mecanismo de evoluo do tempo t 1 para o tempo t faz-se necessrio para o incio do monitoramento via Fator de Bayes. A distribuio para (t (sl )|Ht1 (l)) na famlia conjugada (ver
seo 4.6) uma distribuio Gama. A suposio de uma distribuio Gama para os riscos relativos, tem sido considerada por vrios autores como uma suposio adequada (Martuzzi e Hills,
1995), pois alm de unimodal ela pode tomar uma grande variedade de formas regulares podendo,
por exemplo, acomodar assimetria da distribuio. Para o mecanismo de evoluo temporal,
assuma mais especicamente que a relao entre t (sl ) e t1 (sl ) da forma multiplicativa
t (sl ) =
t (sl )
t1 (sl ),
m
0 < m 1,
(4.41)
67
Assumindo que o processo t (sl ) independente de t1 (sl ) obtenha diretamente que E(t (sl )|Ht1 (l)) =
t1 (sl ) e ainda (west e Harrisson, 1997) (t1 (sl )|Ht1 (l)) Gama(at1 (sl ), bt1 (sl )) implica
fornecendo a estrutura conjugada necessria para o cmputo do Fator de Bayes a cada tempo t.
Essencialmente, m controla a passagem de informao dos dados do tempo t 1 para o tempo
t. Grandes valores de m (prximo de 1) garantem uma maior passagem de informao entre
os perodos de tempo tal que para uma abordagem adaptativa com janela temporal w pequena
importante que quase toda informao contida na janela seja avaliada de modo que usamos
m = 0.9 e tambm, a0 (sl ) = b0 (sl ) = 100 implicando em uma distribuio priori inicial com
clusters no mais existem e os dados sucessivos no trazem mais informaes relevantes. Aps
continuarmos o monitoramento no tempo observamos que no momento atual n = 24 no existe
indicao de qualquer mudana na distribuio do processo espao-temporal.
68
Figura 4.6: Monitoramento on-line usando Fator de Bayes Sequencial Adaptativo com janela
w = 3, = 0, 05
Figura 4.7:
t [15, 17]
Dados Simulados
Figura 4.8:
69
t [16, 18]
tal que E(Yt (sl )|t (sl ) = et (sl ) t (sl ) com et (sl ) representando o nmero de casos esperados em
sl no tempo t, e dado por et (sl ) = 0 Nt (sl ). 0 uma taxa de referncia global para a doena.
populao mediana em relao ao mapa. Quando simulamos um processo sem cluster assumimos
que sob o modelo padro {t } realizao de um processo Gama tal que,
t (sl ) Gama(100, 100), t = 1, 2, ..., 20 e l = 1, 2, ..., 32.
Esta distribuio a priori, produz uma pequena variao no risco sobre todo o mapa tal que o
valor esperado de Yt (sl ) esta prximo de et (sl ). Para o modelo de cluster emergente denimos
um risco alternativo por t (sl ) = t (sl ) I{t11,sl } . para valores de = 1.5, 2, 3. Note que
neste caso o ponto de mudana k = 12. Usamos, ainda, 0 = 0.0001 (taxa de um caso para
cada 10000 habitantes); probabilidade de falso alarme = 0.05, 0.01; uma janela temporal de
tamanho w = 3 e = 0.2, 0.4. Isto gera um total de 11 cenrios diferentes sobre o modelo
de cluster e 2 cenrios diferentes ( = 0.2, 0.4) sobre o modelo padro. Obviamente este total
de cenrios muito pequeno em relao a classe de todos possveis. No entanto representam
parmetros(, , ) comumente utilizados em outros estudos de simulao de alguns trabalhos j
existentes na literatura (Zhou e Lawson, 2008; Tango et al, 2010). Aps gerarmos estes cenrios
aplicamos o Fator de Bayes usando o algoritmo descrito na seo 4.6 com mecanismo de evoluo
temporal dado em 4.41.
70
O algorItmo descrito em na seo 4.6 usado da seguinte forma: usamos quatro valores
(1,1.5,2,4) para o parmetro de forma da elipse e ento escolhemos os ngulos de modo que
duas elipses de mesma forma, centro e tamanho, com ngulos consecutivos tenham interseco
de no minmo 70% de suas reas. Assim (ver tabela 4.2), quando = 1.5 usamos 2 ngulos de
90 graus, = 2 usamos 6 ngulos de 60 graus, = 4 usamos 12 ngulos de 15 graus. Para = 1
a representao geomtrica do cluster simplesmente um crculo, ou seja usamos apenas um
ngulo. Como descrito na seo 4.5 usamos o fato que a excentricidade, "e"da elipse satisfaz a
relao e2 = 1 (a/b)2 = 1 2 de modo que desta relao podemos obter o valor das quatro
excentricidades usadas. Neste caso, para cada sl e parmetro de forma xo, a cardinalidade de
0l no passo 5 do algoritmo dado em 4.6 igual a
Jl0 = L nmero de ngulos nmero de excentricidades
= L nmero de ngulos # de parmetros de forma usados.
isto signica que, neste caso com L = 32, em cada sl podemos construir 672 conjuntos de
localizaes espaciais com formato eliptco. Logo o nmero total de subconjuntos eliptcos
igual 32 672 = 21504. Usamos um valor de c dado no passo 5 do algoritmo proposto igual a
c = L/4, teremos, ento, que o nmero total de subconjunto avaliados no passo inicial 5376.
71
o Valor predito positivo (PPV) diminui quando aumentammos o valor de . A SSC sempre
maior que o VPP implicando que o cluster localizado tende a ser maior que o verdadeiro cluster,
porm com uma boa preciso Por exemplo, quando = 2, = 0.05 e = 0.2 o atraso estimado
igual a 1.429, que pode ser considerado muito pequeno, pois o cluster foi detectado logo no seu
incio. A preciso na localizao medida pela SSC 0.746 enquanto que o VPP=0.724.
De uma forma geral, o mtodo bastante rpido (possui pequeno atraso) e possui uma boa
preciso. Uma outra observao interessante que, quando usamos um valor de = 0.4 os
resultados quase no se alteram. Uma visualizao da relao atraso versus preciso mostrada
72
atravs de histogramas bivariados nas guras 4.11 e 4.12. Nestas guras pode-se observar que o
atraso baixo a Sensitividade e o Valor predito positivo so relativamente bons. Uma amostra
das densidades preditivas na regio do cluster alocado articialmente no mapa mostrado na
gura 4.13. Nesta gura possvel observar que a preditiva alternativa uma verso suavizada
da preditiva padro.
Tabela 4.3: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) com diferentes valores para , diferentes probabilidades de alarmes falsos ()
usando o Fator de Bayes Adaptativo Eliptico com janela w=3.
Medidas de Performance
= 0.05
SSC
VPP
ADD
1.50
0.608
0.781
1.989
2.00
0.746
0.724
1.429
3.0
0.838
0.681
1.195
1.50
0.598
0.778
2.159
2.00
0.759
0.733
1.508
3.0
0.850
0.689
1.206
1.50
0.605
0.751
1.889
2.00
0.740
0.723
1.410
3.0
0.800
0.678
1.190
1.50
0.590
0.770
2.140
2.00
0.750
0.732
1.500
3.0
0.850
0.680
1.202
= 0.2
= 0.01
= 0.05
= 0.4
= 0.01
4.10 Discusso
73
Figura 4.11: Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.2: Sensitividade
versus atraso e Valor Predito Positivo versus atraso
Figura 4.12: Histograma Bivariado para o Fator de Bayes Adaptativo com = 0.4: Sensitividade
versus atraso e Valor Predito Positivo versus atraso
4.10 Discusso
A proposta deste captulo o desenvolvimento de um novo mtodo para deteco e monitoramento de clusters emergentes. Ns desenvolvemos e descrevemos uma abordagem Bayesiana,
baseada em um Fator Bayes Adaptativo com janela temporal limitada, e usamos uma estrutura
de cluster onde o espao representado por subconjutos de localizaes espaciais com formato
eliptico. Trs importantes caractersticas do mtodo proposto so: 1) A utilizao de uma janela
temporal w que permite a estimao, de qualquer parmetro de interesse, usando dados histricos
pertencentes ao conjunto de tempos t = 1, 2, ....t w; 2) Uma abordagem adaptativa no espao
dos cluster que permite tornar o algoritmo de varredura no espao-tempo "relativamente"rpido.
3) ajusta automaticamente o limite de controle para a funo de alarme, mantendo constante
a probabilidade de um falso alarme e, ainda, tornando o atraso na deteco muito pequeno. A
forma explcita da distribuio preditiva tambm muito importante neste caso, pois permite
analiticamente a obteno de todas as quantidades de interesse para cada tempo de monitoramento e qualquer rea do mapa em estudo.
4.10 Discusso
74
Figura 4.13: Distribuies Preditivas e Padro aps o ponto de mudana nas reas que compe
o cluster: Chaves em (A), Eddy em (B), Lea em (C) e Otero em (D).
Este mtodo desenvolvido, pode ser entendido como uma verso espao-temporal do Fator de
Bayes Sequncial descrito em West(1986) e por isso tambm pode ser extendido para os modelos
analisados em West e Harrison (1986). Alm da abordagem adaptativa, outras diferenas desse
mtodo de monitoramento espao-temporal em relao aos existentes na literatura so: uma
possvel incorporao na anlise de alguns componentes de uma srie temporal como tendncia e
sazonalidade; controle adequado da probabilidade de um falso alarme; no requer o uso de testes
baseados em simulao de Monte Carlo para validar a signicncia estatstica dos resutados. Uma
desvantagem utilizao de distribuies a priori somente na famlia conjugada de distribuies.
75
5.1 Introduo
Os algortmos desenvolvidos anteriormente para a deteco de clusters emergentes no levam
em considerao a incerteza sobre o formato, tamanho e tempo de nicio do mesmo. De uma
maneira implcita, a busca realizada por estes algortmos supe que todos os candidatos a cluster
emergente so equiprovveis. Por isso, neste captulo abordamos o problema da deteco de
de densidade conhecida para Xt , dado um valor selecionado para o parametro t , para cada
t, tal que t = (t (s1 ), t (s2 ), ..., t (sL ))0 pertence a algum conjunto aberto do espao nito
76
f (Xt | t ) =
sl S
, para
G0 (t (sl )).
sl S
Ento,
G( t | = k, = j ) =
sl
/ j
G0 (t (sl ))
sl S
se t k 1
G0 (t (sl ))
mt,j
sl j [G0 (t (sl ))]
se t k, sl j
idia de quanto esta grandeza estocstica, notamos que se Z1 uma varivel aleatria com
funo de distribuio F (z1 ) e Z2 tem funo de distribuio F m (z2 ), ento
Z
z2
P(Z1 < Z2 ) =
1 Z y2
P(Z1 < Z2 ) =
d[y1 ]
(5.1)
d[y2m ]
i = 1, 2, obtemos,
Z
=
0
y2 d[y2m ] =
m
m+1
77
tk1
s S
l
YZ
(5.2)
sl S
sl S
sl j
sl
/ j
denote, quando t k e = j
Z
Pj (Xt ) = Pj (Xt | = k, = j ) = f (Xt | t )dG( t | = k, = j ), t k, sl j
Z Y
Y
=
f (Xt (sl )|t (sl ))dG0 (t (sl ))
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]mt,j
sl j
sl
/ j
Y Z
sl
/ j
Y Z
(5.3)
sl j
Aps observar o processo n-vezes e combinando (5.2) com (5.3) temos que,
(k1)n
f (X1 , X2 , ..., Xn | = k, = j ) =
P0 (Xt )
t=1
n
Y
Pj (Xt )
(5.4)
t=k1
Qn
t>n Pj (Xt )
f (X1 , X2 , ..., Xn | = k, = j ) =
P0 (Xt )
t=1
n
Y
Pj (Xt )
(5.5)
t=k
n
Y
t=1
P0 (Xt )
(5.6)
78
Usando a distribuio a priori para o par (, ) dada na seo 5.2, obtenha que a distribuio a
( = k, = j |Hn ) =
onde
f (Hn ) =
J X
n
X
Q
(k) (j) n
t=1 P0 (Xt )
f (Hn )
Q(k1)
Q
(k) (j) t=1 P0 (Xt ) n
t=k Pj (Xt )
f (Hn )
(k1)
(k) (j)
P0 (Xt )
t=1
i=1 k=1
n
Y
Pj (Xt ) +
t=k
se k > n
(5.7)
se k n, = j
(k)
n
Y
P0 (Xt ).
t=1
k=n+1
Qn
e obtenha que,
( = k, = j |Hn ) =
(k) (j)
Qn
P
(k)
(i)
i=1
k=1
t=k F Bt (i)+ k=n+1 (k)
Q
(k) (j) n
F Bt (j)
Qn t=k
P
PJ Pn
(k)
(i)
F
B
i=1
k=1
t=k
PJ
se k > n
Pn
onde
F Bt (j) =
(5.8)
se k n, = j
Pj (Xt )
, t k.
P0 (Xt )
(5.9)
sl S
Y Z
sl
/ j
Y Z
sl j
Obtenha que
Pj (Xt ) Y
F Bt (j) =
=
P0 (Xt )
sl j
(5.10)
que depende somente do sub-processo Xt (j) = {Xt (sl ) : t k, sl j }. Em uma estrutura geral
computamos F Bt (j) da seguinte forma:
1. Para computarmos a integral
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]mt,j , assumimos que G0 (t (sl ))
79
de modo que
Z
f (Xt (sl )|t (sl ))d[G0 (t (sl ))]
mt,j
Z
=
0
mt,j
f (Xt (sl )|G1
]
0 (y))d[y
mt,j 1
f (Xt (sl )|G1
dy
0 (y))mt,j y
0
= EZ f (Xt (sl )|G1
(5.11)
0 (z)) ,
s l j .
(5.12)
q=1
Quanto maior o valor de Q, mais precisa ser esta abordagem. Mesmo se L for
razoavelmente grande esta abordagem no torna o algoritmo de busca por cluster
emergente muito demorado, pois exige apenas a gerao de uma matriz L Q de
valores.
(b) Aproximar EZ f (Xt (sl )|G1
0 (z)) usando o mtodo Delta, de modo que
EZ f (Xt (sl )|G1
f (Xt (sl )|G1
0 (z)) z=E(Z)
0 (z))
= [f (Xt (sl )|G1
0 (z))]z=mt,j /(mt,j +1) .
3. Obviamente a quantidade
(5.13)
f (Xt (sl )|t (sl ))d[G0 (t (sl ))] obtida com mt,j = 1.
n
X
k=1
( = k, = j |Hn ) e n (0) =
X
X
j=1 k=n+1
( = k, = j |Hn ).
(5.14)
80
Onde
n,w (j) = P(n w + 1 n, = j |Hn ) =
com j = 1, 2, ..., J.
n
X
( = k, = j |Hn ).
k=nw+1
7 perodos de tempo (7 dias, meses, etc,...), ento k0 (n, 6) = n 7 e w=6. Claramente, quando
w = n temos o processo a posteriori dado em 5.14.
(5.15)
onde o valor esperado realizado sobre a distribuio a posteriori para (, ). Agora, considere
81
J
X
I{ <,d=j}
j=1
J
X
aij (i).
(5.16)
i=0
Equanto a formulao do risco de Bayes dada em (5.15) expressa em termos dos valores para
as variveis aleatrias no observveis (, ). A expresso (5.16) da uma verso para o risco
de Bayes baseado na distribuio a posteriori conjunta de (, ). Para provar (5.16), usamos
I{AB} = I{A} I{B} e observamos que o evento { = n, d = j} mensurvel a (X1 , ..., Xn ).
Agora,
E[a0d I{ <} |H ] =
J
X
E[a0d I{ <,d=j} |H ] =
j=1
J
X
j=1
mas
E[I{ <,d=j} |H ] =
=
X
n=1
n=1
n=1
= limM
I{ =n,d=j} n (0)
n=1
M
X
n=1
(5.17)
= I{ <,d=j} (0).
e portanto,
E[a0d I{ <} |H ] =
J
X
(5.18)
j=1
M =1 {
ainda, que
E[ad I{ } |H ] =
J X
J
X
j=1 i=1
E[ad I{ ,d=j,=i} |H ] =
J X
J
X
j=1 i=1
82
mas,
E[I{ ,d=j,=i} |H ] =
=
X
n=1
n=1
n=1
I{ =n,d=j} n (i)
n=1
= limM
M
X
n=1
(5.19)
= I{ <,d=j} (i).
Logo,
E[ad I{ } |H ] =
J X
J
X
(5.20)
j=1 i=1
J
X
j=1
J
X
J X
J
X
j=1 i=1
"
I{ <,d=j} a0j (0) +
j=1
J
X
#
aij (i) =
J
X
i=1
I{ <,d=j}
j=1
J
X
aij (i).
i=0
(5.21)
Para construrmos o tempo de alarme, denimos as funes,
u(y) = min[uj (y)] onde uj (y) =
jJ
J
X
y(i)aij ,
j J.
i=0
J
X
I{ <,d=j}
j=1
= I{ <}
J
X
J
X
aij (i)
i=0
I{d=j} uj ( )
j=1
(5.22)
Onde o evento I{ <} dene uma regra de deciso d e, d qualquer ndice d = j tal uj ( ) =
u( ). Ou seja, minimizar o risco de Bayes a posteriori consiste em escolher j = arg min[uj ( )] .
jJ
Desta forma a deciso tima depende do valor do processo , somente no estgio em que o alarme
disparado. Note que,
uj ( ) =
J
X
i=0
J
X
i=1
aij (i)
83
J
X
(i) (j)
i=1
De modo que sob a perda 0-1, a deciso tima escolher o conjunto j com a maior probabilidade
a posteriori. Ento, seja 0 < B < 1 e
= { : R(|Hn ) 1 B}
com
Dena como estratgia para deteco de cluster emergente um procedimento = (
, d)
tempo de alarme,
= min{n 1 : max[n (j)] > B}
jJ
(5.23)
( = k, = j |H )
k=1
= ( = 1, = j |H1 ) + ( = 2, = j |H2 ) + + ( = , = j |H ).
(5.24)
de alarme,
w = min{n w : max[n,w (j)] > B}
jJ
(5.25)
84
de estados {l1 , ..., lj }. Para n > 1, denote l(n1) como o estado do processo l no tempo n 1,
onde
(
(n1)
l
j
= arg
max n1 (lj ) , j = 1, 2, ..., Jl
lj l
(5.26)
(n1) = {1
j
(n1)
, ..., L
j
(n1)
n1 (l
por
l
j
(5.27)
onde |(n) | denota a cardinalidade de (n) . Para deteco de cluster emergente usamos o tempo
de alarme
= min{n 1 :
max
(n1)
l
(n)
(n1)
n (
[
l
j
)] > B}
(5.28)
(n1)
= arg
max
(n1)
l
(n)
(n1)
n (
[
l
j
)] .
Para uma anlise "objetiva", ns usamos B = 1/(J 0 ) este valor signica que a priori, qualquer
subconjunto de localizaes espaciais tem a mesma probabilidade de representar a parte espacial
do cluster emergente.
85
(5.29)
em que E(lj ), E(lj ), E(%lj ) so, respectivamente, escores de tamanho, forma e direo do clus-
ter, a terna (p1 (lj ), p2 (lj ), p3 (lj )) so valores no negativos representamdo pesos de importncia
e
c=
lj
86
assumir que E(lj ) igual ao raio de lj , rlj . Observe que rlj grande (lj ) diminui, tornando um
cluster pequeno mais provvel (situao 1). Desde de que a forma est xada (formato circular)
tomamos E(lj ), pois E(lj ) > 0 penaliza a forma do clusters. Notando que o formato circular
independe da direo, tomamos E(%lj ). Para escolher p1 (lj ), podemos proceder da seguinte
forma: sejam lj e lj dois candidatos a cluster tal que rlj = 2 e rlj = 3. Ento, obtemos que
(lj )
= ep1 (lj )
(lj )
p1 (lj ) = log
(lj )
(lj )
tal que p1 (lj ) reete pesos de preferncia na escala logartmica. Por exemplo, ns podemos supor
que ao aumentarmos o raio (aumentamos o tamanho do cluster) em uma unidade de distncia
(por exemplo, 1Km) ocorra uma perda de similaridade espacial entre o centro do cluster e as
reas da borda do cluster, tal que lj seja (devido a perda de similaridade espacial de lj ) 10%
mais provvel que lj . Ento escolhemos p1 (lj ) = log(1, 1)
= 0, 1. A escolha p1 (lj ) = 1 implica
que crculos com mesmo raio possuem a mesma probabilidade de ser a verdadeira parte espacial
do cluster emergente.
Em geral, diferentes funes escore para cada parte espacial do cluster emergente podem
ser usadas para reetir diferentes crenas a priori sobre a estrutura do cluster. Especicaes
apropriadas requerem o conhecimento de um expert sobre o padro dos eventos em questo.
Quando E(lj ) = E(lj ) = E(%lj ) = 0, teremos uma distribuio a priori uniforme no espao
dada por (lj ) = 1/||,
lj , onde || a cardinalidade de .
Figura 5.1: Uma Classe de clusters com formato circular e tamanho varivel
5.7 Aplicao
87
A distribuio a priori para o ponto de incio do cluster emergente (parte temporal) baseada
numa verso truncada da distribuio geomtrica. Assumimos que
( = k) = (k) = p(1 p)k(nw+1) ,
k = n w + 1, n w + 2, ....
(5.30)
(5.31)
k = 1, 2, ....
Em uma anlise puramente temporal, a distribuio geomtrica dada em (5.31) foi usada pela
primeira vez por Shiryaev (1963) como distribuio a priori para um provvel ponto de mudana.
Recentemente, esta distribuio tem sido usada para monitorar mudanas no tempo de chegada
em um processo de Poisson em vrias categorias com taxa de chegada conhecida (Brown, 2008) e
desconhecida (Brown, 2009). Uma classe mais geral de distribuies a priori, no qual a geomtrica
est inserida, usada para monitoramento de mudanas na escala temporal tem sido apresentada
em Borovkov(1998). Um grande problema ao usr-mos esta abordagem a especicao de p.
Na escala temporal, Frisn and Wessman (1999), Sonesson and Bock (2003), tem recomendado
o uso de pequenos valores para p (por exemplo p = 0.20) de modo que os resultados possam
ser comparados com o mtodo da razo de verossimilhana (veja, 2.2.2). Pequenos valores de
p indicam que a probabilidade de uma mudana pequena. Ns assumimos que no tempo n
a probabilidade a priori que no tenha ocorrida uma mudana p0 . Desta forma, p satisfaz a
equao,
P( > n) = p0
mas,
P( > n) =
k=n+1
p(1 p)k1
k=n+1
n+w
= (1 p)
(1 p) = (1 p) .
1/w . Para
ento obtenha p = 1 p1/w
0 . Uma escolha natural p0 = 1/2 de modo que p = 1 0.5
esta escolha, a probabilidade a priori de que no tenha ocorrido mudana no ponto k maior
que 0.5.
5.7 Aplicao
Para ilustrar a utilizao do mtodo para deteco de cluster no espao-tempo baseado em
um processo a posteriori, ns avaliamos o conjunto de dados referente aos casos de cncer da
tireide em homens que ocorreram no Novo Mxico durante o perodo de tempo 1973-1992. Este
conjunto de dados foi descrito e utilizado na seo 3.3 desta tese e tm sido usado por alguns
5.7 Aplicao
88
pesquisadores (Kulldor, 2001; Lima e Duczmal, 2011) como um banco de dados teste para
avaliar a performance de um mtodo proposto para a deteco de cluster emergente.
5.7.1
sl S
xT,i,r (sl )/
sl S
NT,i,r (sl ). Logo eT,i,r (sl ) = NT,i,r (sl )T,i,r representa uma estimativa
para o nmero de casos esperados no tempo T na classe de idade i e raa r sob a suposio de
que no existe cluster no espao-tempo. Portanto, uma estimativa para o nmero total de casos
5.7 Aplicao
89
P P
i
r eT,i,r (sl )
e, nalmente usamos,
t w + 1.
T =1
Obviamente, os {t (sl ) : l = 1, 2, ..., L e t 1} so assumidos independentes com distribuio comum W eibull(a, b) onde a e b so, respectivamente, os parmetros de forma
e escala dessa distribuio. A distribuio W eibull(a, b) surge, neste captulo, como uma
distribuio alternativa em relao ao uso de uma distribuio na famlia conjugada (ver
seo 4.6), pois ela pode tomar uma grande variedade de formas regulares podendo, por
exemplo, acomodar assimetria da distribuio. Esta distribuio, possui
Moda(t (sl )) = b
a1
a
1/a
, a > 1 e b > 0.
e
Varincia = b2 ((1 + 2/a) ((1 + 1/a))2 )
Em que (.) denota a funo gama. Em problemas de deteco de cluster emergente,
razovel supor que, se no existem mudanas no processo espao-temporal em monitoramento, os {t (sl ) : l = 1, 2, ..., L e t 1} surgem de forma aleatria a partir de uma
distribuio comum. Desta forma, quando o processo esta sob-controle, pode-se interpretar
a M oda(t (sl )) como sendo o valor mais provvel para o risco relativo de ocorrncia de um
caso de cncer da tireide em uma rea escolhida ao acaso no mapa. Observe que, se
b=
a1
a
1/a
,
Logo, sobre esta escolha para b, podemos selecionar o valor a de modo a obtermos pequenas
variaes em torno de 1 para a distribuio de t (sl ). Como escolha apropriada, ns usamos
o par (a, b) = (2, 1.414) que fornece M oda = 1 e pouca variao (veja gura 5.3). Agora,
seja
1/a
y = G0 (t (sl )) G1
,
0 (y) = b (log(1 y))
0 < y < 1.
e
f (Xt (sl )|t (sl )) = (Xt (sl )!)1 (et (sl )t (sl ))Xt (sl ) exp{et (sl )t (sl )}
5.7 Aplicao
90
ento,
Xt (sl )
1
1/a
f (Xt (sl )|G1
(y))
=
(X
(s
)!)
e
(s
)b(log(1
y))
t l
t l
0
exp{et (sl )[b(log(1 y))1/a ]}.
(5.32)
Figura 5.3: funo de densidade weibull (f.d), funo de densidade do mximo de m-variveis
weibull (f.d. max), Funo de distribuio weibull (F.d), Funo de distribuio do
mximo de m-variveis weibull (F.d. max), 1-Funo de distribuio weibull (1-F.d),
1-Funo de distribuio do mximo de m-variveis weibull (1-F.d. max)
2. Distribuio a priori para : Para compararmos nossos resultados com os obtidos em
Kulldor (2001) e Lima e Duczmal (2011). Ns supomos que tem formato geomtrico
circular, porm com tamanho varivel como mostrado na gura 5.1. Em cada ponto sl
arbitrrio do mapa ns centramos um crculo e aumentamos seu raio rlj at que contenha
todos os outros centrides. Nesta formulao no existe restrio ao tamanho do crculo
de modo que temos um total inicial de crculos igual a L2 = 322 . Usando um simples
algoritmo para eliminao de crculos com as mesmas localizaes espaciais, obtemos um
total de
J 0 = 743
(5.33)
5.7 Aplicao
91
(lj ) = c exp(rlj ),
exp(rli ).
(5.34)
li
A escolha p1 (lj ) = 1 implica que crculos com mesmo raio possuem a mesma probabilidade
a priori de ser a verdadeira parte espacial do cluster emergente. Para obteno do raio rlj ,
realizamos um reescalonamento nas distncias entre os centrides do mapa. Centrado em
sl , seja d(sl , sl0 ) a distncia de sl a qualquer outro ponto s0l do mapa e M ax(sl ) a maior
l , sl0 ) = d(sl , sl0 )/M ax(sl ). Usando d(s
l , sl0 ) como
distncia observada, ento denimos d(s
k = n w + 1, n w + 2, ....
(5.35)
p = 1 p0
o tempo n. A tabela 5.1 apresenta alguns valores para p de acordo com o valor de w e
p0 = 0.5 que o valor usado nesta aplicao.
p0 = 0.5
5.7.2
0.21
0.16
0.13
0.11
0.09
0.08
5.7 Aplicao
92
k=n+1 (k)
li ( n) exp(rli )
PQ
sl lj
1
q=1 fm (Xt (sl )|G0 (zq ))
.
PQ
1
q=1 f1 (Xt (sl )|G0 (zq ))
onde z1 , z2 , ..., zQ so Q = 1000 valores gerados de uma distribuio Beta(m, 1). O ndice
em f1 (.) signica que m = 1 e fm (.) dada em (5.32) substituindo y por zq .
Desta forma,
n
X
( = k, = lj |Hn ).
(5.36)
k=nw+1
1
q=1 fm (Xt (sl )|G0 (zq ))
sl lj PQ f1 (Xt (s )|G1 (zq ))
l
q=1
0
PQ
1
Q
Q
f
(X
(s
)|G
m
t
l
n
q=1
0 (zq ))
0.51/6 )(0.51/6 )k(n5) exp(rli ) t=k sl l PQ
1
f1 (Xt (s )|G (zq ))
i
li (n)
Pn
k=n5 (1
Qn
t=k
PQ
q=1
+ 0.5/cn
(5.37)
Obviamente,
n (0) = 1
X
li
n,w (lj ).
(n)
Como em (5.33) temos J 0 = 743 obtemos da seo 5.5 que B = 1/743 0.0013. Agora,
usamos um limite de controle B = 0.5 e aplicamos o processo a posteriori adaptativo nos cojunto
de dados de cncer da tireide (Kulldor, 2001) e os resultados obtidos so apresentados e
discutidos na prxima seo.
5.7.3
Os resultados mais importantes envolvendo a aplicao do mtodo de monitoramento proposto, baseado na Mxima Probabilidade a Posteriori (MPA) conjunta de um possvel tempo
de mudana em alguma regio do mapa, so apresentados nas guras 5.4 e 5.5. A gura 5.4
5.7 Aplicao
93
Os valores observados para esta razo, mostram que nos ltimos dois perodos de tempo (t =
19, 20) esta razo foi superior para todas as reas pertencentes ao cluster indicando um aumento
5.7 Aplicao
94
Figura 5.4: A esquerda: Mxima probabilidade a posteriori adaptativa para m=2, ponto k=15
e regio da mudana; A direita: Mxima probabilidade a posteriori adaptativa para
m=8, ponto k=19 e regio da mudana.
Figura 5.5: Em (A): Mxima probabilidade a posteriori adaptativa para m=2, 4 e 8; Em (B)
Razo valor observado por valor esperado xt (sl )/et (sl ), t k = 1, 2, ..., n para as
regies do cluster emergente detectado e considerado signicativo
95
Dados simulados
tal que E(Xt (sl )|t (sl ) = et (sl ) t (sl ) com et (sl ) representando o nmero de casos esperados em
sl no tempo t. e dado por et (sl ) = 0 Nt (sl ). 0 uma taxa de referncia global para a doena.
populao mediana em relao ao mapa. Quando simulamos um processo sem cluster assumimos
que sob o modelo padro {t }, realizao de um processo Gama tal que,
t (sl ) Gama(100, 100), t = 1, 2, ..., 20 e l = 1, 2, ..., 32.
Esta distribuio a priori produz uma pequena variao no risco sobre todo o mapa tal que o
valor esperado de Xt (sl ) esta prximo de et (sl ). Para o modelo de cluster emergente denimos
um risco alternativo por t (sl ) = t (sl ) I{t11,sl } . onde t (sl ) o valor gerado da distribuio
de referncia Gama(100,100) e = 1.5, 2, 3. Observa-se que neste caso o ponto de mudana
k = 12. Usamos, ainda, 0 = 0.0001 (taxa de um caso para cada 10000 habitantes); uma
janela temporal de tamanho w = 6. Para detectarmos o cluster no espao tempo, ns usamos
G0 W eibull(2, 1.414) e G0 U nif (0, 2). Isto gera um total de 18 cenrios diferentes sobre o
modelo de cluster e sobre estes cenrios ns aplicamos como funo de monitoramento a expresso
5.37 e calculamos as medidas de performance: Sensitividade Condicional de um alarme SSC;
Valor Predito Possitivo Condicional de um alarme VPP; atraso na deteco ADD. descritas
na seco 3.5.1. Uma observao importante, que embora o processo {t } seja gerado de uma
distribuio Gama, usamos como distribuies de referncia as distribuies Uniforme e Weibull.
96
quando aumentamos o valor de e m. A SSC sempre menor que o VPP implicando que o
cluster localizado tende a ser menor que o verdadeiro cluster, porm com uma boa preciso. Isto
deve ocorrer como efeito da distribuio a priori para a parte espacial do cluster que favorece de
uma maneira mais forte os clusters com pequenas reas (pois as distncias entre seus centrides
so mais prximas). Por exemplo, quando = 2, m = 8 e G0 W eibull o atraso estimado
igual a 0.581, que pode ser considerado muito pequeno, pois o cluster foi detectado logo no seu
incio. A preciso na localizao medida pela SSC 0.907 enquanto que o VPP=0.946.
De uma forma geral, o mtodo bastante rpido (possui pequeno atraso), possui uma boa
preciso e aparentemente parece ser robusto no sentido de que mesmo usando uma distribuio
a priori diferente da verdadeira, os resultados obtidos foram satisfatrios. Uma amostra do
funcionamento on-line do mtodo com dados simulados apresentado na gura 5.6. Nesta gura
observamos que quando m cresce a mxima probabilidade a posteriori se aproxima de 1.
Figura 5.6: Amostra de uma simulao do processo a posteriori adaptativo para distribuies de
referncia Weibull e Uniforme com: = 2, B=0.5, m=2,4,8
5.9 Discusso
97
Tabela 5.2: Valores estimados para Sensitividade (SSC), Valor Predito Positivo (VPP) e Atraso
(ADD) usando o processo a posteriori adaptativo com janela w=6, diferentes valores
para e duas distribuies para G0 : Weibull(2,1.414) e Uni(0,2)
Medidas de Perfomance
SSC
VPP
ADD
1.50
0.571
0.634
3.785
2.00
0.510
0.742
3.462
3.00
0.341
0.679
2.917
1.50
0.940
0.953
2.950
Weibull(2,1.414) m = 4 2.00
0.907
0.941
1.478
3.00
0.805
0.928
1.224
1.50
0.933
0.958
1.845
2.00
0.907
0.946
0.581
3.00
0.877
0.897
0.463
1.50
0.741
0.779
3.170
2.00
0.781
0.813
3.000
3.00
0.639
0.823
2.602
1.50
0.846
0.887
2.884
2.00
0.819
0.835
1.257
3.00
0.847
0.883
0.915
1.50
0.816
0.873
2.553
2.00
0.809
0.833
0.933
3.00
0.800
0.807
0.384
m=2
m=8
m=2
Unif(0,2)
m=4
m=8
5.9 Discusso
Neste captulo desenvolvemos um novo mtodo para deteco e monitoramento de clus-
5.9 Discusso
98
priori para a parte espacial do cluster que levam em considerao o tamanho, forma e direo do
cluster. Para identicar possveis mudanas na taxa de ocorrncias de eventos, ns elaboramos
uma abordagem alternativa em relao ao uso de distribuies na famlia conjugada (descritas na
seo 4.4), baseada em mudanas na funo de distribuio a priori. Essas mudanas so capituradas por uma distribuio que estocasticamente maior do que a considera como distribuio
padro (ou distribuio de referncia). Resultados mostrados em nossas simulaes mostraram
uma certa robustez no mtodo na presena de distribuies a priori mal especicada. Em nossa
aplicaes obtivemos resultados mais conclusivos que os apresentados em Kulldor (2001) e Lima
e Duczmal (2011).
99
6 Concluso
Nesta tese de doutorado foram desenvolvidos vrios mtodos para a deteco de mudanas
no espao-tempo que podem ser usados em uma variedade de sistemas de vigilncia: Sistema
de vigilncia em crimes; Sistema de vigilncia em sade pblica; Sistemas de monitoramento
ambiental. O foco principal a deteco de clusters no espao-tempo.
Ao combinarmos tcnicas de vigilncia estatstica no domnio do tempo com estimao adaptativa e algortmo para deteco de cluster espacial com representao geomtrica circular, ns
desenvolvemos um mtodo de monitoramento no espao-tempo baseada no uso da Razo de
Verossimilhana Adaptativa (ALR). Em essncia a ALR uma razo de verossimilhana genuna
e por isso preserva a propriedade martingal de modo que os mtodos baseados na ALR no requerem o uso de testes de Monte Carlo para validar a signicncia estatstica do procedimento
o que tornou bastante rpido e eciente o algortmo desenvolvido para deteco do tempo e
localizao da mudana.
Ao considerarmos a possvel observao de processos espao-temporais compostos por componentes correlacionados, no-estacionrios ou com localizao espacial da mudana com um
formato no circular, Ns desenvolvemos, para a deteco de clusters emergentes nestes tipos
de processos, uma abordagem Bayesiana baseada em um Fator Bayes Adaptativo com janela
temporal limitada e usamos uma estrutura de cluster onde o espao representado por subconjuntos de localizaes espaciais com formato eliptico. Trs importantes caractersticas observadas
nesse novo mtodo so: 1) A utilizao de uma janela temporal w que permite a estimao, de
qualquer parmetro de interesse, usando dados histricos pertencentes ao conjunto de tempos
t = 1, 2, ....t w; 2) Uma abordagem adaptativa no espao dos cluster que permite tornar o algo-
riori conjunta de que tenha ocorrido uma mudana no padro de eventos de um determinado
6 Concluso
100
fenmeno em estudo em uma sub-regio do mapa a um tempo desconhecido. Neste caso foi
usada como funo de alarme, a mxima probabilidade a posteriori conjunta (MAP), que torna
mais simples a interpretao da abordagem adaptativa em termos de probabilidades a posteriori.
Mostramos que esta abordagem minimiza uma perda esperada a posteriori representada por uma
combinao de uma perda por um falso alarme e uma falsa localizao. Desenvolvemos uma estrutura geral de distribuies a priori para a parte espacial do cluster que levam em considerao
o tamanho, forma e direo do cluster.
Embora analiticamente, tenha sido impossvel obter propriedades dos mtodo desenvolvidos
no que tange ao atraso e preciso na deteco, empiricamente, atravs de alguns simples estudo
com dados articiais, obtivemos resultados altamente satisfatrios, que podem ser raticados
ou no atravs de estudos comparativos com outros mtodos. Estes estudos comparativos no
foram abordados aqui devido algumas diculdades tcnicas. Uma importante observao nos
resultados e simulaes que a performance dos mtodos propostos sugerem que a abordagem
adaptativa na classe dos subconjuntos de localizaes espaciais muito efetiva em um monitoramento simultneo no espao-tempo.
101
Referncias Bibliogrcas
Assuno, R., Corra, T (2009). Surveillance to detect emerging space-time clusters
Computational Statistics and Data Analysis, 53, 2817-2830.
Ailamaki, A., Faloutsos, C., Fischbeck, P (2003). An environmental sensor network to determine
drinking water quality and security SIGMOD Record, 32, 47-52.
Banerjee S, Carlin B.P, Gelfand A.E (2004). Hierarchical Modeling and Analysis for Spatial
Data. Chapmam Hall, Boca Raton, FL
Besag, J. and Newell. J (1991). The detection of cluster in rare diseases. J.R. Statist. Soc. A,
154, 143-155.
Borovkov, A.A., (1998). Asymptotically optimal solutions in the change-point problem. Theory
Probab. Appl, 43, 539-561.
Brown,M. (2008). Monitoring a Poisson process in several categories subject to changes in the
arrival rates Statistics and Probability Letters 78,2637-2643.
Brown,M. (2008). Bayesian Detection of Changes of a Poisson Process Monitored at Discrete
Time Points Where the Arrival Rates are Unknown Sequential Analysis 27,68-77.
Cuzick, J. and Edwards, R (1990). Spatial clustering for inhomogeneos populations. Journal of
Royal Statistical Society. B, 52, 73-104.
Duczmal, L.H., Assuno, R.M., (2004). A simulated annealing strategy for the detection of
arbitrary shaped spatial clusters. Computational Statistics and Data Analysis, 45, 269-286.
Duczmal, L., Canado, A.L., Takahashi, R.H., Bessegato, L.F. (2007). A genetic algorithm for
irregularly shaped spatial scan statistics. Computational Statistics and Data Analysis 52, 43-52.
Dwass, M., (1957). Modied randomization test for nonparametric hypotheses. Ann. Math.
Statist, 28, 181-187.
Frisn, M. and Wessman, P. (1999). Evaluations of likelihood ratio methods for surveillance:
dierences and robustness Communs Statist. Simuln Computn 28, 597-622.
Gangnon, R.D., Clayton, M. K. (2007). Cluster detection using Bayes factors from
overparameterized cluster models. Environ Ecol Stat, 14, 69-82.
Gutierez, P. E, and Smith A.F.M, (1995). Conjugate Parametrizations for Natural Exponential
Families. Journal of the American Statistical Association 90, 1347-1356.
Kass, R.E and Adrian, E.R. (1995). Bayes Factors Journal of the American Statistical
Association 90,430, 773-795.
Knorr-Held, L., Raer G., (2000). Bayesian detection of clusters and discontinuities in disease
maps. Biometrics, 56, 13-21.
Kulldor, M., (1997) A spatial scan statistic. Communs Statist. Theory Meth., 26, 1481-1496.
Referncias Bibliogrcas
102
Kulldor, M., (2001) Prospective time periodic geographical disease surveillance using a scan
statistic. Journal of Royal Statistical Society, A., 164, 61-72.
Kulldor, M., Huang, Lan., Pickle, Linda., Duczmal, L. (2006). An Elliptic Spatial Scan
Statistic. Statistics In Medicine, 25, 3929-3943.
Gorr, W., Harries, R. (2003). Introduction to crime forecasting. International Journal of
Forecasting, 19, 551-555.
Imbiriba, E.N.B, Neto,A.L.S, Souza, W.V, Pedrosa, V., Cunha, M.G, Garnelo, L. (2009).
Social inequality, urban growth and leprosy in Manaus: a Spatial appoach. Rev Saude Publica,
43,4, 656-665.
Lai, T.L., (1995). Sequential change point detection in quality control and dynamical systems.
Journal of Royal Statistical Society, A., 57, 613-658.
Lai, T.L., (1998). Information bounds and quick detection of parameter changes in stochastic
systems. IEEE Trans. Inform. Theory., 44, 2917-2929.
Lima, M.S, Duczmal, L.H, (2009) Endemic Disease Surveillance Using Bayes Factor.
International Society for Disease Surveillance Eighth Annual Conference, Miami, EUA
Lima, M.S, Duczmal, L.H., (2011). Surveillance and Detection of Space-Time Clusters using
Adaptive Bayes Factor. in: Cancer Clusters. Editor: Bradley D. Germanno, Series: Cancer
Etiology, Diagnosis and Treatments, Nova Science Publishers, ISBN: 978-1-61209-516-5
Lima, M.S, Duczmal, L.H, (2011) Adaptive Likehood Ratio Approaches for the Detection of
Space-Time Disease Clusters submited
Lorden, G., Pollak M., (2005). Nonanticipating estimation applied to sequential analysis and
changepoint detection. Annals of Statistics, 33, 1422-1454.
Marshall, J.B., Spitzner, D.J., Woodall, W.H., (2007). Use of the local Knox statistic for the
prospective monitoring of disease occurrences in space and time. Statistics in Medicine., 26,
1576-1593.
Migon, H.S. and Gamermam, D. (1999). Statistical Inference: An Integrated Approch. Hodder
Arnold, London
Morris, C.N (1982). Natural Exponential Families with Quadratic Variance Functions. Annals
of Statistics ., 10, 65-80.
Neill, D.B, Moore, A.W., Sabhnani, M.R., (2005). Detecting elongated disease clusters.
Morbidity and Mortality Weekly Supplement on Syndromic Surveillance, Report, 54, 197.
Neill, D.B, (2006). Detection of Spatial and Spatio-Temporal Clusters. Ph.D. Thesis, University
Pittsburgh.
Neill, D.B, (2009). Expectation-based scan statistics for monitoring spatial time. International
Journal of Forecasting 25, 498-517.
Openshaw, S., Craft, A.W., Charlton, M., and Birch, J.M., (1988). Investigation of leukaemia
cluster by use of a geographical analysis machine. Lancet, 1, 272-273.
Page, E. S., (1954). Continuous inspection schemes. Biometrika, 41, 100-115.
Patil, G.P., Taillie, C., (2003). Geographic and network surveillance via scan statistics for
critical area detection. Statistical Science, 18, 457-465.
Referncias Bibliogrcas
103
Pavlov, I.V., (2003). Sequential Procedure of Testing Composite Hypotheses with Applications
to the Kiefer-Weiss. Theory Prob. Appl, 35, 280-292.
Pollak, M., Siegmund. D., (1975) Aproximations to the expected sample size of certain
sequential test. Annals of Statistics, 3, 1267-1282.
Pollak, M. (1985) Optimal detection of a change in distribution. Annals of Statistics, 13,
206-227.
Pollak, M. (1987) Average run lengths of an optimal method of detecting a change in
distribution. Annals of Statistics, 15, 749-779.
Porter,D.M, (2007) Some Adaptive approaches for space-time anomaly detection. First
International Workshop in Sequential Methodologies, IWSM.
Roberts, S. W. (1966) A comparison of some control chart procedures. Technometrics., 8
411-430.
Sabhnani, M., Neiil, D.B., Moore, A. W., Tsui, F.C., (2005). Detecting anomalous clustersin
pharmacy retail data. In Proceedings of the KDD, workshop on data mining methods for
anomaly detection 2005, 58-61.
Shiryayev, A.N., (1986). On optimum methods in quickest detection problems. Theory Probab.
Appl., 8, 22-46.
Shiryayev. A.N, (1978). Optimal Stopping Rules. In: Springer-Verlag, New york
Sonesson, C., Bock, D., (2003). A review and discussion of prospective statistical surveillance
in public health. Journal of Royal Statistical Society, A., 166, 5-21.
Sonesson, C., (2007). A CUSUM framework for detection of space time disease clusters using
scan statistic. Statistics in Medicine., 26, 4770-4789.
Tartakovsky, A.G., Rozovskii, L.R., Blazek, R.B., Kim, H. (2006). Detection of intrusions in
information systems by sequential change-point methods. Statistical Methodology., 3, 252-293 .
Tango, T. (1995). A class of tests for detecting general and focused clustering of rare diseases.
Statistics in Medicine., 14, 2323-2334.
Tango, T., Takahashi, K., (2005). A exibly shaped spatial scan statistic for detecting clusters.
International Journal of Health Geography, 4, 4-11.
Tango, T., Takahashi, K., Kohriyama, Kazuaki. (2010). A Space-Time Scan Statistic for
Detecting Emerging Outbreaks Biometrics, 4, 1-10.
Tuiia, D., Lasaponarab, R., Telescab, L., Kanevskia, M., (2008). Emergence of spatio-temporal
patterns in forest-re sequences. Physica A, 387, 3271-3280.
Turnbull, B.W., Iwano, E.J.,Burnett,W.S., HOWE, H.L, and Clark,L.L (1990). Monotoring for
Cluster of disease: Aplication to leukemia incidence in upstate New York. American J. epidem,
88, 132, S136-S143.
Walter, S.D. (1994). A simple test for spatial patter in regional health data. Statistics in
Medicine., 13, 1037-1044.
West, M., (1986). Bayesian Model monitoring. Journal of Royal Statistical Society, B., 48,
70-78.
Referncias Bibliogrcas
104
West, M. and Harrison, P.J. (1986). Monitoring and Adaptation in Bayesian Forecasting
Models Journal of the American Statistical Association 81,395, 741-750.
West, M. and Harrison, P.J. (1997). Bayesian Forecasting and Dynamic Models Springer-Verlag
New York, Second Edition
Zhou, H. and Lawson, A.B, (2008). EWMA smoothing and Bayesian spatial modeling for
health surveillance Statistics in Medicine 48
Ross,S.M (1983). Stochastic Processes. Wiley Series in Probability and Mathematical Statistics:
Probability and Mathematical Statistics. John Wiley Sons Inc., New York, 1983. Lectures in
Mathematics, 14.