Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
= = =
= =
|
|
.
|
\
|
=
n
i
i
n
i
n
j
ij
n
i
n
j
j i ij
z z w
z z z z w n
I
1
2
1 1
1 1
O ndice global de Moran a expresso da autocorrelao espacial considerando
apenas o primeiro vizinho. Ele realiza o teste cuja hiptese nula de independncia
espacial. Sua interpretao semelhante interpretao de um coeficiente de correlao
comum: quanto mais prximo de 0, indica falta de associao espacial; e para valores
prximos de 1, indica forte associao (Silva, 2006).
b) C de Geary:
( ) ( )
= = =
= =
=
n
i
i
n
j
ij
n
i
n
i
n
j
j i ij
z w
z z w n
C
1
2
1 1
1 1
2
1
14
O ndice de Geary difere do de Moran por utilizar a diferena entre os pares. Sua
interpretao feita de maneira oposta: quanto mais prximo de 1, h indcios de que no
existe associao espacial; e quanto mais prximo de 0 mais forte a associao entre
localidades vizinhas (Silva, 2006).
4.3.2 Modelos de Regresso Espacial
O processo de modelagem consiste na busca de um modelo, o mais simples
possvel, que descreva bem os dados observados. Um modelo de regresso uma
ferramenta estatstica que utiliza o relacionamento existente entre duas ou mais variveis
de maneira que uma delas possa ser descrita ou o seu valor possa ser estimado a partir das
demais. A anlise de regresso em dados espaciais incorpora na modelagem a dependncia
espacial entre os dados, melhorando a capacidade do modelo em fazer predies (Cmara
et al., 2004).
Tipicamente, procura-se alcanar dois objetivos: (a) encontrar um bom ajuste entre
os valores preditos pelo modelo e os valores observados da varivel dependente; (b)
descobrir quais das variveis explicativas contribuem de forma significativa para este
relacionamento linear. Para tanto, pressupe-se que as observaes so no-
correlacionadas, e, consequentemente, que os resduos do modelo tambm so
independentes e no-correlacionados com a varivel dependente, tem varincia constante,
e apresentam distribuio normal com mdia zero (Cmara et al., 2004).
No entanto, no caso de dados espaciais, muito pouco provvel que a hiptese
padro seja verdadeira. Caso a distribuio da varivel dependente no seja normal, os
modelos espaciais se tornam enviesados e no devem ser utilizados. Uma soluo para
este caso a utilizao dos modelos lineares generalizados, pois estes no necessitam
seguir o pressuposto de normalidade. Tal fato pode ser observado com a construo do
histograma da varivel dependente e tambm testado atravs de um teste de normalidade,
como o de ShapiroWilk, por exemplo (Bailey e Gatrell, 1995).
4.3.3 Modelos Lineares Generalizados
Os modelos lineares generalizados so uma extenso dos modelos lineares
clssicos, ou seja, unificam as teorias para os diversos tipos de varivel resposta, sejam
15
elas do tipo categricas, discretas ou contnuas (McCullagh & Nelder, 1989). Este tipo de
modelagem utilizado, principalmente, quando um ou mais pressupostos dos modelos de
regresso linear clssicos no so satisfeitos. Alm disso, admiti-se que as variveis
respostas possuam distribuio diferente da Normal e que sua mdia se expresse como
diferentes funes de covariveis e de seus respectivos coeficientes (Silva, 2006).
No processo de modelagem, considera-se que o comportamento da varivel
resposta pode ser representado por dois componentes: um componente sistemtico e um
componente aleatrio. O primeiro se refere varivel resposta, cuja distribuio deve
pertencer famlia Exponencial, e o segundo referente s variveis explicativas, que
compem um modelo linear (Kotz & Johnson, 1983). O elo entre as duas partes feito
atravs de uma funo denominada funo de ligao.
Dado um vetor aleatrio Y = {Y
1
,..., Y
n
}, das variveis resposta, consideramos que
sua distribuio pertence famlia Exponencial se sua funo de distribuio puder ser
escrita da seguinte forma:
( )
( )
( ) | | ( )
)
`
| + u u
|
= | u ; y c b y
a
1
exp , ; y f
i i i i
i
i
As funes a
i
(.), b
i
(.) e c
i
(.) so funes conhecidas, e
i
chamado de parmetro
cannico. Alm disso, E(Y
i
) =
i
= b
i
(
i
) e Var (Y
i
) = a
i
() b
i
(
i
), onde b e b
representam, respectivamente, a primeira e a segunda derivadas. Se conhecido, ento
temos um modelo com a varivel resposta pertecente famlia exponencial (Meira, 2009).
As variveis que compem a parte sistemtica formam uma combinao linear,
dando origem a um preditor linear da forma:
| ' q
= i
X
i
onde X
i
a matriz de covariveis e o vetor de parmetros desconhecidos a serem
estimados.
A funo de ligao g(.) uma funo conhecida e diferencivel, que tem o
objetivo de relacionar o componente aleatrio
i
e o componente sistemtico
i
, ou seja,
relaciona a mdia ao preditor linear:
16
( ) | ' = q =
i i i
X g
Se a funo de ligao g(
i
) =
i
, ento o preditor linear modela diretamente o
parmetro cannico. Assim, a funo de ligao pode ser obtida, diretamente, da
distribuio de probabilidade escrita na forma da famlia exponencial (Silva, 2006;
Dobson, 1983).
O quadro abaixo mostra as principais distribuies da famlia exponencial usadas
em modelos lineares generalizados:
Quadro 4.2: Distribuies importantes da famlia exponencial, com seus identificadores:
distribuies Normal, Gama, Normal Inversa, Binomial, Poisson e Binomial Negativa.
Distribuio ( ) | a u ( ) u b ( ) | ; y c
Normal
( )
2
, N o
2
o
2
2
u
( )
(
(
to +
o
2
2
2
2 ln
y
2
1
Gama
( ) v , G
1
v
1
( ) u ln ( ) ( ) v I v v ln y ln y ln
Normal Inversa
( )
2
, IG o
2
o
2
2
1
( )
2 1
2u
( )
(
(
o
+ to
y
1
y 2 ln
2
1
2
3 2
Binomial
( ) t , m B
1 |
.
|
\
|
t
t
1
ln
( )
u
+ e 1 ln m
|
|
.
|
\
|
y
m
ln
Poisson
( ) P
1
ln
u
e
! y ln
Binomial Negativa
( ) k , BinNeg
1
|
|
.
|
\
|
+
k
ln
( )
u
e 1 ln k
( )
( )
(
I
+ I
! y k
y k
ln
Geralmente, quando a varivel resposta uma contagem de casos, indicado
utilizar os modelos generalizados de Poisson. Quando a varivel resposta do tipo
17
Poisson, a funo de ligao cannica a logartmica, ou seja, g() = = log (). O
modelo definido como:
Y~Poisson
| ' q
= i
X
i
|
i i i
X g ' = = ) log( ) (
) exp( |
i i
X' =
A distribuio de Poisson tambm pode ser utilizada para estimar taxas. Por
exemplo, a taxa de mortalidade definida por T = n/p, onde n o nmero de bitos e p a
populao em risco. Neste caso temos o seguinte modelo:
|
i
X p n ' = ) / log(
|
i
X p n ' = ) log( ) log(
|
i
X p n ' + = ) log( ) log(
Dessa forma, modelamos a taxa levando em conta a populao e a contagem de
casos. A parcela do modelo apresentada como log(p) denomidada Offset, pois seu
coeficiente no estimado (McCullagh & Nelder, 1989).
Na distribuio de Poisson, a mdia igual varincia, ou seja, E[Y] = VAR[Y].
Porm, muito difcil que essa caracterstica seja encontrada na prtica. Logo, quando
ocorre da varincia ser maior que a mdia, isto , VAR[Y] > E[Y], temos um indcio de
superdisperso, e devemos ento assumir que precisamos encontrar outra forma de ajustar
os dados, por exemplo, utilizando a distribuio Binomial Negativa, que inclui um termo
de erro ao modelo, conforme abaixo (McCullagh & Nelder, 1989). Alm disso, o excesso
de zeros tambm pode fazer com que exista superdisperso nos dados, sendo necessrio
aplicar os modelos para dados de contagem inflacionados de zero, como o modelo de
Binomial Negativa Inflacionada de Zeros (Montoya, 2009).
Y~Binomial Negativa
i i i i
X g c | + ' = = ) log( ) ( , ) , ( ~ u u c Ga
i
18
= ] [Y E e
u
2
] [ + = Y Var
A estimao dos parmetros do vetor |
= _
|
A regra de deciso : se W >
2
m q
_ tabelado, ento rejeita-se a hiptese nula de que
o menor modelo o melhor.
J para os modelos que no so aninhados, isto , M
m
M
q
, a seleo do melhor
modelo se d pelo uso do Critrio de Informao de Akaike (AIC). Neste critrio, h um
vis no log da funo de verossimilhana dado assintoticamente pelo nmero de
19
parmetros do modelo. Desta maneira, AIC = - 2 log L + 2p, sendo log L o log da funo
de verossimilhana e p o nmero de parmetros do modelo. Usamos para o critrio de AIC
a regra de que quanto menor o valor do AIC, melhor o modelo (McCullagh & Nelder,
1989).
Para avaliar a adequao do modelo, utilizamos tambm a deviance, onde o teste
tem a hiptese nula de que o modelo est adequado aos dados. A estatstica de teste tem a
seguinte forma:
2
~
p n
D
W
= _
|
A hiptese nula rejeitada se verificamos W >
2
p n
_ tabelado. (McCullagh &
Nelder, 1989).
O processo de modelagem uma aproximao que consiste basicamente em
representar a realidade de forma simplificada. Este processo envolve suposies a respeito
da varivel resposta e da sua relao com as variveis explicativas. Logo, na escolha das
variveis que sero inicialmente utilizadas no modelo, devem ser consideradas somente
aquelas que possuem alguma ligao lgica com o problema em questo, ou seja, as
variveis devem ser escolhidas de acordo com a sua relevncia para estudo. Alm disso,
deve-se tomar cuidado na incluso de variveis que apresentem autocorrelao serial ou
dependncia entre si, para evitar problemas na hora de escolha do melhor modelo (Silva,
2006). Este aspecto pode ser visto na verificao da multicolinearidade, que consiste em
investigar se alguma das variveis independentes pode ser escrita como combinao linear
de outra.
Deve-se tambm atentar para os casos onde possivelmente exista estrutura espacial
na varivel resposta. Neste caso, ao utilizar modelagem linear generalizada, faz-se o
grfico dos resduos no mapa para ver se existe algum padro espacial. indicado tambm
realizar o teste de Moran sobre os resduos e avaliar a existncia de estrutura espacial
(Carvalho & Bivand, 2003).
20
5 Resultados
5.1 Perfil da mortalidade por cncer de tero no Estado do Rio de
Janeiro.
No perodo 2007 a 2009, ocorreram 164.728 bitos em mulheres com idade acima
de 20 anos residentes no Estado do Rio de Janeiro, sendo 2.199 por cncer de tero, tendo
uma representatividade de 1,3% nas mortes femininas do perodo. Destes, foram excludos
9 registros que no possuam informao sobre o municpio de residncia e 2 registros
com idade ignorada ou menor que 20 anos, restando 2188 registros.
Dos bitos vlidos para o estudo, 1536 (70,2%) foram por cncer do colo do tero
e 652 (29,8%) por cncer do tero de poro no especificada (Tabela 5.1). Observa-se o
aumento progressivo por faixa etria na proporo de bitos por cncer do colo do tero
de poro no especificada. A partir dos 50 anos, 80,8% das mulheres esto nesta
classificao.
Tabela 5.1: Distribuio etria dos casos de morte por cncer de tero, segundo faixa
etria, no perodo de 2007 a 2009.
Faixa Etria (%)
Causa Bsica do bito 20-29 30-39 40-49 50-59 60-69 70 ou mais Total
Cncer do Colo do
tero
32 172 348 343 297 344 1536
(2,1%) (11,2%) (22,7%) (22,3%) (19,3%) (22,4%) (70,2%)
Cncer do tero de
poro no especificada
9 19 97 135 149 243 652
(1,4%) (2,9%) (14,9%) (20,7%) (22,9%) (37,3%) (29,8%)
Total
41 191 445 478 446 587 2188
(1,9%) (8,7%) (20,3%) (21,8%) (20,4%) (26,8%) (100,0%)
Fonte: SIM-DataSUS
Considerando o total das duas classificaes, a faixa etria mais atingida foi a de
70 anos ou mais, que somou 587 mortes (26,8%), seguida pela faixa de 50 a 59 anos, com
478 casos (21,8%). Analisando as taxas de mortalidade, observou-se maior risco de
mortalidade por essa neoplasia nas mulheres mais velhas (Tabela 5.2). Estes dados
mostram que as mulheres com idades avanadas so as principais vtimas do cncer do
colo do tero, que raramente atinge mulheres com menos de 30 anos. Esta questo est
relacionada ao aumento da expectativa de vida das populaes, obesidade, hipertenso,
21
menor paridade, mudana de estilo de vida, sedentarismo, modernizao e estresse (Meira,
2009).
Tabela 5.2: Distribuio dos bitos e taxa de mortalidade (por 100.000 habitantes)
segundo a faixa etria, no perodo de 2007 a 2009.
Taxas de Mortalidade por 100.000 hab. por faixa etria
20-29 30-39 40-49 50-59 60-69 70 ou mais Total
Nmero de casos 41 191 445 478 446 587 2188
Taxa de mortalidade 3,03 15,20 37,87 50,94 77,21 104,06 37,31
Fonte: SIM-DataSUS/ IBGE
Foi verificado que as mulheres brancas so mais atingidas por esta doena,
representando 54,8% dos casos (Tabela 5.3). As mulheres de cor parda so as segundas
mais atingidas, com 27,9% dos registros, seguidas das mulheres negras com 17,0%.
Mulheres amarelas ou indgenas raramente morrem por esta patologia.
Tabela 5.3: Distribuio dos bitos segundo raa/cor, no perodo de 2007 a 2009.
Raa/ Cor (%)
Causa Bsica do bito Branca Preta Parda Amarela Indgena Total
Cncer do Colo do
tero
804 244 440 2 3 1493
(53,9%) (16,3%) (29,5%) (0,1%) (0,2%) (70,2%)
Cncer do tero de
poro no especificada
361 118 153 1 0 633
(57,0%) (18,6%) (24,2%) (0,2%) (0,0%) (29,8%)
Total
1165 362 593 3 3 2126
(54,8%) (17,0%) (27,9%) (0,1%) (0,1%) (100,0%)
* 62 registros (2,8%) foram excludos por apresentar informao da cor da pele vazia ou ignorada, sendo 43 casos de
cncer do colo do tero e 19 casos de cancer do tero de poro no especificada.
Fonte: SIM-DataSUS
Analisando a situao conjugal, vimos que a maior parte das mortes acontece em
mulheres solteiras, representando 37,1% dos casos (Tabela 5.4). Ou ainda, podemos dizer
que as mulheres sem companheiro (solteiras, vivas ou separadas judicialmente) so
grande maioria. Na anlise desagregada, os nmeros indicam maior risco de mortalidade
por cncer do colo do tero nas mulheres solteiras (40,1%), enquanto por cncer do tero
de poro no especificada o maior risco est nas mulheres vivas (34,5%).
22
Tabela 5.4: Distribuio dos bitos segundo situao conjugal, no perodo de 2007 a
2009.
Situao Conjugal (%)
Causa Bsica do bito Casada
Separadas
Judicialmente
Solteira Viva Total
Cncer do Colo do
tero
438 105 609 366 1518
(28,9%) (6,9%) (40,1%) (24,1%) (70,2%)
Cncer do tero de
poro no especificada
192 36 194 222 644
(29,8%) (5,6%) (30,1%) (34,5%) (29,8%)
Total
630 141 803 588 2162
(29,1%) (6,5%) (37,1%) (27,2%) (100,0%)
* 26 registros (1,2%) foram excludos por apresentar informao da cor da pele vazia ou ignorada, sendo 18
casos de cncer do colo do tero e 8 casos de cancer do tero de poro no especificada.
Fonte: SIM-DataSUS
Em relao ao nvel de escolaridade (Tabela 5.5) houve mais casos de mortalidade
por cncer do colo do tero em mulheres com 4 a 7 anos de estudo (40,5%) e menor
mortalidade nas mulheres com 12 anos ou mais (6,5%). J o cncer de tero de poro no
especificada apresentou maior mortalidade nas mulheres com at 3 anos de estudo (40,4%)
e menor tambm nas mulheres com 12 anos ou mais (9,3%).
Tabela 5.5: Distribuio dos bitos segundo escolaridade (anos de estudo concludos), no
perodo de 2007 a 2009.
Escolaridade - Anos de estudo concludos (%)
Causa Bsica do bito Nenhuma
1 a 3
anos
4 a 7
anos
8 a 11
anos
12 ou
mais
Total
Cncer do Colo do
tero
167 338 532 190 86 1313
(12,7%) (25,7%) (40,5%) (14,5%) (6,5%) (71,8%)
Cncer do tero de
poro no especificada
66 142 171 88 48 515
(12,8%) (27,6%) (33,2%) (17,1%) (9,3%) (28,2%)
Total
233 480 703 278 134 1828
(12,7%) (26,3%) (38,5%) (15,2%) (7,3%) (100,0%)
* 360 registros (16,5%) foram excludos por apresentar informao da cor da pele vazia ou ignorada, sendo 223 casos de
cncer do colo do tero e 137 casos de cancer do tero de poro no especificada.
Fonte: SIM-DataSUS
23
5.2 Anlise exploratria espacial da mortalidade por cncer do colo do
tero no Estado do Rio de Janeiro.
Foram feitas anlises exploratria e descritiva dos dados e anlises exploratrias de
dados espaciais, a fim de se observar o comportamento das taxas de mortalidade no
espao. Para isso, foram utilizados mapas sombreados para deteco de possveis
municpios com excesso do agravo em estudo.
A taxa padronizada de mortalidade por cncer do colo do tero de 35,02 por
100.000 mulheres no Estado do Rio de Janeiro no perodo. Podemos ver na Tabela 5.6 que
existem 49 municpios com taxas acima da taxa estadual. Os municpios de Comendador
Levy Gasparian (156,46), Macuco (145,48) e Areal (94,26) apresentaram as maiores taxas
por 100.000 mulheres no perodo. As menores taxas ocorreram nos municpios de Itatiaia
(7,99), Tangu (9,73) e Porcincula (10,18).
Tabela 5.6: Ranking das taxas de mortalidade por cncer do colo do tero, padronizadas
pela populao mundial (Segi, 1960), no perodo de 2007 a 2009.
24
Municpio
Taxas de mortalidade
padronizadas
Municpio
Taxas de mortalidade
padronizadas
Comendador Levy Gasparian 156,46 Nova Friburgo 36,00
Macuco 145,48 Maca 35,18
Areal 94,26 Nilpolis 35,08
Conceio de Macabu 74,99 Resende 34,05
Paraty 74,37 Niteri 33,77
Cardoso Moreira 74,22 Iguaba Grande 33,32
Pira 67,85 Seropdica 32,61
Duas Barras 64,79 Cabo Frio 32,42
Cordeiro 63,62 Mesquita 31,87
Cambuci 63,22 Volta Redonda 31,78
Queimados 61,89 Casimiro de Abreu 31,75
So Joo da Barra 60,21 Campos dos Goytacazes 30,89
Arraial do Cabo 59,34 Rio de Janeiro 30,43
Varre-Sai 59,26 Rio das Flores 28,86
Mangaratiba 59,06 So Fidlis 28,53
Miguel Pereira 59,00 Rio Bonito 26,22
Paraba do Sul 55,72 Cantagalo 25,83
Itabora 55,59 Sapucaia 25,36
Pinheiral 55,05 Saquarema 25,03
Cachoeiras de Macacu 54,35 Sumidouro 23,89
Belford Roxo 50,97 Itaocara 22,59
Santa Maria Madalena 50,82 Laje do Muria 22,45
Carmo 50,42 Carapebus 22,25
Valena 49,43 Itaperuna 21,71
Trs Rios 48,87 Quissam 21,25
Mag 47,49 So Jos do Vale do Rio Preto 20,80
Trajano de Moraes 46,75 Vassouras 19,57
Paracambi 46,44 Barra Mansa 19,46
Terespolis 46,18 So Sebastio do Alto 18,73
So Francisco de Itabapoana 46,12 Natividade 16,93
So Pedro da Aldeia 44,50 Italva 16,89
Paty do Alferes 43,91 Barra do Pira 15,88
Duque de Caxias 43,86 Angra dos Reis 15,67
Nova Iguau 42,26 Silva Jardim 14,76
Araruama 42,25 Mendes 13,77
So Gonalo 41,73 Guapimirim 12,44
Rio das Ostras 40,44 Porcincula 10,18
Maric 40,42 Tangu 9,73
Japeri 40,03 Itatiaia 7,99
Armao dos Bzios 39,83 Aperib 0,00
Petrpolis 39,30 Engenheiro Paulo de Frontin 0,00
Bom Jesus do Itabapoana 38,49 Miracema 0,00
So Joo de Meriti 37,44 Porto Real 0,00
Bom Jardim 36,78 Quatis 0,00
Itagua 36,66 Rio Claro 0,00
Santo Antnio de Pdua 36,53 So Jos de Ub 0,00
25
Taxas de Mortalidade Padronizadas pela Populao Mundial
0
20
40
60
80
100
120
140
Na Figura 5.1, observa-se estas taxas distribudas em seus respectivos municpios.
Vale destacar que os municpios de Aperib, Engenheiro Paulo de Frontin, Miracema,
Porto Real, Quatis, Rio Claro e So Jos de Ub (7,6%) no apresentaram bito por cncer
do colo de tero no perodo.
Figura 5.1: Distribuio espacial das taxas de mortalidade por 100.000 mulheres,
padronizadas pela populao mundial, no perodo de 2007 a 2009.
Pelo mapa, inicialmente, no possvel ver claramente a existncia de um padro
espacial das taxas de mortalidade. Podemos confirmar esta hiptese aplicando os testes de
independncia espacial de Moran e Geary. A Tabela 5.7 mostra os resultados dos testes.
Tabela 5.7: Resultado dos testes de independncia espacial das taxas de mortalidade.
Teste de Independncia Espacial*
Estatstica de teste Varincia p-valor
I de Moran 0,03865 0,00456 0,2311
C de Geary 0,91261 0,00854 0,1799
* Os testes foram avaliados ao nvel de signicncia de 5%.
Fonte: SIM-DataSUS/ R 2.15.0
26
Os testes de independncia espacial demonstraram no haver correlao espacial
entre os dados, uma vez que a hiptese nula de completa aleatoriedade espacial no foi
rejeitada.
5.3 Modelagem
Para a utilizao da anlise de regresso espacial, importante verificar sobretudo
a dependncia espacial. Alm disso, se as taxas de mortalidade no apresentam
distribuio Normal, devemos fazer um tratamento da varivel para que este tipo de
regresso seja utilizado. O resultado do teste de normalidade de Shapiro-Wilk para as
taxas de mortalidade (Tabela 5.8) nos leva rejeio da hiptese nula de normalidade dos
dados. E tambm, pelo histograma das taxas (Figura 5.2), verificamos que a distribuio
no parece ser Normal.
Tabela 5.8: Resultado do teste de normalidade de Shapiro-Wilk para as taxas de
mortalidade.
Teste de Normalidade de Shapiro-Wilk*
Estatstica de teste p-valor
W 0,9093 0,00886
* Os testes foram avaliados ao nvel de signicncia de 5%.
Fonte: SIM-DataSUS/ R 2.15.0
27
Figura 5.2: Histograma da taxa de mortalidade por cncer do colo do tero no Estado do
Rio de Janeiro, no perodo de 2007 a 2009.
Histograma da Taxa de Mortalidade
taxa de mortalidade
f
r
e
q
u
n
c
i
a
0 50 100 150
0
5
1
0
1
5
2
0
2
5
3
0
Visto que no h dependncia espacial, no devemos utilizar modelos de regresso
espacial, e sim modelos lineares generalizados. Vimos tambm que a distribuio da
varivel dependente no atende o pressuposto de normalidade. Como os dados do estudo
representam uma contagem de casos, optamos primeiramente por utilizar a distribuio de
Poisson. Porm, encontramos uma mdia de 23,78 casos e uma varincia de 7911,67. Este
um indcio de superdisperso dos dados, o que nos levou a utilizar a distribuio
Binomial Negativa.
Cada varivel foi testada em modelos univariados, e aquelas com significncia
inferior ou igual a 25% foram selecionadas para incluso em um modelo multivariado
(Tabela 5.9).
28
Tabela 5.9: Resultados da modelagem univariada com todas as variveis do estudo.
Modelos univariados com todas as variveis
Estimativa Erro padro Estatstica t p-valor AIC
PIB_PERCAPITA 0,0000 0,0000 -1,8520 0,0672 553,33
IFDM_S -1,9623 1,0470 -1,8740 0,0641 553,19
IFDM_T -1,1455 0,8427 -1,3590 0,1770 553,67
IFDM_EDU -0,4169 0,8840 -0,4720 0,6380 554,01
IFDM_EMP_REND -0,2380 0,3168 -0,7510 0,4540 554,01
DENSIDADE 0,0000 0,0000 0,0900 0,9280 554,15
EXP_VIDA -0,0007 0,0312 -0,0210 0,9830 554,16
PROP_LIXO -0,2064 0,9327 -0,2210 0,8250 554,14
PROP_ESGOTO -0,3182 0,3887 -0,8190 0,4150 553,97
PROP_ABAST -0,9417 0,9064 -1,0390 0,3020 553,83
PROP_SUPERIOR -0,3769 1,7705 -0,2130 0,8320 554,14
PROP_NEGROS 2,2538 1,6542 1,3620 0,1760 553,62
PROP_RENDA -4,5305 3,7137 -1,2200 0,2260 553,76
PROP_SANEA -0,0011 0,0111 -0,0970 0,9230 554,15
PROP_ENERGIA -0,5119 1,4825 -0,3450 0,7310 554,12
PROP_DESOCUP 0,6501 2,5817 0,2520 0,8020 554,14
PROP_INSTRUCAO 0,1190 0,7376 0,1610 0,8720 554,15
PROP_70ANOS 2,3050 3,3263 0,6930 0,4900 554,03
Fonte: SIM-DataSUS/ IBGE-Censo2010/ R 2.15.0
Dos resultados da modelagem univariada, retiramos as variveis
PIB_PERCAPITA, IFDM_S, IFDM_T, PROP_NEGROS e PROP_RENDA. No modelo
multivariado, foram retiradas uma a uma as variveis com o maior p-valor, restando
finalmente IFDM_T e PROP_RENDA com p-valor abaixo de 5% (Tabela 5.10).
29
Tabela 5.10: Resultado da modelagem multivariada com variveis selecionadas nos
modelos univariados.
Modelo multivariado com variveis selecionadas nos modelos univariados
Estimativa Erro padro Estatstica t p-valor
Intercepto -6,188 1,167 -5,301 0,0000
PIB_PERCAPITA 0,000 0,000 -0,82 0,4140
IFDM_T -1,059 1,309 -0,809 0,4210
IFDM_S -0,9231 1,326 -0,696 0,4880
PROP_NEGROS 1,328 1,88 0,707 0,4820
PROP_RENDA -7,346 4,492 -1,635 0,1060
*AIC: 559,87
Intercepto -6,663 0,9426 -7,069 0,0000
PIB_PERCAPITA 0,000 0,000 -0,861 0,3914
IFDM_T -1,469 1,138 -1,29 0,2005
PROP_NEGROS 1,593 1,795 0,887 0,3774
PROP_RENDA -8,046 4,281 -1,879 0,0636
*AIC: 558,01
Intercepto -6,3976 0,8693 -7,36 0,0000
IFDM_T -1,9005 0,998 -1,904 0,0601
PROP_NEGROS 1,7253 1,7788 0,97 0,3347
PROP_RENDA -8,6855 4,2041 -2,066 0,0418
*AIC: 556,19
Intercepto -5,9942 0,7926 -7,563 0,00000
IFDM_T -8,8832 4,2778 -2,077 0,04070
PROP_RENDA -2,1472 0,9926 -2,163 0,03320
*AIC: 554,48
Fonte: SIM-DataSUS/ IBGE-Censo2010/ R 2.15.0
Posteriormente, as variveis foram testadas todas juntas num nico modelo
multivariado, e foram selecionadas tambm as que apresentaram p-valor igual ou inferior a
25% (Tabela 5.11).
30
Tabela 5.11: Resultado da modelagem multivariada com todas as variveis do estudo.
Modelo multivariado com todas as variveis
Estimativa Erro padro Estatstica t p-valor
Intercepto -5,582000 5,01 -1,115 0,2686
PIB_PERCAPITA -0,000002 0,00 -0,615 0,5407
IFDM_S -73780000 72470000 -1,018 0,3120
IFDM_T 221400000 217400000 1,018 0,3120
IFDM_EDU -73780000 72470000 -1,018 0,3120
IFDM_EMP_REND -73780000 72470000 -1,018 0,3120
DENSIDADE 0,000023 0,000 0,518 0,6060
EXP_VIDA 0,000918 0,040 0,023 0,9819
PROP_LIXO -2,471000 5,595 -0,442 0,6600
PROP_ESGOTO -1,185000 0,714 -1,661 0,1011
PROP_ABAST -1,201000 1,151 -1,044 0,3000
PROP_SUPERIOR 3,602000 3,866 0,932 0,3546
PROP_NEGROS 3,421000 2,139 1,599 0,1144
PROP_RENDA -23,040000 7,919 -2,910 0,0048
PROP_SANEA -0,023040 0,067 -0,346 0,7306
PROP_ENERGIA 1,112000 2,926 0,380 0,7050
PROP_DESOCUP 5,762000 4,285 1,345 0,1829
PROP_INSTRUCAO 2,681000 2,229 1,203 0,2330
PROP_70ANOS 0,921400 6,101 0,151 0,8804
*AIC = 582,35
Fonte: SIM-DataSUS/ IBGE-Censo 2010/ R 2.15.0
Restaram as variveis PROP_ESGOTO, PROP_NEGROS, PROP_RENDA,
PROP_DESOCUP e PROP_INSTRUCAO para um novo modelo multivariado (Tabela
5.12). Retirando tambm uma a uma as variveis com maior p-valor, permaneceram
PROP_ESGOTO, PROP_NEGROS e PROP_RENDA com p-valor at 5% (Tabela 5.12).
31
Tabela 5.12: Resultado da modelagem multivariada com variveis selecionadas no
modelo multivariado completo.
Modelo multivariado com variveis selecionadas no modelo multivariado completo
Estimativa Erro padro Estatstica t p-valor
Intercepto -7,0155 0,9876 -7,103 0,00000
PROP_DESOCUP 1,1357 2,6743 0,425 0,67215
PROP_INSTRUCAO 0,5978 1,4149 0,423 0,67370
PROP_ESGOTO -1,5075 0,6102 -2,470 0,01547
PROP_NEGROS 4,3462 1,8134 2,397 0,01871
PROP_RENDA -17,2611 6,0178 -2,868 0,00519
*AIC: 558,63
Intercepto -6,6719 0,5394 -12,368 0,00000
PROP_DESOCUP 0,8708 2,5828 0,337 0,73681
PROP_ESGOTO -1,6429 0,5269 -3,118 0,00247
PROP_NEGROS 4,5523 1,7838 2,552 0,01246
PROP_RENDA -15,8048 4,8966 -3,228 0,00176
*AIC: 556,67
Intercepto -6,6239 0,508 -13,039 0,00000
PROP_ESGOTO -1,6143 0,5248 -3,076 0,00279
PROP_NEGROS 4,5967 1,774 2,591 0,01120
PROP_RENDA -15,796 4,8818 -3,236 0,00171
*AIC: 554,7
Fonte: SIM-DataSUS/ IBGE-Censo 2010/ R 2.15.0
Assim, temos como resultado final os seguintes modelos propostos:
- Modelo 1: TAXA_BRUTA = 5,994 8,883 IFDM_T 2,147 PROP_RENDA
- Modelo 2: TAXA_BRUTA = 6,624 1,614 PROP_ESGOTO + 4,597
PROP_NEGROS 15,796 PROP_RENDA
5.4 Escolha entre os Modelos
Para a comparao dos modelos, foram utilizadas a verificao da colinearidade
das variveis escolhidas, seus coeficientes de regresso, parcimnia e Critrios de
Informao de Akaike (AIC). Uma vez que no usual fazer anlise de resduos para os
32
modelos com distribuio Binomial Negativa, no se utilizou esta tcnica para a
comparao de modelos (Lambert, 1992). A anlise de Deviance tambm no pode ser
utilizada neste caso, pois nem todas as variveis do Modelo 1 esto contidas no Modelo 2.
5.4.1 Verificao de Colinearidade
Nos dois modelos encontrados, no h colinearidade entre as variveis, pois todos
os valores da verificao de colinearidade (VIF) esto abaixo de 10. Assim, por este
critrio no podemos descartar nenhum dos modelos propostos.
Tabela 5.13: Resultado da verificao de colinearidade entre as variveis dos dois
modelos propostos.
Verificao de Colinearidade Modelo 1
PROP_RENDA IFDM_T
1,281034 1,281034
Verificao de Colinearidade Modelo 2
PROP_RENDA PROP_ESGOTO PROP_NEGROS
1,838968 1,892302 1,149021
Fonte: SIM-DataSUS/ IBGE-Censo2010/ R 2.15.0
Observou-se tambm que a correlao entre elas baixa, exceto as variveis
PROP_ESGOTO e PROP_RENDA, que apresentam, em mdulo, uma correlao acima
de 0,5, considerada alta.
Tabela 5.14: Correlao entre as variveis dos dois modelos propostos.
Correlao entre as variveis significativas
PROP_ESGOTO PROP_NEGROS PROP_RENDA IFDM_T
PROP_ESGOTO 1,0000 0,1971 -0,6211 0,3622
PROP_NEGROS 0,1971 1,0000 0,0617 -0,2113
PROP_RENDA -0,6211 0,0617 1,0000 -0,4512
IFDM_T 0,3622 -0,2113 -0,4512 1,0000
Fonte: SIM-DataSUS/ IBGE-Censo2010/ R 2.15.0
33
5.4.2 Critrios de Informao de Akaike (AIC)
Verificou-se que o modelo que melhor se ajusta aos dados o Modelo 1, pois este
apresenta o menor valor de AIC (554,48) quando comparado ao Modelo 2 (554,7).
Portanto, nesta comparao fica claro que o modelo que melhor descreve os casos de
mortalidade por cncer do colo do tero no Estado do Rio de Janeiro o que utiliza as
variveis IFDM Total e proporo de pessoas com renda at salrio mnimo.
5.4.3 Parcimnia
O Modelo 1 composto das variveis proporo de pessoas com renda at
salrio mnimo e IFDM Total. Vimos em estudos anteriores que variveis indicadoras de
desenvolvimento scio-econmico influenciam bastante na distribuio dos casos de
mortalidade por cncer do colo do tero. A renda um forte indicador scio-econmico
por se tratar de uma informao sobre remunerao da populao local e seu poder
aquisitivo. J o IFDM Total, como mostra a Figura 5.3, engloba questes de emprego,
educao e sade, tornando-se um indicador de desenvolvimento municipal bastante
completo.
Figura 5.3: Resumo das variveis componentes do IFDM por rea de desenvolvimento.
Fonte: Publicao IFDM 2009 edio 2011, p.7. Documento do site http://www.firjan.org.br/IFDM.
34
Por outro lado, no Modelo 2 os casos de mortalidade por cncer do colo do tero
so descritos em funo da proporo de pessoas com renda at salrio mnimo,
proporo de negros e proporo de pessoas com rede de esgoto. Estas duas ltimas
variveis no podem ser consideradas como indicadores scio-econmicos, mas sim uma
consequncia deles. Ou seja, normalmente as baixas propores de pessoas com rede de
esgoto adequada nos municpios, por exemplo, decorrem de baixo rendimento, e no o
contrrio.
Na Figura 5.4 podemos perceber que, nos municpios onde a proporo da
populao com renda at salrio mnimo baixa, esto as menores propores
populacionais de negros, os maiores IFDM Totais e as maiores propores de indivduos
com rede de esgoto adequada. Vale ressaltar que a premissa de que as maiores propores
de negros ocorrem em municpios com baixa renda se contradiz com anlise exploratria
dos dados, onde percebemos que as maiores vtimas da doena so as mulheres brancas.
Figura 5.4: Distribuio espacial das variveis significativas dos dois modelos propostos.
35
Portanto, embora os dois modelos paream razoveis para descrever as taxas de
mortalidade por cncer do colo do tero nos municpios do Estado do Rio de Janeiro,
consideramos que o Modelo 1 mais parcimonioso e explica melhor a varivel resposta
do nosso estudo.
5.4.4 Problemas com o Modelo Escolhido
Modelo 1: TAXA_BRUTA = 5,994 8,883 IFDM_T 2,147 PROP_RENDA
O Modelo 1 foi escolhido por ser, estatisticamente, o modelo que melhor explica
os casos de mortalidade por cncer do colo do tero. Porm, seus coeficientes no esto de
acordo com o que ocorre na realidade. Tipicamente, quando o IFDM Total alto, a
proporo de pessoas com baixa renda pequena. Portanto, estes dois indicadores teriam
crescimento em direes opostas e deveriam ter sinais diferentes na equao. No entanto,
isto no o que acontece, e os sinais indicam que eles crescem na mesma direo. Desta
forma, o Modelo 1 no pode ser utilizado.
Voltando aos resultados dos modelos univariados, observamos que as variveis
PIB_PERCAPITA e IFDM_S tm os menores p-valores e AIC (Tabela 5.15). Embora o
nvel de significncia de 5% no seja suficiente para considerar os modelos significativos,
podemos aceit-los a 7% e utiliz-los para descrever a varivel resposta. Com os mesmos
critrios de escolha do modelo ideal, analisamos o AIC, os coeficientes de regresso e a
parcimonialidade dos modelos.
Tabela 5.15: Resultados dos dois modelos univariados mais significativos.
Modelos univariados mais significativos
Estimativa Erro padro Estatstica t p-valor
Intercepto -6,2413 0,8616 -7,244 0,0000
IFDM_S -1,9623 1,047 -1,874 0,0641
*AIC: 553,19
Intercepto -7,733 0,07616 -101,964 0,0000
PIB_PERCAPITA -0,000005 0,000002 -1,852 0,0672
*AIC: 553,33
Fonte: SIM-DataSUS/ IBGE-Censo2010
36
IFDM Sade
0.65
0.70
0.75
0.80
0.85
0.90
0.95
Os menores valores de AIC e p-valor (553,19 e 0,064, respectivamente) so do
modelo que utiliza o IFDM Sade. E ainda, como estamos tratando de dados de sade
pblica, razovel escolher que um indicador de sade nos explique melhor que um
indicador mais usado em economia. Assim, o modelo final escolhido :
TAXA_BRUTA = 6,241 1,962 IFDM_S
O IFDM Sade um importante indicador que objetiva avaliar a qualidade do
Sistema de Sade Municipal. Dentre as variveis medidas atravs dele, esto a qualidade
do atendimento e disponibilidade de acesso aos servios de sade, isto , os procedimentos
mais bsicos que um municpio deve oferecer sua populao. Dos resultados desta
avaliao, possvel a criao de medidas em prol da melhoria da qualidade dos servios
de sade de pblica. A Figura 5.5 mostra a distribuio espacial desta varivel nos
municpios do Estado do Rio de Janeiro.
Figura 5.5: Distribuio espacial do IFDM Sade nos municpios do Estado do Rio de
Janeiro, no perodo de 2007 a 2009.
37
6 Consideraes Finais
Neste trabalho foi verificado que, entre os anos de 2007 e 2009, 70,2% dos bitos
analisados foram ocasionados devido presena do cncer do colo do tero, contra 29,8%
de bitos por cncer do tero de poro no identificada. Tambm foi observado que a
taxa de mortalidade total foi maior em mulheres com idade superior a 50 anos, raramente
ocorrendo em mulheres com idade inferior a 30 anos. Este fato pode ser explicado pelo
aumento da expectativa de vida das populaes, aliado a outros fatores como hipertenso,
obesidade e sedentarismo.
Um importante fator social identificado no estudo foi o estado civil, onde mais de
70% dos bitos ocorreram em mulheres sem companheiro, entre vivas, separadas e
solteiras. O que pode contribuir para este fator a diferena de comportamentos e atitudes
entre mulheres casadas e no casadas, tais como a maior frequncia nos exames de
rastreamento, realizao de exerccios fsicos e dieta equilibrada, pois as mulheres casadas
costumam apresentar condutas de sade mais positivas (Meira, 2006).
Quando diagnosticado precocemente, o cncer do colo do tero pode ser tratado, o
que faz reduzir os ndices de mortalidade. No entanto, h necessidade de um maior
esclarecimento por parte da populao, visto que a doena ocorre, em maior parte, em
mulheres com menos anos de estudo e que possuem tambm menos recursos econmicos
(Meira, 2006). Este problema pode ser resolvido atravs de um maior incentivo, por parte
do governo, na participao da populao desfavorecida em programas de preveno da
doena.
Foi observado que os municpios que apresentaram as maiores taxas de
mortalidade foram Comendador Levy Gasparian, Macuco e Areal. J as menores taxas
foram observadas nos municpios de Porcincula, Tangu e Itatiaia. Uma das causas
dessas altas taxas pode ser atribuda grande dificuldade que os moradores do interior do
Estado encontram em ter acesso a redes de servio para deteco e tratamento precoce da
doena.
Na modelagem dos dados, foram encontrados quatro modelos significativos, ou
seja, quatro formas diferentes de explicar estatisticamente a distribuio da mortalidade
por cncer do colo do tero nos municpios do Estado do Rio de Janeiro. Cada um deles
capaz de fazer uma boa descrio das taxas de mortalidade. Porm, vimos que
38
importante, alm de encontrar um bom modelo, que ele seja parcimonioso e condizente
com a realidade dos dados trabalhados.
O IFDM Sade foi escolhido como o principal fator capaz de descrever
mortalidade por cncer do colo do tero nos municpios do Rio de Janeiro porque, alm de
se mostrar significativo estatisticamente, foca na sade bsica da populao e utiliza
bancos de dados considerados relevantes e confiveis pelos especialistas no assunto. Em
sua construo so priorizados os bancos de dados do SIM e SINASC, e opta-se por
indicadores de variveis de controle local, uma vez que no h unidades hospitalares de
ponta para cada especialidade mdica em todos os municpios brasileiros.
As demais variveis que compem os modelos descartados no se mostraram to
relevantes quanto o IFDM Sade. Observou-se que a proporo de pessoas com renda at
salrio mnimo era um bom indicador junto com o IFDM Total, mas no nos trouxe um
modelo confivel, pois o crescimento das mesmas aconteceu em direes opostas. Alm
disso, as propores populacionais de negros e de pessoas com rede de esgoto no so
bons indicadores de desenvolvimento, pois geralmente configuram como consequncias
da evoluo dos indicadores scio-econmicos.
Ainda sobre as demais variveis, seria interessante, futuramente, um estudo mais
minucioso de suas caractersticas. Nas modelagens, vimos que a proporo de pessoas
com renda at salario mnimo apresenta coeficientes sempre negativos, tanto no modelo
univariado quanto nos multivariados. Alm desta, outras variveis como IFDM Sade,
IFDM Total e PIB percapita apresentam o mesmo problema. Pode ser que exista alguma
estrutura de correlao ou uma diferena de escala entre as variveis dependentes e a
varivel resposta que esteja causando isto, e pode ser melhor investigado.
Analisar dados de sade sempre um grande desafio. Podemos ter, por exemplo,
dvidas sobre quais indicadores utilizar para explicar uma varivel resposta, considerando
da melhor forma as diferentes realidades brasileiras. Aps a escolha, a principal
dificuldade est em encontrar dados dedignos relativos a determinado assunto ou
localidade. Um dos motivos deste fato a prpria caracterstica dos sistemas de sade, que
costumam realizar atendimentos em municpios diferentes dos municpios de residncia
dos pacientes. H que se registrar tambm a baixa qualidade dos registros mesmo os
obrigatrios e municipalizados como os da ateno bsica, onde ocorre com frequncia
a sub ou super noticao.
39
O mais importante durante um estudo de dados agregados o entendimento do seu
objeto de estudo. O resultado da modelagem deve, no s ser plausvel numericamente,
como tambm refletir a realidade do tema em questo. Assim, no basta apenas ter o
conhecimento estatstico. necessrio conhecer o comportamento biolgico e social da
doena e apresentar resultados lgicos, para que estes possam ser utilizados como
referncia por outros pesquisadores.
40
7 Referncias
A situao do cncer no Brasil INCA; 2006.
Bailey TC, Gatrell AC. Interactive spatial data analysis. Essex: Longman Scientific; 1995.
Boletim Brasileiro de Avaliao de Tecnologias em Sade n 17: Cncer de colo de
tero: a vacina para preveno do HPV e o desafio para a melhoria da qualidade do
rastreamento no Brasil; 2011.
Bosseti C, Malvezzi M, Chatenoud L, Negri E, Levi F, La Veccia C. Trends in mortality
in Americas, 1970 a 2000. Annal Oncol. 2005; 16(1): 489-511.
Brenna SMF, Hardy E, Zeferino LC, Namura I. Conhecimentos, atitude e prtica do
exame Papanicolau em mulheres com cncer de colo de tero. Cad. Sade Pblica. 2001;
17(4): 909 a 914.
Cadernos de Ateno Bsica n 13: Controle dos cnceres do colo do tero e da mama.
Ministrio da Sade; 2006.
Cmara G, Druck S, Monteiro AM, Carvalho MS. Anlise Espacial de Dados Geogrficos.
Braslia: EMBRAPA; 2004.
Disponvel em: http://www.dpi.inpe.br/gilberto/livro/analise/cap5-areas.pdf
Carvalho MS, Bivand R. Exploring and analysing rates of Hansens Disease in Olinda,
Brazil; 2003.
Centro de Informaes e Dados do Estado do Rio de Janeiro(CIDE). Anurio estatstico
do Rio de Janeiro. Rio de Janeiro: SECPLAN; 2002.
CID-10 (Cdigos)
Disponvel em: http://www.bulas.med.br/cid-10/
41
DATASUS. Banco de dados do Sistema Unico de Saude.
Disponivel em: www.datasus.gov.br.
Dobson AJ. An Introduction to Statistical Modelling. 1 ed. New York,Chapman and Hall;
1983.
Fernandes WC, Kimura M. Qualidade de vida relacionada sade de mulheres com
cncer de colo uterino; 2010.
Guerra MR, Gallo CVM, Mendona GAS. Risco de cncer no Brasil: tendncias e estudos
epidemiolgicos mais recentes. Revista Brasileira de Cancerologia. 2005; 51(3): 227-234.
IFDM 2009; Edio 2011.
Disponvel em: http://www.firjan.org.br/IFDM/
Instituto Nacional de Cncer. Estimativas 2006: Incidncia de Cncer no Brasil. Rio de
Janeiro. INCA; 2005.
Instituto Nacional de Cncer. Estimativas 2008: Incidncia de Cncer no Brasil. Rio de
Janeiro. INCA; 2007.
Instituto Nacional de Cncer. Estimativas 2010: Incidncia de Cncer no Brasil. INCA;
2009.
Kiney W, SUNG HY, Kearney KA, Geiger AM. Missed cervical cancer (ICC).
Gynecologic Oncology.1998;71(3): 428-30.
Kotz, S., Johnson, N. L., 1983, Encyclopedia of Statistical Sciences. Vol. 3, 1 ed.New
York, John Wiley & Sons.
Lambert, D. Zero-inflated Poisson regression, with an application to defects in
manufacturing.Technometrics; 1992
42
Latorre MRO. Cncer em Goinia: anlise da incidncia e da mortalidade no perodo de
1988 a 1997.[ tese de livre-docncia]. So Paulo (SP) : Universidade de So Paulo,2001.
Levi, F, Boffetta P, Lucchini F, Negri E, La Vecchia C. Cervical Cancer mortality in
young women in Europe : patterny and trends. Eur J Cancer. 2000; 36(1): 2266-2271.
Medeiros VCRDD, Medeiros RCD, Moraes LMD, Menezes Filho JBD, Ramos ESN,
Saturnino ACRD. Cncer de Colo de tero: Anlise Epidemiolgica e Citopatolgica no
Estado do Rio Grande do Norte. Sociedade Brasileira De Anlises Clnicas; 2006.
Meira KC. Mortalidade por cncer de colo de tero no municpio do Rio de Janeiro, no
perodo de 1999 a 2006. Dissertao de Mestrado na Escola Nacional de Sade Pblica
Sergio Arouca. ENSP; 2009.
Montoya AGM. Inferncia e diagnstico em modelos para dados de contagem com
excesso de zeros. Dissertao de Mestrado. Universidade Estadual de Campinas.
Campinas; 2009.
Naffah Filho M, Cecilio MAM. Subsdios para um novo modelo de ateno ao cncer no
Estado de So Paulo; 2006.
Nelder JA, McCullagh P. Generalized Linear Models.Segunda edio. Chapman and Hall,
Londres; 1999.
Nelder JA, Wedderburn RWM. Generalized linear models.Journal of the Royal Statistical
Society; 1972.
Pesquisa Nacional Por Amostra de Domiclios. Acesso e Utilizao de Servios de Sade.
PNAD, 2003.
Pesquisa Nacional Por Amostra de Domiclios. Um Panorama da Sade no Brasil - Acesso
e Utilizao dos Servios, Condies de Sade e Fatores ou Risco e Proteo Sade.
PNAD, 2008.
43
Pinheiro P. HPV/CNCER DO COLO DO TERO/Sintomas e Vacina; 2012. Disponvel
em: http://www.mdsaude.com/2009/09/hpv-cancer-colo-utero.html
Risi Jnior JB, Nogueira RP. As condies de sade no Brasil. In: Finkelman J, editor.
Caminhos da sade pblica no Brasil. Rio de Janeiro. Ed. Fiocruz; 2002: 109-233.
Secretaria de Gesto Participativa. Quarto Seminrio da Regio Metropolitana I: Frum
dos Conselhos Municipais de Sade do Rio de Janeiro da Regio Metropolitana I, 2005.
Srie D. Reunies e Conferncias. Rio de Janeiro (Brasil): Secretaria de Gesto
Participativa; 2005.
Silva CMFP. Modelagem dos acidentes com vtima no Municpio do Rio de Janeiro.
[tese]. Rio de Janeiro (Rio de Janeiro): COPPE/UFRJ; 2006.
Taplin SH, Ichikawa L, Yood MU, Manos MM, Geiger AM, Weinmann S, Gilbert J,
Mouchawar J, Altaras R, Beverly RK, Casso D, Westbrook EO, Bischoff K, Zapka JG,
Barlow WE.Cervical cancer in women with comprehensive health care acess: attributable
factors in screening process. J Natl Cancer Inst.2005; 97(9): 675-83.
Teixeira AL, Lwy I. Imperfect tools for a difficult job: Colposcopy, colpocytogy and
screening for cervical cancer in Brazil. Soc Studies of Science.2011; 41(4):586-608.
WHO (World Health Organization). Global Action Against Cancer. 1 ed, p-24, 2003.
44
Apndice
45
Apndice 1 Script do R
require(rJava)
require(xlsx)
require(sp)
require(foreign)
require(rgeos)
require(maptools)
require(spdep)
require(spatstat)
require(RColorBrewer)
require(car)
require(MASS)
dados=read.csv2("bancoR.csv", header=T)
attach(dados)
y=readShapeSpatial("33mu2500gsd.shp")
summary(dados)
hist(TAXA_BRUTA, main="Histograma da Taxa Bruta", xlab="taxa bruta de
mortalidade")
#Adicionando as taxas padronizadas no mapa
slot(y,"data")$TAXAPAD=(TAXA_PAD)
#Adicionando o IFDM Total no mapa
slot(y,"data")$IFDM_T=(IFDM_T)
#Adicionando o IFDM Sade no mapa
slot(y,"data")$IFDM_S=(IFDM_S)
#Adicionando a proporo de negros no mapa
slot(y,"data")$PNEG=(PROP_NEGROS)
#Adicionando a proporo de domiclios com rede de esgoto no mapa
slot(y,"data")$PESG=(PROP_ESGOTO)
#Adicionando a proporo de domiclios com renda at 1/2 salrio mnino no mapa
slot(y,"data")$PREND=(PROP_RENDA)
#Adicionando o PIB per capita no mapa
slot(y,"data")$PIBPC=(PIB_PERCAPITA)
#Matriz de vizinhana
y.coord <- coordinates(y)
y.viz <- poly2nb(y)
#Plotando cada varivel no mapa
# Informao sobre as cores disponveis
brewer.pal.info
#TAXA_PAD
taxapad.cut <- round(fivenum(y$TAXAPAD), digits=4)
cores <-brewer.pal(4, "Reds")
spplot(y,"TAXAPAD", at=taxapad.cut,col.regions=cores , main="Taxas de Mortalidade
Padronizadas pela Populao Mundial")
#IFDM_T
ifdmt.cut <- round(fivenum(y$IFDM_T), digits=4)
cores <-brewer.pal(4, "Greens")
spplot(y,"IFDM_T", at=ifdmt.cut,col.regions=cores,main="IFDM Total")
46
#IFDM_S
ifdms.cut <- round(fivenum(y$IFDM_S), digits=4)
cores <-brewer.pal(4, "RdPu")
spplot(y,"IFDM_S", at=ifdms.cut,col.regions=cores,main="IFDM Sade")
#PROP_NEGROS
pneg.cut <- round(fivenum(y$PNEG), digits=4)
cores <-brewer.pal(4, "Oranges")
spplot(y,"PNEG", at=pneg.cut,col.regions=cores, main="Proporo de Negros")
#PROP_ESGOTO
pesg.cut <- round(fivenum(y$PESG), digits=4)
cores <-brewer.pal(4, "Blues")
spplot(y,"PESG", at=pesg.cut,col.regions=cores, main="Proporo de Domiclios com
Rede de Esgoto")
#PROP_RENDA
prend.cut <- round(fivenum(y$PREND), digits=4)
cores <-brewer.pal(4, "Purples")
spplot(y,"PREND", at=prend.cut,col.regions=cores, main="Proporo de Pessoas com
Renda at 1/2 S.M.")
#Teste de normalidade
shapiro.test(y$TAXA)
hist(y$TAXA, main="Histograma da Taxa de Mortalidade", xlab="taxa de mortalidade",
ylab="frequncia")
#ndice Moran
moran.test(y$TAXA, nb2listw(y.viz, style = "W"))
#ndice Geary
geary.test(y$TAXA, nb2listw(y.viz, style = "W"))
#MLG - testando modelos univariados
mod.ifdms=glm(formula = CASOS ~ IFDM_S + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.ifdms)
mod.neg=glm(formula = CASOS ~ PROP_NEGROS + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.neg)
mod.sup=glm(formula = CASOS ~ PROP_SUPERIOR + offset(log(POP_FEM)), family
= neg.bin(1))
summary(mod.sup)
mod.ifdmer=glm(formula = CASOS ~ IFDM_EMP_REND + offset(log(POP_FEM)),
family = neg.bin(1))
summary(mod.ifdmer)
mod.agua=glm(formula = CASOS ~ PROP_ABAST + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.agua)
mod.esg=glm(formula = CASOS ~ PROP_ESGOTO + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.esg)
mod.lixo=glm(formula = CASOS ~ PROP_LIXO + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.lixo)
47
mod.ifdmt=glm(formula = CASOS ~ IFDM_T + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.ifdmt)
mod.instrucao=glm(formula = CASOS ~ PROP_INSTRUCAO + offset(log(POP_FEM)),
family = neg.bin(1))
summary(mod.instrucao)
mod.ev=glm(formula = CASOS ~ EXP_VIDA + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.ev)
mod.idh=glm(formula = CASOS ~ IDH + offset(log(POP_FEM)), family = neg.bin(1))
summary(mod.idh)
mod.dens=glm(formula = CASOS ~ DENSIDADE + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.dens)
mod.70=glm(formula = CASOS ~ PROP_70ANOS + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.70)
mod.dens=glm(formula = CASOS ~ DENSIDADE + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.dens)
mod.ener=glm(formula = CASOS ~ PROP_ENERGIA + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.ener)
mod.pibpc=glm(formula = CASOS ~ PIB_PERCAPITA + offset(log(POP_FEM)), family
= neg.bin(1))
summary(mod.pibpc)
mod.rend=glm(formula = CASOS ~ PROP_RENDA + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.rend)
mod.sanea=glm(formula = CASOS ~ PROP_SANEA + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.sanea)
mod.desocup=glm(formula = CASOS ~ PROP_DESOCUP + offset(log(POP_FEM)),
family = neg.bin(1))
summary(mod.desocup)
mod.ifdmedu=glm(formula = CASOS ~ IFDM_EDU + offset(log(POP_FEM)), family =
neg.bin(1))
summary(mod.ifdmedu)
#Testando modelos multivariados a partir dos univariados significativos
mod.1 = glm(formula = CASOS ~ PROP_RENDA + PIB_PERCAPITA +
PROP_NEGROS + IFDM_s + IFDM_T + offset(log(POP_FEM)), family = neg.bin(1))
summary(mod1)
#MLG Testando modelo multivariado completo
mod.total=glm(formula = CASOS ~ PIB_PERCAPITA + IFDM_S + IFDM_T +
IFDM_EDU+ IFDM_EMP_REND + DENSIDADE + EXP_VIDA + PROP_LIXO +
PROP_ESGOTO + PROP_ABAST + PROP_SUPERIOR + PROP_NEGROS +
PROP_RENDA + PROP_SANEA + PROP_ENERGIA + PROP_DESOCUP +
DENSIDADE + PROP_INSTRUCAO + PROP_70ANOS + offset(log(POP_FEM)),
family = neg.bin(1))
48
summary(mod.total)
#Testando modelos multivariados restritos
mod2 = glm(formula = CASOS ~ PROP_DESOCUP + PROP_ESGOTO +
PROP_NEGROS + PROP_RENDA + PROP_INSTRUCAO + offset(log(POP_FEM)),
family = neg.bin(1))
summary(mod2)
#Modelos finais
mod1 = glm (formula = CASOS ~ IFDM_T + PROP_RENDA + offset(log(POP_FEM)),
family = neg.bin(1))
summary(mod1)
mod2 = glm(formula = CASOS ~ PROP_RENDA + PROP_ESGOTO + PROP_NEGROS
+ offset(log(POP_FEM)), family = neg.bin(1))
summary(mod2)
#Verificando a colinearidade entre as variveis dos modelos significativos
vif (mod1)
vif (mod2)
49
Anexo
50
Anexo A Projeto GLOBOCAN
O objetivo do projeto fornecer estimativas contemporneas da incidncia de,
mortalidade e prevalncia do principal tipo de cncer, a nvel nacional, para 184 pases do
mundo. As estimativas so apresentadas para Globocan 2008, separadamente para cada
sexo e, para dados de incidncia e mortalidade, por dez faixas etrias. Os dados de 5 anos
de prevalncia esto disponveis para a populao adulta (idades 15 e mais anos).
Notas:
1. Estas estimativas baseiam-se nos dados mais recentes disponveis no IARC (Agncia
Internacional para a Pesquisa do Cncer) e em informaes disponveis publicamente na
internet, mas os nmeros mais recentes podem estar disponveis diretamente a partir de
fontes locais.
2. Porque as fontes de dados esto melhorando continuamente em qualidade e extenso,
as estimativas no podem ser de horas extras verdadeiramente comparveis e deve ser
tomado cuidado ao comparar essas estimativas com os publicados anteriormente. As
diferenas observadas podem ser o resultado de uma mudana na metodologia e no deve
ser interpretado como um efeito tendncia do tempo.
Fonte: http://globocan.iarc.fr/
51
Anexo B Padronizao da populao mundial, proposta por Segi em 1960 (Latorre,
2001).
Os registros de cncer de base populacional (RCBP) so instituies que coletam
informaes sobre todos os casos novos de cncer de uma determinada rea geogrfica
definida, atravs de um processo contnuo e sistemtico de coleta. Com isso, possvel
obter as taxas de incidncia para cada uma das localizaes de cncer, segundo variveis
importantes do ponto de vista de distribuio da doena, como sexo, idade, raa ocupao
e outras. Essa taxa definida como o nmero de casos novos dividido pela populao do
meio do perodo, em determinada rea, multiplicado por uma base que, no caso do cncer,
geralmente 100.000. Quando trata-se de cncer infantil, a base 1.000.000. Ao longo da
histria, houve vrias tentativas de implantao dos RCBP em todo o mundo. Porm,
muitas no tiveram continuidade devido s dificuldades encontradas na coleta das
informaes e pouca aplicabilidade dos dados.
Ao comparar-se reas com estruturas etrias diferentes, ou analisar tendncias
dentro de uma mesma rea durante um perodo de tempo que possivelmente ocorreram
mudanas na distribuio etria da populao, deve-se trabalhar no com coeficientes
brutos, mas com coeficientes padronizados por idade. Para o clculo das taxas
padronizadas, escolhe-se uma populao de referncia e estima-se qual ser a taxa de
incidncia para a populao padro caso ela estivesse submetida s taxas por idade
especficas da populao de estudo. Para comparaes internacionais, recomenda-se a
populao de 1960, com estrutura etria descrita a seguir:
52
Tabela 5.16: Populao mundial proposta por Segi em 1960.
Faixa etria Populao Mundial %
0-4 12.000 12,0
5-9 10.000 10,0
10-14 9.000 9,0
15-19 9.000 9,0
20-29 16.000 16,0
30-39 12.000 12,0
40-49 12.000 12,0
50-59 9.000 9,0
60-69 7.000 7,0
70 ou + 4.000 4,0
Total 100.000 100,0
53
Anexo C Classificao Internacional de Doenas (CID - 10)
A Classificao Internacional de Doenas e Problemas Relacionados Sade
(tambm conhecida como Classificao Internacional de Doenas CID 10) publicada
pela Organizao Mundial de Sade (OMS) e visa padronizar a codificao de doenas e
outros problemas relacionados sade. A CID 10 fornece cdigos relativos classificao
de doenas e de uma grande variedade de sinais, sintomas, aspectos anormais, queixas,
circunstncias sociais e causas externas para ferimentos ou doenas. A cada estado de
sade atribuda uma categoria nica qual corresponde um cdigo CID 10.
De acordo com a CID-10, existem trs cdigos que definem neoplasias malignas
relacionadas ao tero. So eles C53 (Neoplasia maligna do colo do tero), C54 (Neoplasia
maligna do corpo do tero) e C55 (Neoplasia maligna do tero, poro no especificada).
O cdigo C54 no foi utilizado porque a forma de contgio do cncer do corpo do tero
diferente do cncer do colo do tero. Portanto, os fatores scio-econmicos associados
podem ser distintos. A Tabela 5.17 mostra especificao de cada cdigo.
Tabela 5.17: Cdigos CID-10 para neoplasias malignas do tero.
C53 - Neoplasia maligna do colo do tero
C53.0 Neoplasia maligna do endocrvix
C53.1 Neoplasia maligna do exocrvix
C53.8 Neoplasia maligna do colo do tero com leso invasiva
C53.9 Neoplasia maligna do colo do tero, no especfico
C54 - Neoplasia maligna do corpo do tero
C54.0 Neoplasia maligna do istmo do tero
C54.1 Neoplasia maligna do endomtrio
C54.2 Neoplasia maligna do miomtrio
C54.3 Neoplasia maligna do fundo do tero
C54.8 Neoplasia maligna do corpo do tero com leso invasiva
C54.9 Neoplasia maligna do corpo do tero, no especfico
C55 - Neoplasia maligna do tero, poro no especificada
Fonte: http://www.medicinanet.com.br/cid10.htm
54
Anexo D ndice Firjan de Desenvolvimento Municipal (IFDM)
O ndice FIRJAN de Desenvolvimento Municipal (IFDM) o indicador resultante
de um estudo anual do Sistema FIRJAN, que acompanha o desenvolvimento de todos os
5.565 municpios brasileiro em trs reas: Emprego & Renda, Educao e Sade. Ele
feito, exclusivamente, com base em estatsticas pblicas oficiais, disponibilizadas pelos
ministrios do Trabalho, Educao e Sade.
Mesmo tendo um recorte municipal, possvel gerar um resultado nacional
discriminado por unidades da Federao graas divulgao oficial das variveis
componentes do ndice tanto por estados quanto para o pas.
De leitura simples, este ndice varia de 0 a 1. Quanto mais prximo de 1, maior o
desenvolvimento da localidade. Alm disso, sua metodologia possibilita determinar, com
preciso, se a melhora relativa ocorrida em determinado municpio decorre da adoo de
polticas especficas ou se o resultado obtido apenas reflexo da queda dos demais
municpios. Por ter periodicidade anual, recorte municipal e abrangncia nacional, a
metodologia do IFDM pioneira e nica, na medida em que possibilita o
acompanhamento do desenvolvimento humano, econmico e social de todos os
municpios brasileiros.
A defasagem temporal entre o ano que se refere o IFDM e sua divulgao decorre
do fato de serem utilizadas apenas estatsticas. At a edio de 2010, referente ao ano de
2007, essa diferena era de trs anos. A partir da edio de 2011, por esforo do Ministrio
da Sade em abreviar os prazos de divulgao de seus dados, foi possvel reduzir a essa
defasagem do IFDM para apenas dois anos.
- IFDM Emprego&Renda: acompanha o mercado formal de trabalho, com base nos
dados disponibilizados pelo Ministrio do Trabalho e Emprego. Como o prprio nome
sugere, o indicador trabalha com dois subgrupos, ambos com o mesmo peso (50% do
total) no indicador nal: emprego formal (postos de trabalho gerados) e renda
(remunerao mdia mensal do trabalhador formal).
- IFDM-Educao: foi idealizado para captar tanto a oferta como a qualidade da
educao infantil e do ensino fundamental nos municpios brasileiros, de acordo com as
competncias constitucionais dos municpios. Desse modo, apesar de no ser vivel e/ou
eciente esperar que haja uma universidade em todo municpio brasileiro nem mesmo
55
ensino mdio, esse de competncia estadual pode-se ao menos exigir que todo municpio
apresente ensino fundamental de qualidade.
- IFDM-Sade: Segundo a OMS, a ateno bsica o primeiro nvel de contato dos
indivduos, da famlia e da comunidade com o sistema nacional de sade pelo qual os
cuidados de sade so levados o mais proximamente possvel aos lugares onde pessoas
vivem e trabalham, e constituem o primeiro elemento de um continuado processo de
assistncia sade. Partindo da premissa de que o nvel primrio de atendimento
populao prioritrio e deve existir em todos os municpios brasileiros, o IFDM Sade
adotou as variveis Atendimento Pr-Natal, bitos Mal Denidos e bitos Infantis por
causas evitveis por se constiturem fatores reconhecidamente de ateno bsica.
Fonte: http://www.firjan.org.br/IFDM/
56
Anexo E Municpios do Estado do Rio de Janeiro. Fonte: http://4.bp.blogspot.com