INferencia Causal - Fio Cruz

SciELO Books / SciELO Livros / SciELO Libros
LUIZ, RR., and STRUCHINER, CJ. Inferncia causal em epidemiologia: o modelo de respostas
potenciais [online]. Rio de Janeiro: Editora FIOCRUZ, 2002. 112 p. ISBN 85-7541-010-5. Available
from SciELO Books <http://books.scielo.org>.

All the contents of this chapter, except where otherwise noted, is licensed under a Creative Commons Attribution-Non
Commercial-ShareAlike 3.0 Unported.
Todo o contedo deste captulo, exceto quando houver ressalva, publicado sob a licena Creative Commons Atribuio -
Uso No Comercial - Partilha nos Mesmos Termos 3.0 No adaptada.
Todo el contenido de este captulo, excepto donde se indique lo contrario, est bajo licencia de la licencia Creative
Commons Reconocimento-NoComercial-CompartirIgual 3.0 Unported.

Inferncia causal em epidemiologia:
o modelo de respostas potenciais

Ronir Raggio Luiz
Claudio Jos Struchiner
Inferncia Causal
em pidemiologia
FUNDAO OSWALDO CRUZ
Presidente
Paulo Marchiori Buss
Vice-Presidente de Desenvolvimento Institucional,
Informao e Comunicao
Paulo Gadelha
EDITORA FIOCRUZ
Coordenador
Paulo Gadelha
Conselho Editorial
Carlos E. A. Coimbra Jr.
Carolina M. Bori
Charles Pessanha
Hooman Momen
Jaime L. Benchimol
Jos da Rocha Carvalheiro
Luis David Castiel
Luiz Fernando Ferreira
Maria Ceclia de Souza Minayo
Miriam Struchiner
Paulo Amarante
Vanize Macdo
Zigman Brener
Coordenador Executivo
Joo Carlos Canossa P. Mendes
Ronir Raggio Luiz
Claudio Jos Struchiner
Inferncia Causal
em pidemiologia
Copyright 2002 dos autores
Todos os direitos desta edio reservados
FUNDAO OSWALDO CRUZ / EDITORA
ISBN: 85-7541-010-5
Capa, projeto grfico e editorao eletrnica
Anglica Mello
Preparao de originais e reviso
Marcionlio Cavalcanti de Paiva
Copidesque
Irene Ernest Dias
Catalogao-na-fonte
Centro de Informao Cientfica e Tecnolgica
Biblioteca Lincoln de Freitas Filho
2002
EDITORA FIOCRUZ
Av. Brasil, 4036 1
o
andar sala 112 Manguinhos
21040-361 Rio de Janeiro RJ
Tels.: (21) 3882-9039 e 3882-9041
Telefax: (21) 3882-9006 e 3882-9007
http://www.fiocruz.br/editora
e-mail: editora@fiocruz.br
L954i Luiz, Ronir Raggio
Inferncia causal em epidemiologia: o modelo de respostas poten-
ciais. / Ronir Raggio Luiz e Claudio Jos Struchiner. Rio de Janeiro:
Editora Fiocruz, 2002.
112 p., tab.
1. Inferncia. 2. Causalidade. 3. Modelos epidemiolgicos.
CDD 20.ed. 614.4
Sumrio
Prefcio .......................................................................................................... 7
Apresentao ............................................................................................... 11
Introduo ................................................................................................... 15
1. Causalidade e Epidemiologia .................................................................. 21
2. O Modelo Estatstico de Causalidade ..................................................... 29
3. Questes Epidemiolgicas Relacionadas ................................................ 73
Concluso .................................................................................................... 97
Referncias Bibliogrficas ......................................................................... 107
7
comum caracterizar a epidemiologia como uma disciplina (para
alguns) ou cincia (para outros) que tem como um dos seus eixos cen-
trais de interesse a preocupao com a determinao do processo sade-
doena. Assim, compreensvel que a causalidade seja um tema recor-
rente na literatura produzida na rea. A produo intelectual sobre esse
assunto, dada sua complexidade, envolve uma multiplicidade de aborda-
gens, configurando uma rede de argumentos e proposies que exploram
desde aspectos mais filosficos como a construo e a crtica do
determinismo causal , at questes mais operacionais como os critri-
os de julgamento da causalidade , passando por discusses sobre os li-
mites e as possibilidades de sua aproximao por meio do mtodo cient-
fico. Explorar toda essa diversidade de pontos de vista uma tentao
para quem deseja ter uma compreenso mais global do problema. Afinal,
como seria possvel falar de causalidade sem se reportar aos pensamen-
tos originais de Aristteles, ao cartesianismo, ao problema de Hume, ao
critrio de demarcao de cincia delineado por Popper e aos tipos de
determinao propostos por Bunge? Como refletir sobre causalidade em
epidemiologia sem conhecer os postulados de Henle-Koch, os critrios de
Hill, as idias de Susser e o modelo de causas suficiente, necessria e
componente de Rothman? Como discutir inferncia causal na epide-
miologia moderna sem considerar os pensamentos de Miettinen, Robins
Prefcio
8
e Greenland sobre confundimento? E como ignorar os desenvolvimentos
mais recentes sobre diagramas causais, propostos por Pearl? Entretanto,
se a multiplicidade de vertentes a regra, ela leva, muitas vezes, a um
discurso demasiadamente genrico. A grata surpresa que o leitor ter
com este livro a objetividade dos autores, que, evitando falar sobre
tudo ao mesmo tempo agora, propem um mergulho elucidativo em
uma das mais importantes contribuies da estatstica para a discusso
da causalidade, nomeadamente o modelo de respostas potenciais de Rubin,
e sua interface com o mtodo epidemiolgico.
A base contrafactual do modelo de respostas potenciais de Rubin
provoca uma certa inquietao nos epidemiologistas, pois implica imedia-
tamente uma referncia ao problema fundamental da inferncia causal,
qual seja, a impossibilidade de se observar respostas para diferentes trata-
mentos em um mesmo indivduo, simultaneamente. Nessa perspectiva, con-
forme salientam os autores, o efeito causal em um s indivduo poderia ser
aferido se soubssemos qual seria seu desfecho se ele tivesse sido exposto
causa potencial t e se seu desfecho tivesse sido exposto causa potencial c.
Como todo efeito de uma determinada causa t deve ser mensurado em
relao a uma causa c, torna-se, ento, impossvel observar o efeito de t
relativo a c naquele indivduo. Os autores apresentam algumas possibili-
dades de superao desse impasse e discutem as condies para sua utili-
zao epidemiolgica. De particular interesse so as solues cientfica e
estatstica, e as premissas adjacentes de homogeneidade e estabilidade.
Dentre as formas mais comuns de ruptura da hiptese de estabilidade, os
autores ressaltam a existncia de interferncia entre as unidades de obser-
vao, situao bastante comum em doenas transmissveis. Uma outra
questo fundamental para a formulao estatstica de causalidade a in-
dependncia entre as respostas e o mecanismo de designao de tratamen-
to. Os autores abordam esse problema sob a situao clssica de alocao
9
aleatria do tratamento nas unidades de observao (randomizao) e
sob a tica dos estudos observacionais, em que se espera que tal indepen-
dncia esteja condicionada a um conjunto de co-variveis observadas. Nesse
momento, a idia de um escore de propenso apresentada de forma clara
e heurstica, acessvel aos leitores com menor experincia estatstica. Um
pouco mais complexa, mas nem por isso menos importante ou menos
interessante, a seo sobre inferncia estatstica, em que os autores
discutem quatro mtodos conceitualmente distintos de inferncia estats-
tica: os testes de hipteses nulas pontuais sob randomizao, a inferncia
de parmetros causais baseada em possveis designaes aleatrias do
tratamento, a inferncia bayesiana para efeitos causais e a inferncia
freqentista. No captulo seguinte, o leitor ir encarar, sob uma nova
tica, conceitos mais familiares ao epidemiologista. Nesse ponto, discu-
tem-se fundamentalmente questes relacionadas ao julgamento da vali-
dade em estudos epidemiolgicos, com particular nfase nos conceitos de
confundimento, permutabilidade e ignorabilidade, e as implicaes para
os tipos de delineamentos mais utilizados em epidemiologia. Finalmente, os
autores apresentam um excelente texto de concluso, mas no vale co-
mear por ele!
H muito era desejado um livro sobre inferncia causal que apre-
sentasse a contribuio da estatstica para a discusso da causalidade,
explorando suas interfaces com o mtodo epidemiolgico. O trabalho
aqui apresentado cumpre esse objetivo, estabelecendo um dilogo com a
epidemiologia em que so valorizadas e resguardadas as identidades de
cada disciplina. Assim como outras disciplinas da rea da sade coletiva
devem procurar ampliar seus horizontes e interagir com diferentes re-
as do conhecimento, tanto a (bio)estatstica como a epidemiologia tm
muito a ganhar com o estreitamento de suas relaes. esse esprito
interdisciplinar que torna o trabalho de Ronir e Claudio uma referncia
10
importante, no s para os epidemiologistas e bioestatsticos, mas tam-
bm para outros profissionais da sade coletiva que desejem ampliar
sua viso sobre a questo da causalidade.
Guilherme Loureiro Werneck
Ncleo de Estudos de Sade Coletiva/
Depto. de Medicina Preventiva da UFRJ
Instituto de Medicina Social da UERJ
11
Este livro tem sua origem na dissertao de mestrado em estatstica
desenvolvida por Ronir Raggio Luiz no Instituto de Matemtica da Univer-
sidade Federal do Rio de Janeiro, tendo surgido do fascnio comum entre
orientado e orientador pelos desafios da pesquisa biomdica e da
epidemiologia. Ambos vislumbramos na inferncia causal um tema que res-
pondesse s nossas inquietaes sobre a lgica da investigao cientfica.
A proposta, aqui, apresentar a contribuio da estatstica para a
discusso sobre causalidade, por meio do modelo de respostas potenciais
proposto por Rubin. Apesar da aridez do tema, procuramos traduzir para o
leitor interessado, tipicamente um epidemiologista, questes presentes ape-
nas em artigos cientficos, e relacionadas operacional e conceitualmente a
uma investigao causal. Nosso objetivo oferecer ao pesquisador da rea
mdica uma ponte entre a estatstica e os aspectos causais da investigao
epidemiolgica. Se, de um lado, um estatstico tradicionalmente se esquiva
quando confrontado com uma questo causal, de outro, um epidemiologista
no tem contato com a noo estatstica de causa. A palavra traduzir se
aplica tambm em seu sentido original, na medida em que, at aonde vai
nosso conhecimento, no h textos em portugus sobre o tema.
Este volume est estruturado em trs captulos. Na Introduo, con-
vidamos o leitor a se envolver com o tema. No captulo 1 oferecemos um
panorama da discusso de causalidade em epidemiologia e no captulo 2
Apresentao
12
desenvolvemos a teoria propriamente dita do modelo de respostas potenci-
ais, explorando o papel do mecanismo de designao de tratamento. O
tpico intitulado Inferncia Estatstica um pouco mais rido, mas sua
leitura pode ser deixada de lado num primeiro momento sem comprome-
timento da essncia do assunto. No captulo 3 procuramos relacionar a
teoria exposta a conceitos epidemiolgicos, particularmente os de validade
e confundimento. Por fim, na Concluso discutimos as principais implica-
es do contedo apresentado. Em sntese, o modelo causal apresentado
um modelo construdo sob uma tica contrafactual, em que a varivel
resposta , na realidade, um vetor de respostas potenciais, com dimenso
dada pelo nmero de tratamentos considerados. A lgica subjacente a
esse modelo a busca dos efeitos de causas postuladas, e no o inverso,
isto , a busca das causas de efeitos observados. Essa mudana de cami-
nho, apesar de revolucionria, no nova nem originariamente prpria
estatstica. Conta-se que Albert Einstein, quando professor da Politcni-
ca de Zurique, causou verdadeiro escndalo entre seus colegas ao afirmar
que o princpio bsico de toda a cincia superior era priori-dedutivo, e
no posteriori-indutivo. Em outras palavras, o homem deve focalizar a
causa e da partir para os efeitos.
Um ponto que merece destaque quanto ao contedo do livro a
superao da at ento incmoda interface da estatstica com a noo de
causa. Assim, sustentados na retrica estatstica segundo a qual correlao
no implica causalidade, e apesar do reconhecimento geral de que um
experimento randomizado bem planejado pode fornecer poderosa ajuda
na investigao de relaes causais, os estatsticos abstiveram-se de pensar
em causalidade de forma mais especfica e audaciosa. Esse fato sutilmen-
te evidenciado por Oscar Kempthorne, um dos maiores estatsticos do s-
culo XX, recentemente falecido, quando apresenta a questo do que seja
um conceito vivel de causa. A substituio do foco da questo causal de
13
uma definio epistemolgica para a mensurao de efeitos causais pare-
ce ser uma importante estratgia que os estatsticos encontraram para
prestar a sua contribuio ao tema.
Por fim, vale a pena enfatizar a oportunidade do tema proposto, que
deve ir alm dos interesses da epidemiologia e da estatstica, para ser perce-
bido tambm como estratgico para o desenvolvimento da rea da sade
pblica de forma mais geral.
Os Autores
15
A curiosidade e a necessidade h muito tm estimulado a busca das
causas dos diversos fenmenos que so rotineiramente observados. Em par-
ticular, a ocorrncia de doenas um fenmeno em que h interesse geral
na identificao de suas causas para que obviamente possam ser preveni-
das. Entretanto, inferir causalidade uma tarefa complexa, envolvendo
diversas reas de investigao. A filosofia, a sociologia e a medicina sem-
pre se sentiram desafiadas por essa questo, enquanto a estatstica s mais
recentemente parece ter despertado seu interesse por ela. Embora se iden-
tifiquem referncias idia de causa nos trabalhos sobre experimentos
aleatorizados desenvolvidos por Fisher no incio do sculo XX, formal-
mente a contribuio da estatstica para esta discusso comeou com o
trabalho de Rubin em 1974.
Holland (1986) salientou que quando se fala de causalidade, a difi-
culdade est na diversidade de questes que surgem. Os filsofos, por exem-
plo, esto interessados no significado fundamental da noo de causa. Os
socilogos ou mdicos, por sua vez, interessam-se pela identificao das causas
de um dado efeito. E h ainda os cientistas em geral, interessados em enten-
der os detalhes dos mecanismos causais.
A discusso sobre causalidade parece ser mais objetiva em um con-
texto estatstico, uma vez que sua contribuio se concentra principalmente
na mensurao de efeitos causais. Medir efeitos causais sem o entendimento
Introduo
16
do mecanismo causal envolvido ou do significado de causalidade no s
possvel como faz parte do cotidiano de todos. Eventualmente, pode ser mais
conveniente em um primeiro momento tentar objetivamente, por meio de
mensuraes adequadas, identificar a causa de efeitos observados do que
conceitu-la formalmente ou entender os detalhes de seus mecanismos. Ob-
serva-se ainda que mensuraes cuidadosas de efeitos causais freqentemente
conduzem a um melhor entendimento do mecanismo causal envolvido
(Holland & Rubin, 1988). Mais especificamente, o objetivo da estatstica na
questo causal tem-se concentrado no estudo de efeitos causais relativos a
possveis manipulaes que so previamente estabelecidas. Essa abordagem
segue um caminho contrrio a uma substancial discusso no estatstica
de causa e efeito, que se concentra em estimar (ou mesmo determinar) qual
a causa de uma particular resposta (Rubin, 1990a). Essa idia dever ficar
mais clara ao longo dos captulos deste livro.
Inferncia causal em epidemiologia, apesar de conter o termo
inferncia, bastante peculiar estatstica, no se tem valido, tradicional-
mente, de princpios estatsticos para sua avaliao. A tnica da discusso
tem-se dividido entre a abordagem filosfica e o estabelecimento de condi-
es ou restries que respaldem uma interpretao causal. Nesse aspecto, a
principal contribuio da estatstica refere-se a uma dessas condies, que
a verificao da existncia de associao estatstica entre a varivel res-
posta (doena) e o suposto fator causal (exposio). Desse modo, apesar de
a teoria estatstica nos ltimos anos ter subsidiado um substancial desen-
volvimento da metodologia epidemiolgica por meio de tcnicas quantita-
tivas avanadas, o problema fundamental de inferir causalidade ainda
persiste, sobretudo quando investigada com base em estudos observacionais
(Breslow, 1996). Mesmo sob randomizao,
1
analistas mais cautelosos
1
Randomizao (ou aleatorizao) um mecanismo aleatrio de alocao dos tratamentos
(causas) s unidades, presente apenas em ambientes experimentais, reconhecido como apro-
priado para obteno de concluses causais.
17
procuram falar sobre causalidade com ressalvas. Nosso objetivo, aqui,
rever um modelo estatstico de causalidade, abordando tpicos e contri-
buies recentes ou ainda no efetivamente incorporadas ao pensamento
e prtica epidemiolgicos.
Para a tarefa de identificao de fatores causais, a epidemiologia tem-
se utilizado tanto de estudos observacionais quanto de experimentais (os
ensaios clnicos). Uma vez que a experimentao nem sempre possvel
quando se trabalha com populaes humanas, maior nfase tem sido dada
aos estudos observacionais, principalmente aos estudos de caso-controle cuja
execuo, embora mais sujeita a vieses, torna-se, eventualmente, a nica
opo vivel em razo de questes operacionais tais como tempo, custo, ra-
ridade de uma determinada doena etc. Entretanto, a possibilidade de se
estabelecer um modelo estatstico cuja formulao seja comum s aborda-
gens experimental e observacional parece adequada, pois unificaria a idia
de causa contida nos estudos epidemiolgicos. A diferena fundamental en-
tre as abordagens se concentra no nvel de controle que o analista,
experimentador ou observador possui sobre o mecanismo de determinao
de qual tratamento (causa) a unidade recebe.
Independentemente de qual desenho epidemiolgico, experimental ou
observacional um pesquisador utilize, uma proposio causal a ser
investigada tal como tabagismo causa doena cardiovascular apresenta
caractersticas que dificultam sua avaliao. No apenas evidente que nem
todos os fumantes apresentaro doena cardiovascular, como tambm evi-
dente que alguns no-fumantes podero desenvolver a doena. A proposi-
o tem sido avaliada, portanto, incorporando a idia de risco. Se, de fato,
fumar tem algum efeito, seria esperado encontrar um risco maior de ocor-
rncia de doena cardiovascular entre fumantes do que entre no-fuman-
tes. Nessa perspectiva, o papel do mecanismo que designa (determina) o tra-
tamento (no caso, exposio ao fumo) fundamental. Saber como os indiv-
18
duos foram alocados nos grupos fumante e no-fumante de capital impor-
tncia para que o resultado da comparao entre as taxas (ou riscos) en-
contradas possa ser atribudo causa em questo, e no a uma explicao
alternativa. Por exemplo, se os fumantes so mais idosos que os no-fuman-
tes, a que se deveria atribuir uma eventual elevao na taxa de doena
cardiovascular quando se comparassem fumantes e no-fumantes? Ao h-
bito de fumar ou idade? Alm disso, os mtodos de inferncia estatstica
usam o mecanismo de designao para deduzir inferncia causal e, para
determinados dados e suposies, as inferncias causais eventualmente va-
riam quando este mecanismo varia (Rubin, 1991).
Apesar da razovel idade das primeiras tentativas metodolgicas para
identificao das causas das doenas, a atualidade do tema ainda marcante.
Os clssicos trabalhos de Rothman (1976) e Susser (1977) foram merece-
dores de recentes reedies (Wilkelstein, 1995; Greenland, 1995). A abor-
dagem aqui apresentada fortemente sustentada no j clssico trabalho de
Holland (1986), que cunhou o termo Modelo de Rubin, explorando a no-
o de causa por meio de uma lgica contrafactual. Uma reviso desse mo-
delo aparece em Little & Rubin (2000). Entretanto, s mais recentemente
surgiram algumas aplicaes em epidemiologia. Os trabalhos de Rubin
(1991), Efrom & Feldman (1991) e Halloran & Struchiner (1995) so refe-
rncias da utilizao, em problemas epidemiolgicos, da noo de causali-
dade devida a Rubin. Embora a viso de causalidade sob uma tica
contrafactual tenha se desenvolvido e sido defendida (Greenland, 2000),
ainda no h um consenso por parte dos autores (Dawid, 2000).
A proposta , portanto, apresentar a contribuio da estatstica para
a discusso sobre causalidade por meio da incorporao das idias de Rubin
e outros autores, explorando sua aplicabilidade aos principais desenhos
epidemiolgicos e ressaltando a importncia do mecanismo de designao
das causas consideradas. Alm disso, mais que um objetivo, tem-se a pre-
19
tenso de estreitar ainda mais as relaes entre o estatstico e o epidemio-
logista. Se, de um lado, um estatstico tradicionalmente se esquiva quando
confrontado com uma questo causal, de outro, um epidemiologista no
tem contato com uma noo estatstica de causa. Construir com base nesse
conceito uma ponte entre estas duas reas, estatstica e epidemiologia, pa-
rece ser bastante interessante para se ressaltar ainda mais a subrea co-
nhecida como bioestatstica.
Os captulos e sees aqui apresentados no so estanques. Rando-
mizao, confundimento e permutabilidade e o conceito de validade, por
exemplo, apesar de constiturem tpicos separados, se relacionam estreita-
mente quando o tema em questo se refere noo de causa. Assim, quando
se abordar determinado tpico, alguns outros estaro eventualmente pre-
sentes, direta ou indiretamente.
21
A epidemiologia, como cincia preocupada com a freqncia, a distri-
buio e os determinantes das doenas que acometem a populao, tem de-
senvolvido procedimentos metodolgicos baseados em modelos estatsticos que
buscam identificar a etiologia das doenas. Esses modelos so, entretanto, de-
pendentes de pressupostos que muitas vezes no podem ser checados com base
em dados observados. O conceito de validade tem, portanto, um papel-chave na
avaliao dos efeitos causais. Por sua vez, a validade sobre a existncia de uma
relao de causa e efeito entre uma doena e um fator de risco dependente
das caractersticas de cada desenho de estudo que a epidemiologia utiliza.
Segundo Rothman & Greenland (1998), uma causa pode ser entendida
como qualquer evento, condio ou caracterstica que desempenhe uma fun-
o essencial na ocorrncia da doena. Observa-se, ainda, que causalidade
um conceito relativo, devendo ser compreendido em relao a alternativas
concebveis. Isto , o efeito de uma causa sempre relativo a uma outra causa.
A expresso A causa B significa que A a causa de B relativa a alguma outra
causa que, freqentemente, se refere condio no A (Holland, 1986). Por
exemplo, ao se falar que histria de tabagismo inveterado uma causa para
cncer de pulmo, necessrio especificar a causa alternativa, que pode ser,
por exemplo, tabagismo recente ou no tabagismo.
Ainda em relao questo conceitual de causa, a epidemiologia tem
trilhado um caminho que passa pela filosofia da cincia. So vrios os auto-
Causalidade e Epidemiologia
1
22
res que seguem essa linha. O trabalho de Rothman (1988) agrega ensaios e
comentrios de diversos autores sobre causalidade sob a tica filosfica,
discutindo questes ligadas lgica da causalidade e teoria da refutao
de Popper. Entretanto, o processo de identificao de um suposto agente cau-
sal pode ser simplificado utilizando-se uma abordagem mais pragmtica,
sem a necessidade de um aprofundamento na questo terico-conceitual
intrnseca noo de causa. Alm disso, enquanto os cientistas em geral
consideram associaes causais como etapas do processo de conhecimento
da epidemiologia e da histria natural da doena, profissionais envolvidos
diretamente com a preveno das doenas necessitam, para suas aes, de
concluses rpidas, to logo alguma evidncia tenha sido atingida.
A questo causal no ambiente epidemiolgico tem sido apresentada tam-
bm de uma forma determinstica, observando-se, entretanto, que a ocorrncia
de uma doena em geral no est associada exclusivamente a uma nica causa.
Para ocorrncia da doena, necessrio um conjunto de causas componentes.
Rothman & Greenland (1998) definem causa suficiente como um conjunto
de eventos e condies mnimos que inevitavelmente acarreta a ocorrncia de
doena, no qual mnimo implica que no se pode prescindir de nenhum dos
eventos ou condies componentes. Nota-se ainda que, para a ocorrncia de
uma determinada doena, pode haver diversos conjuntos de causas suficien-
tes. Algumas causas componentes, quando presentes em todas as causas sufi-
cientes alternativas, so chamadas causas necessrias. Outras, para serem
identificadas, dependem da interao com outras causas componentes. A Figu-
ra 1 ilustra esse modelo, no qual se observam trs causas suficientes, sendo A
uma causa necessria. Um modelo de causalidade com essas caractersticas,
isto , fundamentado na classificao dos mecanismos que precedem a respos-
ta, diferentemente do modelo a ser discutido, que se baseia na classificao de
respostas individuais exposio, tem sido conhecido como modelo de Rothman
ou modelo de causas suficiente/componente (Greenland, 1995).
23
Figura 1 Exemplo do modelo de causalidade de Rothman para uma par-
ticular doena
Muitas causas que so de interesse da epidemiologia, embora no
sejam suficientes, so componentes de causas suficientes. Dispor de gua
no tratada no suficiente para o surgimento de doenas diarricas e
fumar no suficiente para produzir cncer de pulmo, mas ambas so
causas componentes de causas suficientes. Observa-se, ainda, que a identifi-
cao completa de todas as causas componentes de uma determinada causa
suficiente, mesmo que seja possvel e vivel, no fundamental se o objetivo
a preveno da doena. Por exemplo, mesmo no sendo capaz de identifi-
car todas as causas componentes de uma dada causa suficiente para cncer
de pulmo, entre as quais est o hbito de fumar, possvel prevenir aqueles
casos que resultariam desta causa suficiente pela remoo do fumo da cons-
telao de causas componentes (Rothman, 1976).
O fato que a maioria ou mesmo todos os componentes de uma causa
suficiente so desconhecidos. Exigem-se, portanto, hipteses especficas e
modelos apropriados para que a avaliao dos efeitos observados possa ser
atribuda a uma causa estabelecida. Alm disso, o conhecimento biolgico
sobre uma proposio epidemiolgica freqentemente raro, tornando-a, na
maioria das vezes, uma mera afirmao de associao entre a exposio e a
doena. Averiguar a existncia de associao tarefa bem familiar estatsti-
ca. A passagem da atribuio de associao entre a exposio (suposto agente
causal) e a doena para atribuio de causa tem sido a tnica da discusso
E
A
B
C
D H
A
B
F
G J
A
C
F
I
Causa Suficiente I Causa Suficiente II Causa Suficiente III
24
sobre causalidade. A partir da incorporao das idias de Rubin, traduzidas
no chamado Modelo de Rubin, uma nova lgica pode ser desenvolvida.
Historicamente, a primeira tentativa formal para identificao das
causas de uma doena se deu com a formulao, em 1890, do que foi cha-
mado de Postulados de Henle-Koch (Evans, 1978). Tais postulados satisfazi-
am a necessidade de se estabelecer regras que guiassem a investigao de
bactrias como possveis agentes causais (Yerushalmy & Palmer, 1959). Ba-
sicamente, estabeleciam os seguintes critrios para o organismo patognico:
deve estar presente em todos os casos da doena em questo;
no deve ocorrer nem de forma casual nem de forma patognica em
outra doena;
isolado do corpo e crescido em cultura pura, deve induzir a doena
quando inoculado em suscetveis.
Foi observado, inclusive por Koch, que para a identificao de um
suposto agente causal no era necessrio que todos os critrios fossem satis-
feitos e que apenas os dois primeiros j eram suficientes. Ou seja, o cumpri-
mento dos postulados fornecia razoveis elementos para aceitar a hiptese
de causalidade do suposto agente, enquanto o seu descumprimento no de-
veria excluir tal hiptese.
Apesar de suas limitaes, que os tornavam no aplicveis a todas as
doenas bacterianas e eventualmente no aplicveis s doenas virticas e
parasitrias, esses postulados serviram de base para que a discusso sobre a
etiologia das doenas, considerando-se suas especificidades, fosse ampliada.
Assim, medida que o conhecimento sobre as doenas crescia, como, por
exemplo, identificando-se novos vrus e suas respectivas caractersticas bio-
lgicas, tempo de incubao e possibilidade de imunidade, os postulados de
Henle-Koch foram sendo testados e modificados. As modificaes consistiam,
basicamente, na incorporao de novas restries para que a atribuio de
causalidade servisse a todas as doenas, inclusive as crnicas.
25
As modificaes culminaram com os critrios estabelecidos por Hill
em 1965. Identificada uma associao entre exposio e doena, ele sugeriu
que os seguintes aspectos fossem considerados na tentativa de se distinguir
uma associao causal de uma no-causal:
FORA DA ASSOCIAO uma associao ser to mais forte quanto
mais distante do valor de nulidade estiver a medida de efeito de
interesse calculada.
2
O argumento que uma associao forte tem
mais chance de ser causal do que uma associao fraca. Isso porque
se ela se deveu a algum vis; ento, muito provavelmente, este vis
seria evidente. Associaes fracas, contudo, so mais provveis de
serem explicadas por vieses no detectados. Entretanto, uma associ-
ao fraca no descarta a hiptese de causalidade. Outra caracte-
rstica importante que a fora de uma associao no um aspecto
compatvel biologicamente, e sim uma caracterstica que depende da
prevalncia das outras causas componentes. Uma forte associao
de determinada causa pode indicar simplesmente que esta causa
pouco prevalente em relao s outras e no possuir, assim, signifi-
cado biolgico importante (Rothman & Greenland, 1998).
CONSISTNCIA a consistncia se refere repetio dos achados para
diferentes populaes. Resultados similares reforam a hiptese de
causalidade.
ESPECIFICIDADE uma causa especfica para um determinado efeito
se a introduo de um suposto fator causal seguido da ocorrncia
do efeito e sua remoo implica que tal efeito no ocorra. Em razo
do fato de que muitos fatores implicam muitos efeitos e praticamente
todas as doenas tm mltiplas causas, a especificidade de uma asso-
2
Uma medida de efeito uma comparao (diferena ou razo) entre medidas de freqncia de
doena (prevalncias, riscos, taxas ou odds) calculada para dois grupos, freqentemente
expostos e no expostos a determinado fator sob investigao causal.
26
ciao respalda uma interpretao causal, mas sua falta no deve
ser indicao de no-causalidade.
TEMPORALIDADE a causa deve necessariamente preceder o efeito. Os
estudos transversais e retrospectivos muitas vezes carecem dessa evi-
dncia, dificultando uma atribuio de causalidade.
GRADIENTE BIOLGICO este aspecto refere-se presena de uma curva
dose-resposta. Observar uma freqncia crescente de ocorrncia de
doena medida que se aumenta a dose ou o nvel da exposio
refora a hiptese de causalidade. Entretanto, a observao de um
efeito dose-resposta pode ser devida completamente a algum vis.
PLAUSIBILIDADE se o efeito hipotetizado plausvel diante do conhe-
cimento biolgico vigente, a interpretao causal fortalecida. No
entanto, plausibilidade biolgica no pode ser exigida, uma vez que
depende do conhecimento disponvel poca da investigao. Em
geral, quanto menos se conhece a respeito da etiologia da doena e
doenas similares, menos segurana se tem para rejeitar uma inter-
pretao causal com base neste critrio (Kleibaum et al., 1982).
COERNCIA o critrio de coerncia satisfeito quando a associao
encontrada no entra em conflito com o que conhecido sobre a
histria natural e a biologia da doena. Nota-se que este critrio
combina aspectos dos critrios de consistncia e plausibilidade bio-
lgica. Ele mereceu especial ateno em recente trabalho (Rosembaun,
1994), no qual se buscou quantificar a evidncia fornecida por uma
associao coerente.
EVIDNCIA EXPERIMENTAL conhecido o poder da experimentao na
avaliao de causalidade. Entretanto, a obteno de tal evidncia
raramente disponvel em estudos envolvendo populaes humanas
devido, principalmente, a questes ticas.
27
3
Construdo sob uma tica contrafactual significa que o modelo fundamentado em valores
hipotticos, isto , em valores que no so efetivamente observados.
ANALOGIA uma analogia simples pode aumentar a credibilidade
para uma atribuio de causalidade. Por exemplo, se conhecido
que certa droga causa m-formao congnita, talvez uma outra
similar que se est estudando tambm poderia, por analogia, apre-
sentar o mesmo efeito.
exceo do critrio de temporalidade, nenhum outro desses nove
critrios de evidncia epidemiolgica sugeridos por Hill (1965) deve ser
exigido como condio sine qua non para julgar se uma associao causal.
Pode-se dizer tambm que eventualmente os critrios de evidncia experi-
mental e analogia so irrelevantes e o de especificidade, imprprio. Holland
(1986) agrupa os critrios de plausibilidade, coerncia e analogia por en-
tender que os trs se referem aos conhecimentos adquiridos at a poca do
estudo. Essa abordagem , pois, condicionada a aspectos e critrios que na
maioria das vezes no so nem necessrios nem suficientes. Quando so
satisfeitos reforam a hiptese de causalidade, mas quando isso no ocorre,
no se deve descart-la.
De modo diferente, a abordagem estatstica sobre causalidade baseia-
se na formulao de um modelo construdo sob uma tica contrafactual,
3
na qual so estabelecidas hipteses que procuram viabilizar a inferncia
causal. A dificuldade est, pois, na verificao de tais hipteses, nem sempre
passveis de serem testadas por meio dos dados observados. A validade de
algumas hipteses no testveis, por sua vez, depende do nvel de convenci-
mento que o analista consegue obter, para si prprio e para os outros, com
base em uma cuidadosa anlise de cada situao em particular. Sendo as-
sim, de grande valia que as hipteses no testveis adjacentes ao modelo
estejam explicitadas, para que possam ser analisadas criticamente.
29
Causalidade e Estatstica
A relao entre causa e estatstica merece alguns comentrios inici-
ais. Sustentados na retrica estatstica de que correlao no implica causa-
lidade e apesar do reconhecimento geral de que um experimento randomizado
bem planejado pode fornecer uma poderosa ajuda na investigao de rela-
es causais, os estatsticos abstiveram-se de pensar em causalidade de for-
ma mais especfica e audaciosa. Isso sutilmente evidenciado quando, por
exemplo, lemos o trabalho de Kempthorne (1978), um grande estatstico
contemporneo, que, muito modestamente, se preocupa em no ser arro-
gante quando ele, um mero estatstico (em sua auto-avaliao), aborda a
questo do que seja um conceito vivel de causa.
Dempster (1990) argumenta que a primeira razo para que os esta-
tsticos analisem causalidade prtica. O pensamento causal est profunda-
mente presente no entendimento cientfico dos problemas da estatstica apli-
cada. Por meio de alguns exemplos prticos, tal como a questo de saber se a
reduo da ingesto de lcool por mulheres elimina ou adia o surgimento
de alguns casos de cncer de mama, o autor conclui que a coleta e a anlise de
dados estatsticos constituem uma poro aprecivel da base emprica em
que ocorrem as tentativas cientificamente confiveis de atribuio de cau-
salidade. Ou, como observado por Gail (1996), o pensamento estatstico,
O Modelo Estatstico de Causalidade
2
30
presente na coleta e na anlise de dados, tem sido crucial para o entendi-
mento do poder e das potenciais fragilidades das evidncias cientficas. O
resultado disso um crescente desenvolvimento do horizonte do estatstico e
dos mtodos estatsticos, impulsionando o surgimento de novas metodologias
e debates construtivos sobre critrios necessrios para se inferirem relaes
causais. Esse conhecimento estatstico forma a base de grande parte da pr-
tica epidemiolgica atual.
Em termos mais especficos, o processo de inferir causalidade envol-
ve diversas tarefas estatsticas. decisivamente importante, quando se dis-
cutem efeitos causais, comear definindo a quantidade a ser estimada. Sub-
seqentemente, deve-se estudar mtodos para coletar dados com os quais
essa quantidade possa ser estimada. E, finalmente, deve-se considerar tc-
nicas estatsticas para inferir os efeitos com base nos dados observados
(Rosenbaun & Rubin, 1984). na etapa de definio da quantidade a ser
estimada que se concentra a mudana na lgica da investigao causal
devida a Rubin (1974), por meio do modelo de respostas potenciais. Entre-
tanto, no momento da coleta de dados para estimao dessa quantidade, o
esquema de amostragem necessrio deve ser considerado em razo do dese-
nho de estudo epidemiolgico. J para a etapa de inferncia causal basea-
da nas observaes, diversas tcnicas podem ser utilizadas. Rubin (1990a)
tem discutido e comparado essas tcnicas, com especial destaque para o
mtodo bayesiano.
Assim, o problema de atribuio de causalidade, em uma leitura esta-
tstica, interpretado como um problema de deteco de efeitos causais por
meio de mensuraes. Medir efeitos causais constitui, pois, a base do desen-
volvimento da teoria estatstica que discute causalidade, com particular in-
teresse em epidemiologia. Nessa viso, inferir estatisticamente efeitos causais
traduz-se em um processo de estimao de efeitos devido a potenciais mani-
pulaes que podem ou poderiam ser aplicadas a uma unidade em um con-
31
texto real com todas as suas complexidades, necessitando, portanto, de defi-
nies adequadas a essa estrutura complicada (Rubin, 1990a).
Uma primeira caracterstica importante associada contribuio da
estatstica para a discusso de causalidade, que acaba se refletindo em uma
limitao, se refere concentrao do estudo nos efeitos de causas previa-
mente determinadas, em oposio abordagem usual, que busca as causas
de efeitos observados. Essa uma condio imposta por Holland (1986) e
defendida por Rubin, o qual, de forma incisiva, expressa:
Em qualquer situao relativamente complicada do mundo real, envolvendo plan-
tas, animais, pessoas, avies ou reatores nucleares, eu acredito que geralmente
impossvel examinar uma resposta observada e realisticamente encontrar a causa
dela. A nica esperana para tal atribuio descrever a situao muito cuidado-
samente para limitar o tratamento (causa) sugerido que tenha ocorrido e indicar
a) quais outros fatores (outras potenciais causas) esto sendo assumidos fixados
em seus valores observados; e b) quais tratamentos (causas) alternativos
contrafatuais esto sendo considerados terem acontecidos preferivelmente ao tra-
tamento observado, que a causa postulada. (Rubin, 1990a:280)
Dempster (1990) tenta justificar essa insistncia de Holland (1986)
e Rubin (1990a), afirmando que os princpios estatsticos que estudam as
dificuldades de se fazer indues sobre o mundo real com base em correla-
es empricas no esto estreitamente ligados ao conceito de causa. Acres-
centa que o estatstico deve tambm estar interessado na abordagem tradici-
onal, que estuda as causas de efeitos observados, utilizando-se, entretanto,
de princpios complementares queles descritos por Holland no Modelo de
Rubin. Entretanto, essa restrio parece justificvel, uma vez que tenta res-
ponder de forma mais pragmtica questo de como identificar uma causa.
No necessariamente exclui outras formas de estudar causalidade, apenas
limita a participao da estatstica nessa discusso. Os princpios comple-
mentares aludidos por Dempster (1990) fazem uso mais especificamente de
conceitos prprios teoria filosfica.
32
Outra caracterstica importante contida nesta discusso, e que tam-
bm bastante controversa, se refere definio do que pode ser considera-
do uma causa. A condio-chave dessa idia, sob a tica estatstica, que
cada unidade deve estar potencialmente exposta ao de qualquer uma
das causas cujo efeito poderia ser medido. Assim, atributos pessoais imut-
veis, tais como sexo ou raa, no podem ser vistos como causas, j que no se
poderia observar seu efeito sob a condio alternativa quela que a unidade
possui. bastante comum encontrar declaraes de causalidade atribudas
a caractersticas pessoais. Mas tais declaraes, na conotao de causa de
Holland (1986), so sempre declaraes de associao entre os valores de um
atributo e uma varivel resposta para as unidades de uma populao. As-
sim, pode-se dizer, por exemplo, que certa pessoa no teve cncer de pele
(melanoma) porque era negra. No entanto, tudo o que pode ser inferido
dessa declarao que a proporo de casos de melanoma inferior entre
negros, apesar da condio causal que a declarao carrega. Tal restrio
est longe de ser um consenso por parte de autores preocupados com a
questo da causalidade, principalmente os filsofos. Entretanto, entre os es-
tatsticos ela razoavelmente bem aceita. Kempthorne (1978) diz que sem
sentido epistemolgico falar de uma caracterstica de um indivduo cau-
sando ou determinando uma outra caracterstica individual. Cox (1986,
1992) parece acolher a idia ao reconhecer que certas variveis no podem
propriamente ser vistas como causas.
Deve ser reconhecido, todavia, que se um atributo pessoal pode ou
no ser uma causa depende da conotao que se d palavra. Mas, para o
modelo estatstico a ser discutido a seguir, essa condio teoricamente im-
portante, pois a idia de causa nele contida se refere comparao de res-
postas potenciais sob as diferentes situaes de exposio (causas ou trata-
mentos) consideradas.
33
O Modelo de Respostas Potenciais
Estrutura do modelo
Um estudo estatstico de efeitos causais , portanto, aquele em que se
comparam os resultados de dois ou mais tratamentos em uma populao de
unidades, onde, em princpio, cada uma destas unidades poderia ser exposta
a qualquer um dos tratamentos. A estruturao desse modelo, tambm co-
nhecido como Modelo de Rubin, foi pioneiramente descrita de forma elo-
qente por Holland (1986) e apresentada novamente de forma sucinta em
outros trabalhos (Holland & Rubin, 1988; Holland, 1989; Wainer, 1991;
Halloran & Struchiner, 1995; Angrist et al., 1996; Little & Rubin, 2000). A
seguir, tenta-se reproduzir quase que integralmente essa estrutura, a fim de
consolidar a notao.
Os elementos essenciais que compem o Modelo de Rubin:
uma populao de unidades, U;
um conjunto, K, de agentes causais bem definidos (tambm chama-
dos tratamentos ou causas) para os quais cada unidade u
e
U possa
ser exposta. Para efeito de simplificao, sero considerados apenas
dois agentes causais, K t c = {; }, onde t representa tratamento ou
exposio e c controle ou no exposio;
uma resposta, Y, a varivel dependente, que pode ser registrada
para cada unidade aps a exposio aos agentes causais em K. Y ser
considerada dicotmica, na medida em que em epidemiologia o prin-
cipal interesse a ocorrncia ou no de uma determinada doena. A
extenso para um Y qualquer imediata.
Nesse modelo, o papel do tempo fundamental. Quando uma unidade
exposta a uma causa, isso deve acontecer em algum tempo ou dentro de
um perodo de tempo especfico. Assim, as variveis dividem-se em pr-
34
exposio, aquelas cujos valores so determinados anteriormente exposi-
o causa, e ps-exposio, aquelas determinadas aps. A funo da vari-
vel resposta Y medir o efeito de uma causa. Logo, se encontra na classe
das variveis ps-exposio. Isso d surgimento a uma caracterstica crtica
do modelo, isto , o valor de uma varivel ps-exposio potencialmente
afetado pela particular causa, t ou c, para a qual a unidade exposta. E isso
exatamente equivalente declarao de que causas tm efeitos, que a
essncia da idia de causalidade.
Assim, no lugar de uma varivel dependente simples Y, tem-se uma
varivel dependente Y
k
para cada um dos tratamentos para os quais a uni-
dade pode potencialmente ser exposta. Se uma unidade exposta ao agente
causal t, registra-se o valor Y
t
para esta unidade. Se a mesma unidade
tivesse sido exposta ao agente causal c no lugar de t, seria registrado o valor
Y
c
e no o valor Y
t
. Formalmente, para dois tratamentos, associa-se o vetor
( Y
t
, Y
c
) para cada unidade u
e
U, onde Y
k
(u) a resposta obtida para a
unidade u quando exposta causa
k K e
.
O efeito da causa t sobre u quando medido por Y relativo causa c
a diferena entre Y
t
(u) e Y
c
(u). No modelo, ser representado pela dife- e-
rena algbrica
Y u Y u
t c
( ) ( ) .
Holland (1986) chama essa diferena de efeito causal de t relativo
c sobre u, quando medido por Y. Essa a maneira com que o modelo para
inferncia causal expressa a mais bsica de todas as declaraes causais,
sendo na realidade a quantidade que se gostaria de poder estimar a partir
de dados observveis e hipteses plausveis. Uma forma alternativa de se
quantificar o efeito causal considerar a razo entre as respostas potenciais.
Assim, dentro da situao considerada, onde tanto a varivel exposi-
o (tratamento) quanto a varivel resposta (doena) so dicotmicas, as-
sumindo-se o valor 1 para presena e 0 para ausncia, o efeito causal indi-
35
vidual Y u Y u
t c
( ) ( ) ser igual a 1 somente se u torna-se doente quando
exposto, mas no se torna doente quando no exposto. Y u Y u
t c
( ) ( ) ser 0
quando o status de doena de u o mesmo, independentemente da condio
de exposio. E, finalmente, ser -1 se u no adoece quando exposto, mas
adoece quando no exposto. Assim, para um determinado indivduo u
0
, o
valor 0 para o efeito causal Y u Y u
t c
( ) ( ) indicao de ausncia de efeito
da causa t relativa causa c para a unidade u
0
. J os valores 1 e -1 represen-
tam existncia de efeito da causa postulada, sendo o valor -1 indicativo de
uma causa preventiva por exemplo, uma vacina.
Inferncia causal est, enfim, interessada no efeito de causas sobre
unidades especficas, isto , est interessada em determinar o valor do efeito
causal Y u Y u
t c
( ) ( ) . frustrada, entretanto, por uma limitao de obser-
vao que Holland (1986) chama de Problema Fundamental da Inferncia
Causal. Qual seja: impossvel observar os valores de Y
t
(u) e Y
c
(u) para
a mesma unidade u e, portanto, impossvel observar o efeito de t relativo
a c sobre u. No entanto, a aplicao dessa afirmao depende da natureza
dos tratamentos e das unidades sob estudo.
A aparente inviabilidade de fazer inferncias causais em conseqncia
desse problema desaparece quando se nota que a impossibilidade de obser-
vao simultnea de Y
t
(u) e Y
c
(u) no significa ausncia total de informa-
o relevante sobre estes valores. E essa informao depende da situao
considerada. Holland (1986) assinala duas solues para o problema, que
chama de soluo cientfica e soluo estatstica.
A soluo cientfica faz uso de hipteses de homogeneidade ou estabi-
lidade. Ao estudar o comportamento de uma pea em laboratrio, um cien-
tista pode acreditar que o valor de Y
c
(u) no depende do momento em que
medido hiptese de estabilidade temporal e o valor de Y
t
(u) no
afetado pela exposio anterior da unidade u causa c hiptese de causa
transiente. Assim, para superar o Problema Fundamental da Inferncia
36
Causal, o cientista expe u causa c, mede Y
c
(u) e, subseqentemente, expe
u causa t e mede Y
t
(u). A obteno do efeito causal em nvel individual
Y u Y u
t c
( ) ( ) torna-se, ento, imediata. Note-se, entretanto, que o efeito cau-
sal que pode ser obtido pelo cientista dependente de hipteses no testveis.
Isto , o cientista no capaz de provar as suposies que fez de estabilidade
temporal e causa transiente. Com um trabalho cuidadoso, ele pode convencer
a si e aos outros de que so vlidas, mas nunca poder estar absolutamente
certo disso. Essa abordagem bastante comum em experimentos fsicos e est
presente em nossas pequenas avaliaes de causalidade feitas diariamente.
Uma segunda maneira de aplicar a soluo cientfica assumir que
Y u Y u
t t
( ) ( )
1 2
= e Y u Y u
c c
( ) ( )
1 2
= para duas unidades u
1
e u
2
. Ou, de
forma mais geral, assumir que Y u Y u
k k
( ) ( )
1 2
= para todo par de unida-
des u
1
e u
2
. Essa a hiptese que Holland (1986) chama de homogeneidade
de unidades. Sob tal hiptese, a obteno do efeito causal em nvel individu-
al tambm se torna imediata, uma vez que Y u Y u Y u Y u
t c t c
( ) ( ) ( ) ( ) =
1 2
para todo u, u
1
e u
2
e
U. Apesar de tambm ser bastante comum em labora-
trios, essa soluo para o problema fundamental da inferncia causal
tem sido buscada por estatsticos e epidemiologistas, que procuram
operacionaliz-la por meio de procedimentos de seleo de unidades. A ma-
neira que os cientistas de laboratrios (e, de forma anloga, os epide-
miologistas) utilizam para se convencer de que as unidades so homogneas
prepar-las (ou selecion-las) cuidadosamente, de modo que elas pare-
am idnticas em todos os aspectos relevantes. Apesar de se poder fazer a
hiptese de homogeneidade plausvel, sua validade no passvel de ser
testada principalmente devido possibilidade de existncia de outras vari-
veis no observadas eventualmente importantes. Na maioria dos estudos
epidemiolgicos, seno em todos, a hiptese de homogeneidade obtida por
estratificao, isto , pela separao das unidades em subgrupos com base
em co-variveis observadas, dificilmente seria justificada, pois raramente
37
existiriam situaes em que todos os fatores de risco importantes so
acuradamente medidos e controlados (Greenland, 1990). Entretanto, a
estratificao e, num caso mais extremo, o pareamento constituem estrat-
gias de seleo de unidades comumente utilizadas na avaliao de efeitos
causais por meio de uma aproximao, tanto quanto possvel, da hiptese
de homogeneidade de unidades.
Como visto, estratificao entendida como a busca de unidades homo-
gneas por meio da identificao de subpopulaes com base em co-variveis
pr-exposio observadas. O pareamento uma tentativa de se atingir
comparabilidade entre potenciais fatores de confundimento no estgio de
desenho do estudo. Isso feito selecionando-se apropriadamente, para o
estudo, unidades para formar os pares que sejam to semelhantes quanto
possvel com respeito a potenciais variveis de confundimento. Consiste,
portanto, na escolha de uma ou mais unidades controle para cada unidade
tratada que seja similar quanto a caractersticas mensuradas anteriormente
ao dos tratamentos.
Cabe aqui uma pequena apresentao da idia de confundimento.
Uma discusso mais detalhada ser feita em tpico especfico. Como exem-
plo, considere um estudo experimental para avaliao de efeitos causais no
qual, uma vez analisados os dados apropriadamente a partir da amostra
disponvel, conclui-se pela existncia de associao entre exposio e doen-
a, no importando por ora a magnitude desta associao. Trs situaes
alternativas devem ser consideradas:
existe de fato uma associao causal entre exposio e doena e o
estudo foi capaz de detect-la;
no existe de fato associao causal entre exposio e doena, mas
por mero acaso uma infeliz amostra forneceu evidncias de causa-
lidade. Neste caso, a ordem de grandeza do acaso comumente me-
dida pelo p-valor;
38
no existe de fato associao causal, mas um vis no estudo foi
responsvel pela evidncia amostral de causalidade quando avalia-
da pelo p-valor.
Em epidemiologia, os principais vieses, cujo controle fundamental
para causalidade, tm sido tradicionalmente classificados em vis de seleo,
vis de informao e confundimento (ou confuso). Assim, confundimento
se refere a uma explicao alternativa para uma determinada concluso,
constituindo portanto um dos principais seno o principal problemas
para a inferncia causal. Aproveitando o exemplo para antecipar um outro
elemento fundamental desse modelo estatstico de causalidade, esta terceira
situao, em que os dados apontam a existncia de causalidade em virtude
da presena de algum vis, tem sido apresentada tambm como um proble-
ma relacionado ao mecanismo de designao de tratamentos (Rubin, 1991).
Assim, confundimento poderia ser visto tambm como algo devido ao em-
prego de um mecanismo de designao de tratamentos imprprio.
Voltando ao Problema Fundamental da Inferncia Causal, de forma
diferente da soluo cientfica, a soluo estatstica substitui a busca do
efeito causal obtido em nvel individual pela busca de um efeito causal tpi-
co, em nvel populacional ou subpopulacional. O efeito causal mdio, T, de
t relativo c sobre U a esperana da diferena Y u Y u
t c
( ) ( ) para as
unidades
u U e
. Isto ,
T Y Y
t c
= E( ).
Que, pelas regras usuais de probabilidade, pode ser expresso como
T Y Y
t c
= E E ( ) ( ).
Essa expresso revela que respostas que podem ser observadas sobre
diferentes unidades podem ser utilizadas para obter informao sobre T. Se
algumas unidades so expostas causa t, elas podem ser usadas para fornecer
informao sobre E( ) Y
t
, j que este o valor mdio de Y
t
sobre e U, enquanto
outras unidades podem ser expostas c e se obtiver informao sobre E( ) Y
c
.
39
Na situao considerada, em que a resposta Y dicotmica assumin-
do o valor 1 quando presente e 0 quando ausente, pode-se reconhecer no
parmetro T, definido anteriormente, a medida de efeito conhecida pelos
epidemiologistas como risco atribuvel. Isso porque
De forma anloga, o risco entre controles (ou no expostos)
R Y Y
c c c
= = = Pr( ) ( ) 1 E .
Assim, T mede a parcela do risco entre os tratados que pode ser atribu-
da ao tratamento, j que remove o risco em conseqncia de outras causas.
O mecanismo que indica qual tratamento (exposio), t ou c, a uni-
dade u recebe, muito importante e envolve todas as consideraes estats-
ticas de um experimento bem planejado, tal como a randomizao ou pro-
cedimentos a ela alternativos. Assim, a soluo estatstica substitui o efeito
causal impossvel de se observar de t sobre unidades especficas, pelo poss-
vel de ser estimado efeito causal mdio de t, sobre uma populao de unida-
des. Em resumo, diante da impossibilidade de se observar Y
t
(u) e Y
c
(u) para
a mesma unidade, elege-se um conjunto de unidades a serem expostas
causa t estimando-se E( ) Y
t
e um outro conjunto a ser exposto causa c
para se estimar E( ) Y
c
.
Tal como a soluo cientfica, a soluo estatstica para o Problema
Fundamental da Inferncia Causal pressupe a validade de hipteses no
passveis de serem testadas, ou apenas parcialmente testveis. As hipteses
adjacentes soluo estatstica so duas: a de independncia ou a de efeito
constante. Para discusso da hiptese de independncia, necessrio incor-
porar um novo elemento ao modelo. Seja S a varivel que indica a causa
(tratamento) a que cada unidade em U exposta. Isto , S u t ( ) = indica que
a unidade exposta causa t e se observa Y
t
(u). Por sua vez, S u c ( ) =
indica exposio c e a resposta observada Y
c
(u). Assim, a resposta obser-
vada para a unidade u Y
S(u)
(u). A varivel resposta observada , portanto,
E( ) .Pr( ) .Pr( ) Pr( ) Y Y Y Y R
t t t t t
= = + = = = = = 1 1 0 0 1 Risco entre tratados
40
Y
S
e, mesmo que agora o modelo contenha trs variveis, S, Y
t
e Y
c
, oo
processo de observao envolve apenas duas, S e Y
S
. Holland (1986) obser-
va ainda que a distino entre as trs situaes envolvidas, isto , o processo
de mensurao Y que produz a varivel resposta, as duas verses da vari-
vel resposta Y
t
e Y
c
que correspondem a qual causa a unidade exposta e
a varivel resposta observada Y
S
, muito importante e freqentemente no
est presente em discusses sobre causa. Essa distino no surge em estudos
de simples associao, mas crucial para anlise de causalidade.
Em um estudo experimental, S construda pelo experimentador, en-
quanto em um estudo no controlado (observacional) determinada por
fatores alm do controle do analista. Em qualquer caso, a caracterstica
crtica da noo de causa nesse modelo que o valor de S u ( ) para cada
unidade poderia ter sido diferente. Estar sob o controle do experimentador,
nesse contexto, significa que ele conhece a estrutura probabilstica que indi-
cou o tratamento
k K e
unidade
u U e
, tal como num processo de
randomizao em que as unidades so alocadas nos grupos de exposio com
base em um mecanismo aleatrio, independentemente de outras variveis.
Em estudos observacionais, o analista procura resgatar as vantagens
do processo de randomizao, no qual se busca comparabilidade entre os
tratamentos considerados, por meio da observao de co-variveis relevan-
tes (associadas ao tratamento ou resposta) que podem ser controladas no
momento do desenho do estudo ou, posteriormente, na anlise. Busca-se
ento substituir a hiptese de independncia por hipteses menos rigorosas
de independncia condicional, onde o condicionamento determinado por
co-variveis pr-exposio observadas. Assim, incorpora-se ao modelo es-
tatstico geral para inferncia causal um conjunto de q co-variveis obser-
vveis no afetadas pela exposio, isto , pr-exposio.
A Tabela 1 sintetiza as informaes observadas relevantes para se
fazer inferncia causal em um contexto geral, comumente disponveis nos
41
estudos epidemiolgicos. Inferir causalidade em um contexto real e comple-
xo torna-se possvel ou no dependendo da capacidade de se obter alguma
informao sobre os pontos de interrogao desta tabela, isto , sobre os
valores no observados. O estabelecimento de hipteses plausveis, embora
nem sempre passveis de serem validadas pelos dados disponveis, em con-
junto com tcnicas estatsticas apropriadas constituem importantes instru-
mentos para estimao ou conhecimento dos valores que teriam sido obser-
vados pelas unidades, tivessem elas recebido tratamento alternativo quele
que de fato receberam.
Tabela 1 Exemplo de dados observveis em um estudo de 2 tratamentos
(k=2) em uma populao de U unidades com q co-variveis e
1 varivel resposta (2 respostas potenciais)
Co-variveis X Y
X
1
X
2
. . . X
q
Y
t
Y
c
1 x
11
x
12
. . . x
1q
t y
t
(1) ?
2 x
21
x
22
. . . x
2q
t y
t
(2) ?
3 x
31
x
32
. . . x
3q
c ? y
c
(3)
: : : : : : :
: : : : : : :
u x
u1
x
u2
. . . x
uq
c ? y
c
(u)
: : : : : : :
: : : : : : :
U x
U1
x
U2
. . . x
Uq
t y
t
(U) ?
Essa estrutura permite visualizar que o processo de inferncia de cau-
salidade deve estar condicionado aos dados observados e ao padro de ob-
servao dos dados de fato observados e dos dados perdidos ou no observa-
dos (missing). Os missing da Tabela 1, representados pelos pontos de inter-
rogao, so inerentes prpria formulao do Modelo de Rubin, diferente-
mente de outros tipos de dados perdidos comumente encontrados na prtica
Unidades S
42
devido a circunstncias indesejveis, tais como falta de resposta em um in-
qurito ou censura. Para fins de causalidade, a considerao de ambos os
tipos de missing fundamental.
Para fins de uniformizao dos procedimentos estatsticos comumente
utilizados para anlise, pode ser conveniente a adoo de uma notao co-
mum contida em Rosembaun (1995). As U unidades sob investigao podem
ser divididas em M estratos ou subpopulaes com base em co-variveis, isto
, com base em caractersticas mensuradas anteriormente designao dos
tratamentos. Assim, existem U
m
unidades no estrato m, m = 1, 2,..., M, de
modo que
U U
m
m
=
. Faz-se S
m
(u)=1 se a u-sima unidade do estrato m
recebe o tratamento t e S
m
(u)=0 se recebe o tratamento c. Escreve-se ainda
n
m
para o nmero de unidades tratadas no estrato m, de modo que
n S u
m m
u
U
m
=
=
( )
1
e 0s s n U
m m
. E, finalmente, designe-se como S o vetor colu-
na U-dimensional contendo os valores S
m
(u) para todas as unidades, isto ,
, onde
Esta notao compreende diversas situaes. Se nenhuma co-vari-
vel utilizada para estratificar a populao, ento existe um nico estrato
contendo todas as unidades (M =1). Se U
m
=2 e n
m
=1 para m =1, 2,..., M,
ento fica caracterizado um estudo pareado com base nas co-variveis,
isto , cada um dos M pares apresenta uma unidade tratada e uma unida-
de controle. A situao onde U
m
> 2 e n
m
=1 para m =1,2,...,M conhe-
cida como pareamento com mltiplos controles, ou seja, existem M con-
juntos de unidades, cada qual com uma unidade tratada e uma ou mais
unidades controle.
S
S
S
=
(
(
(
(
(
(
(
(
(
=

(
(
(
S
S
S U
S
S U
M m
M
1
1
1 1
2
1
1
2
1
( )
( )
( )
( )
( )
S
m
m
m m
S
S U
=

(
(
(
( )
( )
1
43
Como j comentado, o efeito causal mdio T a diferena entre os
dois valores esperados E( ) Y
t
e E( ) Y
c
. Entretanto, os valores observados
( , ) S Y
S
podem apenas fornecer informao sobre
E( | ) Y S t
S
= = E( | ) Y S t
t
= e E( | ) Y S c
S
= = E( | ) Y S c
c
= .
No entanto, claro que E( ) Y
t
e E( | ) Y S t
t
= no so em geral
iguais, bem como E( ) Y
c
e E( | ) Y S c
c
= . Quando as unidades so designa-
das aleatoriamente s causas consideradas (t ou c), por meio de algum pro-
cesso fsico de randomizao (tal como o lanamento de uma moeda), ento
a determinao de qual causa a unidade u exposta considerada estatisti-
camente independente de qualquer outra varivel, incluindo Y
t
e Y
c
. Isso
significa que se um processo de randomizao executado, ento plausvel
considerar S independente de Y
t
e Y
c
e de todas as outras variveis sobre e U.
Essa a hiptese de independncia que, quando vlida, valida as seguintes
equaes bsicas:
E E ( ) ( | ) Y Y S t
t t
= = e E E ( ) ( | ) Y Y S c
c c
= = .
Logo,
Podendo essa quantidade ser estimada a partir dos dados observados por
Y u I U Y u I U
S S u t t
u
U
S S u c c
u
U
( ) ( )
( ( ) ) ( ( ) ) =
=
=
=

1 1
,
onde U
t
e U
c
so os nmeros de indivduos alocados nos grupos tratado e
controle, respectivamente, e I uma varivel indicadora de indivduo
tratado ou no.
Assim, o estimador
( | ) ( | ) T Y S t Y S c
t c
= = = E E
, sob a hip-
tese de independncia, no viciado para T, o efeito causal mdio, que
o parmetro de interesse para a soluo estatstica. Esse estimador de
uso corrente em estudos de comparao de tratamentos e, no raro, no
se encontram explicitadas as hipteses adjacentes que viabilizam sua
( | ) ( | ) ( | ) ( | ) ( ) ( ) T Y S t Y S c Y S t Y S c Y Y T
S S t c t c
= = = = = = = = E E E E E E
44
avaliao. Holland (1986) chama este estimador de efeito causal pri-
meira vista, enquanto Smith & Sugden (1988) batizaram-no de efeito
causal aparente.
Sendo T uma mdia, goza de todas as caractersticas e propriedades
inerentes a esta estatstica. Assim, se a variabilidade dos efeitos causais
Y u Y u
t c
( ) ( ) sobre todas as unidades u em U grande, T pode no repre-
sentar adequadamente o efeito causal de uma determinada unidade u
0
. Se
existe interesse especfico em u
0
, ento T pode ser irrelevante independente-
mente de quo precisa tenha sido sua estimativa.
Uma outra hiptese que torna possvel a inferncia causal a de
efeito constante. Esta hiptese assume que o efeito de t o mesmo para
todas as unidades. Vale ento a seguinte equao:
T Y u Y u u U
t c
= e ( ) ( ), .
Essa hiptese conhecida pelo nome de aditividade em modelos es-
tatsticos para experimentos, uma vez que o tratamento t adiciona uma
quantidade constante T resposta controle para cada unidade. Sob
aditividade, o efeito causal especialmente importante e fcil de estimar,
pois o mesmo efeito vale para cada unidade da populao. Em muitos casos
em que no vale essa hiptese, j se mostrou que o efeito causal obtido no
nvel populacional uma medida de pouco interesse. Por exemplo, em um
estudo sobre a eficcia de uma droga nova onde se suspeita de importantes
diferenas entre homens e mulheres, os efeitos causais subpopulacionais,
para homens e para mulheres, que so relevantes. Efeitos causais subpo-
pulacionais no so potencialmente mais atraentes apenas porque esto
condicionados a caractersticas observadas das unidades, mas tambm por-
que aditividade provavelmente vale mais neste nvel que em um nvel
populacional (Rubin, 1990a). Eventualmente, havendo interesse em perse-
guir a validao da hiptese de efeito constante, comumente faz-se uso de
transformaes adequadas na varivel resposta.
45
A hiptese de efeito constante pode ser parcialmente verificada divi-
dindo-se U em n subpopulaes U U U
n 1 2
, ,..., com base em co-variveis..
Para cada U
i
, podemos estimar os efeitos causais mdios subpopulacionais
T
1
, T
2
, ... , T
n
. Uma grande variabilidade entre os T
i
indicao de que a
hiptese de efeito constante pode no ser vlida. Caso contrrio, essa hip-
tese pode ser plausvel.
Existe uma relao entre as hipteses de homogeneidade e efeito cons-
tante. Se vale a hiptese de homogeneidade, vale tambm a hiptese de efeito
constante. Isso porque se, para duas unidades u
1
e u
2
, Y u Y u
t t
( ) ( )
1 2
= e
Y u Y u
c c
( ) ( )
1 2
= , ento
Y u Y u
t t
( ) ( )
1 2
0 =
e
Y u Y u Y u Y u Y u Y u
c c t t c c
( ) ( ) ( ) ( ) ( ) ( )
1 2 1 2 1 2
0 = =
Y u Y u Y u Y u T
t c t c
( ) ( ) ( ) ( )
1 1 2 2
= = .
Se faz-se somente a hiptese de efeito constante, no se pode concluir
que
T
seja no viciado para o efeito causal mdio T. Isso porque, sob a
hiptese de efeito constante, pode-se escrever Y u T Y u
t c
( ) ( ) = + para todas
as unidades. Aplicando-se o operador esperana condicionado a
S t =
nes-
ta ltima expresso, tem-se
E E ( | ) ( | ) Y S t T Y S t
t c
= = + = .
Mas,
( | ) ( | ) T Y S t Y S c
t c
= = = E E
. Logo, ,
[ ( | ) ( | )] T T Y S t Y S c
c c
= + = = E E
.
Sem a hiptese de independncia, no h uma razo especfica para
que o termo entre colchetes acima seja igual a zero, o que seria necessrio
para que, somente com a hiptese de efeito constante, o estimador
T
pudesse
estimar sem vis o parmetro de interesse T.
J com a hiptese mais forte de homogeneidade de unidades, fcil
mostrar que o efeito causal aparente
(
T
) no viesado para o efeito causal
mdio ( ) T . De fato, sob esta hiptese, tem-se que Y u Y u
k k
( ) ( )
1 2
= para
todo par de unidades u
1
e u
2
. Isto , as respostas potenciais Y u
t
( ) e Y u
c
( )
so constantes para qualquer
u U e
(porm diferentes para a mesma uni-
46
dade, a menos que no haja efeito). Assim, E( ) Y
t
e E( ) Y
c
so tambm
constantes para quaisquer combinaes de unidades. Logo,
( | ) ( | ) ( ) ( ) T Y S t Y S c Y Y T
t c t c
= = = = = E E E E
.
Hiptese de valor estvel unidade-tratamento
Toda a estruturao do Modelo de Rubin, discutida at aqui e sinteti-
zada na Tabela 1, s adequada sob a condio que Rubin (1980) batizou
de hiptese de valor estvel unidade-tratamento ou posteriormente, de for-
ma mais simples, de hiptese de estabilidade (Rubin, 1990b). Esta sim-
plesmente a hiptese a priori de que o valor de Y para a unidade u quando
exposta ao tratamento t o mesmo, independentemente de qual mecanismo
usado para designar o tratamento unidade e de quais tratamentos as
outras unidades recebem. Neste ltimo aspecto, coincide com a hiptese de
no interferncia entre unidades, de Cox (1958).
Embora no seja absolutamente necessria para inferncia causal, a hi-
ptese de estabilidade a hiptese mais simples sob a qual os efeitos causais para
cada unidade, tais como Y u Y u
t c
( ) ( ) , podem ser definidos precisamente (Rubin,
1990a). Por ser uma hiptese muito forte, freqentemente no vlida para
muitas situaes. Alm disso, Dempster (1990) observa que a simplicidade
dessa hiptese contrasta com a complexidade dos problemas de causalidade
encontrados em situaes reais. A hiptese de estabilidade freqentemente
plausvel em experimentos bem planejados. Em outras situaes, entretanto,
fazem-se necessrias consideraes criteriosas antes de se legitimar causali-
dade com base nos efeitos observados. Quando a hiptese de estabilidade
violada, modelos especiais podem ser construdos a fim de acomodar novas
condies, embora tais modelos normalmente assumam hipteses no testveis.
As formas mais comuns de violao da hiptese de valor estvel uni-
dade-tratamento acontecem quando no existe uniformidade na eficincia
47
para cada tratamento ou quando existe interferncia entre as unidades. Para
exemplificar o problema com a uniformidade na eficincia, suponha um
estudo no qual se quer avaliar o efeito de uma droga, administrada oral-
mente, sobre a presso sangnea. O grupo tratado, ento, aquele que
recebe o comprimido com a substncia para a qual se supe seja hipotensora,
e o grupo controle recebe um placebo. Se, para o grupo tratado, os compri-
midos variam em eficincia, isto , se apresentam quantidades variadas da
substncia considerada e isso pode ter um efeito diferenciado, ento o efeito
causal Y u Y u
t c
( ) ( ) no precisamente definido, uma vez que seu valor
depende especificamente de qual comprimido a unidade u recebe. A rigor,
para satisfazer a hiptese de valor estvel unidade-tratamento, cada com-
primido deveria ser considerado um tratamento. Em respostas dicotmicas
essa possvel violao menos sentida, na medida em que somente grandes
variaes nas doses implicariam mudana na resposta. Um exemplo seria a
avaliao do efeito do hbito de fumar sobre doena cardiovascular, onde
no grupo de fumantes pode haver diferentes nveis de consumo de cigarros.
Na maioria das situaes prticas, procura-se garantir essa hiptese admi-
nistrando-se doses ou construindo-se grupos de tratamento to homog-
neos quanto possvel. Entretanto, sua verificao normalmente no vivel
com base nos dados observados.
A violao da hiptese de estabilidade devido existncia de inter-
ferncia entre as unidades, por ser mais nitidamente percebida em situa-
es reais, tem sido motivo de maior preocupao. H interferncia entre
unidades quando a resposta causa imputada (tratamento) para uma
determinada unidade depende do tratamento designado a outra unidade.
Logo, o efeito causal tambm no definido, j que seu valor depende de
unidades vizinhas. Em epidemiologia, a ocorrncia de doenas contagio-
sas constitui bom exemplo de uma situao em que essa hiptese clara-
mente violada, j que estas doenas tm como caracterstica fundamental
48
a presena de cadeias de transmisso de um hospedeiro para outro, de modo
que um indivduo (unidade) eventualmente torna-se infectado dependendo
de contatos com outros j infectados.
Como conseqncia da violao da hiptese de estabilidade, faz-se
necessria uma expanso da representao das respostas, tal como aquela
da Tabela 1, adicionando-se tantas colunas de respostas potenciais quanto
necessrias para se considerar a interferncia entre as unidades (Rubin,
1990b). Assim, por exemplo, numa situao extremamente simples em que
s exista interferncia entre as unidades u
1
e u
2
, de tal forma que a resposta
da unidade u
2
depende do tratamento que a unidade u
1
recebe, seriam ne-
cessrias quatro colunas para representar as respostas potenciais. Percebe-
se imediatamente a dificuldade dessa abordagem para uma situao real
envolvendo complexas cadeias de transmisso.
Halloran & Struchiner (1995), estudando a aplicao do Modelo de
Rubin em programas de vacinao (interveno) para doenas contagio-
sas, observam que a exposio infeco (interferncia) pode tambm ser
vista como um tipo de causa ou manipulao. A exposio infeco em
doenas contagiosas dada pelos outros membros da populao, diretamen-
te ou via vetores,
4
fundamental no s para a transmisso como tambm
para a avaliao dos efeitos da interveno (vacinao). Entretanto, essa
causa deve ser avaliada usando-se um diferente tipo de efeito causal, o
efeito indireto. Este , portanto, aquele efeito devido ao contato com outros
indivduos ou vetores de transmisso, diferente do efeito direto atribuvel
vacinao. Assim, os autores discutem uma forma alternativa para solu-
cionar o problema de interferncia entre unidades, presente em doenas
contagiosas, por meio do condicionamento da anlise somente aos indiv-
duos expostos infeco.
4
Um vetor pode ser entendido como qualquer ser vivo que veicule o agente infeccioso desde a
fonte de infeco (indivduo, macaco etc.) at o hospedeiro em potencial.
49
No desenvolvimento de sua anlise, definem como E o indicador para
exposio infeco, onde ( ) E = + representa exposio infeco e
( ) E = representa no exposio infeco. Os tratamentos (causas) em
questo, t e c, so receber vacina e no receber vacina, e a resposta Y
tambm dicotmica, assumindo o valor 0 para no doente e 1 para doente.
Considerando a notao j utilizada, as respostas potenciais para uma de-
terminada unidade u quando exposta infeco seriam, ento,
( ( ) | ) Y u E
t
= + e ( Y u E
c
( ) | ) = + . O efeito causal direto condicional para
a unidade u a diferena entre essas duas respostas potenciais. Assim,
analogamente a T, o efeito causal mdio, os autores definem o efeito causal
mdio condicional exposio infeco como
T Y E Y E
t c
' = = + = + E E ( | ) ( | ) .
O termo E( | ) Y E
c
= + o quociente entre o nmero de indivduos
suscetveis no vacinados que potencialmente tornam-se infectados, se ex-
postos infeco, e o nmero total de expostos. Pode, portanto, ser definido
como a probabilidade de transmisso esperada em indivduos suscetveis
no vacinados devido ao contato com indivduos expostos j infectados. Vale
a mesma interpretao para o termo E( | ) Y E
t
= + , substituindo-se no
vacinado por vacinado. Se ningum exposto infeco, ento ( | ) Y E
c
=
e ( Y E
t
| ) = so iguais a zero, de modo que o efeito causal mdio na
ausncia de exposio infeco ser tambm zero.
Assim, o condicionamento do estudo aos indivduos expostos infec-
o tenta resgatar a hiptese de estabilidade. Isto , condicionar o estudo aos
expostos infeco torna novamente adequada a representao das respos-
tas potenciais em duas colunas: uma para a resposta ao tratamento receber
vacina e outra para a resposta ao controle no receber vacina. Entre as
dificuldades dessa soluo, Halloran & Struchiner (1995) assinalam que
nem todos os indivduos so expostos infeco, de modo que a resposta
potencial para um determinado indivduo dependente no s do mecanis-
50
mo de designao como tambm do potencial de exposio infeco, ca-
racterizando ento uma abordagem contrafactual em dois nveis. Isto , se
um indivduo exposto infeco e se no vacinado, qual a sua resposta?
Um outro problema est relacionado impossibilidade de se distinguir, na
prtica, dois diferentes tipos de no exposio infeco. H aqueles indiv-
duos que, independentemente do tratamento recebido, no sero expostos
infeco, e h aqueles que no sero expostos sob particulares designaes
de tratamento. Por fim, dado que pessoas no expostas infeco no so
includas na anlise, o nmero de indivduos no estudo poderia ser muito
reduzido, sobretudo se muitos expostos infeco so vacinados.
Assim, inferncia causal em doenas contagiosas, onde no vale a
hiptese de estabilidade devido presena de interferncia entre as unida-
des, tem como dificuldade principal a identificao das fontes de exposio
infeco, comumente no possvel em situaes reais, de modo que se exigem
hipteses no testveis especficas sobre as situaes de exposio infeco,
tais como picadas de mosquitos, relaes sexuais ou o nmero de contatos
com indivduos j infectados. Alternativamente, o estudo de intervenes em
doenas contagiosas pode ser conduzido, substituindo-se as informaes so-
bre a exposio infeco por hipteses parcialmente no testveis que
modelem a dinmica da transmisso do agente infeccioso.
O Mecanismo de Designao de Tratamentos
Diferentemente de um modelo determinstico de causa que procura
demonstrar causalidade, tal como o modelo de Rothman, um modelo esta-
tstico ou probabilstico procura inferir causalidade. Esse modelo no ne-
cessariamente nega a viso de que a ocorrncia de uma doena poderia ser
perfeitamente determinada por certa quantidade de fatores, apesar de muitos
51
deles no serem conhecidos ou eventualmente no observados de forma apro-
priada. Assim, a incerteza presente nos modelos estatsticos serve sobretudo
para expressar a ignorncia sobre o processo causal e sobre como observ-lo
na prtica, e no porque se acredita ser a ocorrncia da doena um fenmeno
aleatrio. O Modelo de Rubin, no obstante apresentar uma estrutura
determinstica, tem a sua discusso inserida em um contexto probabilstico em
razo, principalmente, do Problema Fundamental da Inferncia Causal.
por meio do mecanismo que designa qual tratamento as unidades
recebem que se identifica a natureza probabilstica necessria para se ten-
tar inferir causalidade. Mais precisamente, qualquer mtodo estatstico para
inferncia causal exige especificaes para os procedimentos que geram os
dados observados. Isto , faz-se necessrio conhecer as estruturas
probabilsticas de registro de dados por meio dos mecanismos de amostragem
e de designao de tratamentos. Aqui, com o objetivo de explorar mais
detalhadamente a aplicabilidade da idia de causa contida no Modelo de
Rubin, no ser considerado nenhum esquema de amostragem. Assim, a
aleatoriedade presente ser toda devida ao mecanismo de designao de
tratamentos, assumindo-se, portanto, que todas as U unidades participam do
estudo. Entretanto, tem-se visto que o prprio mecanismo de designao de
tratamentos pode refletir tanto o esquema de seleo das unidades de uma
populao finita quanto a indicao de qual tratamento cada unidade rece-
be (Rubin, 1978). Smith & Sugden (1988) separam estes dois mecanismos e
diferenciam a anlise pela ordem com que eles se sucedem: amostrando-se
as unidades antes de designar o tratamento ou, alternativamente, designan-
do-se os tratamentos s unidades e posteriormente amostrando-se unidades
de cada estrato de tratamento.
Desse modo, para que se possa inferir causalidade, independentemente
do procedimento estatstico a ser utilizado, necessria a explicitao de um
mecanismo de designao de tratamentos um modelo probabilstico para o
52
processo pelo qual se obtm os valores de Y que de fato so observados. Em
outras palavras, necessrio especificar o processo que conduz aos valores
observados de S. Comumente, para a situao dicotmica considerada, tem-
se na prtica imaginado as unidades recebendo um determinado tratamen-
to, t por exemplo, com probabilidade p X ( ) e, conseqentemente, o trata-
mento alternativo com probabilidade 1 p X ( ), onde p X ( ) uma fun-
o desconhecida das co-variveis X. Assim, o mecanismo de designao de
tratamentos pode ser escrito genericamente por meio da seguinte expresso
probabilstica, atribuindo-se os valores 0 e 1 para os tratamentos c e t,
respectivamente:
Pr ( | ) ( ) [ ( )]
( ) ( )
S X =

=
[
p X p X
u
S u
u
S u
u
U
1
1
1
,
onde as variveis em negrito indicam vetor ou matriz de dados para todas
as unidades.
Essa expresso revela o mecanismo de designao como dependente
de co-variveis observveis, a matriz
X
U q x
. Entretanto, um mecanismo de
designao pode tambm ser dependente de variveis no observveis ou
somente parcialmente observveis, a matriz Ux2 de respostas potenciais
Y Y Y = ( , )
t c
. Seja W o conjunto de todas as outras co-variveis pr-ex-
posio, que diferentemente das co-variveis X, so desconhecidas ou no
passveis de observao. Desse modo, o mecanismo de designao de trata-
mentos deve ser concebido de forma geral como dependente dessas trs quan-
tidades aleatrias. Simbolicamente, Pr ( | , , ) S X Y W .
Um mecanismo dito controlado quando est livre da dependncia
de Y e W (Smith & Sugden, 1988). Sem considerar a dependncia sobre W,
Rubin (1990a, 1991) classifica alguns mecanismos de designao de trata-
mentos de acordo com suas propriedades. Assim, uma classe muito impor-
tante aquela constituda dos mecanismos ditos no confundidos (o neolo-
gismo inevitvel). Estes so os mecanismos que independem da varivel
resposta Y, isto , Pr( Pr S X Y S X | , ) ( | ) = para todos os valores possveis
53
de S, X e Y. A dependncia de um mecanismo sobre X pode usualmente ser
tratada diretamente na anlise, enquanto a dependncia sobre Y, em especi-
al sobre sua parte no observada, em geral difcil de ser considerada de
maneira satisfatria. Da a importncia dessa classe de mecanismos.
Uma importante caracterstica da especificao de um mecanismo de
designao que ele deve ser probabilstico, no sentido de que cada unida-
de tenha uma probabilidade de designao dos tratamentos t ou c satisfa-
zendo a desigualdade
0 1 < = < e Pr( S u t u U ( ) | , ) , . X Y
Se alguma unidade no tem chance de ser designada para algum tra-
tamento, sensato considerar o porqu e se a incluso de tal unidade de
fato adequada ao estudo planejado (Rubin, 1991).
Um mecanismo de designao dito ignorvel para os valores ob-
servados de X, Y e S se
Pr | Pr( | Pr( | ( , ) , , ) , ) S X Y S X Y Y S X Y = =
t c S
.
Isto , o mecanismo pode ser escrito como dependente somente dos
dados observados.
Sob a condio de ser no confundido e probabilstico, isto , se
( , ) Y Y S X
t c
| e 0 1 < = < Pr( | S u t X ( ) ) ,
onde o smbolo
significa independncia, o mecanismo conhecido como

fortemente ignorvel. Observa-se que se o mecanismo fortemente
ignorvel, tambm ignorvel, mas a recproca no verdadeira (Rosembaun
& Rubin, 1983). Essa classe de mecanismos de designao de tratamentos
tambm est dentro da classe dos mecanismos ditos controlados.
Para inferncia causal, o mecanismo de designao de tratamentos
assume uma funo vital. Pode-se dizer que o ceticismo que acompanha a
atribuio de causa com base em estudos observacionais surge das potenciais
dificuldades de se colocar um mecanismo de designao aceitvel. Isto , a
principal fonte de incerteza na anlise de um estudo observacional no
54
geralmente o mtodo de inferncia empregado, mas sim a especificao do
mecanismo de designao (Rubin, 1991). Embora na maioria das vezes esteja
completamente ausente, este tipo de discusso deve ser um importante compo-
nente da anlise de qualquer estudo observacional para efeitos causais.
A importncia do mecanismo de designao para inferncia causal
pode ser ilustrada pela seguinte situao hipottica, baseada em um exem-
plo de Smith & Sugden (1988). Considere um estudo observacional do tipo
coorte, em que indivduos suscetveis a determinada doena so acompa-
nhados por certo perodo de tempo e alocados nos diferentes nveis de expo-
sio (causas) sem qualquer controle sobre este mecanismo. Os dados ob-
servados sobre casos incidentes de hepatite A diante das duas causas alter-
nativas postuladas, presena ou no de gua tratada no domiclio, para as
trs mil crianas existentes em certa regio e acompanhadas por um ano
esto sumariados na Tabela 2.
Tabela 2 Casos de hepatite A em um ano, segundo condio da gua do
domiclio (dados hipotticos)
Tratamentos Total Resposta (Y
S
)
ou causas acompanhado Casos (1) No casos (0)
Com gua tratada (t ) 499 165 334
Sem gua tratada (c ) 2.501 577 1.924
TOTAL 3.000 742 2.258
Os dados mostram um risco significativamente maior para aqueles
que dispem de gua tratada no domiclio (165/499 = 0,3307) em relao
queles que no possuem (577/2501 = 0,2307), com um efeito causal apa-
rente (
T
) de 0,3307 - 0,2307 = 0,1. Como j dito, em epidemiologia, tal
medida conhecida como risco atribuvel. O risco atribuvel usado para
quantificar o risco da doena no grupo exposto (no exemplo, com gua
55
tratada) que pode ser considerado atribuvel exposio, uma vez que re-
move o risco de doena presente de forma geral devido a outras causas (o
risco no grupo no exposto). Assim, a interpretao do risco atribuvel
dependente da suposio de que existe uma relao de causa e efeito entre
exposio e doena.
Uma concluso precipitada com base no risco atribuvel obtido com
base nos dados da Tabela 2 indicaria que possuir gua tratada no domiclio,
ao contrrio de um conhecimento j consolidado, fator causal para hepa-
tite A. O nmero de casos a mais de hepatite A entre aqueles que possuem
gua tratada atribuvel a esta condio de 1 para cada 10 crianas. Entre-
tanto, o quo aproximada essa estimativa est do efeito causal verdadeiro,
desprezada a variao amostral, pode depender de co-variveis observveis
ou no e tambm da prpria resposta. Como j observado, em um modelo
estatstico de causalidade, essa dependncia tratada por meio do mecanis-
mo de designao de tratamentos. Inferir causalidade com base no efeito
causal aparente sem considerar essas possveis dependncias pode levar a
concluses enganadoras, pois este efeito pode ser bem diferente do efeito
causal verdadeiro. Mesmo mecanismos de designao de tratamentos con-
trolados, que dependem apenas de co-variveis observveis, podem produ-
zir grandes diferenas. Se uma co-varivel X tal que para valores grandes
desta varivel mais provavelmente se observa a resposta 1 para o tratamen-
to t e a resposta 0 para o tratamento c, e se a alocao dos tratamentos
obtida inadvertidamente sem a considerao de X, ento os efeitos causais
aparente e verdadeiro sero bem distantes. O condicionamento do mecanis-
mo de designao em X produziria um efeito causal aparente ajustado, de
modo que o efeito causal verdadeiro poderia ser estimado sem vis.
Para o exemplo considerado, a matriz de respostas potenciais
Y Y Y
U t c x2
= ( , ) uma matriz onde cada Y u
k
( ) , k = {t,c} e u = 1, 2,...,U
assume o valor 0 ou 1. Assim, os U pares de respostas potenciais
56
( Y u Y u
t c
( ), ( ) ) podem tomar os valores (0,0), (0,1), (1,0) e (1,1). Se as fre-
qncias desses pares so hipoteticamente conhecidas e dadas pela Tabela 3,
a seguir, ento o efeito causal mdio verdadeiro seria
T Y Y
t c
= =
+
+
=

= E E ( ) ( ) ,
300 100
3000
600 100
3000
300 600
3000
01.
Tabela 3 Exemplo de um mecanismo de designao no ignorvel e fre-
qncia hipottica dos pares de respostas potenciais
Respostas Freqncia Pr(S(u)=t )
potenciais (Y
t
,Y
c
)
(0,0) 2.000 0,11
(0,1) 600 0,19
(1,0) 300 0,52
(1,1) 100 0,09
TOTAL 3.000
Suponha que o mecanismo no seja ignorvel e que a probabilidade
de designao do tratamento t a uma unidade dependa do par de respostas
potenciais, como indicado pela mesma Tabela 3. Sob este mecanismo, as fre-
qncias de casos e no casos de hepatite A pelos nveis de exposio consi-
derados que se espera observar podem ser calculadas. A resposta 1 (caso)
observada, ou quando t aplicado com probabilidade 0,52 ao par de res-
postas potenciais (1,0), cuja freqncia de 300 crianas, ou com probabi-
lidade 0,09 ao par (1,1), que tem freqncia 100. Isto , a freqncia espe-
rada de casos sob o tratamento t (300x0,52)+(100x0,09)=165. Da mes-
ma forma, a freqncia de no casos sob o tratamento c (sem gua tratada),
que se esperaria observar se a verdade fosse aquela representada pela Tabela 3,
seria de 2000x(1-0,11)+300x(1-0,52)=1924. As outras duas freqncias
esperadas, casos sob o tratamento c e no casos sob o tratamento t, podem ser
obtidas de forma anloga, cujos resultados so 577 e 334, respectivamente.
57
curioso observar que as freqncias esperadas coincidem exatamente com
os valores observados pelo estudo e apresentados na Tabela 2.
A finalidade desse exemplo ilustrar quo perigosa pode ser a inter-
pretao de resultados se baseada em estudos observacionais. Se, eventual-
mente, por um alguma razo o mecanismo que alocou as unidades aos tra-
tamentos no ignorvel e este fato no do conhecimento do analista, as
estimativas resultantes sofrero erros sistemticos, podendo inclusive gerar
uma medida de efeito de igual magnitude mas de sentido contrrio, como o
caso desse exemplo, perdendo, conseqentemente, sua interpretao causal.
O mecanismo de designao de tratamentos o elemento, ento, que
assume papel dominante em uma formulao estatstica de causalidade.
Dependendo do tipo de estudo empregado, mecanismos particulares po-
dem ser usados a fim de subsidiar concluses de causalidade. Classica-
mente, randomizao em estudos experimentais (Rubin, 1974) e, mais re-
centemente, o escore de propenso em estudos observacionais (Rosembaun
& Rubin, 1983) tm sido advogados como mecanismos apropriados para
se inferir causalidade.
Randomizao
Randomizao um tema cuja literatura disponvel bastante ex-
tensa e data o incio do sculo XX, com os trabalhos de Fisher. Apesar disso,
a discusso de suas caractersticas e propriedades continua sendo extrema-
mente atual. Formalmente, randomizao proporciona um mecanismo com
base no qual possvel a obteno das propriedades probabilsticas das esti-
mativas. As principais propriedades so:
o efeito causal aparente
T
uma estimativa no viesada de T, o
efeito causal verdadeiro. Esta propriedade j fora observada quando
se comentou sobre a hiptese de independncia;
58
declaraes probabilsticas bem definidas podem ser feitas para in-
dicar quo incomuns valores observados de
T
seriam sob um espe-
cfico efeito causal hipotetizado. P-valores, intervalos de confiana e
razes de verossimilhana para parmetros causais so computados
sob a hiptese de que as indicaes alternativas de tratamento so
respostas igualmente provveis. Esta hiptese perfeitamente
justificada sob randomizao.
Greenland (1990) tem dito que inferir estatisticamente causalidade
com base em intervalos de confiana, p-valores ou razes de verossimilhan-
a de pouco significado se o mecanismo de designao exposio desco-
nhecido ou sabidamente no randomizado. Um mecanismo randomizado
proporciona, ento, o elo entre inferncia estatstica e parmetros causais.
De forma anloga, amostras aleatrias fornecem a chave para o relaciona-
mento entre inferncia estatstica e parmetros populacionais.
Um importante fato enfatizado por Rubin (1978) que randomizao,
quando empregada, garante independncia a priori entre o mecanismo de
designao de tratamentos e diversos fatores ou atributos das unidades, in-
cluindo aqueles eventualmente tambm causais. Assim, randomizao fun-
ciona como um fiador da validade da representao matemtica de medidas
de efeito de fatores causais observados, permitindo modelar os efeitos de
fatores no observados como erros aleatrios (Dempster, 1990).
A propriedade que tem o estimador considerado no caso de se
adotar um mecanismo randomizado de no ser tendencioso no deve
trazer muito conforto para o epidemiologista. O conceito estatstico de vis
e o conceito epidemiolgico de confundimento, embora possam ser relaci-
onados, so bem diferentes. Vis estatstico se refere a uma mdia pondera-
da diferente de zero das estimativas dos efeitos causais, com pesos dados
pela distribuio de probabilidade de tais estimativas. Confundimento
visto como falta de comparabilidade dos grupos considerados, sendo, por-
59
tanto, caracterstica de uma particular alocao. Porm, no caso artificial
de se quantificar o grau de confundimento de cada possvel alocao como
a diferena entre a estimativa e o parmetro causal de interesse, pode-se
concluir que a no tendenciosidade de experimentos randomizados
corresponde a um confundimento mdio igual a zero sobre a distribuio
dos resultados das possveis alocaes (Greenland, 1990). O epidemiologista,
ao tentar interpretar o resultado de um estudo, est interessado no grau de
confundimento de uma particular estimativa observada, cuja magnitude
no diretamente obtida por um estudo randomizado. Entretanto, sob
randomizao pode-se fazer a probabilidade de um confundimento grave,
tal como interpretado anteriormente, to pequena quanto se queira, au-
mentando-se o tamanho das coortes sob os tratamentos considerados. No
entanto, esse recurso, quase sempre uma grande dificuldade em situaes
reais, no uma garantia absoluta de que no h confundimento severo
em um particular estudo. ainda possvel que um infeliz resultado tenha
ocorrido e, assim, o grau de confundimento seja grande. Desse modo, se as
coortes so grandes e no h evidncias de falta de comparabilidade entre
elas, o processo de randomizao proporciona um mecanismo em que se
deposita alta credibilidade na hiptese de que as coortes so aproximada-
mente comparveis, desde que no haja nenhuma violao grosseira do
protocolo de designao dos tratamentos s unidades.
Ainda dentro dessa lgica, atualmente faz-se uma interpretao mais
atraente de um ensaio randomizado. Supe-se que randomizao garanta
que os grupos sob as condies de exposio consideradas so comparveis,
onde o sentido de comparabilidade que o resultado observado para o gru-
po exposto teria sido o mesmo se o grupo no exposto tivesse sido exposto, e
vice-versa. Isso porque, como j dito aqui, supe-se assegurada a hiptese
de que as respostas so independentes da designao dos tratamentos e de
que co-variveis no observadas so balanceadas nos dois grupos. Em ou-
60
tras palavras, sob randomizao, no importa qual dos dois grupos de indi-
vduos ser exposto ao fator causal considerado.
Entretanto, dependendo de caractersticas especficas de um estudo,
nem mesmo a randomizao garante estimativas no tendenciosas do efeito
biolgico de interesse. Struchiner & Halloran (1996), estudando os efeitos
de vacinas para doenas contagiosas, mostraram como a exposio infec-
o pode ser um fator de confundimento para o efeito causal de interesse
mesmo em ensaios randomizados. Exposio infeco, tal como picada de
mosquito ou contato sexual, vista como uma co-varivel freqentemente
no registrada nos estudos que se d exclusivamente pela ao da natureza
(Halloran & Struchiner, 1995).
Sintetizando, um mecanismo de designao construdo com base em
algum processo randomizado, tal como o lanamento de uma moeda, onde a
indicao de um tratamento se daria pela ocorrncia de cara e, obviamente,
a ocorrncia de coroa implicaria indicao do tratamento alternativo, pode
ser escrito como
Pr( ) S =
|
\
|
.
|
1
2
U
,
sendo as 2
U
possveis indicaes igualmente provveis, proporcionando por-
tanto um mecanismo independente das variveis X e Y e, mais interessante
que estas, tambm de W, as co-variveis no observadas. Da a credibilidade
dada a esse mecanismo quando o interesse atribuir causa. Para o Modelo de
Rubin, a validade desta ltima expresso suficiente para inferncia causal.
Escore de propenso
Como visto, sob randomizao, os dois grupos sob tratamento podem
ser diretamente comparveis porque provavelmente suas unidades so si-
milares. Sem esse mecanismo, comparaes diretas podem ser enganadoras,
61
pois as unidades expostas a um tratamento podem, em geral, diferir sistema-
ticamente das unidades expostas ao outro tratamento. Nessas condies, es-
cores balanceadores podem ser usados para que a comparao entre os
grupos considerados seja reveladora do efeito que se quer estimar.
Um escore balanceador, b X ( ) , uma funo das co-variveis ob-
servadas X, tal que a distribuio condicional de X dado b X ( ) a mesma
para o grupo tratado ( S = t ) e para o grupo controle ( S = c ). Isto , dado
b X ( ) , S e X so independentes. Simbolicamente,
S X b X | ( ).
O escore balanceador mais trivial obviamente b X X ( ) = , e outros
de maior interesse so funes mais complexas de X.
Rosenbaun & Rubin (1983) mostraram que se um mecanismo de
designao fortemente ignorvel dado X, ento a diferena entre as mdias
dos grupos tratamento e controle para cada valor de um escore balanceador
uma estimativa no viesada do efeito do tratamento naquele valor e, con-
seqentemente, pareamento ou estratificao sobre este escore devem pro-
duzir estimativas no viesadas do efeito causal mdio verdadeiro.
Assim, um outro mecanismo de designao, com indicao para utili-
zao em estudos observacionais, obtido com base em um particular esco-
re balanceador conhecido como escore de propenso. Este definido como
a probabilidade condicional de designao de um particular tratamento dado
um vetor de co-variveis observadas. O interessante desse mecanismo que
o ajustamento para um escore de propenso escalar suficiente para remo-
ver vieses, em razo de todas as co-variveis observadas. A seleo de uni-
dades tratadas e controles com o mesmo valor para esse escore tero a mes-
ma distribuio de X.
Em experimentos randomizados, o escore de propenso uma funo
conhecida, havendo portanto uma especificao apropriada para
Pr( | ) S t X = . No entanto, em estudos observacionais, o escore de propen-
62
so quase sempre uma funo desconhecida, de modo que uma especificao
para ele deve ser estimada com base em dados observados por meio de al-
gum modelo adequado, como, por exemplo, o modelo logstico. Para um
bayesiano, essas estimativas so probabilidades preditoras a posteriori de
designao do tratamento t para uma unidade com vetor X de co-variveis.
Sob um modelo logstico, fazendo t =1 e c =0, o escore de propenso
Pr( | ) S t X = dado por
onde os |
i
so coeficientes estimados com base nos dados observados S e X.
J foi utilizada a notao para a probabilidade de uma determinada
unidade receber um tratamento, t por exemplo, como p X ( ) . Assim,
p X S t X ( ) Pr( | ) = = e, atribuindo-se novamente os valores 1 e 0 para
os tratamentos t e c, respectivamente, tem-se o seguinte mecanismo de desig-
nao, tambm j apresentado, construdo com base no escore de propenso:
Uma interessante utilizao do escore de propenso acontece quando
se criam pares de unidades tratamento-controle. Para cada unidade que
recebe um tratamento, busca-se outra para ser seu controle que tenha um
escore de propenso aproximadamente igual. Com isso, inferncias sobre o
efeito causal devido ao tratamento podem ser obtidas livres dos efeitos das
variveis usadas para construir o escore. Esse tipo de uso do escore de pro-
penso em estudos observacionais anlogo randomizao em experi-
mentos controlados pareados. Dentro de cada par, tratado e controle tm
aproximadamente a mesma probabilidade preditora, dado X, de ser tratado.
Randomizao em um experimento de comparao pareado mais interes-
Pr( ) S t X
e
e
i i
i
q
i i
i
q
x
x
= =

+

+
+
=
=
|
| |
| |
0
1
0
1
1
Pr ( | ) ( ) [ ( )]
( ) ( )
S X =

=
[
p X p X
u
S u
u
S u
u
U
1
1
1
63
sante, claro, na medida em que sustenta a hiptese de no dependncia de
X bem como de W, o conjunto de co-variveis no observadas.
Como ilustrao das potencialidades desse mecanismo, considere-se a
anlise de causalidade desenvolvida por Rubin (1991) em que se busca
estimar os possveis efeitos em virtude da entrada no mercado de uma droga
psiquitrica com seu nome genrico em concorrncia a seu nome comerci-
al. O grupo tratado (S=t ) foi constitudo por aqueles pacientes que optaram
pela troca, enquanto o grupo controle (S=c ) consistiu daqueles que manti-
veram o uso da droga com seu nome comercial. Foram observadas 53 co-
variveis pr-interveno entre variveis demogrficas e relacionadas ao
uso da droga, cujo controle pensou-se ser conveniente para que os efeitos
pudessem ser medidos e atribudos causa em questo e no a uma possvel
diferena nestas co-variveis entre os grupos. Obteve-se assim o escore de
propenso Pr( | ) S t X = para cada unidade, por meio de um modelo
logstico para as co-variveis X ou transformaes delas. Com base nesse
escore para cada unidade tratada, buscou-se uma unidade controle com o
valor mais prximo. A conseqncia desse processo de pareamento foi sinte-
tizada em uma tabela de freqncias, tal como a Tabela 4. Esta tabela conta
a freqncia, por faixas de magnitude, de uma medida de vis padronizada
para as 53 co-variveis envolvidas, ou eventualmente utilizando-se trans-
formaes apropriadas, antes e depois do pareamento. Essa medida de vis
foi obtida por meio da seguinte expresso:
onde x
d
foi a diferena entre as mdias dos grupos tratado e controle para
cada varivel (ou transformao), antes e aps o pareamento, e
s
t
2
e
s
c
2
foram as varincias de cada grupo antes do pareamento.
x
s s
d
t c
( )
2 2
2
+
64
Nota-se que antes do pareamento havia duas co-variveis com vis
acima de 0,25 e 10 (quase 19%) com vis de pelo menos 0,10. Aps o
pareamento, houve grande concentrao das variveis com medida de vis
inferior a 0,05, o que levou Rubin (1991) a considerar o procedimento bem
efetivo. Isto , os dois grupos sob investigao puderam ser considerados
homogneos, pelo menos com relao s co-variveis observadas.
Tabela 4 Distribuio de freqncia de uma medida de vis padronizada
para 53 co-variveis antes e aps pareamento
Vis Antes Aps
Padronizado N % N %
At 0,05 30 56,6 49 92,5
0,05 - 0,10 13 24,5 4 7,5
0,10 - 0,15 3 5,7 0 0,0
0,15 - 0,20 5 9,4 0 0,0
0,20 - 0,25 0 0,0 0 0,0
0,25 ou + 2 3,8 0 0,0
TOTAL 53 100,0 53 100,0
Admitindo-se esse procedimento como adequado, pode-se adotar um
mecanismo de designao mais simplificado. Se, entre as U unidades presen-
tes no estudo, encontramos M U s 2 pares, de tal forma que as unidades
de cada par tratamento-controle apresentem a mesma probabilidade de se-
rem tratadas, ento o mecanismo de designao reduz-se a
Pr( ) S =
|
\
|
.
|
1
2
M
,
se as unidades de cada par recebem tratamentos diferentes. Assim, cada um
dos
2
M
possveis valores de S que designam t a uma unidade do par e c
outra, so igualmente provveis, e qualquer S que designe as duas unidades
do par o mesmo tratamento tem probabilidade 0.
65
Resumindo, as limitaes e propriedades de um mecanismo construdo
com base no escore de propenso so bem conhecidas. Pareamento sobre
esse escore balanceia as co-variveis observadas X. Entretanto, diferente-
mente da randomizao, no balanceia co-variveis no observadas, exceto
aquelas correlacionas com X. Outra questo importante que ajustamen-
to sobre esse escore balanceia X apenas em mdia. Em um particular estu-
do, mesmo aps um ajustamento, possvel ainda encontrar por mero
acaso algumas variveis no balanceadas entre os grupos sob investiga-
o. Da a necessidade, quase sempre presente, de se estabelecerem hipte-
ses adicionais, eventualmente no testveis, a fim de validar uma atribui-
o de causalidade.
A abordagem mais comumente encontrada para controle de co-
variveis eventualmente confundidoras tem se dado por meio de anli-
ses multivariadas, incorporando a noo de modelagem estatstica. No
entanto, a contribuio dos modelos estatsticos para inferncia causal,
com os quais se tenta descrever as medidas de efeito causal de interesse
por meio dos coeficientes do modelo, tem sido apresentada e criticada em
muitos trabalhos (Greenland, 1979; Robins & Greenland, 1986;
Vandenbrouke, 1987; Greenland, 1989b). Alternativamente, apesar de s
mais recentemente se encontrarem na literatura clnica e epidemiolgica
trabalhos que utilizem o escore de propenso como um instrumento para
controle simultneo de muitas co-variveis observadas, Rosembaun e Rubin
tm, em dupla ou individualmente, defendido em vrios trabalhos este me-
canismo como apropriado para a discusso de causalidade com base em
estudos observacionais. DAgostino (1998) apresenta um excelente tutorial
desse procedimento.
66
Inferncia Estatstica
Como j mencionado, o objetivo, quando se analisam os dados dispo-
nveis, obter alguma informao sobre os pontos de interrogao ilustra-
dos na Tabela 1 e, assim, poder estimar efeitos causais tais como T para as
unidades sob investigao. Repetindo, as interrogaes se referem aos valo-
res de Y que seriam observados se, contrariamente ao fato, as unidades ti-
vessem recebido o tratamento alternativo quele que receberam. Entretanto,
objetivo tambm estender a informao desses efeitos para unidades em
que nenhum dos elementos do par de respostas potenciais ( , ) Y Y
t c
tenha
sido observado, tais como as outras unidades da populao das quais se
supe ter extrado aquelas que de fato esto sob anlise, ou mesmo para
unidades que futuramente possam ser expostas aos tratamentos. Em outras
palavras, quer-se inferir estatisticamente efeitos causais. Rubin (1990a,
1991) tem assinalado e comparado quatro mtodos de inferncia estatstica,
apontando a diferena entre eles como conseqncia da forma com que
usam os dados observados para obter informao sobre os valores no ob-
servados, os quais, como se tem visto, so necessrios para que se definam os
efeitos causais. Mais importante que as diferentes formas de construo des-
ses mtodos que todos compartilham a mesma estrutura conceitual de
causalidade presente no Modelo de Rubin.
Os quatro mtodos considerados por Rubin (1990a) como concei-
tualmente distintos so:
teste de hipteses nulas pontuais sob um mecanismo randomizado;
inferncia de parmetros causais baseada em possveis alocaes
aleatrias de tratamentos;
inferncia bayesiana para efeitos causais;
inferncia freqentista.
67
Apesar do Problema Fundamental da Inferncia Causal, talvez a de-
monstrao mais simples de que possvel a estimao de efeitos causais seja
possvel por meio do estabelecimento de uma hiptese nula pontual tal como
H
0
: Y u Y u u U
t c
( ) ( ), . = e
sob essa hiptese, Y, a matriz de respostas potenciais U x2 de fato comple-
tamente revelada, uma vez que ou Y u
t
( ) ou Y u
c
( ) observado, ee
Y u Y u
t c
( ) ( ) = . Sendo Y
S
o valor observado de Y e definindo-se
Y
H
0
como
o valor revelado sob H
0
, tem-se
Y Y Y
H
0
= ( ; )
S S
. Dessa forma, so especi-
ficados valores conhecidos para cada ponto de interrogao da Tabela 1. Em
outras palavras, H
0
em conjunto com os dados observados implica valor
especfico para cada interrogao e, assim, todos os valores e todos os efeitos
causais passam a ser conhecidos.
Segundo o desenvolvimento de Rubin (1990a), dois fatos importantes
se seguem. Primeiro, os valores das probabilidades das possveis designaes
de tratamentos, especificada pelo mecanismo de designao Pr( | , ) S X Y ,
podem ser obtidos no s para a particular designao S observada como
tambm para qualquer outra designao possvel, dados X X =
obs
e
Y Y =
H
0
. Em segundo lugar, os valores do vetor
Y
Ux S u
Y u
1
= { ( )}
( )
podem
ser encontrados para cada possvel S sob H
0
. Em particular,
Y Y
H
0
=
S
.
Assim, o valor de qualquer estatstica
Z Z S X Y = ( , , )
obs H
0
pode ser calcu-
lada no apenas para a especfica designao de tratamentos observada S,
mas tambm para todas as outras possveis. Como resultado, escolhendo-se
uma direo para valores incomuns de Z, vale o seguinte clculo:
Pr( , ) Z Z mais extremo que |
obs obs H
0
X X Y Y = = =

= = =
Pr( , ) ) S Z Z
S
| x ( mais extremo que
obs H obs
0
X X Y Y o
onde d uma funo indicadora, assumindo o valor 1 quando o argumento
for verdadeiro e 0 quando for falso. Essa expresso fornece o nvel de
,
68
significncia (ou p-valor) para H
0
baseado na estatstica de teste Z. Sob um
mecanismo probabilstico no confundido corresponde ao teste randomizado
de Fisher. Estes p-valores podem tambm ser calculados com mecanismo
confundidos ou mesmo no probabilsticos, embora a interpretao dos re-
sultados seja pouco interessante (Rubin, 1990a).
J se viu que se o p-valor pequeno, ento ou um evento raro
aconteceu, ou a hiptese nula no verdadeira, ou ainda o mecanismo de
designao colocado est errado. Dessa maneira, a qualquer hiptese nula
pontual pode ser atribudo um p-valor, onde pontual significa que H
0
em
conjunto com os valores observados Y
S
, implica o conhecimento de todos
os valores de Y. Esse mtodo de inferncia tem como grande vantagem sua
simplicidade e imparcialidade, que so particularmente interessantes quan-
do Z e sua direo de raridade so definidos antes que qualquer dado
seja observado.
Outro aspecto interessante desse mtodo se refere ao rico debate entre
Neyman e Fisher, cuja origem pode ser atribuda especificao da hiptese
nula. Enquanto Fisher defendia uma hiptese nula tal como a apresentada
acima, ou seja, de ausncia de efeito em cada unidade, Neyman propunha
como hiptese nula a igualdade entre os efeitos mdios populacionais, isto ,
H
0
: E E ( ) ( ) Y Y
t c
= . Rubin (1990b) discute maiores detalhes sobre as con-
seqncias da abordagem de Neyman.
Estreitamente relacionado a esse mtodo por tambm funcionar sob
aleatoriedade, distingue-se outro mtodo para se inferir causalidade em que,
entretanto, hipteses nulas pontuais no assumem mais um papel central. A
abordagem se concentra na inferncia de parmetros causais sob a distri-
buio de um estimador causal obtida com base nas possveis e aleatrias
designaes dos tratamentos. Por ser mais associada idia de levantamen-
tos amostrais aleatrios, Rubin (1990a) assinala que essa bordagem deve
ser vista mais como uma avaliao da qualidade de procedimentos de
69
inferncia propostos, tais como erro quadrtico mdio e poder, do que pro-
priamente um mtodo para inferncia por si.
Inicialmente define-se um parmetro causal, T Y Y
t c
= E( ) por
exemplo, podendo ser inclusive funo de X, o que caracterizaria um parmetro
causal subpopulacional. Em seguida, busca-se um estimador

( , , ) T T S X Y =
tal que seja aproximadamente no tendencioso para T, isto ,
E(
, ) T X Y T | ~
,
onde a aleatoriedade devida a S com distribuio dada por Pr( , ) S X Y | .
Em geral, a esperana de uma estatstica depende de (X,Y). Assim, a determi-
nao de
T
que satisfaa a esperana acima fcil com mecanismos de
designao probabilsticos no confundidos, tal como randomizao, mas
em mecanismos diferentes pode ser difcil ou mesmo impossvel sem a defi-
nio de fortes hipteses a priori (Rubin, 1990a). necessria, ainda, a
determinao de um estimador

( , , ) V V S X Y =
para a varincia de
T
que seja aproximadamente no tendencioso e que tenha variabilidade me-
nor que a de
T
. Assim, assumindo-se normalidade da distribuio de
T T
,
inferncias para T so obtidas a partir da declarao probabilstica
(

) ~ (

) T T V N ; 0
.
A escolha dos estimadores geralmente baseada em princpios tais
como varincia mnima, no tendenciosidade e menor erro quadrtico m-
dio. Apesar de reconhecer que esse mtodo proporciona resultados coinci-
dentes com os do mtodo anterior, Rubin (1990a) aponta a dificuldade des-
sa abordagem em se adequar a problemas mais complicados e reais, como
por exemplo distribuies no normais. Resumindo, esse mtodo de inferncia
trata X e Y como fixados mas Y como desconhecido, e obtm as caracters-
ticas dos estimadores sob todas as possveis designaes de tratamentos da-
das pelo mecanismo Pr( , ) S X Y | .
O mtodo bayesiano proporciona abordagem mais direta para se
inferirem efeitos causais, na medida em que se concentra na distribuio
70
a posteriori de T. Essa , pois, a distribuio do parmetro causal de interesse
condicionada a valores observados e especificaes de modelos probabilsticos
para as variveis envolvidas. Isto , inferncia bayesiana de efeitos causais
obtida com base na colocao de uma distribuio de probabilidade a priori
para Y dado X e da especificao probabilstica do mecanismo de designa-
o de tratamentos. Enquanto no mtodo de hipteses nulas pontuais os
pontos de interrogao da Tabela 1 eram especificados com base nos dados
observados em conjunto com H
0
, no mtodo bayesiano busca-se a distribui-
o deles dados todos os valores observados. Busca-se, portanto, a distribuio
a posteriori de Y
S
, a componente no observada de Y. A distribuio de Y
S
pode ser escrita como
onde Y Y Y = ( , )
S
S
particiona Y em valores observados e no observados. .
E, no caso de um mecanismo de designao de tratamentos no confundido,
isto , se
Pr( , ) Pr( ) S X Y S X | | = ,
ento a distribuio de Y
S
simplificada, sendo dada por
Pr( , )
Pr( )
Pr( )
Y X Y
Y X
Y X Y
S
S
S
d
|
|
|
=
}
.
Os valores observados de ( , , ) X S Y
S
em conjunto com a distribui-
o a posteriori de Y
S
implica distribuio para qualquer funo de
( , , ) X S Y tais como os efeitos causais mdios populacional ou
subpopulacional, ou mesmo efeitos causais individuais. Assim, dentro de uma
estrutura bayesiana, inferncias causais podem ser obtidas por exemplo a
partir de Pr( , , ) T
S
| X S Y . Prprio desse mtodo a necessidade de se esta-
belecer um modelo para a distribuio de Y dado X. Usualmente apela-se
para o teorema construdo por de Finetti e escreve-se
Pr( , , )
Pr( , )Pr( )
Pr( , )Pr( )
Y X S Y
S X Y Y X
S X Y Y X Y
S
S
S
d
|
| |
| |
=
}
71
Pr( ) ( , )Pr( ) Y X | | =
=
[
}
f Y X d
u
u
U
u
1
u u u
onde Y
u
a u-sima linha de Y e f Y X
u u
( , ) | u o modelo comum para a
distribuio condicional de Y dado X para cada linha de (Y,X) dado o
parmetro no observvel
u
com distribuio a priori Pr(
u
). No faz mui-
to tempo, a grande dificuldade dessa abordagem se concentrava na identifi-
cao de distribuies conjugadas, de modo a se obter um procedimento
analiticamente tratvel. Entretanto, essa barreira tem sido vencida com a
incorporao de procedimentos de simulao.
O quarto mtodo de inferncia citado por Rubin (1990a; 1991) do-
mina a prtica. O mtodo freqentista similar ao mtodo de inferncias de
parmetros causais na sua formulao, mas em vez de suas caractersticas
serem obtidas sob possveis S do mecanismo de designao Pr( , ) S X Y |
para um fixado (X,Y), so obtidas sob repetidas observaes de Y a partir da
distribuio amostral Pr( ; ) Y X | u , dada por
com
u
constante mas desconhecido. Essa abordagem proporciona resulta-
dos estatsticos matemticos bem conhecidos para
u
, especialmente quando
f segue uma distribuio normal.
Rubin (1991) critica esse mtodo porque, apesar de formular quase
todas as hipteses que o mtodo bayesiano formula, no permite uma
especificao a priori para
u
. Do ponto de vista prtico, uma especificao
para Pr(
u
) muito menos sensvel do que qualquer especificao para
f Y X
u u
( , ) | u , principalmente em estudos observacionais. Assim, por exem-
plo, enquanto na teoria bayesiana intervalos de confiana para
u
tm uma
interpretao probabilstica imediata, dentro do mtodo freqentista esta
interpretao depende do argumento condicional de que amostras repetidas
seriam necessrias para verificar a freqncia relativa de intervalos que de
fato compreendiam
u
.
Pr( ; ) ( ; ) Y X | | u u =
=
[
f Y X
u u
u
U
1
72
Uma outra forma, mais genrica, de se apresentar conceitualmente a
questo da inferncia encontrada em Smith & Sugden (1988), escreven-
do-se a funo de verossimilhana das variveis envolvidas. O processo de
inferncia causal envolve basicamente a considerao de trs conjuntos
de variveis: as respostas Y, as co-variveis conhecidas X e as desconhecidas
W. Formalmente, pode-se escrever parametricamente de forma conveniente
a distribuio conjunta dessas variveis como:
f g h ( | , ; ) ( | ; ) ( ; ) W Y X Y X X u | ,
onde se assume que os parmetros ,
u
e | so distintos. Tomando-se
tambm de forma geral o mecanismo de designao como Pr( , , ) S | X Y W
e admitindo-se que todas as unidades esto presentes no estudo, a funo de
verossimilhana pode ser escrita como
h S f g d d
S W
( ; ) Pr( , , ) ( , ; ) ( ; ) X Y X W W Y X Y X Y W | u | | |
} }
.
E as condies que implicariam um mecanismo que sustentasse uma
interpretao causal seriam:
S | Y X W , e Y W X | .
Diante dessas consideraes sobre os mtodos de inferncia estatsti-
ca, percebe-se que os recursos que a estatstica tradicionalmente utiliza para
fazer inferncias sobre associaes podem ser transferidos para o caso em
que se estuda causalidade com base na adoo explcita de um modelo espe-
cialmente planejado para este fim.
73
Questes Epidemiolgicas Relacionadas
3
At aqui se tem visto como a estatstica pode contribuir para a
discusso sobre inferncia causal, procurando explorar as propriedades
e limitaes de um modelo estatstico de causalidade devido a Rubin.
interessante, tambm, discutir as interfaces dessa contribuio com a teo-
ria e a prtica epidemiolgica, abordando algumas questes metodol-
gicas relacionadas.
A importncia do instrumental estatstico no desenvolvimento da
teoria epidemiolgica tem cada vez mais ficado evidente. Embora construda
sobre o trip clnica, medicina social e estatstica, a epidemiologia tem
experimentado nos ltimos anos um boom de reconhecimento graas, em
parte, utilizao e ao aperfeioamento de tcnicas quantitativas avana-
das especialmente desenvolvidas para responder complexidade dos pro-
blemas por ela enfrentados. Assim, a incorporao de um modelo estatsti-
co de causalidade parece ser relevante por ser esta, a causalidade, o gran-
de desafio da investigao epidemiolgica.
Pode-se entender inferncia epidemiolgica como o processo de ob-
teno de inferncias, tais como a predio de ocorrncias de doenas ou a
identificao de suas causas, com base em dados epidemiolgicos, isto ,
dados relacionados ocorrncia de doenas em populaes. Essas inferncias
devem poder ser feitas sem os benefcios diretos de evidncias experimen-
tais e tambm sem a necessidade de uma teoria estabelecida sobre a etiologia
74
da doena, ou seja, sem o estabelecimento de um mecanismo causal. Cabe
aqui um parntese, j que o termo populao em epidemiologia merece
ateno especial. Apesar de os epidemiologistas observarem indivduos, as
interpretaes dos resultados so baseadas na combinao de dados de
muitas unidades. Razes para o uso de populaes em epidemiologia esto
relacionadas a dois grandes objetivos: avaliar programas de melhora do
status de sade de grupos especficos e, mais interessante que isso, permitir
que uma investigao faa inferncias causais, usando mtodos estatsti-
cos, sobre as relaes entre certas exposies e o status de sade.
Como exemplo de que inferncias epidemiolgicas devem ser poss-
veis mesmo sem os benefcios de um estudo experimental, considere como
problema a verificao da hiptese de que cafena fator causal para doen-
a cardiovascular. Essa hiptese pode ser testada por meio da estimao do
risco atribuvel a esse fator, que, como j visto, obtido pela diferena entre
o risco de doena cardiovascular entre indivduos usurios dessa substn-
cia e o risco entre indivduos no usurios. Entretanto, diferentemente de
uma exposio experimental, o uso de cafena de opo pessoal e tem sido
apontada sua correlao com diversas outras preferncias, principalmente
o fumo. Portanto, mesmo que cafena no tenha nenhum efeito sobre o risco
de doena cardiovascular, no se esperaria encontrar uma equivalncia de
riscos entre usurios e no usurios de cafena. Assim, a anlise deve ser
conduzida necessariamente atravs de um estudo observacional que seja
capaz de corrigir eventuais diferenas entre os grupos considerados. essa
tentativa de correo que tem estimulado muito no s o aparecimento de
novas tcnicas estatsticas como tambm o estabelecimento de critrios
de diagnstico e controle dessas tcnicas, de modo a validar ou no as hip-
teses a elas adjacentes.
Um desafio dos estudos epidemiolgicos , portanto, a estimao iso-
lada do risco atribuvel (ou de qualquer outra medida de efeito pertinente)
75
a uma determinada exposio no exemplo, uso de cafena , livre dos
efeitos devidos a outros fatores, de modo que as eventuais concluses de
causalidade sejam vlidas. No entanto, nesse momento surge uma outra
caracterstica fundamental da pesquisa epidemiolgica. Eventualmente, a
estimao independente de uma medida de efeito de determinado fator
pode ser de pouca valia se existe um outro fator que age sinergicamente
com ele. Existe sinergismo quando a presena de um fator modifica o efei-
to biolgico do outro e um caso particular acontece quando os indivduos
tm a doena somente se expostos aos dois fatores, mas no a um deles
isoladamente. Sinergismo conceito da biologia , na prtica, comumente
avaliado por meio do conceito estatstico de interao. Diz-se que existe
interao estatstica entre dois fatores, A e B, se necessrio um parmetro
adicional para descrever adequadamente o risco de doena em virtude da
exposio conjunta a esses fatores. Em oposio, dois fatores podem ser
considerados estatisticamente independentes se o risco de doena, dada
uma exposio conjunta a esses fatores, pode ser adequadamente modela-
do como uma funo dos efeitos separados, onde esta funo pode ser
aditiva, multiplicativa ou, ainda, assumir outra forma. Assim, a determi-
nao se existe ou no interao estatstica depende do modelo estatstico
adotado (Siemiatycki & Thomas, 1981).
Desse modo, ao lado do confundimento, a interao de fatores, enten-
dida, portanto, como a interdependncia entre dois fatores que alteram a
magnitude de um dado efeito, uma outra importante preocupao
metodolgica. Entretanto, o interesse principal em uma discusso de causa-
lidade presente nos estudos epidemiolgicos o julgamento da validade da
associao observada entre exposio e doena.
76
O Conceito de Validade
Validade pode ser entendida como a capacidade de um particular
estudo epidemiolgico encontrar critrios lgicos que apontem para ausn-
cia de vieses. Assim, um estudo de associao entre uma exposio e uma
doena considerado vlido, e com conseqente interpretao causal, se
est livre de vieses que possam, alternativamente exposio proposta, ex-
plicar seus resultados.
Os vieses possveis em um particular estudo podem ser devidos a
vrias fontes, e a maior parte deles comum a qualquer desenho
epidemiolgico. Tradicionalmente, como j dito aqui, os vieses tm sido
classificados como vis de informao, vis de seleo e confundimento.
Greenland (1991) prope uma classificao mais abrangente, que, embo-
ra no tenha ecoado na literatura, parece representar uma estrutura mais
conveniente para discutir a validade dos estudos e o processo de inferncia
epidemiolgica. Em sua abordagem, qualquer estudo epidemiolgico cujo
objetivo seja a avaliao de causalidade deve considerar as seguintes con-
dies: validade de comparao, validade de seguimento, validade de
especificao e validade de mensurao. Em estudos de caso-controle, es-
pecificamente, alm de serem mais sujeitos a fontes adicionais de erros de
mensurao, deve-se considerar tambm a validade de seleo de casos e
controles. Percebe-se imediatamente a complexidade que envolve a vali-
dade de determinada medida de efeito, visto que necessrio o cumpri-
mento de uma srie de condies suficientes. Essas quatro condies so
vistas como condies de validade internas, pois se referem apenas es-
timao de efeitos dentro dos grupos de exposio considerados, sem pre-
ocupao quanto generalizao dos resultados para outras populaes.
So condies suficientes para validade, mas no necessrias, no sentido
de que uma eventual violao pode no produzir vis.
77
Pode-se acreditar que haja validade de comparao se as unidades
que de fato foram expostas, caso no o tivessem sido, teriam apresentado
aproximadamente a mesma distribuio para a varivel resposta (propor-
o de doena) que as unidades no expostas. Vale o mesmo raciocnio para
as unidades no expostas: tivessem elas sido expostas, se esperaria observar
o mesmo resultado que o das unidades de fato expostas. Validade de compa-
rao simplesmente significa que a distribuio da varivel resposta para as
unidades de um determinado grupo de tratamento (exposio) prediz o que
teria acontecido com o grupo de tratamento alternativo, tivessem as unida-
des deste ltimo grupo experimentado a condio do outro. Ou ainda, uma
outra forma de dizer isso afirmar que os grupos tratado (exposto) e con-
trole (no exposto) so comparveis ou permutveis com respeito vari-
vel resposta, independentemente da situao de exposio que eventual-
mente cada unidade experimente. Falta de validade de comparao deve
resultar em uma estimativa viesada da medida de efeito causal considerada
e diz-se que h confundimento na estimativa. Como se trata da principal
preocupao da investigao de causa, essa questo retomada adiante em
um item especfico, no qual discutida mais detalhadamente, procurando-
se interfaces entre a forma com que a epidemiologia trata a questo e o
Modelo de Rubin.
Validade de seguimento acontece quando, dentro de cada grupo de
tratamento considerado (tratado e controle), o risco de censura
5
no est
associado ao risco de doena. Desse modo, dada a validade de seguimento,
espera-se que o risco de doena dentro de cada grupo em um determinado
momento seja o mesmo tanto para unidades perdidas (ou retiradas do estu-
do por razes concorrentes) at este momento quanto para unidades acom-
panhadas alm deste momento. No exemplo do uso de cafena como fator
5
Censura diz respeito finalizao do perodo de seguimento por uma razo diferente daquela
que se esperaria observar, no caso, ocorrncia da doena em questo.
78
causal para doena cardiovascular, poder-se-ia imaginar um vis de se-
guimento, j que tabagismo, que est associado exposio em questo, rela-
ciona-se tambm a uma taxa maior de mortalidade por doena cardiovascular
e tambm por outras doenas. Ou seja, indivduos expostos cafena estari-
am potencialmente mais sujeitos censura por causas de morte relacio-
nadas ao tabagismo do que os indivduos no expostos.
Quando se discutiram os mecanismos de designao de tratamentos,
particularmente o escore de propenso, verificou-se a necessidade de se es-
tabelecer um modelo estatstico. Mais genericamente, as tcnicas estatsticas
assumem algum tipo de modelo para o processo de gerao dos dados a
serem analisados. E, na ausncia de randomizao ou amostras aleatrias,
raramente ser possvel identificar um modelo absolutamente correto. Logo,
algum tipo de erro de especificao deve ser esperado. No caso de respostas
dicotmicas, o modelo amostral tradicionalmente empregado o binomial.
Um modelo amostral deve ser entendido como uma expresso matemtica
que descreve a probabilidade de observao dos possveis dados como fun-
o de parmetros, quase sempre desconhecidos. Em um estudo de coorte,
por exemplo, a validade de um modelo binomial depende da hiptese de que
os riscos dentro de cada grupo de exposio permanecem constantes por
todo o perodo de acompanhamento. Mais especificamente, o risco de doen-
a cardiovascular no constante ao longo do tempo para as coortes acom-
panhadas uma vez que, medida que os indivduos vo envelhecendo, tal
risco vai aumentando. Logo, a utilizao do modelo binomial, nesse exem-
plo, no gozaria de validade de especificao.
Alm da fonte de erro devido ao modelo amostral, falta de validade de
especificao pode ser devida tambm a um modelo estrutural, isto , a uma
expresso matemtica que descreve os parmetros do modelo amostral como
funo de co-variveis, tal como um modelo logstico. Associado a qualquer
modelo estrutural encontra-se sempre um conjunto de hipteses que para
79
serem validadas so comumente confrontadas com os dados observados.
Na literatura, comum encontrar o modelo estrutural incorporado ao mode-
lo amostral, sendo essa combinao designada genericamente como modelo
estatstico. Assim, de uma estimativa de uma medida de efeito pode-se dizer
que tem validade de especificao se obtida com base em um modelo esta-
tstico correto, ou pelo menos aproximadamente correto. E se o modelo
amostral ou o modelo estrutural usado na anlise for incorreto, as estima-
tivas resultantes podem estar viesadas. Como comentrio adicional, mesmo
quando um eventual erro de especificao no conduza a um vis, testes
estatsticos ou intervalos de confiana para as estimativas ficam comprome-
tidos (Greenland, 1991).
J foi ressaltado que a contribuio da estatstica para o processo de
inferir causalidade passa necessariamente pela mensurao de variveis
que permitam a quantificao dos efeitos causais. Desse modo, medir ade-
quadamente as variveis envolvidas condio sine qua non para uma
possvel interpretao de causa. Entretanto, do ponto de vista prtico ou
operacional, qualquer estudo est sujeito a erros de mensurao por vrias
fontes, o que obviamente pode contribuir para um possvel vis na estimati-
va. Assim, pode-se dizer que uma estimativa de uma determinada medida de
efeito goza de validade de mensurao se ela no sofre de vieses em conse-
qncia de erros de mensurao nas variveis envolvidas no estudo. Para
ajudar na tarefa de identificar possveis erros de mensurao, pode ser til
classific-los de acordo com suas fontes. E erros de uma determinada fonte
podem ser ainda classificados de acordo com caractersticas que so preditoras
da direo do vis que eles produzem.
Greenland (1991) prope um esquema de classificao para os erros
de mensurao bastante abrangente, dividindo-os quanto fonte, quanto
ao tipo e quanto dependncia entre eles. Quanto fonte, os erros podem
ser classificados como erros de procedimento tais como instrumentos mal
80
calibrados ou falta de lembrana em estudos retrospectivos, erros de uma
varivel proxy, ou seja, erros por se utilizar uma varivel substituta vari-
vel de interesse e erros de construo, que surgem de ambigidades na
definio das variveis. Independentemente da fonte, os erros podem ser clas-
sificados como diferenciais ou no diferenciais, se a direo ou a magnitude
dos erros tende a variar ou no com os valores verdadeiros de outras vari-
veis, respectivamente. Finalmente, diz-se que erros na mensurao de duas
variveis so dependentes se a magnitude ou a direo do erro cometido na
mensurao de uma varivel est associada magnitude ou direo do erro
cometido em uma outra varivel. Se no existe associao entre os erros, diz-
se que so independentes. Questo importante suscitada por essa classificao
uma maior valorizao da validade de mensurao. Se suspeita-se que os
instrumentos utilizados para medir as variveis envolvidas no medem ade-
quadamente aquilo que se pensa que estejam medindo, ento pouca
credibilidade deveria ser dada a qualquer resultado eventualmente obtido.
Por exemplo, conceitos epidemiolgicos tais como sensibilidade e especificidade
dizem respeito ao poder, ou s probabilidades, que tem um teste diagnstico de
classificar como doente ou no doente indivduos que de fato estejam doentes
ou no doentes, respectivamente. Logo, conhecer a magnitude dessas probabi-
lidades seria necessrio para, pelo menos, identificar o sentido do erro.
Diante dessas consideraes, em que se registra uma srie de
condicionantes acerca da validade de um estudo, parece justificvel a insegu-
rana sempre presente quando o assunto estabelecimento de causa. O co-
nhecimento dos possveis vieses envolvidos em um particular estudo , por-
tanto, fundamental para que, sempre que possvel, possam ser verificados a
partir dos dados disponveis. Fazendo uma associao com a teoria contida no
Modelo de Rubin, a discusso de alguns possveis vieses fica embutida nas
hipteses relacionadas ao modelo, que precisariam, portanto, ser testadas. De
novo, nem sempre as hipteses adjacentes podem ser postas prova.
81
Confundimento e Permutabilidade
Confundimento tem sido reconhecido como um dos principais pro-
blemas da pesquisa epidemiolgica e j foi aqui citado diversas vezes. Em
razo disso, muito se tem escrito e j h bastante tempo sobre esse problema
metodolgico, registrando-se um rico debate no s sobre abordagens alter-
nativas para seu controle, mas tambm sobre o seu prprio conceito. Do
ponto de vista epidemiolgico, v-se confundimento como um problema sur-
gido a partir de uma diferena intrnseca aos riscos de doena entre as
populaes exposta e no exposta (Greenland & Robins, 1986). Isso significa
que a diferena existiria mesmo se a exposio estivesse ausente em ambas
as populaes. Retomando o exemplo em que a exposio sob considerao
o uso de cafena, esperar-se-ia encontrar riscos para doena cardiovascular
diferentes entre usurios e no usurios de cafena, mesmo se nenhum da-
queles indivduos usurios tivesse de fato sido exposto cafena. Essa dife-
rena poderia ser explicada pela falta de comparabilidade, ou confundimento,
devida associao entre cafena e tabagismo. O conceito de confundimento
est baseado, portanto, na idia de comparabilidade.
Entretanto, parece que o prprio conceito do problema ainda motivo
de discusso, sendo o termo usado comumente para se referir a trs problemas
distintos. A forma mais antiga se relaciona a um tipo de vis na estimao de
um efeito causal, utilizado na literatura epidemiolgica e sociolgica. Um
conceito mais recente associa confundimento idia de no colapsibilidade,
isto , uma certa medida de efeito bruta diferente daquela obtida pela com-
binao desta medida com estratos de uma terceira varivel. Um terceiro
conceito est relacionado impossibilidade de separao do efeito principal e
o efeito de interao, presente comumente em uma anlise de varincia.
difcil distinguir adequadamente esses conceitos. Em particular, os conceitos
de confundimento como um vis na estimao do efeito e como no
82
colapsibilidade so freqentemente tratados como idnticos. Greenland et al.
(1999) abordam essa questo e explicitam essas diferenas. Independente-
mente do conceito, o importante que, para se fazer inferncia causal, ne-
cessria a garantia de comparabilidade entre os grupos considerados.
Greenland (1989a), ao comentar o trabalho de Wickramaratne &
Holford (1987) sobre confundimento em estudos epidemiolgicos, identi-
fica trs ambientes apropriados para essa discusso. O primeiro corresponde
exatamente ao Modelo de Rubin, o qual, segundo ele, a melhor formalizao
atualmente disponvel para se tratar do problema de confundimento. Como
foi possvel observar aqui, essa abordagem explora a noo de no
ignorabilidade da designao dos tratamentos. Um segundo ambiente, ima-
ginado por Greenland & Robins (1986), trata confundimento sob o con-
ceito de permutabilidade. Essa questo retomada adiante por apresentar
forte ligao com o Modelo de Rubin. A terceira abordagem, devida a Gail
(1986), trata confundimento sob a noo de ajustamento para co-vari-
veis balanceadas.
Greenland & Robins (1986) discutem o conceito de confundimento
epidemiolgico baseados em um modelo desenvolvido para se estudar efei-
tos individuais. Sob esse modelo, percebem confundimento como um proble-
ma de no identificabilidade de parmetros. Isto , valores distintos de um
parmetro de interesse desconhecido podem gerar a mesma distribuio de
dados observados. Associam tambm a esse conceito a idia de permu-
tabilidade, cujo significado aquele prprio teoria bayesiana, qual seja:
so esperados os mesmos resultados caso as condies de exposio dos gru-
pos sejam permutadas (Migon & Gamerman, 1999). Esse aspecto corresponde,
na realidade, hiptese de homogeneidade desenvolvida no Modelo de Rubin.
Alis, como poder ser observado, este modelo de efeitos individuais asseme-
lha-se bastante ao Modelo de Rubin, visto, porm, sob uma tica exclusiva-
mente epidemiolgica.
83
Fazendo-se uma reproduo simplificada de Greenland & Robins
(1986), considere-se a situao na qual se deseja estudar o efeito de um
fator de exposio dicotmico sobre o risco de uma doena em um perodo
de tempo a risco especificado. Existem quatro tipos de indivduos de acordo
com suas possveis respostas aos tratamentos considerados. Assim, um indi-
vduo classificado como tipo 1 aquele que se torna doente independente-
mente da exposio, e o tipo 4 aquele imune doena. Os indivduos tipo
2 ou 3 so os suscetveis. A Tabela 5 ilustra esse fato, onde o valor 1
indicativo de presena de doena e o valor 0, de ausncia. Aps observar um
nico indivduo do grupo tratado sobre o perodo de tempo a risco e verifi-
car que ele contraiu a doena, no possvel dizer, sem uma informao
adicional, se ele do tipo 1 aquele indivduo condenado a adoecer sob
qualquer condio ou do tipo 2, aquele indivduo suscetvel doena pela
exposio. Da mesma forma, se ele no tivesse contrado a doena tambm
no seria possvel dizer a qual tipo pertenceria: ao 3 ou ao 4. Ou seja,
independentemente do que observado, no possvel dizer se a exposio
tem efeito. Esse um problema de no identificabilidade.
Tabela 5 Tipos de indivduos quanto a suas possveis respostas (1 ou 0) a
um tratamento dicotmico
Tipo e descrio Tratamento Tipo de
dos indivduos Tratado Controle efeito
Tipo 1: Indivduo condenado a adoecer 1 1 Sem efeito
Tipo 2: Indivduo suscetvel 1 0 Causal
Tipo 3: Indivduo suscetvel 0 1 Preventivo
Tipo 4: Indivduo imune doena 0 0 Sem efeito
Nota: um efeito preventivo tambm um efeito causal.
Se, adicionalmente ao indivduo exposto, observa-se um indivduo
no exposto, quatro possveis resultados se apresentam:
84
a) ambos os indivduos adoecem;
b) somente o indivduo exposto adoece;
c) somente o no exposto adoece;
d) nenhum dos dois adoece.
Pela mesma razo exposta, no possvel saber se a exposio tem
efeito. Entretanto, se razovel supor que os dois indivduos so do mesmo
tipo, ento torna-se possvel deduzir se a exposio tem ou no algum efeito.
Isso porque, na hiptese de que os indivduos so do mesmo tipo, as respostas
(a) e (d) significam que a exposio no tem efeito. Do mesmo modo, as
respostas (b) e (c), quando combinadas com a hiptese, implicam causalida-
de. Assim, a combinao da resposta observada com a hiptese de equiva-
lncia dos indivduos implica identificabilidade do efeito. Essa equivalncia
pode ser colocada em termos de permutabilidade dos indivduos. Se as con-
dies de exposio dos dois indivduos tivessem sido trocadas (permuta-
das), o mesmo resultado seria obtido.
Para completar a apresentao da noo de confundimento por meio
do modelo de efeitos individuais de Greenland & Robins (1986), necess-
ria a considerao de uma populao de indivduos. Considere uma coorte
de U
t
indivduos expostos a um tratamento t, inicialmente livres de doena,
acompanhados ao longo de um perodo a risco. Seja
p
j
, j = 1, 2, 3 e 4,
a proporo de indivduos dessa coorte que so do tipo j, de acordo com a
Tabela 5. Considere tambm uma coorte de U
c
indivduos controles (ou
no expostos) e equivalentes propores de indivduos do tipo j dadas por
q
j
. Ao final do tempo considerado, os resultados poderiam ser resumidos
em uma tabela 2x2 tal como a Tabela 6, a seguir.
85
Tabela 6 Freqncias observadas de doentes, como funo dos tipos de
indivduos, segundo coortes a risco
Grupos de Total Freqncia
exposio acompanhado Doentes No Doentes
Tratado (t ) U
t
D
t
= (p
1
+p
2
)xU
t
ND
t
= (p
3
+p
4
)xU
t
Controle (c ) U
c
D
c
= (q
1
+q
3
)xU
c
ND
c
= (q
2
+q
4
)xU
c
Para atribuio de causa, seria necessrio conhecer no grupo tratado
as propores indicadoras de existncia de efeito, ou seja, os valores p
2
e p
3
,
embutidos nas freqncias observadas D
t
e ND
t
. O risco atribuvel ex-
posio (
T
), obtido pela diferena entre os riscos nas populaes expostas
(

R
t
) e no expostas (

R
c
) e que tem representado a medida de efeito causal
de interesse, dado por
S com o valor calculado de
T
no possvel dizer se efetivamente
h algum efeito, pois para qualquer valor de
T
, positivo, negativo ou zero,,
no se pode identificar as propores p
2
ou p
3
. Fazendo-se, entretanto, a hip-
tese de comparabilidade entre as coortes, isto , assumindo-se que a propor-
o de indivduos que adoeceriam se a exposio estivesse ausente a mes-
ma para ambas as coortes, seria obtida apenas uma identificabilidade parcial.
Isso porque, sob essa condio, vale a equao q
1
+ q
3
= p
1
+ p
3
. Logo,
Ento, se
T
>0 implica que p
2
tambm maior que zero, o que significa
que no estudo houve alguns indivduos que tiveram a doena por causa da
exposio. Da mesma forma,
T
<0 significa que alguns tiveram a doena
prevenida pela exposio, isto , p
3
>0. Porm, se
T
=0, s se pode deduzir
que p
2
= p
3
. Para se concluir que no houve efeito, e assim atingir completa

T R R
D
U
D
U
t c
t
t
c
c
= =
( ) ( ) ( ) ( ) T
D
U
D
U
p p q q p p p p p p
t
t
c
c
= = + + = + + =
1 2 1 3 1 2 1 3 2 3
86
identificabilidade, necessria a hiptese adicional de que p
3
(ou p
2
, alter-
nativamente) seja igual a zero, isto , assumir que a exposio nunca previ-
ne. Assim, sob essa hiptese adicional,
T
=0 implica p
2
=0, indicando por-
tanto no ter havido efeito. A hiptese de que q
1
+ q
3
= p
1
+ p
3
pode ser vista
tambm como uma hiptese de permutabilidade parcial, e dir-se-ia que se
as condies de exposio fossem trocadas, o valor observado do risco na
ausncia da exposio teria sido o mesmo. Para uma completa permu-
tabilidade seria necessria a hiptese adicional de que q
1
+ q
2
= p
1
+ p
2
, ou
seja, existiria a mesma relao entre exposio e risco se as condies de
exposio fossem permutadas.
A finalidade desta seo foi apresentar a discusso de confundimento
tal como ela tem estado presente em um contexto epidemiolgico. Diante das
caractersticas desse modelo determinstico de efeitos individuais, usado por
Greenland & Robins (1986) para discutir confundimento, uma analogia
com o Modelo de Rubin parece inevitvel. Nesse nvel individual, a falta de
identificabilidade dos efeitos, remediada pela hiptese de permutabilidade,
corresponde ao Problema Fundamental da Inferncia Causal, cuja soluo
correspondente seria a hiptese de homogeneidade. Tambm pode ser perce-
bida, embutida nos quatro tipos de indivduos citados, a noo de respostas
potenciais, prpria do Modelo de Rubin. Cada combinao possvel de expo-
sio e resposta potencial no Modelo de Rubin corresponderia a um dos
quatro tipos de indivduos no modelo de efeitos individuais.
Do ponto de vista da formulao do Modelo de Rubin, a discusso
sobre confundimento est concentrada no mecanismo de designao de trata-
mentos. E, como j visto, existe uma classe de mecanismos ditos no confundi-
dos, que so aqueles que no dependem da varivel resposta Y , isto ,
Pr( Pr S X Y S X | , ) ( | ) = para todos os valores possveis de S, X e Y , sendo
a dependncia sobre X passvel de ser controlada na medida em que so co-
variveis observadas. Se adiciona-se a condio 0 1 < = < Pr( | S u t X ( ) ) ,
87
viu-se que o mecanismo conhecido como sendo fortemente ignorvel.
Assim, o Modelo de Rubin trata o problema de confundimento por meio da
idia de ignorabilidade.
Os Estudos Epidemiolgicos
De forma geral, os estudos epidemiolgicos podem ser divididos entre
aqueles experimentais e aqueles observacionais, dependendo do controle de
que o investigador dispe sobre o mecanismo que designa a condio de expo-
sio das unidades. Entre os observacionais, destacam-se os estudos de coorte,
os estudos de caso-controle e os estudos de coorte-retrospectivo, de acordo
com a forma com que so coletadas as unidades e o timing de observao.
6
A
Figura 2, adiante, ilustra esse conceito. Embora a epidemiologia disponha de
outros tipos de estudos, tais como os estudos ecolgicos, ou ainda particulares
desenhos dentro dos citados, essa classificao suficiente para se explorar de
forma geral a noo de causa contida nos estudos epidemiolgicos.
Em um estudo experimental, que no ambiente epidemiolgico co-
nhecido como um ensaio clnico ou um estudo de interveno, a designao
dos tratamentos s unidades controlada pelo experimentador. Isto , os
tratamentos so designados para as unidades com base em um mecanismo
casual, comumente um gerador de nmeros aleatrios, que de conheci-
mento do experimentador, de modo que s o acaso determina quem recebe
qual tratamento. Sob essa condio, espera-se, portanto, que as unidades
recebendo os diferentes tratamentos sejam comparveis, tal como discutido
no captulo sobre randomizao. Entretanto, o acaso poderia em princpio
fazer os grupos tratado e controle diferirem de maneira significativa, no
6
Timing refere-se relao cronolgica entre as observaes dos status de doena e exposio
e suas ocorrncias de fato.
88
sendo difcil quantificar o seu impacto potencial e distingui-lo do efeito do
tratamento. Testes estatsticos usuais e intervalos de confiana fazem preci-
samente isso. Sob esse desenho, portanto, toda a teoria desenvolvida para o
Modelo de Rubin se aplica diretamente. A causa a ser avaliada bem como a
causa alternativa so estabelecidas a priori e, uma vez alocadas aleatoria-
mente nas U unidades investigadas, qualquer medida de efeito pode ser ob-
tida diretamente, com a crena geral de que ir satisfazer aos critrios de
validade discutidos salvo pelo acaso e por particulares situaes , tal
como comentado na seo sobre randomizao.
Figura 2 Timing dos principais estudos epidemiolgicos observacionais em
relao exposio e resposta
Fonte: Hennekens & Buring (1987).
Estudo de caso-controle
Exposio Doena
?
?

Estudo de coorte
Exposio Doena
?
?
Estudo de coorte-retrospectivo
Exposio Doena
?
?
Legenda:
=presente
Bases de seleo dos grupos no incio do estudo
=ausente
? =a ser observado =investigador no incio do estudo
89
Um estudo observacional, entretanto, pode ser entendido generica-
mente como uma investigao emprica de tratamentos (ou exposies) e
dos efeitos que eles causam, na qual, entretanto, diferentemente de um estu-
do experimental, o investigador no tem controle sobre a designao dos
tratamentos considerados para as unidades. Isto , as unidades no so de-
signadas para os tratamentos por um dispositivo aleatrio criado por um
experimentador. Como j visto aqui, esse fato faz dos estudos observacionais
mais sujeitos a vieses e conseqentemente menos poderosos para avaliao
de efeitos causais que os estudos experimentais. Assim, estudos observacionais
so tipicamente empregados quando por alguma razo um estudo experi-
mental no possvel, ou por questes ticas ou pela prpria factibilidade
do estudo. Assim, nos estudos observacionais, para compensar a inseguran-
a quanto comparabilidade dos grupos devida falta de controle sobre o
mecanismo de designao de tratamentos, o investigador deve se armar
com uma teoria estatstica pertinente. Essa teoria deve compreender, por-
tanto, uma estrutura e um conjunto de ferramentas que forneam medidas
que considerem as evidncias do estudo.
Procedimentos de ajustamento comumente utilizados tais como
pareamento e estratificao, que procuram viabilizar a hiptese de
homogeneidade de unidades e que podem, por exemplo, ser operacionalizados
pelo escore de propenso, no garantem que os grupos tratado e controle
sejam comparveis sob todos os aspectos relevantes. Por exemplo, o
pareamento garante que os dois grupos so comparveis apenas quanto a
algumas caractersticas previamente definidas. Se os grupos no so compa-
rveis antes da exposio aos tratamentos em razo de algum aspecto no
considerado no pareamento, ento uma eventual diferena na resposta ob-
servada pode ser apenas um reflexo dessa diferena inicial. O problema de
fato grave quando os grupos no so comparveis e os dados disponveis
no so suficientes ou fracassam na tentativa de revelar esse fato. Tcnicas
90
especficas, tais como a Anlise de Sensibilidade, tm sido desenvolvidas para
discutir essa questo. Se a estimativa de um efeito causal insensvel a vari-
aes plausveis em supostos valores de co-variveis no observadas, ento
uma interpretao causal se torna mais defensvel. Assim, enquanto os pro-
cedimentos de ajuste comumente utilizados podem tentar corrigir vieses j
conhecidos, os vieses ocultos, isto , aqueles que necessitam de informaes
adicionais no observadas para serem visualizados, so tratados sob a tc-
nica de Anlise de Sensibilidade (Rosembaun, 1995).
Entre os diversos desenhos observacionais, um estudo de coorte ocu-
pa uma posio privilegiada, sobretudo porque qualquer medida de risco
pode ser obtida diretamente. Entretanto, a falta de controle do mecanismo de
designao pode inviabilizar uma concluso causal se no houver uma pre-
ocupao especfica com os diversos vieses possveis. No exemplo do uso de
cafena como fator causal para doena cardiovascular, viu-se que estimati-
vas no ajustadas para uma medida de efeito pertinente deve ser confundi-
da por muitas variveis, tal como tabagismo, e deve tambm apresentar falta
de validade de seguimento. Desse modo, o nmero de variveis que deveri-
am ser controladas muito grande para que um controle adequado fosse
feito por estratificao. Assim, dado que a verdadeira dependncia funcio-
nal dos riscos de doena cardiovascular para uso de cafena e eventuais
variveis confundidoras desconhecida, as estimativas obtidas por modelos
multivariados provavelmente tambm estariam viesadas. E, mesmo que esse
vis no fosse importante, as estimativas ainda permaneceriam confundidas
em virtude da incapacidade de se medir acuradamente todas as variveis
envolvidas. Dado esse exemplo, no qual se constata que em um estudo de
coorte devem existir diversas fontes de vieses de magnitudes desconhecidas e
direes diferentes, qualquer concluso de causalidade deve ser vista com
muita cautela. No entanto, os elementos essenciais que constituem o Modelo
de Rubin so facilmente identificados em um estudo de coorte. O desafio
91
seria, portanto, a identificao de um mecanismo ignorvel, de um mecanis-
mo que fosse dependente apenas dos dados observados. Essa no obvia-
mente uma tarefa simples, pois pressupe necessariamente o estabelecimen-
to de hipteses adjacentes. E na possibilidade de tais hipteses no serem
passveis de testes luz dos dados observados, qualquer concluso de causa-
lidade deve vir acompanhada explicitamente da crena de que so vlidas.
A situao particularmente mais desfavorvel quando o investigador
est posicionado cronologicamente aps a ocorrncia da doena (Figura 2),
quando a investigao causal desenvolvida com base em um estudo de
caso-controle ou de um estudo de coorte-retrospectivo. Assim, apesar da
boa aderncia dos estudos de coortes s condies do Modelo de Rubin,
principalmente devido forma de observao, isto , buscando-se o efeito de
causas postuladas e no as causas do efeito observado, as dificuldades prti-
cas desses estudos tm estimulado um desenvolvimento terico de desenhos
de estudo retrospectivos, particularmente os estudos de caso-controle.
A caracterstica bsica que distingue um estudo de caso-controle que a
seleo das unidades intencionalmente baseada na resposta dos indivduos.
Um grande complicador desse desenho o fato de que a obteno de medidas de
efeito que estejam associadas explicitamente noo de risco no imediata, e
depende da possibilidade de incluso ou no dos casos no grupo dos controles
selecionados. Alis, a constituio de um grupo controle adequado , sem d-
vida, o grande desafio dos estudos e tem ocupado grande parte do tempo dos
autores preocupados com tal questo. Segundo Greenland (1991), se os indi-
vduos que se tornam casos no perodo de risco considerado so inelegveis
para incluso no grupo controle, como nos tradicionais desenhos de caso-
controle, a hiptese de raridade da doena em questo ser necessria para se
estimarem riscos relativos com base em dados. Se, entretanto, tal como nos
novos desenhos de caso-controle, esses indivduos, mesmo sendo casos, so ele-
gveis para o grupo controle, ento a hiptese de raridade pode ser dispensada.
92
As limitaes do mtodo caso-controle so bem conhecidas. Falta de
validade devido a vis de seleo, mais freqentemente causado por nveis
altos de recusa participao no estudo, gerando controles no representa-
tivos da populao sob risco; erros de mensurao, particularmente devido
a diferentes vieses de recordao entre casos e controles; e confundimento, a
sempre presente possibilidade de que a associao encontrada resultado de
variveis escondidas que falseiam uma associao causal, constituem as
principais fragilidades desse estudo (Breslow, 1996). Entre suas vantagens,
destacam-se as redues tanto no tempo quanto no nmero de indivduos
necessrios para atingir o mesmo poder estatstico que se atingiria em um
estudo de coorte. Desse modo, adicionalmente s quatro condies de vali-
dade j apresentadas, deve-se acrescentar a condio de validade de seleo,
tanto de casos quanto de controles. Haver validade de seleo de casos
quando o nmero de casos estudados provavelmente menor que a popula-
o de casos, por alguma razo tal como a incapacidade de registrar todos ,
que tenham ocorrido durante certo perodo, fornea estimativas no viesadas
das prevalncias, para a populao de casos, das diferentes causas (nveis de
exposio) consideradas. Validade de seleo de controles acontece sob a
mesma lgica, substituindo casos por controles.
Com relao a procedimentos de ajuste, uma importante caractersti-
ca distingue os estudos de caso-controle e os de coorte. Nos estudos de coorte,
pareamento refere-se seleo das subcoortes de exposio, de modo a se
forar distribuies semelhantes entre as subcoortes para os fatores utiliza-
dos no pareamento. Esse procedimento deve prevenir confundimento para
as variveis envolvidas no pareamento, a menos que haja outra questo tal
como uma falta de validade de seguimento relacionada a alguma varivel
do pareamento. Nos estudos de caso-controle, pareamento refere-se sele-
o de indivduos de maneira a forar que as distribuies dos fatores
considerados entre casos e controles sejam similares. Entretanto, sob esse
93
desenho, pareamento no previne confundimento. De fato, sabido que um
estudo de caso-controle pareado produz vis de seleo que pode ser, toda-
via, controlado pelo fator de pareamento. Um exemplo simples, presente em
Greenland (1991), pode ser til para esclarecer. Considere uma populao
sob risco, metade homem, em que os homens tendem a beber menos caf que
as mulheres e cerca de 75% dos casos de uma certa doena de homens.
Uma seleo de controles no viesada deveria ser constituda de 50% de
homens. Se, entretanto, faz-se um pareamento dos controles aos casos pela
varivel sexo, cerca de 75% dos controles seriam constitudos de homens. E,
visto que homens bebem menos caf e seriam majoritrios no grupo contro-
le, a freqncia de usurios de cafena estaria diminuda no grupo controle,
subestimando a verdadeira proporo de usurios de cafena na populao
sob risco. Como resultado, uma medida de efeito no ajustada seria superes-
timada. No entanto, as prevalncias de usurios de cafena no grupo controle
especficas por sexo no so alteradas pelo pareamento. Logo, o vis de seleo
poderia ser removido pelo ajustamento para a prpria varivel utilizada no
pareamento. A concluso que pareamento pode exigir controle na anlise
para a varivel utilizada no pareamento. Existe vasta literatura que discute os
mritos desse procedimento; entre eles, a eventual reduo na varincia dos
estimadores ajustados considerado o principal. Assim, a fim de evitar um
aumento no nmero de variveis a serem controladas, o pareamento, quando
indicado, deveria ser limitado apenas s variveis que de fato fossem necess-
rias. Entretanto, a utilizao j discutida do escore de propenso como instru-
mento para a construo de pares poderia ser uma excelente alternativa.
Do ponto de vista do Modelo de Rubin, a varivel resposta para um
estudo de caso-controle a varivel dicotmica que indica se a unidade
um caso ou um controle, isto ,
Y
S
=

1, caso a unidade seja um caso

0, caso a unidade seja um controle.
94
E agora, diferentemente da situao ideal, deve-se buscar a causa desse
efeito j observado. Nesse tipo de desenho, os parmetros associados so as pro-
pores populacionais (ou probabilidades), entre casos e controles, de indivdu-
os com e sem a exposio de interesse, tal como representadas na Tabela 7.
Como visto, os parmetros de interesse em um estudo de causalidade
so E( ) Y
t
e E( ) Y
c
, que, quando se trata de variveis dicotmicas, podem
ser escritos como Pr( ) Y
t
= 1 e Pr( ) Y
c
= 1 . Logo, as probabilidades retros-
pectivas da Tabela 7, genericamente dadas por Pr( ) S k Y y
S
= = | , no
apresentam nenhuma interpretao causal, pois sequer se referem ao even-
to correto. Entretanto, fazendo-se uso do teorema de Bayes, pode-se escrever
mas, Pr( ) Pr( ) Y y S k Y y S k
S k
= = = = = | | e
Pr( ) Pr( )Pr( ) S k S k Y y Y y
S S
y
= = = = =
| . Logo, ,
Pr( )
Pr( )Pr( )
Pr( )Pr( )
Y y S k
S k Y y Y y
S k Y y Y y
k
S S
S S
y
= = =
= = =
= = =
|
|
|
.
Tabela 7 Probabilidades populacionais retrospectivas
Tratamentos Resposta (Y
S
)
ou causas Casos (Y
S
=1) Controles (Y
S
=0)
S = t Pr(S=t | Y
S
=1) Pr(S=t | Y
S
=0)
S = c Pr(S=c | Y
S
=1) Pr(S=c | Y
S
=0)
TOTAL 1 1
As probabilidades Pr( ) Y y S k
k
= = | so ditas prospectivas por-
que os eventos condicionantes acontecem em algum tempo antes do evento
de interesse. E so aquelas passveis de ser obtidas diretamente por meio de
estudos prospectivos, experimentais ou de coorte. A Tabela 8 ilustra essas
probabilidades. A expresso anterior revela que as probabilidades prospectivas
Pr( ) Pr( )
Pr( )
Pr( )
Y y S k S k Y y
Y y
S k
S S
S
= = = = =
=
=
| |
,
95
podem ser determinadas com base nas probabilidades retrospectivas e nas
propores de casos e controles da populao.
Com base nos parmetros E( ) Y
t
=Pr( ) Y
t
= 1 e E( ) Y
c
=Pr( ) Y
c
= 1 ,
viu-se que foi construda a medida de efeito causal conhecida como risco
atribuvel, definida como a diferena entre esses dois parmetros. Entretan-
to, outras medidas de efeito de interesse podem ser definidas. O risco relativo,
definido como
e o odds ratio, cuja expresso correspondente
so largamente utilizados na literatura epidemiolgica.
Tabela 8 Probabilidades populacionais prospectivas
Tratamentos Resposta (Y) TOTAL
ou causas Casos (Y=1) Controles (Y=0)
S = t Pr(Y
t
=1 | S=t ) Pr(Y
t
=0 | S=t ) 1
S = c Pr(Y
c
=1 | S=c ) Pr(Y
c
=0 | S=c ) 1
Dentro de um estudo caso-controle tradicional em que a hiptese de
raridade da doena no parea razovel, a idia de risco fica comprometi-
da. Nesse caso, o parmetro causal de interesse se limita ao odds ratio, que,
com base na Tabela 7, pode ser estimado por
Para verificar se essa medida pode ter uma interpretao causal, bas-
ta observar que ela se iguala que seria obtida prospectivamente. Aplican-
do-se o teorema de Bayes s probabilidades que constituem
OR
r
.
e obser-
vando-se, como antes, que
RR
Y
Y
t
c
=
=
=
Pr( )
Pr( )
1
1
OR
Y
Y
Y
Y
t
t
c
c
=
=
=
=
=
Pr( )
Pr( )
Pr( )
Pr( )
1
0
1
0
OR
S t Y
S c Y
S t Y
S c Y
r
S
S
S
S
.
=
= =
= =
= =
= =
Pr( )
Pr( )
Pr( )
Pr( )
|
|
|
|
1
1
0
0
,
96
Pr( ) Pr( ) Y y S k Y y S k
S k
= = = = = | | ,
chega-se mesma expresso para o odds ratio, que pode ser obtida com base
na Tabela 8, dada por
Apesar disso, ainda no possvel dizer se um particular estudo de
caso-controle gozaria de uma interpretao causal. A expresso acima est
para OR assim como
est para
Logo, sem uma informao adicional no se pode falar sobre causali-
dade. No caso de
T
, viu-se que sob randomizao o problema estaria resol-
vido. Entretanto, um estudo de caso-controle nunca randomizado. Assim,
a alternativa consiste na observao de um conjunto de co-variveis X e na
busca de um modelo para o mecanismo de designao que seja ignorvel, de
modo que, condicionalmente a X, S e Y, sejam independentes.
Nossa finalidade, aqui, foi tentar inserir os desenhos tradicional-
mente utilizados na pesquisa epidemiolgica para atribuio de causa
lgica de causalidade presente no Modelo de Rubin. Se, em um nvel mais
geral, os estudos experimentais se contrapem aos estudos observacionais
pelo controle que o investigador possui sobre o mecanismo de designao
de tratamentos, especificamente nos estudos observacionais, h tambm
uma contraposio, porm muito menos significativa, dada pelos estudos
de caso-controle e de coorte que se refere noo apresentada de timing de
observao. Assim, para o estabelecimento das condies de validade devido
a Greenland (1991), essas questes foram consideradas, e, sob este aspecto,
os estudos de coorte-retrospectivo se alinham aos estudos de caso-controle.
OR
Y S t
Y S t
Y S c
Y S c
OR
p
t
t
c
c
r
. .
=
= =
= =
= =
= =
=
Pr( )
Pr( )
Pr( )
Pr( )
1
0
1
0
|
|
|
|
( | ) ( | ) Pr( ) Pr( ) T Y S t Y S c Y S t Y S c
t c t c
= = = = = = = = E E | | 1 1
T Y Y Y Y
t c t c
= = = = E E ( ) ( ) Pr( ) Pr( ) 1 1
97
Concluso
Com base nas questes aqui apresentadas e discutidas, pode-se de
forma sucinta tecer algumas consideraes finais sobre a contribuio da
estatstica no processo de inferir causalidade, particularmente em
epidemiologia, por meio da noo de causa contida no modelo de respostas
potenciais devido a Rubin.
Dado que inferncia causal e inferncia estatstica no se referem
estritamente ao mesmo objeto, o primeiro ponto a ser considerado diz res-
peito participao da estatstica na discusso sobre causalidade. A partir
dos trabalhos de Rubin, Holland e Dempster, entre os principais, no restam
dvidas quanto relevncia dos princpios estatsticos para inferncia cau-
sal. Uma reflexo mais cuidadosa deve nos levar a concluir que no existi-
am dvidas quanto a essa questo. Havia, sim, apenas um distanciamento,
provavelmente em virtude de maior concentrao na soluo dos proble-
mas mais caractersticos da estatstica, ou seja, dos problemas associados
idia de preciso ou modelagem. A questo da validade ficava a cargo da
rea de interesse, sendo o principal interesse em epidemiologia o julgamento
da validade de hipteses causais.
Outro sinal da importncia da estatstica em se preocupar tambm
com o problema da causalidade pode ser extrado do comentrio de Cox
(1986) de que as questes surgidas explcita e implicitamente pelo artigo de
Holland (1986) parecem ser mais importantes para os fundamentos da es-
98
tatstica do que a discusso sobre a natureza da probabilidade. Assim, a
formulao de um modelo estatstico para avaliao de causalidade no s
amplia o campo de atuao da estatstica, mas tambm outorga a ela o
direito a uma co-participao no assunto principal identificao de cau-
sas postuladas , e no apenas, como outrora, um papel coadjuvante, de
apoio s questes ligadas ao julgamento do acaso como explicao para os
resultados. Gail (1996) parece respaldar essa concluso ao afirmar que um
estatstico que no esteja devidamente familiarizado com os princpios e as
ferramentas estatsticas, que no conhea o mtodo cientfico e que no
visualize as vantagens e limitaes tanto dos estudos experimentais quanto
dos observacionais estar mal equipado para contribuir efetivamente para
a soluo de problemas complexos.
Ao mesmo tempo que a estatstica reserva seu lugar na discusso de
causa, tambm apresenta algumas condies que limitam sua participao
em tal debate. Assim, uma definio epistemolgica de causa no parece
atrair o interesse da estatstica. Epistemologia se refere teoria da cincia,
diferentemente da estatstica, que se relaciona tecnologia da cincia (Pe-
reira, 1986). Entretanto, fazem-se necessrios alguns conceitos, de modo a
se viabilizar a identificao de causas. Com base na discusso apresentada,
uma causa (ou tratamento) entendida como qualquer estmulo ou con-
junto de estmulos que conduza a uma resposta observvel. E pode-se en-
tender efeito causal como uma quantidade cuja variao em relao cau-
sa alternativa (no exposio, por exemplo) deve ser atribuda causa pos-
tulada (exposio). Desse modo, para fins de discusso sobre causalidade
sob uma tica estatstica, substitui-se o conceito diverso de causa pelo con-
ceito restrito de efeito causal, o qual parece ser mais apropriado em um
contexto epidemiolgico de acordo com a definio de causa de Rothman &
Greenland (1998). E assim, complementando o que seja uma noo vivel
de causa dentro de uma perspectiva estatstica, um atributo pessoal no
99
deve ser visto como uma causa. Isso no significa que um particular atribu-
to no tenha um valor preditor, j que predio simplesmente uma conse-
qncia de associao entre variveis, que por sua vez no necessariamente
envolve a noo de causa. Por sua vez, Granger (1969) formula sua noo
de causa presente em modelos economtricos em torno da idia de predio.
Segundo ele, uma causa deve aumentar em um sentido probabilstico a ha-
bilidade de predizer o efeito.
Sobre a condio de que o caminho para se atribuir causalidade pas-
sa pela mensurao dos efeitos de causas postuladas e no pela busca da
causa de um efeito observado, deve ser dito que tal limitao, apesar de
revolucionria, no nova e nem originariamente prpria estatstica.
Conta-se que Albert Einstein, quando professor da Politcnica de Zurique,
causou verdadeiro escndalo entre seus colegas ao afirmar que o princpio
bsico de toda a cincia superior era priori-dedutivo e no posteriori-
indutivo. Em outras palavras, o homem deve focalizar a causa e da partir
para os efeitos (Rohden, 1979). Nesse momento surgia ento a magna per-
gunta: como atingir a causa, a no ser pelos efeitos? Talvez o Modelo de
Rubin, com todas as suas limitaes e propriedades explicitadas, seja uma
possvel resposta.
Cox (1992), apesar de reconhecer que a abordagem de causalidade
contida no Modelo de Rubin com sua nfase intervencionista representa
uma noo mais especfica de causa, aponta algumas limitaes. A ausncia
explcita do entendimento do processo de causa adjacente aos dados envol-
vidos, isto , o entendimento do mecanismo causal, para ele uma sria
limitao, j que este parece ser um importante aspecto da noo cientfica
geral de causalidade. Um outro ponto levantado o fato de que o modelo
no torna claro o que est sendo mantido constante quando se varia hipo-
teticamente o agente causal. Em um ensaio clnico randomizado a an-
lise comumente desenvolvida, conhecida como intention to treat , avalia o
100
efeito de um tratamento comparado com outro onde a designao para o
tratamento seguida mesmo sob a possibilidade de outras variaes, even-
tualmente presentes, que so permitidas pelo prprio desenho experimental.
Por exemplo, se uma medicao suplementar no controlada e muito
diferente entre os grupos sob os tratamentos considerados, ento o efeito de
um tratamento deveria incluir as conseqncias da medicao suplementar
associada. Outro exemplo muito comum se refere perfeita aderncia de pa-
cientes a uma teraputica empregada. Normalmente os pacientes no seguem
corretamente a posologia indicada. Este problema conhecido como
compliance. Assim, aquilo que se admite ser possivelmente diferente quando
se modifica a designao ao tratamento crucial para a interpretao de
causalidade. Essas questes tm sido discutidas em um contexto epidemiolgico
(Lee et al., 1991; Imbens & Rubin, 1994; Efron & Feldman, 1991).
Um mecanismo causal uma teoria cientfica que procura descrever
os diversos processos biolgicos, qumicos, fsicos e sociais pelos quais o tra-
tamento produz seus efeitos. A complexidade por trs de um mecanismo
causal parece bem representada pela mxima de Fisher quando argido
sobre o que poderia ser feito em estudos observacionais para elucidar o
caminho que separa associao de causalidade: Faa sua teoria elaborada
(apud Cochran, 1965). A elaborao a que Fisher faz aluso foi interpreta-
da como a considerao, tanto quanto possvel, de todas as conseqncias de
uma hiptese causal estabelecida e como o planejamento detalhado de estu-
dos para verificao de tais conseqncias. Entretanto, essa elaborao pode
eventualmente ser simplificada pela construo de hipteses causais mais
especficas, de modo que as conseqncias dessas hipteses possam ser con-
sideradas e medidas. A mxima de Fisher parafraseada por Rosembaun
(1984), ao dizer que quando se estimam efeitos causais com base em um
estudo observacional, importante que se detalhe o mecanismo causal tanto
quanto o conhecimento cientfico vigente permita, verificando-se se os da-
101
dos do estudo em questo contradizem tal mecanismo. No entanto, deve-se
observar que em experimentos randomizados efeitos causais podem ser esti-
mados sem a especificao de um mecanismo causal. A necessidade de um
mecanismo causal adjacente assume importncia diferenciada em estudos
observacionais e experimentais, principalmente porque, em experimentos
randomizados, sabe-se que o mecanismo de designao de tratamentos for-
temente ignorvel, enquanto em estudos observacionais esse mecanismo apenas
uma hiptese. Para Rosembaun (1984), um mecanismo causal em conjunto
com um mecanismo de designao fortemente ignorvel freqentemente apre-
senta conseqncias testveis. Diante desses pontos, pode-se concluir que a
presena de um mecanismo causal adjacente ajuda na investigao de um
dado fator causal. Entretanto, sua ausncia no parece ser um impedimento.
A formulao do Modelo de Rubin , sem dvida, bastante elegante.
Estudar causalidade com base na idia de respostas potenciais torna bem
clara a noo do que seja um efeito causal e, conseqentemente, viabiliza a
utilizao do instrumental estatstico para sua avaliao. claro que diver-
sas condies precisam ser satisfeitas para que a formulao do modelo
represente adequadamente a complexidade dos problemas reais. Quanto a
sua estruturao, viu-se que a hiptese de estabilidade (ou hiptese de valor
estvel unidade-tratamento) era fundamental, apesar de ser possvel estu-
dar causalidade quando esta hiptese no for vlida. Em epidemiologia, essa
situao bastante comum, devido existncia de doenas contagiosas em
que a exposio infeco (ou contgio) assume um papel-chave. Sob esse
aspecto, Halloran & Struchiner (1995) concluem que a relao entre expo-
sio infeco, efeitos indiretos, confundimento e mecanismo de designa-
o precisa de mais ateno. Nveis de exposio infeco diferentes assu-
mem funo diferente quando se avaliam efeitos diretos e indiretos de um
programa de interveno, tal como vacinao. Quando se avaliam os efeitos
diretos da vacinao sobre a suscetibilidade numa situao em que a expo-
102
sio infeco no a mesma entre os dois grupos (vacinado e no-vaci-
nado), ento a estimativa do efeito causal estar viesada.
A hiptese fundamental que permite inferncias causais que o vetor
de respostas ( , ) Y Y
t c
seja independente do mecanismo de designao. Sob
randomizao, viu-se que essa hiptese deveria ser satisfeita. Entretanto,
diante de estudos observacionais apela-se para a observao de co-vari-
veis e para a hiptese de independncia condicional, isto ,
( , ) Y Y S X
t c
| .
Como visto, um mecanismo que satisfaa a essa condio baseia-se
na idia de ignorabilidade e deve gerar estimativas condicionalmente no
viesadas para o efeito causal de interesse. claro que a especificao de um
mecanismo diferente de randomizao que satisfaa condio acima no
deve ser trivial. Entretanto, estabelecido um mecanismo, os recursos que a
estatstica tradicionalmente utiliza para fazer inferncias podem ser direta-
mente transferidos para o processo de inferncia causal. Em particular, a
abordagem bayesiana tem-se destacado no desenvolvimento de procedimentos
e de teorias especificamente voltadas para a questo causal (Rubin, 1978;
Schaffner, 1993; Gelman et al., 1995).
De forma bem genrica, pode-se dizer que se a estrutura representa-
tiva de causalidade presente no Modelo de Rubin apropriada ou no, de-
pende de uma identificao adequada dos elementos que a constituem. As-
sim, usualmente fcil identificar as unidades (U ), os tratamentos (K ) e uma
varivel resposta (Y ) em estudos experimentais randomizados, pois nessa
situao tudo est sob o controle do investigador e so estabelecidos a priori.
Entretanto, estudos observacionais complexos freqentemente proporcionam
casos em que mesmo analistas experientes podem discordar sobre como iden-
tificar apropriadamente os elementos do modelo (Holland, 1986).
Entre as abordagens de que a epidemiologia tradicionalmente se tem
utilizado para discutir causalidade, a mais objetiva parece ser aquela que se
103
baseia nos critrios estabelecidos por Hill (1965). A abordagem filosfica e o
Modelo de Rothman so de difcil operacionalizao. No entanto, apesar de os
critrios de Hill ajudarem a determinar se uma exposio fator de risco para
uma dada doena, sua aplicao tambm limitada. Como visto, apenas o
critrio de temporalidade necessrio e nenhum dos outros suficiente para
uma interpretao causal. Adeso a qualquer um deles sem demais conside-
raes poderia resultar em falsas concluses. Por exemplo, muito importante
considerar a preciso e a validade interna dos resultados de cada estudo.
Os estudos epidemiolgicos podem perfeitamente ser inseridos na l-
gica de causalidade devida a Rubin. Um ensaio clnico, por j ser randomizado,
tem uma insero imediata. Os estudos observacionais necessitariam da
especificao de um mecanismo de designao de tratamentos que resgatas-
se (ou inferisse) a condio de exposio que cada indivduo j possua no
momento do incio do estudo. nesse ponto que as contribuies da
epidemiologia e da estatstica devem se combinar para constituir uma an-
lise mais abrangente e se aproximar mais da difcil tarefa que o estabeleci-
mento de causa. Se de um lado a estatstica pode contribuir com o Modelo de
Rubin, mtodos de inferncia ou modelagem, a epidemiologia pode contri-
buir com a fundamental discusso de validade das estimativas. Nesse senti-
do, a classificao de validade devida a Greenland (1991), apesar de ainda
no formalizada, no s estende a discusso de vis tradicionalmente conti-
da nos estudos epidemiolgicos por meio da trade confundimento, vis de
informao e vis de seleo, como tambm permite uma visualizao mais
adequada das limitaes do Modelo de Rubin. Como visto, esse modelo
fortemente dependente do estabelecimento de um mecanismo de designao
de tratamentos. Logo, uma especificao no apropriada para esse mecanis-
mo implicaria falta de validade de especificao e, conseqentemente, uma
possvel interpretao de causa ficaria comprometida. Por outro lado, j foi
dito que um mecanismo de designao incorreto estaria relacionado a
104
confundimento, ou seja, falta de validade de comparao. Na realidade, de
acordo com os conceitos contidos na classificao de Greenland, o que acon-
tece de fato, uma falta de validade de especificao. Uma eventual confu-
so pode surgir porque qualquer violao das hipteses adjacentes, tanto
por erro de especificao quanto por erro de mensurao ou mesmo por
falta de validade de seguimento, implica impossibilidade de comparao
imediata entre os grupos sob os tratamentos considerados.
H confundimento, isto , falta validade de comparao, sempre que
existir diferena entre os riscos de doena entre os grupos sob comparao,
independentemente do fator causal em questo. Em outras palavras, haver
confundimento sempre que o grupo de indivduos no expostos no repre-
sentar o que aconteceria com os indivduos expostos, caso eles no tivessem
sido expostos. Planejar um estudo real em que tal conceito possa ser opera-
cionalizado no parece ser tarefa simples. Entretanto, pode-se depositar uma
razovel credibilidade nessa hiptese se o mecanismo randomizado, j que
sob esta condio espera-se que as distribuies de eventuais variveis
confundidoras no sejam muito diferentes nos dois grupos de exposio. E,
como j dito aqui, a probabilidade de confundimento grave pode ser feita
to pequena quanto necessria aumentando-se o tamanho dos grupos
randomizados. Alm disso, sob randomizao, qualquer eventual con-
fundimento que ainda persista aps ajustamentos adequados ser conside-
rado pelo erro padro da estimativa, dado que a especificao do modelo
estatstico utilizado para computar o efeito estimado e seu erro padro este-
ja correta (Greenland, 1991).
Assim, atribuio de causa dependente do estabelecimento de hip-
teses que, de acordo com o estudo em questo, podem ser ou no plausveis.
As hipteses de causa transiente, estabilidade temporal, independncia,
homogeneidade de unidades, efeito constante e valor estvel unidade-trata-
mento aqui discutidas, combinadas ou no, constituem as premissas neces-
105
srias para se estabelecer um modelo terico de causalidade. Acrescente-se
a elas ainda as questes relativas operacionalidade peculiar a cada estudo,
tais como vis de informao, vis de seleo, erros de mensurao, dados
censurados e erros na especificao do modelo probabilstico de estimao,
cuja considerao fundamental para o estudo de causa. No caso de doenas
contagiosas, exigem-se hipteses especificamente sobre a exposio infeco.
A validade de uma atribuio de causa , portanto, dependente de todas essas
condies, com a agravante de em muitas situaes no ser possvel coloc-las
prova. Sendo assim, o modelo estatstico de causalidade devido a Rubin no
deve ser visto como a panacia da questo causal. Tal como a abordagem
filosfica, ou os critrios estabelecidos por Hill ou ainda o modelo de causas
componente/suficiente de Rothman, o Modelo de Rubin apresenta condi-
cionantes que muitas vezes no permitem uma atribuio segura de causa
para determinado fator. Sua contribuio sem o devido acompanhamento
desses condicionantes, apresentados explicitamente, de pouca valia.
Paralelamente, na atualidade tm sido sugeridas outras abordagens
de causalidade, tal como os diagramas causais (Pearl, 1995), ou a incorpo-
rao de novos elementos ao Modelo de Rubin, tal como o de variveis
instrumentais (Angrist et al., 1996). Discute-se, ainda, a unio da estrutura
de causalidade devida a Rubin s abordagens filosfica e de modelos causais
grficos (Schaffner, 1993).
Concluindo, o julgamento final sobre os efeitos causais de um trata-
mento freqentemente depender do acmulo de evidncias obtidas por meio
de uma srie de estudos. A contribuio de cada estudo depende da capacidade
do investigador, ao interpretar os resultados de um estudo que mostre uma
associao consistente com uma hiptese causal, de listar e discutir todas as
explicaes alternativas, incluindo hipteses diferentes ou possveis vieses.
107
Referncias Bibliogrficas
ANGRIST, J. D.; IMBENS, G. W. & RUBIN, D. B. Identification of causal effects using
instrumental variables. Journal of the American Statistical Association,
91:444-472, 1996.
BRESLOW, N. E. Statistics in epidemiology: the case-control study. Journal of
the American Statistical Association, 91:14-28, 1996.
COCHRAN, W. G. The planning of observational studies of human populations.
Journal of the Royal Statistical Society, series A, 128:234-265, 1965.
COX, D. R. Planning of Experiments. Nova York: John Wiley & Sons, 1958.
COX, D. R. Comment on statistics and causal inference. Journal of the
American Statistical Association, 81:963-964, 1986.
COX, D. R. Causality: some statistical aspects. Journal of the Royal Statistical
Society, series A, 155:291-301, 1992.
DAGOSTINO JR., R. B. Propensity score methods for bias reduction in the
comparison of a treatment to a non-randomized control group. Statistics
in Medicine, 17(19):2265-2282, 1998.
DAWID, A. P. Causal inference without counterfactuals (with discussion).
Journal of the American Statistical Association, 95:407-448, 2000.
DEMPSTER, A. P. Causality and statistics. Journal of Statistical Planning and
Inference, 25:261-278, 1990.
EFRON, B. & FELDMAN, D. Compliance as an explanatory variable. Journal of
the American Statistical Association, 86:9-17, 1991.
EVANS, A. S. Causation and disease: a chronological journey. American Journal
of Epidemiology, 108(4):249-258, 1978.
GAIL, M. H. Adjusting for covariates that have the same distribution in
exposed and unexposed cohorts. In: MOOLGAVKAR, S. H. & PRENTICE, R. L.
108
(Eds.) Modern Statistical Methods in Chronic Disease Epidemiology.
Nova York: Wiley, 1986.
GAIL, M. H. Statistics in action. Journal of the American Statistical Association,
91:1-13, 1996.
GELMAN, A. et al. Bayesian Data Analysis. Londres: Chapman & Hall, 1995.
GRANGER, C. W. J. Investigating causal relations by econometric models and
cross-spectral methods. Econometrica, 37:424-438, 1969.
GREENLAND, S. Limitations of the logistic analysis of epidemiologic Data.
American Journal of Epidemiology, 110(6):693-698, 1979.
GREENLAND, S. Reader reactions: confounding in epidemiologic studies.
Biometrics, 45:1309-1310, 1989a.
GREENLAND, S. Commentary: modeling and variable selection in epidemiologic
analysis. American Journal of Public Health, 79(3):340-349, 1989b.
GREENLAND, S. Randomization, statistics and causal inference. Epidemiology,
1(6):421-429, 1990.
GREENLAND, S. Concepts of validity in epidemiological research. In: HOLLAND, W.
W., DETELS, R. & KNOX, G. (Eds.) Oxford Textbook of Public Health. 2.ed.
Methods of Public Health. Nova York: Oxford University Press, 1991. v.2.
GREENLAND, S. Invited commentary on causes. American Journal of
Epidemiology, 141(2):89, 1995.
GREENLAND, S. Causal Analysis in the health sciences. Journal of the American
Statistical Association, 95:286-289, 2000.
GREENLAND, S. & ROBINS, J. M. Identifiability, exchangeability, and epidemiological
Confounding. International Journal of Epidemiolgy, 15(3):413-419, 1986.
GREENLAND, S., ROBINS, J. M. & PEARL, J. Confounding and collapsibility in causal
inference. Statistical Science, 14(1):29-46, 1999.
HALLORAN, M. E. & STRUCHINER, C. J. Causal inference in infectious diseases.
Epidemiology, 6:142-151, 1995.
HENNEKENS, C. H. & BURING, J. E. Epidemiology in Medicine. Boston: Little, Brown
and Company, 1987.
HILL, A. B. The environment and disease: association or causation? Proceeding
of the Royal Society of Medicine, 58:295-300, 1965.
HOLLAND, P. W. Statistics and causal inference. Journal of the American
Statistical Association, 81:945-970, 1986.
109
HOLLAND, P. W. Reader reactions: confounding in epidemiologic studies.
Biometrics, 45:1310-1316, 1989.
HOLLAND, P. W. & RUBIN, D. B. Causal inference in retrospective studies.
Evaluation Review, 12(3):203-231, 1988.
IMBENS, G. W. & RUBIN, D. B. Bayesian Inference for Causal Effects in
Randomized Experiments with Noncompliance. Boston: Harvard
University, Depto. of Economics, 1994.
KEMPTHORNE, O. Logical, epistemological and statistical aspects of nature-nurture
data interpretation. Biometrics, 34:1-23, 1978.
KLEINBAUM, D. G.; KUPPER, L. L. & MORGENSTERN, H. Epidemiologic Research: principles
and quantitative methods. Nova York: Van Nostrand Reinhold, 1982.
LEE, Y. J. et al. Analysis of clinical trials by treatment actually received: is it
really an option? Statistics in Medicine, 10:1595-1605, 1991.
LITTLE, R. J. & RUBIN, D. B. Causal effects in clinical and epidemiological studies
via potencial outcomes: concepts and analytical approaches. Annual
Review of Public Health, 21:121-145, 2000.
MIGON, H. S. & GAMERMAN, D. Statistical Inference: an integrated approach.
Londres: Arnold, 1999.
PEARL, J. Causal diagrams for empirical research. Biometrika, 82(4):669-
710, 1995.
PEREIRA, B. B. Estatstica: a tecnologia da cincia. Rio de Janeiro: Instituto de
Matemtica da UFRJ, 1986. (Estudos e Comunicaes, 27).
ROBINS, J. & GREENLAND, S. The role of model selection in causal inference from
nonexperimental data. American Journal of Epidemiology, 123(3):392-
402, 1986.
ROHDEN, H. Einstein: o enigma da matemtica. 3.ed. So Paulo: Alvorada,
1979.
ROSENBAUM, P. R. From association to causation in observation studies: the
role of tests of strongly ignorable treatment assignment. Journal of the
American Statistical Association, 79:41-48, 1984.
ROSENBAUM, P. R. Coherence in observational studies. Biometrics, 50(2):368-
374, 1994.
ROSENBAUM, P. R. Observational Studies. Nova York: Springer-Verlag, 1995.
(Springer Series in Statistics).
110
ROSENBAUM, P. R. & RUBIN, D. B. the central role of the propensity score in
observational studies for causal effects. Biometrika, 70(1):41-55, 1983.
ROSEMBAUN, P. R. & RUBIN, D. B. Comment: estimating the effects caused by
treatments. Journal of the American Association, 79:26-28, 1984.
ROTHMAN, K. J. Causes. American Journal of Epidemiology, 104(6):587-592,
1976.
ROTHMAN, K. J. Causal Inference. Chestnut Hill, MA: Epidemiology Resources Inc.,
1988.
ROTHMAN, K. J. & GREENLAND, S. Modern Epidemiology. 2.ed. Filadlfia: Lippincott
Williams & Wilkins, 1998.
RUBIN, D. B. Estimating causal effects of treatments in randomized and
nonrandomized studies. Journal of Educational Psychology, 66(5):688-
701, 1974.
RUBIN, D. B. Bayesian inference for causal effects: the role of randomization.
The Annals of Statistics, 6(1):34-58, 1978.
RUBIN, D. B. Discussion of randomization analysis of experimental data: the
Fisher Randomization Test by D. Basu. Journal of the American Statistical
Association, 75:591-593, 1980.
RUBIN, D. B. Formal modes of statistical inference for causal effects. Journal
of Statistical Planning and Inference, 25:279-292, 1990a.
RUBIN, D. B. Comment: Neyman (1923) and causal inference in experiments
and observational studies. Statistical Science, 5:472-480, 1990b.
RUBIN, D. B. Practical implications of modes of statistical inference for causal
effects and the critical role of the assignment mechanism. Biometrics,
47:1213-1234, 1991.
SCHAFFNER, K. F. Clinical trials and causation: bayesian perspectives. Statistics
in Medicine, 12:1477-1494, 1993.
SIEMIATYCKI, J. & THOMAS, D. C. Biological models and statistical interactions:
an example from multistage carcinogenesis. International Journal of
Epidemiology, 10(4):383-387, 1981.
SMITH, T. M. F. & SUGDEN, R. A. Sampling and assignment mechanisms in
experiments, surveys and observational studies. International Statistical
Review, 56(2):165-180, 1988.
111
STRUCHINER, C. J. & HALLORAN, M. E. Randomization and baseline transmission
in vaccine field trials. Rollins School of Public Health of Emory University,
Department of Biostatistics, 1996. (Technical Report, 96-97).
SUSSER, M. Judgment and causal inference: criteria in epidemiologic studies.
VANDENBROUCKE, J. P. Should we abandon statistical modeling altogether?
WAINER, H. Adjusting for differential base rates: lords paradox again.
Psychological Bulletin, 109(1):147-151, 1991.
WICKRAMARATNE, P. J. & HOLFORD, T. R. Confounding in epidemiologic studies:
the adequacy of the control group as a measure of confounding.
Biometrics, 43:751-765, 1987.
WINKELSTEIN JR., W. Invited commentary on Judgment and causal inference:
criteria in epidemiologic studies. American Journal of Epidemiology,
141(8):699-700, 1995.
YERUSHALMY, J. & PALMER, C. E. On the methodology of investigations of etiologic
factors in chronic diseases. Journal of Chronical Diseases, 10:27-40, 1959.
112
Formato: 16 x 23 cm
Tipologia: Footlight MT Light
Garamond Condensed
Papel: Plen Soft 80g/m
2
(miolo)
Carto Supremo 250g/m
2
(capa)
Fotolitos: Laser vegetal (miolo)
Engenho & Arte Editorao Grfica Ltda. (capa)
Impresso e acabamento: Millennium Print Comunicao Visual Ltda.
Rio de Janeiro, maro de 2002.
No encontrando nossos ttulos em livrarias,
contactar a EDITORA FIOCRUZ:
Av. Brasil, 4036 1
o
andar sala 112 Manguinhos
21040-361 Rio de Janeiro RJ
Tel.: (21) 3882-9039 e 3882-9041
Telefax: (21) 3882-9006 e 3882-9007
http//www.fiocruz.br/editora
e-mail: editora@fiocruz.br

INferencia Causal - Fio Cruz

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

INferencia Causal - Fio Cruz

Caricato da

Copyright:

Formati disponibili

SciELO Books / SciELO Livros / SciELO Libros

significa independncia, o mecanismo conhecido como

1, caso a unidade seja um caso

Potrebbero piacerti anche