Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Matthias Egger,lectorenmedicinasocialyepidemiologa
George DaveySmith, profesordeepidemiologaclnica
DepartamentodeAtencinPrimariayCienciasPoblacionales,EscueladeMedicinadelHospital
RoyalFree,LondresNW32PF
AndrewNPhillips,profesordeepidemiologaybioestadsticaCorrespondencia:Dr.Matthias
Egger,m.egger@bristol.ac.uk
BMJ1997;315:15337.
El meta-anlisis es un procedimiento estadstico que integra los resultados de diversos
estudios independientes que se consideran "combinables Un meta-anlisis bien realizado
permite una evaluacin ms objetiva de la evidencia que la que se obtiene con una revisin
narrativa tradicional, proporciona una estimacin ms precisa del efecto del
tratamiento y puede explicar la heterogeneidad entre los resultados de los estudios
individuales . Por otra parte, un meta-anlisis mal realizado puede estar sesgado
debido a la exclusin de estudios relevantes o a la inclusin de estudios inadecuados.
En general, los an-lisis errneos pueden evitarse si se siguen una serie de principios
bsicos. Estos principios se discuten a lo largo de este artculo, junto con las etapas
prcticas en la realizacin de un meta-anlisis.
Puntos esenciales
El meta-anlisis debera ser cuidadosamente planificado, al igual que se hace con
cualquier otro tipo de proyecto de investigacin, con un protocolo detallado escrito
con antelacin
La definicin a priori de los criterios de seleccin de los estudios que se van a incluir y
la bsqueda exhaustiva y completa de tales estudios son elementos cruciales para un
meta-anlisis de alta calidad
La presentacin grfica de los resultados de los estudios individuales en una escala
comn es un paso intermedio importante, que permite examinar visualmente el
grado de heterogeneidad que existe entre los estudios
Existen diferentes mtodos estadsticos para combinar los datos, pero no existe un
nico mtodo "correcto"
Un anlisis de sensibilidad exhaustivo es esencial para evaluar la robustez de las
estimaciones combinadas, en funcin de las diferentes asunciones y criterios de
inclusin.
Meta-anlisis Bayesiano
Algunos estadsticos piensan que otros enfoques estadsticos son ms adecuados que los
dos modelos expuestos anteriormente. Una aproximacin utiliza el teorema de Bayes, as
denominado en honor de un clrigo ingls del siglo XVIII. Los estadsticos bayesianos
expresan su creencia acerca del tamao de un efecto mediante una distribucin de probabilidades previa al conocimiento de los datos, y actualizan esa creencia calculando una distribucin de probabilidades posterior, que tiene en cuenta los datos observados. Los
modelos bayesianos pueden utilizarse tanto bajo las asunciones de efectos fijos como las
de efectos aleatorios. El intervalo de confianza (o ms correctamente, segn la terminologa
bayesiana, el intervalo de credibilidad del 95%, que cubre el 95% de la distribucin de
probabilidades posterior) a menudo ser ms amplio que el que se deriva de los modelos
convencionales, debido a que se introduce otro componente de variabilidad, la distribucin
previa. Los enfoques bayesianos son controvertidos porque la distribucin previa a menudo
est basada en opiniones y juicios subjetivos.
tados homogneos, entonces se asume que las diferencias entre los estudios son consecuencia de la variacin del muestreo y es adecuado utilizar un modelo de efectos fijos. Sin
embargo, si la prueba muestra que existe una heterogeneidad significativa entre los resultados de los estudios, entonces resulta ms apropiado utilizar un modelo de efectos aleatorios. Una limitacin importante de este enfoque es la falta de potencia de las pruebas
estadsticas de heterogeneidad, ya que a menudo no rechazan la hiptesis nula de resultados homogneos, incluso cuando existen diferencias sustanciales entre los estudios. Aunque
no existe una solucin estadstica para
este tema, Odds ratio (IC 95%)
heterogeneidad entre los resultados de
los estudios no debe considerarse slo
un problema para el propio metaanlisis, ya que tambin proporciona
una oportunidad de examinar por qu
los efectos del tratamiento difieren
segn las circunstancias. Despus de
aplicar la prueba estadstica, la
heterogeneidad
debera
intentar
explicar.
Figura1.Mortalidadtotalenlosensayoscon(3
bloqueantes para la prevencin secundaria
despusdeuninfartodemiocardio.Elcuadrado
negroylalneahorizontalcorrespondenalodds
ratioyalintervalodeconfianzadel95%decada
ensayo. El tamao de cada cuadrado N 1984 1
negroreflejaelpesodecadaensayo.Eldiamante
representaeloddsratiocombinadoyelintervalo
deconfianzadel95%,quemuestraunareduccin
del 22% en laodds de muerte (las referencias se
puedenconseguirdelosautores)
Presentacin grfica
Una manera til de presentar los
resultados de cada ensayo y sus
intervalos de confianza consiste en
hacerlo de forma grfica. La figura 1
representa un meta-anlisis'" de
ensayos con
-bloqueantes en la
prevencin secundaria despus de un
infarto de miocardio. Cada estudio se representa por un cuadrado negro y una lnea
horizontal, que corresponden a la estimacin puntual del odds ratio y a su intervalo de
confianza del 95%. Los intervalos de confianza del 95% contendran el efecto verdadero
subyacente en el 95% de las ocasiones, si el estudio se repitiera una y otra vez. La lnea
vertical continua representa la falta de efecto
Muchos clnicos probablemente decidan no tratar a los pacientes con muy bajo riesgo, dado
el gran nmero de pacientes que se tiene que exponer a los efectos adversos de los
-bloqueantes para prevenir una muerte. Valorar el nmero de pacientes que es necesario
tratar en funcin del riesgo estimado del paciente sin tratamiento y de la reduccin del riesgo relativo por el tratamiento es una ayuda en la toma de decisiones sobre pacientes individuales. Se ha publicado recientemente un nomograma que facilita el clculo, a pie de
cama, del "nmero que es necesario tratar".
El meta-anlisis de medidas absolutas del efecto, tales como la diferencia de riesgos, puede
ser til para ilustrar el rango de efectos absolutos en los diferentes estudios. Sin embargo,
la diferencia de riesgos combinada (y el "nmero que es necesario tratar" correspondiente)
estar determinada principalmente por el nmero y tamao de los ensayos en pacientes de
bajo, intermedio o alto riesgo. Por tanto, los resultados combinados sern aplicables
exclusivamente a los pacientes con niveles de riesgo equivalentes al riesgo promedio de los
ensayos incluidos. Por esto, tiene ms sentido habitualmente usar medidas relativas del
efecto para resumir la evidencia y medidas absolutas para aplicar la evidencia a una
situacin concreta, tanto clnica como de salud pblica.
-bloqueantes en la prevencin secundaria despus de un infarto de miocardioreducciones del riesgo absoluto y nmero de pacientes que es necesario tratar en un
ao para prevenir una muerte, segn diferentes niveles de mortalidad en el grupo control
RIESGODE
MORTALIDAD
ENUNAO
ENTRECONTROLES(%)
REDUCCINDEL
RIESGOABSOLUTO
0,002
500
0,006
167
0,01
100
10
0,02
50
20
0,04
25
30
0,06
17
40
0,08
13
50
0,1
10
NMEROQUEES
NECESARIOTRATAR
Los clculos asumen una reduccin constante del riesgo relativo del 20%.
Anlisis de sensibilidad
Con frecuencia existirn opiniones divergentes acerca de cul es el mtodo correcto para
llevar a cabo un meta-anlisis en concreto. Por tanto, siempre se debe examinar la robustez
de los hallazgos mediante un anlisis de sensibilidad exhaustivo que considere diferentes
asunciones. Esto se ilustra en la figura 2 para el meta-anlisis de los -bloqueantes despus
de un infarto de miocardio. En primer lugar, se calcul el efecto global mediante diferentes
mtodos estadsticos, utilizando tanto modelos de efectos fijos como de efectos aleatorios.
La figura muestra que las estimaciones combinadas son virtualmente idnticas y que los
intervalos de confianza son slo ligeramente ms amplios con el modelo de efectos
aleatorios. Esto se explica por la relativamente poca variabilidad entre los ensayos de este
meta-anlisis.
En segundo lugar, la calidad metodolgica de los ensayos fue evaluada en funcin de cmo
fueron asignados los pacientes al grupo de tratamiento activo o al de control, de cmo se
evalu el resultado y de cmo se analizaron los datos. Se dio un mximo de nueve puntos si
la asignacin del paciente fue verdaderamente aleatoria, si la evaluacin del estado vital fue
independiente del grupo de tratamiento y si los datos de todos los pacientes inicialmente
incluidos fueron analizados de acuerdo con el principio de intencin de tratar. La figura 2
muestra que los tres estudios de baja calidad (< 7 puntos) mostraron un efecto ms
beneficioso que los ensayos de alta calidad. Sin embargo, la exclusin de esos tres estudios
deja prcticamente inalterados el efecto combinado y los intervalos de confianza.
En tercer lugar, los resultados significativos tienen mayor probabilidad de ser publicados que
los hallazgos no significativos y esto puede distorsionar los resultados del meta-anlisis. La
presencia de este sesgo de publicacin puede detectarse mediante la estratificacin del
anlisis segn el tamao del estudio - los efectos ms pequeos pueden ser significativos en
los estudios ms grandes. Si existe un sesgo de publicacin, se espera que, entre los
estudios publicados, los ms grandes presentarn los efectos ms pequeos. La figura 2
confirma esta situacin, ya que los ensayos ms pequeos (50 muertes o menos) muestran
el efecto ms grande. Sin embargo, la exclusin de los estudios ms pequeos tiene poco
efecto sobre la estimacin combinada.
En ltimo lugar, dos estudios (1 y N, ver figura 1) fueron interrumpidos antes de lo previsto
debido a los resultados procedentes de anlisis intermedios. Las estimaciones de los efectos
de los tratamientos en los estudios que se interrumpen prematuramente suelen estar
sesgadas, con valores que se alejan del valor nulo. Esto implica la introduccin de sesgos en
los meta-anlisis que incluyen estos ensayos. Sin embargo, la exclusin de estos ensayos
slo afecta de forma marginal la estimacin combinada.
Por tanto, los anlisis de sensibilidad muestran que los resultados de este meta-anlisis son
robustos, independientemente de la eleccin del mtodo estadstico, de la exclusin de
ensayos de menor calidad o de la de los estudios que finalizan antes de tiempo. Tambin
sugieren que es improbable que el sesgo de publicacin distorsione los hallazgos.
Referencias
1.Huque MF. Experiences with meta-analysis in NDA submissions. Proceedings of the
Biopharrnaceutical Sectin of the Arnerican Statistical Association 19882:28-33.
2.Egger M, Davey Smith G. Meta-analysis: potentials and promise. BMI 1997;315:1371-4.
3.Egger M, Davey Smith G, Scheneider M, Minder CE. Bias in meta-analysis detectad by
asimple, graphical test. BMI1997,3 15:629-34.
4.Sacks H, Chalmers TC, Smith Hl. Randomized versus Historical controls for clinical trials.
Arn 1 Med 1982;72:233-40.
5.Schulz KF, Chalmers l, Hayes RI, Altman DG. Emprica) evidence of Bias. Dimensions of
methodological quality associated with stimates of treatment effects in controlled trials.
IAMA 1995;273:408-12.
6.Prendiville W, Elbourne D, Chalmers I. The effects of routine oxytocic administration in the
manager of the third stage of labour: an oveview of the evidence from controlled trials. Br
1 Obstet Gynaecol 1988;95:3-16.
7.Begg CB, Cho M, Eastwood S, Horton R, Moher D, Olkin 1, et al. Improving tha quality of
reporting of randomized controlled trials. The CONSORT statement. IAMA1996;276:637-9.
8.Greenhald T. The Medicine database. BMI 1997,315:180-3.
9.Dickersin K, Hewitt P, Mutch L, Chalmers I, Chalmers TC. Perusing the literatura
comparison of Medicine searching with a perinatal clinical tra) database. Controlled Clinical
Trials. 1985;6:306-317.
10. Dickersin K, Scherer R, Lefebvre C. Identifying relevant studies for systematic reviews.
BMI 1994;309:1286-91.
11. Chalmers I, Dickersin K, Chalmers TC. Getting to grips with Archie Cochrane"s agenda.
BMI 1992;305:786-8.
12. The Cochrane Controlled Trials Register. I: Cochrane Library. CD ROM and online.
Cochrane Collaboration Ilssue 1). Oxford: Update Software, 1997.
13. Moher D, ladad AR, Nicho) G, Penman M, Tugwell, Walsh S. Assessing the quality of
randomized ontrolled trials: an annotated bibliography of sales and cheklists. Controlled
Clinical Trials 1995;16:62-73.
14. ladad AR, Moore RA, Carro) D, lekinson C, Reynolds DIM, Gavaghan Dl, et al. Assessing
the quality of reports of randomized clinical trials: is blinding necessary? Controlled Clinical
Trials 1996; 17:1-12. 15. Chalmers TC. Problems induced by meta-analyses. Stat Med
1991;10:971-80.
16. Moher D, Fortn P, ladad AR, lni P, Klassen T, Le Lorier 1, et al. Completeness of
reporting of trials published in languages other than English: implcations for conduct and
reporting of systematic reviews. Lancet 1996;347:363-6.
17. Laupacis A, Sackett DL, Roberts RS. An Assesment of clinically useful measures of the
consequences of treatment. New Engl. I Med. 1988;318:1728-33.
18. Berln JA, Laird NM, Sacks HS, Chalmers TC. A comparison of statistical methods for
combining even ratas from clinical trials. Stat Med 1989;8:141-51.
19. Yusuf S, Petp R, Lewis 1, Collins R, Sleight P. Beta blockade during and after myocardial
infarction: an overview of the randomized trials. Proq Cardiovasc Dis 1985;17:335-71.
20. DerSimonian R, Laird N. Meta-analysis in clinical trials. controlled Clinical Trails
1986,7:177-88. 21. Carlin IB, Meta-analysis for 2x2 tablas: a bayesian approach. Stat Med
1992,11.141-58 .
22. Lilford RI, Braunholtz D. The statistical basis of public policy: a paradigm shift is
overdue. BMI 1996;313:603-7.
23. Eddy DM, Hasselblad y, Shachter R. Meta-analysis by the confidente profile nielhod. The
statistical synthesis of evidence. Boston: Academic Press, 1992.
24. Bailey KR. Inter-study differences: how should they influence the interpretation and
analysis of results? Stat Med 1987;6:351-8.
25. Gallbraith R. A note on graphical presentation of estimated odd ratios from severa)
clinical trials. Stat Med. 1988,7 :889-94.
26. Multicenter Postinfarction Research Group. Risk stratificatiion and suvival after
myocardial infarction. New Engl 1 Med 1983,309:331-6.
27. Chatellier G, Zapletal E, Lernaitre D, Menard I, Degoulet P. The number needed tot
10
11