Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Bioestadstica y Epidemiologa
1
Profesor Titular
Divisin de Anestesiologa. Pontificia Universidad Catlica de Chile.
332
DATOS FALTANTES (MISSING VALUES)
tantes; por ejemplo, la presencia de efectos adver- aconseja o se puede enfrentar su ausencia.
sos puede condicionar el abandono de los pacien- 1) Completamente al azar: el hecho que falte una
tes o la prdida de seguimiento puede ser mayor observacin no est relacionado con el o los va-
en pacientes que fallecen. No hay ninguna manera lores faltantes ni con los valores existentes. Otra
completamente satisfactoria para manejar los datos manera de pensarlo es que cualquier valor tiene
faltantes por lo que se debe poner nfasis en optimi- la misma probabilidad de faltar que cualquier
zar la recoleccin y registro de los datos en la eta- otro. Por ejemplo, fallas ocasionales de equipos
pa de diseo y durante la ejecucin. En la etapa de que impiden hacer una medicin, olvido ocasio-
diseo se proponen diversas estrategias como por nal en registrar un dato, el encargado de hacer
ejemplo, disear los tratamientos (intervenciones) la medicin se enferm o prdidas de muestras
que tengan flexibilidad como para acomodar dife- porque se rompieron los tubos. Omitir del anli-
rentes preferencias, hacer el seguimiento lo ms sis a los individuos con datos faltantes no altera-
corto posible, evitar mediciones que por experien- ra la validez pero podra disminuir la potencia
cias previas tienen mayor probabilidad de faltar. del estudio. Estimar a priori posibles prdidas
En la etapa de ejecucin: poner metas y monitori- por este mecanismo debiera formar parte del
zar frecuentemente los datos faltantes, poner incen- protocolo en el clculo del tamao muestral.
tivos para los participantes junto con regulaciones 2) Al azar: una o varias caractersticas registradas
ticas estrictas, limitar las cargas o dificultades en pueden explicar la distribucin de los datos fal-
la recoleccin de los datos, ofrecer entrenamiento a tantes. Por ejemplo: el nivel de respuestas fal-
los participantes y facilitar los mtodos de registro. tantes en una encuesta est relacionado con el
Estas consideraciones deben estar definidas en el nivel socio-econmico, el nmero de pacientes
protocolo de los trabajos y descritas en el trabajo con un ECG preoperatorio est relacionado con
publicado. la edad de los pacientes, o un centro en un estu-
Al enfrentar el problema de datos faltantes, el dio multicntrico no mide una variable particu-
punto ms importante es decidir si estos pueden in- lar porque no cuenta con los medios para ello.
troducir sesgos en el anlisis. Si no se sabe nada El nombre es confundente por lo que algunos
sobre la o las causas por las cuales faltan datos es prefieren falta ignorable o manejable estads-
imposible descartar un posible sesgo y menos esti- ticamente.
mar su magnitud. Un segundo punto importante es 3) No al azar: los datos faltantes probablemente
la cantidad: si son pocos los datos faltantes, es pro- dependen o estn relacionados con datos no ob-
bable que su efecto sea menor pero si son muchos servados. Por ejemplo: falta de respuesta en un
su ausencia va comprometiendo progresivamente cuestionario, prdida durante el seguimiento. El
la validez de las conclusiones. Al respecto no hay sesgo o los sesgos que pueden introducirse son
una cifra mgica pero probablemente prdidas ma- evidentes e invalidan en mayor o menor medida
yores al 10% no son aceptables en la mayora de las los resultados.
circunstancias.
Principios para hacer inferencias sobre los datos Hay tres alternativas para lidiar con los datos
faltantes: faltantes: 1) Omitir variables con datos faltantes; 2)
- Definir, si es factible, si los datos faltantes son Omitir individuos en quienes hay datos faltantes.
significativos para el anlisis (y por ende cum- Estos dos mtodos son los que se usan probable-
plen con la definicin para ser datos faltantes). mente con mayor frecuencia pero, como producen
- Esto implica definir una medicin de un posible una prdida de informacin y potencia del estudio
efecto causal. y, adems, no modifican el riesgo de sesgos, no de-
- Documentar en lo posible la o las razones por- bieran ser usados; 3) Estimar (imputar) los datos
qu falta cada dato. faltantes donde estos son reemplazados con valores
- Decidir presunciones principales sobre el meca- predichos desde los datos presentes. La imputacin
nismo de datos faltantes siguiendo la clasifica- puede ser simple (por ejemplo, usar el ltimo valor
cin detallada ms abajo. Este raciocinio debe registrado, el basal o promedios) o a travs de ecua-
estar explcito para los lectores. ciones o modelos para calcular los valores faltantes
- Anlisis basado en las presunciones anteriores. (por ejemplo, asumir que una determinada variable
- Evaluar la robustez de estas presunciones. tiene una distribucin normal con una determinada
media y varianza). Toda imputacin basada en mo-
Los datos faltantes se clasifican en tres catego- delos se basa en presunciones no verificables por lo
ras usando una terminologa que puede confundir que no hay ningn mtodo o modelo generalmente
pero que est relacionada con la manera en que se recomendable ni completamente satisfactorio. Sin
REFERENCIAS cal Statistics. 3rd Ed, Oxford: OUP, 7. Little RJ, Cohen ML, Dickersin K,
2006. et al. The design and conduct of
1. Altman DG. Practical Statistics for 5. Donders ART, van der Heijden clinical trials to limit missing data.
Medical Research. London: Chap- GJMG, Stijnen T, Moons KGM. Statist Med 2012; 31: 3433-3443.
man & Hall, 1991. Review: A gentle introduction to 8. Little RJ, DAgostino RB, Cohen
2. Altman DG, Bland JM. Missing imputation of missing values. J ML, et al. The Prevention and
data. BMJ 2007; 334: 424. Clin Epidemiol 2006; 59: 1087- Treatment of Missing Data in
3. Armitage P, Berry G. Estadstica 1091. Clinical Trials. NEJM 2012; 367:
para la investigacin biomdica. 6. Hogan JW, Roy J, Korkontzelou 1355-1360.
3a ed. Barcelona: Harcourt Brace, C. Handling drop-out in longitudi- 9. Ware JH, Harrington D, Hunter
1997. nal studies. Statist Med 2004; 23: DJ, DAgostino RB. Missing Data.
4. Bland M. An Introduction to Medi- 1455-1497. NEJM 2012; 367:1353-1354.
Correspondencia a:
Dr. Jorge Dagnino S.
jdagnino@med.puc.cl