Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RESUMEN Es bastante frecuente que en estudios epidemiológicos, durante el proceso de análisis de datos,
una o más variables continuas sean cambiadas de escala. El objetivo de este trabajo consistió
en evaluar las consecuencias de la categorización de variables en el análisis de datos. Se estu-
dian tres situaciones bajo diferentes escenarios de análisis estadístico en modelos de regresión.
Los resultados muestran que la dicotomización de variables continuas puede modificar sustan-
cialmente las relaciones entre variables dependientes e independientes. Así por ejemplo, en es-
tudios epidemiológicos en los que se pretende evaluar el efecto de una exposición sobre una res-
puesta, la magnitud o la dirección de dicho efecto pueden estar sesgadas como consecuencia de
la dicotomización de alguna variable. Se recomienda, por lo tanto, evitar, en la medida de lo po-
sible, la categorización de variables en el análisis.
El uso de procedimientos estadísti- de los datos. Por ejemplo, es bastante para evaluar el efecto de la mala clasi-
cos en el análisis de los datos de las in- frecuente que variables continuas como ficación de la exposición en estudios
vestigaciones en salud es cada vez más la tensión arterial o el índice de masa epidemiológicos de seguimiento. En
frecuente, debido a que constituyen la corporal se transformen en variables estudios de casos y controles, Fung y
base de las decisiones que de esos es- dicotómicas: presencia o ausencia de Howe (3) estudiaron el efecto de la
tudios se puedan derivar. Ya sea en hipertensión arterial o de obesidad. mala clasificación de la exposición y
estudios por observación o en ensayos Es importante evaluar las razones de las covariables del estudio sobre las
clínicos, la utilización de métodos esta- por las cuales dichas variables son ca- estimaciones de las medidas de asocia-
dísticos es un potente aporte, desde la tegorizadas y las consecuencias de esa ción y sobre la potencia de las pruebas
planificación del estudio hasta su aná- categorización. Desde una perspectiva estadísticas.
lisis e interpretación. Aceptado esto, es estadística, existen abundantes publi- Otro argumento estadístico encon-
válido preguntarse si el procesamiento caciones acerca de la categorización de trado en la literatura para justificar la
de los datos y los procedimientos esta- variables continuas, unas justificando categorización de variables continuas
dísticos utilizados en un estudio son o su uso y otras poniéndolo en duda. está relacionado con los modelos esta-
no los adecuados. Una de las prácticas Una razón estadística que puede justi- dísticos aplicados en algunos casos.
habituales en el procesamiento de los ficar la categorización está relacionada Algunos investigadores prefieren di-
datos es la categorización de algunas con los errores de medición. A veces es cotomizar la variable de respuesta o la
variables continuas antes del análisis bastante difícil obtener mediciones variable de exposición, o ambas, por-
exactas de una variable continua, o que las variables dicotomizadas repre-
simplemente se sospecha que pueden sentan mejor el estado de enfermo/no
1
contener errores. En este aspecto, Fle- enfermo y pueden facilitar la interpre-
División de Bioestadística, Escuela de Salud
Pública y Centro de Epidemiología Clínica, Uni- gal et al. (1) estudiaron el efecto de los tación de los coeficientes de un mo-
versidad de Chile. Dirección: Independencia 939, errores de medición sobre los riesgos delo estadístico, o porque el recorrido
Santiago, Chile.
2 Departamento de Bioestadística, Universidad de relativos (RR), y Reade-Christopher y de una variable continua tiene dis-
Carolina del Norte, Chapel Hill. Kupper (2) propusieron un modelo tintos significados clínicos (4). Otra
CUADRO 7. Comparación entre el coeficiente de regresión para el colesterol, y el promedio de las estimaciones basadas en las 500 répli-
cas, para algunos escenarios, con tamaño de la muestra = 100 y dicotomización de la edad en deciles 1 y 5
Coeficiente de
correlación entre Verdadero Promedio Diferencia Promedio Diferencia
coeficiente estimación relativa (%) estimación relativa (%)
CyE TS y E TS y C de regresión decil 1 decil 1 decil 5 decil 5
REFERENCIAS
1. Flegal KM, Keyl PM, Nieto FJ. Differential 5. Altman DG, Lausen B, Sauerbrei W, Schu- 9. Amenta JS, Brocher SC, Serenko-Aber AL.
misclassification arising from nondifferential macher M. Dangers of using “optimal” cut- Comparing different statistical methods for
errors in exposure measurement. Am J Epi- points in the evaluation of prognostic factors evaluating diagnostic effectiveness of clinical
demiol 1991;134:1233–1244. [commentary]. J Natl Cancer Inst 1994;86: tests: respiratory distress syndrome as a
2. Reade-Cristopher S, Kupper LL. On the ef- 829–835. model. Clin Chem 1988;34:273–280.
fects of predictor misclassification in multiple 6. Kahn H, Sempos C. Statistical methods in epi- 10. Wartenberg D, Northridge M. Defining expo-
linear regression analysis. Comm Statistics: demiology. New York: Oxford University sure in case-control studies: a new approach.
Theory and Methods 1995;24:13–37. Press; 1989. Am J Epidemiol 1991;133:1058–1071.
3. Fung KY, Howe GR. Methodological issues in 7. Zhao LP, Kolonel LN. Efficiency loss from cat- 11. Altman D. Problems in dichotomizing contin-
case-control studies III: The effect of joint mis- egorizing quantitative exposures into qualita- uous variables [letter]. Am J Epidemiol 1994;
classification of risk factors and confounding tive exposure in case-control studies. Am J 139:442.
factors upon estimation and power. Intl J Epi- Epidemiol 1992;136:464–474. 12. Maxwell S, Delaney H. Bivariate median
demiol 1984;13:366–370. 8. Donner A, Eliasziw M. Statistical implica- splits and spurious statistical significance.
4. Ragland DR. Dichotomizing continuous out- tions on the choice between a dichotomous Psychological Bull 1993;113:181–190.
come variables: dependence of the magnitude or continuous trait in studies of inter- 13. Cumsille F, Bangdiwala SI. Dicotomización de
of association and statistical power on the cut- observer agreement. Biometrics 1994;50: variables continuas en modelos de regresión
point. Epidemiology 1992;3:434–440. 550–555. logística. Rev Med Chile 1996;124: 836–842.
ABSTRACT Frequently during the process of data analysis in epidemiological studies, the scale of
one or more continuous variables is changed. The objective of this paper was to assess
the consequences of categorizing variables during data analysis. We studied three sit-
Categorizing variables in the uations with different scenarios for statistical analysis with regression models. The re-
statistical analysis of data: sults show that dichotomizing continuous variables can substantially modify the
consequences for interpreting relationships between dependent and independent variables. Thus, for example, in
epidemiological studies trying to evaluate the effect of an exposure on a response, the
the results magnitude and/or the direction of this effect can be biased by dichotomizing a vari-
able. We therefore recommend avoiding, as much as possible, the categorization of
variables when doing analyses.
To understand fully all the variations which disease may show, it is necessary to
draw on the experience of the world and not to reason too broadly from results
obtained in a small section of a single country. Disease shows many peculiarities
under the multiple influences of varying environment and that applies not alone
to the communicable diseases. Diphtheria and cancer are almost universally
described in terms of the clinical and epidemiological behavior they evidence in
north temperate climates. What occurs in the tropics is often widely different. An
international viewpoint becomes increasingly necessary for a full and clearer
comprehension of disease.
John E. Gordon
“Epidemiology—old and new"
Journal of the Michigan State Medical Society, 1950;49