Sei sulla pagina 1di 4

Anexo 9.

Elección de la prueba estadística

Este anexo pretende proporcionar unas normas casos, se recurre a otras pruebas estadísticas
sencillas que faciliten la elección de la prueba esta- menos potentes, que no requieren asunciones
dística más adecuada para el análisis de los datos. para su aplicabilidad, conocidas como pruebas
Los métodos para su cálculo y las asunciones en no paramétricas. Este mismo tipo de pruebas
que se basan están disponibles en múltiples textos es aplicable cuando se trata de analizar datos
de estadística. ordinales.

En la tabla A9.1 se resumen las pruebas esta-


Pruebas estadísticas dísticas que se utilizan en las situaciones más
bivariantes frecuentes.
De forma esquemática, cuando tanto el factor de
La elección de la prueba estadística depende de estudio como la variable de respuesta son variables
(cuadro A9.1): cualitativas, la prueba estadística más apropiada
para determinar si existe asociación entre ellas es
• La escala de medida de la variable de respuesta. la ji al cuadrado, siempre que exista un número
Las pruebas estadísticas tienen mayor poten- suficiente de sujetos en cada una de las casillas de
cia si la variable de respuesta es cuantitativa, la tabla de contingencia.
ya que contiene más información que si es
cualitativa. Ejemplo A9.1   Un estudio hipotético pretende
• La escala de medida del factor de estudio. Puede comparar el porcentaje de diabéticos controlados
ser cualitativa dicotómica (tratamiento activo/ en un grupo que ha recibido educación sanitaria
placebo, exposición/no exposición), cualitativa grupal con el de otro grupo que ha recibido los
con más de dos categorías (tres pautas terapéu- cuidados habituales. Se trata de datos indepen-
ticas o diferentes grados de exposición a un dientes, ya que son grupos de sujetos diferentes.
factor de riesgo) o cuantitativa (valores de la El factor de estudio (educación sanitaria) es una
colesterolemia o la presión arterial). variable dicotómica (grupal/habitual), al igual
• El carácter apareado o independiente de los datos. que la variable de respuesta (controlado/no con-
Desde el punto de vista estadístico, se habla trolado). Por lo tanto, los datos se presentarán en
de medidas repetidas o apareadas cuando han una tabla 2 × 2 y se utilizará una ji al cuadrado
sido realizadas sobre los mismos sujetos (p. ej., (o una Z de comparación de dos proporciones),
comparación de las cifras de presión arterial siempre que el número de sujetos lo permita. Si
obtenidas en los individuos de una muestra al no puede utilizarse, se recurrirá a la prueba exacta
inicio y al final de un determinado período). de Fisher.
Dado que los sujetos son los mismos, existe
una menor variabilidad en las mediciones, lo Cuando se comparan dos grupos (factor de es-
que permite utilizar pruebas más potentes que tudio dicotómico) respecto a una variable cuan-
tengan en cuenta este fenómeno. En caso de titativa (comparación de dos medias), la prueba
que los grupos que se comparan estén forma- estadística más adecuada es la t de Student-Fisher.
dos por individuos diferentes, se habla de datos Si no se cumplen las condiciones necesarias para
independientes. su aplicación, se recurre a una prueba no paramé-
• Las condiciones de aplicación específicas de cada trica equivalente, como la U de Mann-Whitney.
prueba. Las pruebas estadísticas que utilizan
datos cuantitativos suelen realizar determi- Ejemplo A9.2  Supongamos que en el ejemplo
nadas asunciones sobre la distribución de las A9.1 interesa comparar la glucemia de ambos
variables en las poblaciones que están siendo grupos de sujetos al finalizar el estudio. En este
comparadas. Estas pruebas son conocidas como caso, la variable de respuesta es cuantitativa (glu-
pruebas paramétricas. La mayoría son robustas, cemia). Se trata, por tanto, de la comparación de
es decir, toleran relativamente violaciones de dos medias en grupos independientes, y la prueba
estas asunciones, especialmente si el número de elección es la t de Student-Fisher, si se cumplen
de sujetos estudiado es elevado. En muchas las condiciones de aplicación.
situaciones, especialmente cuando las muestras
son de pequeño tamaño, no se puede determi- Si se comparan más de dos grupos (factor de
nar si se cumplen dichas asunciones. En estos estudio con más de dos categorías) respecto a una

364 © 2013. Elsevier España, S.L. Reservados todos los derechos


Elección de la prueba estadística

su aplicación, se recurre a la prueba de Kruskal-­


Cuadro A9.1  Factores de los que depende Wallis.
la elección de la prueba
estadística más adecuada Ejemplo A9.3  Supongamos que en el ejemplo A9.1
se han incluido pacientes procedentes de tres cen-
• Escala de medida de la variable de respuesta
• Escala de medida del factor de estudio
tros de salud, y que interesa determinar si la glu-
• Carácter apareado o independiente de los cemia de los sujetos difiere según el centro de pro-
datos cedencia. En este caso, el factor de estudio (centro
• Condiciones de aplicación específicas de cada de salud de procedencia) tiene tres categorías, por
prueba: lo que no puede aplicarse la t de Student-Fisher.
– Número de observaciones Si se cumplen las condiciones para su utilización,
– Asunciones sobre la distribución poblacional se aplicará un análisis de la variancia. Si se observa
de las variables una diferencia estadísticamente significativa, se

Tabla A9.1  Pruebas bivariantes de significación estadística utilizadas con mayor frecuencia

Variable de respuesta
Cualitativa Cualitativa
Factor de nominal (dos nominal (> 2 Cualitativa
estudio categorías) categorías) ordinal Cuantitativa*
Cualitativo (dos grupos)
Independientes Z de comparación Ji al cuadrado U de Mann- t de Student-
de proporciones Whitney Fisher
Ji al cuadrado
Prueba exacta de
Fisher
Apareados Prueba de Q de Cochran Prueba de los t de Student-
McNemar signos Fisher
para datos
apareados
Prueba exacta de Prueba de los
Fisher rangos signados
de Wilcoxon
Cualitativo (más de dos grupos)
Independientes Ji al cuadrado Ji al cuadrado Prueba de Análisis de la
Kruskal-Wallis variancia
© Elsevier. Fotocopiar sin autorización es un delito.

Apareados Q de Cochran Q de Cochran Prueba de Análisis de la


Friedman variancia de dos
vías
Cuantitativo t de Análisis de la Correlación de Correlación de
Student-Fisher variancia Spearman Pearson
Tau de Kendall Regresión lineal
*Cuando las pruebas estadísticas aplicables a las variables cuantitativas no cumplen las asunciones necesarias para su
aplicación, deben utilizarse las pruebas correspondientes como si la variable de respuesta fuera una variable ordinal
(pruebas no paramétricas).

variable cuantitativa (comparación de más de dos realizará un análisis posterior para determinar qué
medias), debe utilizarse el análisis de la variancia grupo o grupos difieren, utilizando alguna de las
(ANOVA). Si no se cumplen los criterios para técnicas de comparación múltiple específicamente

365
Métodos de investigación clínica y epidemiológica

diseñadas para ello (p. ej., la de Scheffé o la de la variable dependiente como las independientes
Neuman-Keuls). son cuantitativas, aunque en la práctica permite
que algunas de las variables independientes sean
Si se trata de determinar la posible asociación en- cualitativas. El valor de un coeficiente de regresión
tre un factor de estudio y una variable de respuesta lineal múltiple es una estimación del efecto de la
cuantitativos, la prueba adecuada es la correlación variable independiente correspondiente sobre
de Pearson o, si no se cumplen las condiciones la variable dependiente, ajustado por el resto de
para su aplicación, la correlación no paramétrica las variables independientes de la ecuación. Es
de Spearman. En el caso de que pueda asumirse decir, representa el cambio esperado de la variable
una relación de dependencia lineal de una de las dependiente cuando se incrementa en una unidad
variables respecto a la otra, se habla de regresión el valor de la variable independiente, asumiendo
lineal simple. que el resto de las variables del modelo se man-
tienen constantes.
Ejemplo A9.4  Consideremos que se quiere eva-
luar si existe asociación entre la edad de un grupo Ejemplo A9.5  En un estudio se evalúa la asociación
de sujetos y sus cifras de presión arterial sistólica entre la edad, el índice de masa corporal (IMC) y
(PAS). Dado que ambas variables están medidas la clase social con la PAS. Dado que la variable
en una escala cuantitativa, se trata de un análisis dependiente (PAS) es cuantitativa, y que dos de
de correlación. Si se deseara determinar en cuánto las variables independientes también lo son (edad
se incrementa la PAS a medida que aumenta la e IMC), se utiliza una regresión lineal múltiple.
edad de los sujetos, se realizaría un análisis de Al final del análisis se obtiene un coeficiente de
regresión lineal, en el que la PAS sería la varia- regresión de la edad de 0,5, lo cual indica que la
ble dependiente, y la edad, la independiente. En PAS es, en promedio, 0,5 mmHg más elevada por
cambio, no tendría sentido evaluar en cuánto cada año más de edad de los sujetos, suponiendo
aumenta la edad de los sujetos al incrementarse que la clase social y el IMC sean constantes; es
su PAS. decir, el efecto de la edad está ajustado por estas
dos variables.

Cuando la variable dependiente es dicotómica


Técnicas estadísticas (enfermo/no enfermo, curado/no curado, etc.), se
multivariantes utiliza la regresión logística. Mientras que en la re-
gresión lineal los coeficientes representan directa-
En investigación clínica y epidemiológica, las mente el cambio en la variable dependiente, en la
técnicas multivariantes se utilizan habitualmente regresión logística estiman medidas relativas; por
cuando existe una variable dependiente (variable ejemplo, la odds ratio asociada al factor de estudio
de respuesta) y múltiples variables independien- y ajustada por el resto de variables independientes.
tes (factor de estudio y otras variables que con- Dado que el modelo logístico no es lineal, sino
trolar). Estas técnicas se emplean con finalidades exponencial, se utilizan transformaciones logarít-
de predicción (obtener una ecuación que permita, micas que hacen que los coeficientes no puedan
conociendo los valores de un conjunto de variables interpretarse directamente.
independientes, predecir el valor de la variable
dependiente), de descripción de la relación entre Ejemplo A9.6  Un estudio evalúa la relación en-
variables (identificar, de entre un conjunto de va- tre diferentes factores de riesgo y el desarrollo de
riables independientes, cuáles están asociadas con cardiopatía coronaria en una muestra de varones
la variable dependiente), o de estimación del efecto adultos. Dado que la variable de respuesta es di-
del factor de estudio (obtener una estimación del cotómica (desarrollo o no de la enfermedad), se
efecto del factor de estudio sobre la variable de realiza un análisis de regresión logística con esta
respuesta, controlando la influencia de variables variable como dependiente y el conjunto de facto-
de confusión). La técnica elegida dependerá de las res de riesgo como independientes. En la ecuación
escalas de medida de las variables implicadas en el resultante, la variable edad tiene un coeficiente
análisis (tabla A9.2). de 0,12. Para poder interpretarlo, debe calcularse
Una de las técnicas más utilizada es la regre- su antilogaritmo natural e0,12 = 1,13, valor que co-
sión lineal múltiple, que se aplica cuando tanto rresponde a la odds ratio asociada al aumento de

366
Elección de la prueba estadística

Tabla A9.2  Elección de la técnica multivariante adecuada

Técnicas inferenciales*
(pueden diferenciarse variables dependientes e independientes)
Variable dependiente Variables independientes Técnica multivariante

Cuantitativa Cualitativas Análisis de la variancia


Cuantitativas (1) Regresión lineal múltiple
Cualitativa Cualitativas Modelo log-lineal
Cuantitativas (1) Regresión logística (2)
Análisis discriminante (3)
Regresión de Cox (4)

Técnicas descriptivas (todas las variables presentan el mismo estatus)


Finalidad Técnica multivariante

Reducir la dimensionalidad de la matriz de datos Análisis factorial


(identificar los factores subyacentes en un conjunto Análisis de componentes principales
de variables) Análisis de correspondencias
Clasificar a individuos o variables en grupos Análisis de conglomerados (clusters)
homogéneos
*Sólo se presentan las principales pruebas aplicables cuando existe una sola variable dependiente. (1) Algunas variables
independientes pueden ser cualitativas. (2) Suele utilizarse cuando la variable dependiente es dicotómica. (3) Suele
utilizarse cuando la variable dependiente tiene más de dos categorías. (4) Se utiliza cuando la variable dependiente
incluye la dimensión tiempo (análisis de supervivencia).

un año de edad de los sujetos, ajustada por el resto el tiempo transcurrido hasta la aparición de un
de las variables de la ecuación. desenlace determinado.
Existen técnicas multivariantes útiles cuando
También se utiliza con frecuencia el modelo no existe una variable que pueda ser considerada
de regresión de Cox, que es útil cuando la varia- dependiente, pero se utilizan poco en investigación
ble dependiente es el tiempo de supervivencia o clínica y epidemiológica.

Bibliografía
© Elsevier. Fotocopiar sin autorización es un delito.

Altman DG. Practical statistics Oxford: Blackwell Science; práctica clínica. 6.a ed. Madrid:
for medical research. London: 2002. Elsevier; 2008.
Chapman & Hall; 1991. Jiménez Villa J. Estadística. En: Norman GR, Streiner DL.
Armitage P, Berry G, Matthews Martín Zurro A, Cano Pérez JF, Bioestadística. Madrid:
JNS. Statistical methods in editors. Atención primaria: Harcourt Brace de España;
medical research. 4th ed. conceptos, organización y 1998.

367

Potrebbero piacerti anche