Sei sulla pagina 1di 7

TAM A O M U ESTRAL EN ESTU DIO S DE IN VESTIG ACIO N

Dr. Sixto Snchez C.

Cuntos participantes necesitamos para nuestro estudio?. Cuantos participantes


necesitamos para demostrar la hiptesis de nuestra investigacin?. Cuantos participantes
necesitamos para demostrar que una variable esta estadsticamente asociada con otra?
Estas son preguntas frecuentes de los investigadores, cuya respuesta depende de
caractersticas de los estudios especificadas mas abajo. Se necesita un tamao muestral
mnimo para demostrar hiptesis (si la hay) y no tan grande como para que signifique
prdida de energa y dinero. Trataremos de mostrar de la manera ms sencilla, pero sin
dejar de explicar los fundamentos bioestadsticos, la forma como calcular el nmero de
sujetos necesarios para los diseos de investigacin y objetivos mas frecuentes.

I.- CALCULO DEL TAMANO MUESTRAL EN ESTUDIOS COMPARATIVOS.- Para


contraste de hiptesis, es decir, cuando se pretende comparar si proporciones o las
medias de las muestras son diferentes. Ejemplo: estudios experimentales, cohortes,
casos-controles.

El tamao de la muestra depende de los siguientes factores: (usaremos como ejemplo un


estudio experimental para explicar estos factores)

1. ERROR TIPO I o : Es la probabilidad de cometer el error de detectar diferencias


entre dos tratamientos cuando en realidad no existe esta diferencia. Se acepta si la
probabilidad de cometer este error es menor de 0.05. Considerar un menor error, aunque
aumenta la confianza, no es necesario pues aumenta innecesariamente el tamao
muestral. Esta probabilidad de errar (0.05) o porcentaje (5%) significa un valor z (prueba
z) de 1.96 para una hiptesis bilateral (dos colas) y 1.64 para una hiptesis unilateral (una
cola) (ver tabla 1). Se usa hiptesis unilateral (una cola) si se estima que uno de los dos
grupos tendr mejores resultados que el otro e hiptesis bilateral (a dos colas) si no
estamos seguros de cual de los dos tratamientos es mejor. Al considerar dos colas
necesitamos mayor tamao muestral que si consideramos 1 cola (precio que se paga por
la inseguridad). Ej.: Si nuestra hiptesis es que el tratamiento A es mejor que el
tratamiento B, el error representara la probabilidad de equivocarse demostrando que
esta hiptesis es cierta cuando en realidad no existe diferencia entre estos dos
tratamientos. Para nuestro ejemplo, usaremos el error a una sola cola (un tratamiento
es superior al otro).

2. NIVEL DE CONFIANZA: Es la diferencia entre 1 y el error (1 - error tipo I o ) y


habitualmente se expresa en porcentaje. En un estudio experimental que compara dos
medicamentos es la probabilidad que un tratamiento realmente no tenga efecto y el
experimento as lo demuestre (confianza del estudio). Se acepta si esta confianza es
95% o ms. Al decir 95% estamos diciendo que se encontrar lo mismo en el 95% de las
veces que se repita el experimento

3. ERROR TIPO II o : Es la probabilidad de cometer el error de no detectar diferencias


entre dos tratamientos cuando en realidad si existe. Se acepta si la probabilidad de
cometer este error es de 0.20. Considerar un error menor de 20%, aunque aumenta el
poder del estudio, no es necesario pues aumenta innecesariamente el tamao muestral.
Ej.: Si nuestra hiptesis es que el tratamiento A es mejor que el tratamiento B, el error
representara la probabilidad de equivocarse demostrando que no existe diferencia entre
estos dos tratamientos cuando en realidad si existe esta diferencia. Siempre se considera
el error a una cola.

Tabla 1.- Valores de la prueba z para diferentes valores


de o :

Valor de Valor de z Valor de z


o Dos colas Una cola
0.001 3.29 3.10
0.01 2.58 2.32
0.05 1.96 1.64
0.10 1.64 1.28
0.20 1.28 0.84
0.30 1.04 0.50

3. PODER (POTENCIA) DEL ESTUDIO: Es la diferencia entre 1 y el error (1 - error o


II): Es la probabilidad de xito (o certeza del estudio) para detectar diferencias reales
entre los resultados de dos grupos de tratamiento. Se acepta si este poder es 80% o
ms. Ej.: Al decir que hemos demostrado la hiptesis de que el tratamiento A es mejor
que el B con un poder del 80% estamos diciendo que tenemos la certeza de que esto
sucede as en el 80% de las veces que se repita el experimento

4. VARIABILIDAD DE LOS DATOS: se refiere a la dispersin de los valores. Se mide


mediante la desviacin estndar (), varianza o el error estndar. A mayor variabilidad o
dispersin de los datos de una variable continua necesitamos mayor tamao muestral.
Esta variabilidad puede ser determinada a partir de estudios previos, experiencias
similares o a partir de un estudio piloto. Ejemplo de variabilidad: La variabilidad de la
edad de un grupo de personas con edades de 60, 30, 20, 10 y 17 aos es mayor que la
variabilidad de otro grupo de personas con edades de 25, 26, 28 , 30 y 32 aos.

5. DIFERENCIA DE EFECTO (): Es la diferencia entre la efectividad de un tratamiento


estudiado con la efectividad de otro tratamiento que consideramos estndar. Si la
efectividad de un tratamiento es mucho mayor que la efectividad del otro, necesitaremos
menor tamao muestral y viceversa. Ej.: Un tratamiento A reduce el nmero de
recurrencias del herpes genital en 6 por ao, en cambio el tratamiento B solo reduce a 2
por ao. La "diferencia de efecto" es: 6 - 2 = 4. Mientras esta diferencia sea ms grande
por ejemplo 6 - 1 = 5, necesitaremos menor tamao muestral para demostrar nuestra
hiptesis de que el tratamiento A es mejor que el tratamiento B.

CONCLUSION: El tamao muestral si el error , la variabilidad ( ) , el error (


equivalente a que el poder 1 - ) o si la diferencia de efecto entre los dos grupos .

En estudios experimentales podemos el poder (error ) hasta incluso 50% (error : 0.5)
pero mantener el error en 0.05. De esta manera podramos solo perder la oportunidad
de detectar un mejor tratamiento quedndonos con el tratamiento estndar. Esto es
menos peligroso que cambiar un tratamiento que conocemos es efectivo por otro nuevo
que no tenemos la certeza de que sea mejor.

En las frmulas presentadas aqu suponemos que los grupos a comparar tienen igual
variabilidad. Si la variabilidad es diferente entre los grupos comparados, existen frmulas
que toman en cuenta este hecho (Ver Rosner Bernard: Fundamentals of Biostatistics).

As mismo, las frmulas presentadas aqu suponen igual numero de casos y controles.
Sin embargo, el nmero de sujetos en los dos grupos a comparar puede anticipadamente
ser diferente (por ejemplo cuando queremos tener dos controles por cada caso). En este
caso se recomiendan otras frmulas que incluyen la proporcin (k) que significa cuan
grande es un grupo con respecto al otro: n2 = k n1 (Ver: Rossner Bernard: Fundamentals
of Biostatistics).

Existe casos en que tenemos disponible un limitado nmero de sujetos en ambos grupos
a comparar por lo que, en lugar de calcular el tamao de la muestra, solo podemos
calcular el poder alcanzado de acuerdo a diferentes valores de la "diferencia de efecto"
entre dos tratamientos.

1.- Clculo del tamao muestral donde se comparan medias entre dos muestras
independientes:

Condicin: La distribucin de la variable cuantitativa en los dos grupos debe seguir un


patrn normal (curva de Gauss en campana). Puede ser usado para: a) estudios
experimentales cuando la variable resultado (dependiente) es continua y b) para estudios
caso control donde la variable predictora (independiente) es contnua. Ejemplo: a)
Experimento: Comparar el efecto de un nuevo tratamiento con respecto a otro tratamiento
estndar para disminuir la presin arterial, b) Caso control: Comparar un grupo de
pacientes con ACV con otro sin ACV en cuanto a sus valores sanguneos de colesterol
hace 10 aos:

n = 2 (z 1- /2 + z 1 - )2 ( s )2

(m1 - m2)2

n: Tamao muestral para cada grupo (son dos grupos)


z 1- /2: Se refiere al error alfa (y por ende a la confianza del estudio). Valor del test z ( z =

1.96) para el error de 0.05 a dos colas (no sabemos si el tratamiento nuevo es
mejor o peor). Se considera una cola (z 1- ) cuando se piensa que uno de los

tratamientos es mejor (o no se sabe si el promedio de colesterol es mayor en un


grupo que en el otro) : En este caso el valor z es 1.64.
z 1 - : Se refiere al error Beta (y por ende al poder del estudio). Valor del test z para un

error de 0.20 (una cola): 0.84.


s : Desviacin estndar de la variable (Ej.: 20 mg en los valores de colesterol o 15 mm.
Hg. en la PA) (variabilidad de los datos)
m1: Promedio (ej.: 300 mg de colesterol) o promedio de disminucin de la PA en un grupo
(ej.: 10 mg. de disminucin de la PA)
m2: Promedio (ej. 250 de colesterol) o promedio de disminucin de la PA en el otro grupo
(ej.: 5 mm Hg. de disminucin de la PA)
2.- Clculo del tamao muestral donde se comparan medias entre dos muestras
dependientes (mismos sujetos evaluados en dos oportunidades):

Ejemplo: Estudio experimental: Valorar la eficacia de un tratamiento para la depresin:


Determinamos el grado de depresin de acuerdo a una escala cuantitativa (de 0 a 100)
valorada antes y despus del tratamiento (muestras dependientes). Valoramos si la
diferencia de las medias del grado de depresin antes y despus del tratamiento es
significativamente diferente de 0.

n= (z 1- /2 + z 1 - )2 ( s )2

( m d )2

n: Tamao muestral del grupo nico


z 1- /2:
Se refiere al error ( y por ende a la confianza del estudio). Colocar el valor de
la prueba z (1.96) (*) para el error de 0.05 a dos colas (no sabemos si el
tratamiento nuevo es mejor, igual o peor) o 1.64 si se considera una sola cola (z 1-

). Se considera a una cola cuando se piensa que uno de los tratamientos es mejor
que el otro.
z 1 - : Se refiere al error (y por ende al poder del estudio). Colocar el valor de la prueba z

(0.84) para el error (*) de 0.20 (una cola).


s : Desviacin estndar del promedio del puntaje de depresin (ej.: 10)
md: Diferencia de las medias de la variable estudiada (score de depresin) antes y
despus del tratamiento (ej. 80 60 = 20).

(*) 1.96, 1.64 y 0.84 pueden cambiar de acuerdo al valor del error o que hemos
escogido. Solo tenemos que buscar en la tabla de la curva normal (z) el valor del test z
correspondiente a los valores de o (a una o dos colas).

3.- Clculo del tamao muestral donde se comparan proporciones, la variable


dependiente es dicotmica y las dos muestras son independientes.

Ejemplo: a) Experimental: Comparar dos tipos de tratamiento de pacientes con cncer en


cuanto a la proporcin de pacientes que sobreviven (p1) o no (p2) durante un periodo, b)
Cohortes: Comparar la proporcin (incidencia) de cncer de piel entre un grupo de
personas que se exponen al sol (p1) en comparacin a la proporcin (incidencia) de
cncer de piel en otro grupo de personas que no se exponen (p2). Para muestras
dependientes, existe una frmula especial, c) Casos y controles: Comparar la proporcin
de obesidad pre gestacional entre el grupo de mujeres que desarrollan pre eclampsia (p1)
y aquellas que no (p2).

_ _
2
n = 2 (z 1- /2 + z 1 - ) p (1 - p )

(p1 - p2)2
n: Tamao muestral para cada grupo (dos grupos de tratamiento, expuesto o no
expuestos al sol, con o sin pre eclampsia)
z 1- /2: Se refiere a error alfa (y por ende a la confianza del estudio). Colocar el valor de la

prueba z: 1.96 para un error de 0.05 para dos colas (no sabemos cual de los p
es mayor). Si consideramos una sola cola (z 1- ) el valor de la prueba z es 1.64

(suponemos que uno de los p es mayor que el otro)


z 1 - : Se refiere a error beta (y por ende al poder del estudio). Colocar el valor de la

prueba z para un error de 0.20 (una cola): 0.84 (se refiere al poder del estudio)

_
p: Media de p1 y p2 = (p1 + p2)/2
p1: Proporcin 1: Probabilidad de morir, estar expuesto al sol o haber tenido obesidad pre
gestacional en el primer grupo (ej.: 0.20)
p2: Proporcin 2: Probabilidad de no morir, estar expuesto al sol o haber tenido obesidad
pre gestacional en el segundo grupo (ej.: 0.80) ` _

Nota: Si se trata de un estudio caso control hay que tener en cuenta que:
p1 = (OR x p2) / [1 - p2 + (OR x p2)], donde OR: Odd ratio, p1 es la proporcin de expuestos
entre los casos y p2 es la proporcin de expuestos entre los controles.

II.- ESTUDIOS DE ESTIMACION.- Para determinar parmetros, es decir, cuando se


pretende hacer inferencias de valores poblacionales (proporciones, medias...) a partir de
una muestra

1.- Clculo del tamao muestral para estimar el promedio de una variable continua:

Ejemplo: Queremos saber la media de la presin arterial en personas de 50 a 60 aos.


Cuntas personas de este rango de edad necesitamos?

n = ( 1.96 x 2 )2
d2

n: Tamao muestral
1.96: Valor de la prueba z para un nivel de confianza del 95% (error de 0.05 a dos
colas)
: Desviacin estndar de la PA: de acuerdo a previos estudios o a un estudio piloto (Ej.:
20 mm. Hg.)
d: Desviacin (marca la precisin): rango dentro del cual pensamos se encuentra el
95% de los verdaderos valores de esa variable en la poblacin (ej.: 4 mm. Hg. si
pensamos que los valores caern entre 130 y 134 mm. Hg.).

2.- Clculo del tamao muestral para estimar la proporcin de una caracterstica en
una poblacin infinita o desconocida (en cuanto a nmero):

Ejemplo: queremos saber la proporcin de adolescentes de 13 a 15 aos que tienen


relaciones sexuales. cuntas personas en este rango de edad necesitamos?. Esta idea
se puede obtener revisando la literatura o mediante estudio pilotos previos. En caso de no
tener dicha informacin se utilizar el valor p=0,5 (50%).

Esta frmula tambin puede ser usada para el tamao muestral de acuerdo a la
sensibilidad o especificidad que deseamos obtener en una prueba de validez.
n = 1.962 p (1 - p)
e2

n: Tamao muestral
1.96: Valor del test z para un nivel de confianza de 95% (error de 0.05 a dos colas)
p: Proporcin que pensamos tiene la caracterstica estudiada (Ej.: 0.4 si pensamos
que el 40% tienen RS).
(1 - p): proporcin que pensamos no tienen la caracterstica estudiada (ej.: 0.6)
e: Error que estamos dispuestos a aceptar, ej.: 0.1 (10%) si pensamos que proporcin
es de 40% 10%.
3.- Clculo del tamao muestral para estimar la proporcin de una caracterstica
en una poblacin finita o conocida:

Ejemplo: queremos saber la proporcin de adolescentes de 13 a 15 aos que tienen relaciones


sexuales en una poblacin de adolescentes de 10,000 personas. cuntas personas en este
rango de edad necesitamos.

n= 1.962 N p (1 - p)
d2 (N-1) + 1.962 p (1 p)

n: Tamao muestral
1.96: Valor del test z para un error alfa de 0.05 a dos colas (y por ende un nivel de confianza del
95%)
N: Tamao de la poblacin (ej.: 10,000 personas)
p: Proporcin que pensamos tiene caracterstica estudiada (Ej.: 0.05 si pensamos
que el 5 % tienen RS).
(1 - p): proporcin que pensamos no tienen la caracterstica estudiada (ej.: 0.6)
d: Error que estamos dispuestos a aceptara, ej.: 0.03 (3%).

Potrebbero piacerti anche