Sei sulla pagina 1di 8

Inv Ed Med 2013;2(8):217-224

www.elsevier.es

METODOLOGA DE INVESTIGACIN EN EDUCACIN MDICA

Clculo del tamao de la muestra en investigacin en educacin


mdica
Jos Antonio Garca-Garca, Arturo Reding-Bernal, Juan Carlos Lpez-Alvarenga
Departamento de Bioestadstica y Bioinformtica, Direccin de Investigacin, Hospital General de Mxico Dr. Eduardo
Liceaga, Mxico D.F., Mxico.
Recepcin 7 de junio de 2013; aceptado 13 de agosto de 2013

PALABRAS CLAVE
Tamao
de
muestra;
clculo; error estadstico;
investigacin en educacin
mdica; Mxico.

Resumen
Un aspecto importante en la metodologa de la investigacin, es el clculo de la cantidad de
participantes que deben incluirse en un estudio. El tamao de muestra permite a los investigadores saber cuntos individuos son necesarios estudiar, para poder estimar un parmetro
GHWHUPLQDGRFRQHOJUDGRGHFRQDQ]DGHVHDGRRHOQ~PHURQHFHVDULRSDUDSRGHUGHWHFWDU
una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente.
El clculo del tamao de la muestra es una funcin matemtica que expresa la relacin entre
las variables, cantidad de participantes y poder estadstico.
La muestra de un estudio debe ser representativa de la poblacin de inters. El objetivo principal de seleccionarla es hacer inferencias estadsticas acerca de la poblacin de la que
proviene. La seleccin debe ser probabilstica.
Los factores estadsticos que determinan el tamao de la muestra son: hiptesis, error alfa,
error beta, poder estadstico, variabilidad, prdidas en el estudio y el tamao del efecto.
6HUHYLVDQODVIyUPXODVXWLOL]DGDVSDUDHOFiOFXORGHOWDPDxRGHODPXHVWUDHQODVVLWXDFLRQHV
ms frecuentes en investigacin, as como la revisin de frmulas para un clculo ms rpido. Se incluyen ejemplos de investigacin en educacin mdica. Tambin se revisan aspectos
importantes como: tamao de la muestra para estudios piloto, estrategias para disminuir el
Q~PHURQHFHVDULRGHVXMHWRV\software para el clculo del tamao de muestra.

KEYWORDS
6DPSOH VL]H FDOFXODWLRQ
population;
statistical
error; research in medical
education; Mexico.

Sample size calculation in medical education research


Abstract
An important aspect in the research methodology, is the calculation of the number of participants that must be included in a study, since the sample size allows the researchers to

Correspondencia: Jos Antonio Garca Garca. Dr. Balmis N 148, Colonia Doctores, Delegacin Cuauhtmoc, C.P. 06726, Mxico
D.F., Mxico. Telfonos: 5004 3842, 5004 3843. Conmutador: 2789 2000, ext. 1164. Correo electrnico: drjagarcia2@prodigy.net.mx

ISSN  - see front matter 2013 Facultad de Medicina Universidad Nacional Autnoma de Mxico. Publicado por Elsevier Mxico. Todos los derechos reservados.

218

Garca-Garca JA et al

know how many individuals it is necessary to study in order to estimate a parameter with the
desired degree of condence, or the number needed in order to detect a certain difference
between the study groups, assuming that exist actually.
The calculation of the sample size is a mathematical function that expresses the relationship
between the variables, amount of participants and statistical power.
A sample from a study should be representative of the population of interest. The main goal
of selecting a sample is to make statistical inferences about the population from which comes
from. The selection must be probabilistic.
Statistical factors that determine the sample size are: assumptions, error alpha, beta error,
statistical power, and variability, losses in the study and size effect.
We review the formulas used for calculating the sample size in the most common situations
in research, as well as the revision of formulas for a faster calculation.
Its included examples of research in medical education.
Also reviewed are important issues such as: sample size for pilot studies, strategies to reduce
the required number of subjects, and software for the sample size calculation.

Introduccin
Un aspecto relevante en la metodologa de la investigacin, es la estimacin o clculo de la cantidad de participantes que deben incluirse en un estudio. La primera
UHH[LyQ TXH VXUJH HV SDUD TXp VLUYH HO FiOFXOR GHO WDmao de la muestra? Permite a los investigadores saber
cuntos individuos son necesarios estudiar, para estimar
XQSDUiPHWURGHWHUPLQDGRFRQHOJUDGRGHFRQDQ]DGHVHDGRRHOQ~PHURQHFHVDULRSDUDGHWHFWDUXQDGHWHUPLnada diferencia entre los grupos de estudio, suponiendo
que existiese realmente.
/D LQFOXVLyQ GH XQ Q~PHUR H[FHVLYR GH VXMHWRV HQcarece el estudio en varios aspectos. Un estudio con un
WDPDxRLQVXFLHQWHGHODPXHVWUDHVWLPDUiXQSDUiPHWUR
FRQSRFDSUHFLVLyQRVHUiLQFDSD]GHGHWHFWDUGLIHUHQFLDV
entre los grupos, conduciendo a conclusiones errneas.
En este documento se revisan los aspectos sobresaOLHQWHV GHO WHPD LQFOX\HQGR ORV PDWHPiWLFRV XWLOL]DGRV
para estimar el tamao de la muestra.

Prembulo
Groso modo, puede considerarse que el objetivo de una
investigacin puede ser:
1. Estimacin de un parmetro. Se pretende hacer
inferencias a valores poblacionales (medias, proporciones), a partir de los resultados en una muestra. Por ejemplo, el porcentaje de estudiantes de
pregrado con obesidad o el de alumnos que son
aceptados para hacer una residencia mdica.
2. Contraste de hiptesis. Aqu se tiene como propsito comparar si las medidas (medias, proporciones) de las muestras son diferentes. Por ejemplo, evaluar qu intervencin educativa consigue
un mayor porcentaje de xitos.1,2

El clculo del tamao de la muestra como una


funcin matemtica
El clculo del tamao de la muestra no es una simple operacin aritmtica que nos proporcione un valor. Es una funcin matemtica, por lo tanto, el cambio de una variable,

necesariamente se acompaa del cambio de la otra considerada en la ecuacin. Permite una mejor aproximacin
DO Q~PHUR TXH VH UHTXLHUH DMXVWDQGR D VX YH] HO SRGHU
estadstico con otros parmetros.
Se denota por: y = f(x)
donde:
y = variable dependiente (atributo o caracterstica
cuyo cambio es el que interesa medir, tambin se le denomina resultante o desenlace. En el clculo del tamao
GHODPXHVWUDHVHOQ~PHURGHSDUWLFLSDQWHVTXHVHQHcesitan).
x = variable independiente (atributo o caracterstica
que explica o predice el cambio en la variable dependiente. En el clculo del tamao de la muestra, un ejemplo es
el poder estadstico que se requiere y que el investigador
MDFRQDQWHODFLyQ 
f = funcin (es una coleccin de pares de valores ordenados, que pertenecen a diferentes conjuntos. En el
clculo del tamao de la muestra, los conjuntos se pueGHQ HMHPSOLFDU FRQ HO SRGHU HVWDGtVWLFR \ HO Q~PHUR
muestral resultante).
f (x) = regla de correspondencia (expresa que para
cada elemento de un conjunto se relaciona solamente con
un elemento de otro conjunto En el clculo del tamao
de la muestra, para un elemento del poder estadstico se
UHODFLRQDVRODPHQWHFRQXQQ~PHURPXHVWUDO 
En la Figura 1 se ilustran dos ejemplos hipotticos
SDUDODUHSUHVHQWDFLyQJUiFDGHOFRQFHSWRGHIXQFLyQSD
UD OD HVWLPDFLyQ GHO WDPDxR GH PXHVWUD 6H XWLOL]DURQ
GDWRV SDUD PRGHORV FRQ GLIHUHQFLD GH PHGLDV JUiFD
L]TXLHUGD \SDUDGLIHUHQFLDGHSURPHGLRV JUiFDGHUHFKD /DJUiFDGHODIXQFLyQHVXQDOtQHD\VREUHHOODORV
seguidores del mtodo tradicional solicitan el resultado
de las frmulas aritmticas empleadas para el clculo,
que representa solamente un punto sobre la lnea. Se utiOL]yHOsoftware Statistica versin 8, para las estimacioQHV\UHSUHVHQWDFLyQJUiFDGHOWDPDxRPXHVWUDO3,4

Rigor en el clculo del tamao de muestra en


ciencias
(Q ODV GLIHUHQWHV iUHDV GH OD LQYHVWLJDFLyQ FLHQWtFD VH
debe tener rigor metodolgico tanto para la elaboracin

219

Clculo del tamao de la muestra

Comparacin de 2 proporciones: clculo del tamao de muestra


Dos proporciones: prueba Z (H0: Pi1 = Pi2)
n vs. poder (alfa= 0.05)

Prueba t muestras independientes: clculo del tamao de muestra


Dos medias: prueba t, muestras independientes (H0: +1 = +2
n vs. poder (alfa= 0.05)
50
Tamao de la muestra requerido (n)

Tamao de la muestra requerido (n)

350
300
250
200

150
100
0.6

0.7

0.8
Poder estadstico

0.9

1.0

45
40
35
30

25
20
0.70

0.75

0.80
0.85
0.90
Poder estadstico

0.95

1.00

Figura 1.5HSUHVHQWDFLyQJUiFDGHODIXQFLyQSDUDHOFiOFXORGHOWDPDxRGHODPXHVWUDWDQWRSDUDFRPSDUDUGRVPHGLDVFRPRGRVSURSRUFLRQHV(QHOHMHGHODVRUGHQDGDVVHPXHVWUDHOQ~PHURGHLQWHJUDQWHVGHODPXHVWUD\HQHOHMHGHODVDEVFLVDVHOSRGHUHVWDGtVWLFR/D
funcin est representada por la lnea, y el asterisco sobre ella representa el valor resultante de la frmula matemtica correspondiente,
REWHQLHQGRDVtHOWDPDxRGHODPXHVWUDSDUDXQSRGHUHVWDGtVWLFRGHOTXHHVXWLOL]DGRKDELWXDOPHQWH

del protocolo, como para el desarrollo de las diferentes


fases de la investigacin. En este orden de ideas, es exigible la misma severidad para estimar el tamao de la
muestra en investigacin en educacin mdica, que en
otras reas del conocimiento.5 Lo anterior aplica para la
PD\RUtDGHORVHVWXGLRVFRQWHQLGRVHQODEU~MXODRFRPSiV
de la investigacin en educacin mdica.6

En dnde se anota el desarrollo del clculo


del tamao de la muestra?
Los sitios en donde se desglosa este proceso son: el protocolo de la investigacin, tambin aparece en las tesis de
Maestras y Doctorados en Ciencias Mdicas y de la Salud
y eventualmente en las de licenciatura. Pero no aparece
en los artculos publicados, se da como un valor entendido
TXHVHUHDOL]yFRQULJRUPHWRGROyJLFR/RTXHDSDUHFHHQ
ORVDUWtFXORVFLHQWtFRVHVODPXHVWUDHQHOHVWXGLRSHUR
no las variables y sus valores que se consideraron para la
HVWLPDFLyQGHOQ~PHUR

Aspectos bsicos en el proceso de muestreo.


De poblacin a muestra y viceversa
Poblacin (cantidad representada en las frmulas como
N), es el conjunto total de elementos del que se puede
seleccionar la muestra y est conformado por elementos
denominados unidades de muestreo o unidades muestrales, con cierta ubicacin en espacio y tiempo. Las unidades de muestreo pueden ser individuos, familias, universidades, grupos de alumnos, profesores, etc. Una muestra
(cantidad representada en las frmulas como n), no es
ms que un subconjunto de la poblacin que se obtiene
por un proceso o estrategia de muestreo.4,7
El objetivo fundamental para seleccionar una muestra
es hacer inferencias estadsticas (estimaciones de uno o
ms parmetros acerca de una poblacin de inters). Esta

poblacin es la que se desea investigar y se le denomina poblacin de inters, blanco, objeto o diana. Para que
ODH[WUDSRODFLyQ LQIHUHQFLDHVWDGtVWLFD WHQJDYDOLGH]OD
muestra debe ser representativa, y alude a que el estimador muestral de las variables de inters debe tener una
distribucin similar a las de la poblacin de dnde proviene. Para cumplir este supuesto de representatividad
es deseable que la muestra sea probabilstica (Figura 2).8
Abraham Flexner, en su trascendental documento, incluy al 100% de la poblacin diana que fueron todas las
escuelas de medicina de Estados Unidos de Norteamrica
\&DQDGi/DPXHVWUDIXHLJXDOHQQ~PHURDODSREODFLyQ
un hecho muy difcil de emular.9
Un aspecto diferente de muestreo es el caso de los
HVWXGLRVSDUDGHWHUPLQDUODHFDFLD\VHJXULGDGGHDOJ~Q
medicamento, comparado con los tratamientos estndares o contra placebo. En ellos, el inters reside en contrastar hiptesis sobre una intervencin (tratamiento o
maniobra) que interesa al investigador. En este caso, el
muestreo suele ser a conveniencia.10
Este artculo se enfoca en el diseo y la determinacin
del tamao de la muestra para obtener representatividad
RYDOLGH]H[WHUQDHQODVFRQFOXVLRQHV

Muestras y proceso de aleatorizacin en los


estudios
8QDYH]TXHORVVXMHWRVGHHVWXGLRVRQVHOHFFLRQDGRVVH
KDFHXQDDOHDWRUL]DFLyQSDUDDVLJQDUODLQWHUYHQFLyQTXH
recibir cada uno. En este caso es adecuado que la aleatoUL]DFLyQVHKDJDSRUEORTXHV6LHOLQYHVWLJDGRUFRQRFHGH
DQWHPDQRODH[LVWHQFLDGHIDFWRUHVTXHPRGLFDQODYDriable dependiente, es recomendable hacer estratos para
controlar a la variable confusora, que es una variable predictora del cambio en la variable dependiente, externa a
ODUHODFLyQSULQFLSDOTXHVHDQDOL]DSHURVLPXOWiQHDPHQWH
relacionada con la variable independiente. Cada estrato

220

Garca-Garca JA et al

Poblacin
de inters
Muestra de tipo
probabilstica

6. Prdidas en el seguimiento del estudio.


7. 5HOHYDQFLD GHO WDPDxR GHO HIHFWR \ VLJQLFDQFLD
estadstica.

1. Hiptesis

Extrapoblacin
Inferencia estadstica

Estimador e
de la muestra

Parmetro O
de la poblacin

Tamao de la
muestra = n

Tamao de la
poblacin = N
Representatividad:
distribucin de frecuencias similar
entre la muestra y la poblacin

Figura 2. Interrelacin entre poblacin y muestra. La representatividad de una muestra probabilstica permite hacer inferencias
HVWDGtVWLFDVDODSREODFLyQGHLQWHUpV0RGLFDGRGH/ySH]$OYDrenga JC, et al.8

VHDOHDWRUL]DHQIRUPDLQGHSHQGLHQWHSDUDORJUDUJUXSRV
balanceados en la intervencin o tratamiento.11
Recientemente se public un ensayo controlado y
DOHDWRUL]DGR HQ LQYHVWLJDFLyQ HQ HGXFDFLyQ PpGLFD HQ
donde la intervencin o tratamiento fue un curso sobre
medicina basada en evidencia de seis meses de duracin,
la muestra incluy a los alumnos del quinto ao de la liFHQFLDWXUD HQ PHGLFLQD ORV FXDOHV IXHURQ DOHDWRUL]DGRV
HQ GRV JUXSRV EDODQFHDGRV HV GHFLU FRQ HO PLVPR Q~mero de participantes. Como variables dependientes se
midieron las actitudes, conocimientos y habilidades autoreportadas, en ambos grupos.12

Factores para la determinacin del tamao


de la muestra
Los factores que condicionan el tamao de muestra, son
de orden logstico o estadstico. Entre los primeros se enFXHQWUDQODVOLPLWDQWHVQDQFLHUDVRODGLVSRQLELOLGDGGH
participantes. Los siguientes son los factores de orden estadstico que se desglosarn a continuacin:8
1. Hiptesis.
2. Error tipo I o error _.
3. Error tipo II o error `.
4. Poder estadstico.
5. Variabilidad.

De acuerdo con el tipo de estudio de investigacin, puede


ser necesario formular una o ms hiptesis. Si se trata de un estudio tipo descriptivo, sta no es necesaria. En
los estudios de tipo comparativo es necesario establecerlas. En ambos casos, es necesario contrastar las hiptesis
\GHWHUPLQDUVLVHDFHSWDQRVHUHFKD]DQ3DUDHVHFRQtraste, las hiptesis toman el nombre de nula (H0) o alternativa (H1). El investigador desea probar la hiptesis
DOWHUQDWLYDTXHVLJQLFDUHFKD]DUODKLSyWHVLVQXOD$OYDORU HUURUWLSR, VHOHFRQRFHFRPRODSUREDELOLGDGGH
que se rechace H0 (se acepte H1) cuando H0 es cierta. Al
YDORUVHOHFRQRFHFRPRODSUREDELOLGDGGHTXHVHDFHSte H0 cuando es falsa (H1 es cierta) (Tabla 1).7,13
El tipo de contraste de hiptesis puede ser unilateral (una cola) o bilateral (dos colas). Una hiptesis uniODWHUDO HVSHFLFD OD GLUHFFLyQ GH OD DVRFLDFLyQ PD\RU R
PHQRU GHODVYDULDEOHVHQODELODWHUDOVHSXHGHDUPDU
ODDVRFLDFLyQHQWUHODVYDULDEOHVSHURQRHVSHFLFDODGLreccin. En el contraste bilateral el tamao de muestra
es ms grande, estos contrastes tambin poseen mayor
UREXVWH]\VHSUHHUHQDORVGHXQDFROD&DEHPHQFLRQDU
que el valor de Z de una distribucin normal (distribucin
en el que el valor de la media igual a 0 y desviacin estndar igual a 1) cambia dependiendo el tipo de contraste de
hiptesis. En la Tabla 2 se muestran los valores frecuenWHPHQWHXWLOL]DGRVGHODGLVWULEXFLyQQRUPDOSDUD=_/2 (2
colas) o para Z` (1 cola).2,14

2. Error tipo I o error _


En un contraste de hiptesis, al valor _ (error tipo I) se
le conoce como la probabilidad de que se rechace H0 (se
acepte H1) cuando H0 es cierta. Es decir, P(aceptar H1 |
H0 es cierta) = _. Al valor (1 _)*100 se le conoce como
HO QLYHO GH FRQDQ]D GH OD SUXHED (O YDORU GH _ vara
GHSHQGLHQGR GHO QLYHO GH FRQDQ]D TXH VH TXLHUD GH OD
prueba; el criterio ms usado en la literatura biomdica
es aceptar un riesgo de _ < 0.05.4,15

3. Error tipo II o error `


A la probabilidad de que se acepte H0 cuando sta es falsa
(H1 es cierta), se le conoce como error tipo II o error `,
es decir: P(aceptar H0 | H1 es cierta) = `. El valor de `

Tabla 1. Interpretacin de los posibles errores estadsticos en el contraste de hiptesis.


Realidad en la poblacin

Resultado de la
investigacin

Existen diferencias (H0 falsa)

No existen diferencias (H0 cierta)

Hay diferencia significativa


(se rechaza H0)

Correcto

Error tipo I (_)

No hay diferencia significativa


(se acepta H0)

Error tipo II (`)

Correcto

221

Clculo del tamao de la muestra

Tabla 2.9DORUHVIUHFXHQWHPHQWHXWLOL]DGRVGHODGLVWULEXFLyQQRUmal para Z.


_

Z_/2 (2 colas)

Z` (1 cola)

0.1

1.65

0.2

0.84

0.05

1.96

0.1

1.28

0.01

2.58

0.05

1.65

WROHUDEOHGHPD\RUDFHSWDFLyQHQODFRPXQLGDGFLHQWtFD
va de 0.1 a 0.2.4

4. Poder estadstico
Es la probabilidad de que un estudio de un determinado
WDPDxRGHWHFWHFRPRHVWDGtVWLFDPHQWHVLJQLFDWLYDXQD
diferencia que realmente existe.
6H GHQH FRPR   `. Es decir, P(aceptar H1 | H1 es
cierta) = 1 - `
Su valor depende del error tipo II que se acepte. Si `
= 0.2, se tendr una potencia de 1 - ` = 0.8. En trminos
porcentuales se dice que la prueba tiene una potencia
del 80%, que es el mnimo aceptado en la literatura biomdica.
Cuanto menores sean los riesgos calculados para los
errores alfa y beta, mayor ser el tamao muestral requerido. Cuanto menor sea la variabilidad, menor ser la
muestra estimada. A menor diferencia que se desea deWHFWDUPD\RUVHUiHOQ~PHURGHSDUWLFLSDQWHV2,16

5. Variabilidad
(VODGLVSHUVLyQHVSHUDGDGHORVGDWRV6HHYDO~DGHSHQdiendo de la variable de inters. Si stas son numricas
FRQWLQXDV JUXSR GH YDORUHV LQQLWRV TXH LQFOX\HQ GHFLmales), el tamao de muestra estar determinado por la
YDULDEOH FRQ HO PD\RU FRHFLHQWH GH YDULDFLyQ &9  >CV

(Y) = (SY/Y)], donde SY es la desviacin estndar y Y es


la media. Por otra parte, cuando las variables de inters
VRQFDWHJyULFDVSRUFRQYHQFLyQVHUHFRPLHQGDXWLOL]DUOD
estimacin de la proporcin que ms se acerque a 0.5, ya
TXHSURSRUFLRQDHOPD\RUQ~PHURPXHVWUDO3DUDGHWHUminar la variabilidad se debe recurrir a la literatura publicada de la variable de inters, cuando el dato no est
GLVSRQLEOHVHXVDUiQGDWRVGHSUXHEDVSLORWR\HQ~OWLPD
instancia a estimaciones hechas por expertos.8,17

6. Prdidas en el seguimiento del estudio


'XUDQWH OD UHDOL]DFLyQ GHO HVWXGLR SXHGH KDEHU SpU
GLGDV GH SDUWLFLSDQWHV SRU GLYHUVDV UD]RQHV (O WDPDxR
mnimo de muestra necesario para obtener resultados
HVWDGtVWLFDPHQWHVLJQLFDWLYRVHVWiSHQVDGRGHDFXHUGR
FRQHQHOQ~PHURGHVXMHWRVDOQDOGHOHVWXGLR\QRFRQ
el inicial. Es recomendable adicionar al clculo inicial, un
10% a 20% de participantes. Una forma sencilla de estimar
HOFiOFXORHVQ 5 GRQGHQUHSUHVHQWDHOQ~PHURGH
participantes sin prdidas, y R es la proporcin de prdidas esperadas.2

5HOHYDQFLDGHOWDPDxRGHOHIHFWR\VLJQLcancia estadstica
La magnitud de la diferencia del efecto que se desea detectar entre los grupos evaluados, es la condicionante
ms importante para el clculo del tamao de la muestra.
Con frecuencia, la obtencin de una diferencia estadstiFDPHQWHVLJQLFDWLYD GLIHUHQFLDHQORVUHVXOWDGRVDOFRQtrastar dos o ms valores o grupos con una prueba estaGtVWLFDJHQHUDOPHQWHVHMDXQSXQWRGHFRUWHSDUDGHFLU
que si hay diferencias entre los valores. Por convencin,
lo ms frecuente es aceptar la propuesta de Karl Pearson,
TXHKD\GLIHUHQFLDVVLJQLFDWLYDVFXDQGRHOYDORUGHp es
  QR UHVXOWD UHOHYDQWH SDUD HO iUHD HQ TXH VH HVWi
investigacin, prctica clnica, educacin mdica, etc. El
investigador debe determinar si la magnitud de esa diferencia es relevante para el rea de inters, independienWHPHQWHGHTXHKD\DVLGRHVWDGtVWLFDPHQWHVLJQLFDWLYD
Se espera que cualquier diferencia de relevancia tambin
VHDHVWDGtVWLFDPHQWHVLJQLFDWLYD10,18
Si en un estudio se han considerado los factores arriba descritos, pero no se ha anticipado que el resultado
sea relevante en educacin mdica, pierde utilidad. Para
HMHPSOLFDUVHUHDOL]yXQHVWXGLRFX\RREMHWLYRIXHPHdir el conocimiento en medicina familiar de dos muestras
de estudiantes que tomaron clases con profesores distintos, y el instrumento de medicin del nivel de conociPLHQWRIXHXQH[DPHQGHRSFLyQP~OWLSOHGHtWHPV
$O PRPHQWR GH DQDOL]DU HVWDGtVWLFDPHQWH ORV GDWRV VH
encontraron diferencias entre ambos grupos (p<0.05),
SHUR HQ HO DQiOLVLV VH LGHQWLFy TXH ODV GLIHUHQFLDV IXH
ron solamente del valor de dos respuestas, por lo anterior,
VH SXHGH DUPDU TXH KD\ GLIHUHQFLDV HVWDGtVWLFDPHQWH
VLJQLFDWLYDVSHURFDUHFHGHUHOHYDQFLDSDUDODWRPDGH
decisiones educativas.
$O FDOFXODU HO WDPDxR GH OD PXHVWUD VH XWLOL]DQ IyUmulas matemticas que consideran en forma simultnea
varios de los siete factores estadsticos antes descritos,
para la mayora de ellos ya existen valores aceptados por
convencin o incluso asignados de manera arbitraria; al
momento de sustituir valores en tales frmulas nos encontramos que los rubros de variabilidad y tamao del
HIHFWRUHTXLHUHQUHYLVLyQELEOLRJUiFDHVWXGLRVSLORWRR
la opinin de expertos para asignar un valor apropiado.

Tamaos de muestra de acuerdo a distintos


diseos de muestreo
Para la determinacin del tamao de muestra, tambin
hay que considerar el tipo de diseo empleado en la invesWLJDFLyQ([LVWHQGLVHxRVGHWDPDxRMR ORVPiVXVDGRV
en estudios clnicos, epidemiolgicos y en investigacin
HGXFDWLYD \GHWDPDxRYDULDEOH(QORVGHWDPDxRMRHO
WDPDxRGHPXHVWUDVHMDGHVGHHOLQLFLRGHODLQYHVWLJDFLyQHQORVHVWXGLRVGHWDPDxRYDULDEOHHOQ~PHURGHVXjetos se ir incrementando hasta obtener un tamao predeterminado (diseo secuencial) o el diseo experimental
que involucra un solo caso. En el resto del documento slo
VHKDFHUHIHUHQFLDDORVGLVHxRVGHWDPDxRMR2,4
/DPD\RUtDGHODVIyUPXODVXWLOL]DGDVSDUDHOFiOFXOR
del tamao de muestra, parten del supuesto de una distribucin normal de los valores de las variables en cuestin;

222

Garca-Garca JA et al

sin embargo, existen herramientas estadsticas para anaOL]DUORVGDWRVFXDQGRHVHVXSXHVWRQRVHFXPSOH

1. Clculo del tamao de muestra de una media


(O LQWHUYDOR GH FRQDQ]D SDUD HVWLPDU OD PHGLD SREODcional a partir de una muestra es el siguiente: I C  y( ,
donde y es la media estimada a partir de la muestra,
Z

y

, y Z

s

i1

n 1

es el valor del eje de

las abscisas de la funcin normal estndar en dnde se


acumula la probabilidad de (1-_). Cuando n es muy pe-

Z
quea,

4. Clculo para el tamao de muestra de la


comparacin de dos medias repetidas (pareadas) en un solo grupo
La frmula es:

Z
n n 
c

podra sustituirse por (n 1), 2 . Entonces


Z 2 2 * s2
al despejar n se tiene n 
 (Q PXHVWUDV QLWDV
2
2

grupo con una intervencin alternativa, D=(Mc-Me), Mc es


la media del primer grupo y Me es la media del segundo,
S2HVODYDULDQ]DGHDPEDVGLVWULEXFLRQHVTXHVHVXSRQHQ
iguales, Z` es el valor del eje de las abscisas de la funcin
normal estndar en dnde se acumula la probabilidad de
(1-`). Esta frmula para estimar nc = ne se emplea cuando
se trata de un contraste de hiptesis bilateral; en caso de
un contraste unilateral, se sustituir Z_/2 por Z_.2,10

donde la poblacin es inferior a un milln, la frmula para


el clculo del tamao de la muestra se suele multiplicar
SRUHOIDFWRUGHFRUUHFFLyQSRUQLWXG

la estimacin del tamao de muestra n 

n
N

, quedando

Z 2 2 * s2
2

* 1

n
N

Z
d

*S 2 ,

donde d es el promedio

de las diferencias individuales entre los valores basales y


posteriores, S2HVODYDULDQ]DGHDPEDVGLVWULEXFLRQHVTXH
se suponen iguales. Z_/2 es el valor del eje de las abscisas
de la funcin normal estndar, en donde se acumula la
probabilidad de (1-_) para un contraste de hiptesis bilateral y Z` es el valor del eje de las abscisas de la funcin
normal estndar, en donde se acumula la probabilidad de
(1-`).19

El error de estimacin o absoluto (b) se obtiene de una


muestra piloto o de estudios previos.4,8

5. Clculo para el tamao de muestra de la


comparacin de dos medias repetidas en dos
grupos distintos de participantes

2. Clculo para determinar el tamao de


muestra de una proporcin

6HXWLOL]DFXDQGRVHTXLHUHFRPSDUDUHOFDPELRHQWUHXQD
medida basal y otra posterior de dos grupos distintos de sujetos. La frmula para la estimacin del tamao de mues-

El tamao de muestra de una proporcin se calcula co-mo

tra de los grupos es la siguiente:

sigue:

n

2
2

* p(1 p)
2

n
N

, donde

Z

p(1 p)
n

, se cono-

ce como precisin del muestreo o error de la estimacin


1

n
 HV HO IDFWRU GH FRUUHFFLyQ SRU QLWXG GH OD SRN

blacin, p es la proporcin estimada del parmetro poblacional y

es el valor del eje de las abscisas de

la funcin normal estndar, en donde se acumula la probabilidad de (1-_). El error absoluto (b) se obtiene de una
muestra piloto o estudios previos. Si no puede determinarse esta proporcin, se tomar a p= 0.5, porque este
YDORUJDUDQWL]DUiHOPD\RUWDPDxRGHPXHVWUD(OQLYHOGH
FRQDQ]D _ TXHVXHOHXWLOL]DUVHHQHVWDVSUXHEDV
SRUORJHQHUDOHVGHO(OLQWHUYDORGHFRQDQ]DSDUD
XQD SURSRUFLyQ TXHGD GHQLGR GH OD VLJXLHQWH PDQHUD
p 1 < p
n

IC  p ( b  p ( Z_ 2 *

.10,19

3. Clculo para el tamao de muestra de la


diferencia de dos medias independientes
La frmula es: n

n

2*S 2
D

*Z

*Z

, donde nc es el ta-

mao de muestra para el grupo de referencia y ne es el del

n n 
c

2* Z
Z
|M

de

*(1
M |2

)*S 2

dc

donde Mdc es la diferencia entre los valores iniciales y los


QDOHVHQHOJUXSRGHORVFRQWUROHV\Mde es la diferencia
HQWUHORVYDORUHVLQLFLDOHV\QDOHVHQHOJUXSRFRQWUDWDmiento.8,19

6. Clculo para estimar el tamao de muestra


de la diferencia de dos proporciones
p (1 p1 )
p2 (1 p2 )
*  Z 2
Z , donLa frmula es: nc  ne  1
2
2

 p1

p2

de p1 es la proporcin del primer grupo y p2 es la proporcin del segundo grupo a comparar y (p1-p2) es la
diferencia de las proporciones entre ambos grupos,
Z_/2 es el valor del eje de las abscisas de la funcin
normal estndar en donde se acumula la probabilidad de (1-_) para un contraste de hiptesis bilateral y
Z` es el valor del eje de las abscisas de la funcin normal estndar, en donde se acumula la probabilidad de
(1-`).2 Un ejemplo es el Reporte Nacional del Estatus
de la Educacin Mdica en EUA.20

7. Clculo para el tamao de muestra de la


comparacin de dos proporciones independientes
Cuando se tiene una tabla de contingencia de 2 x 2 y las condiciones se cumplen para aplicar una prueba ji cuadrada,

223

Clculo del tamao de la muestra

VH SXHGH XWLOL]DU HVWD DSUR[LPDFLyQ SDUD HO FiOFXOR GHO


tamao de la muestra de la comparacin de proporciones
independientes. La frmula que Marragat y colaboradores proponen es:

n n 
c

Z * 2* P *Q
Z * P *Q
P *Q

(P

P )2

, donde

P es la proporcin media de la proporcin de eventos de


inters del grupo control (c) y en el grupo en tratamiento
(e), Qc=1-P, Pc es la proporcin de eventos de inters en el
grupo control, Qc=1-Pc, Pe, es la proporcin de eventos de
inters en el grupo expuesto o en tratamiento, Qe=1-Pe, y
(Pe-Pc) es la diferencia de las proporciones entre el grupo
control y la proporcin del grupo de expuestos.8,19

8. Opcin rpida y aceptable para el clculo


del tamao muestral
([LVWHXQDIyUPXODVLPSOLFDGDSDUDHOFiOFXORGHOWDPDo muestral para comparar dos medias, cuando se acepta
un error bilateral alfa del 5% y una potencia del 80%.2
6LVHGHQRPLQDGLIHUHQFLDHVWDQGDUL]DGD DE) al cociente
entre las diferencias de medias d y la desviacin estndar
s, tenemos: DE = d/s, por lo que, una frmula abreviada,
que sirve para estimar muy aproximadamente el tamao
de la muestra, es:
n = 16/(DE)2
&XDQGR HVWD IyUPXOD HV XWLOL]DGD SDUD FRPSDUDU GRV
proporciones,2 la expresin es:
n = 16pmqm/d2

Conclusiones
La investigacin educativa debe tener el mismo rigor meWRGROyJLFRTXHRWUDViUHDVFLHQWtFDVLQFOXLGRHOFiOFXOR
del tamao de la muestra. Hay que practicar una y otra
YH]HVGHFLUVHUDFWLYRVSDUDSRGHUVHUFRPSHWHQWHHQ
OD FRQFHSWXDOL]DFLyQ GH FyPR HVWLPDU OD IXQFLyQ PDWHmtica del tamao muestral. Al respecto, Abraham FlexQHUHVFULELyODPHGLFLQDPRGHUQDFRPRWRGDHQVHxDQ]D
FLHQWtFDHVWiFDUDFWHUL]DGDSRUODDFWLYLGDG/DVFRQIHrencias y los libros no son sustitutos de las experiencias.

Contribucin de los autores


-$** JHQHUDGRU GH OD SURSXHVWD E~VTXHGD UHFXSHUDcin y anlisis de la informacin relacionada con el tema
y redaccin del manuscrito.
ARB, aportacin de ideas para la estructura del documento, redaccin del documento.
JCLA, asesora continua, aport comentarios y revisin del manuscrito.

Financiamiento
Ninguno.

&RQLFWRGHLQWHUHVHV
/RV DXWRUHV GHFODUDQ QR WHQHU QLQJ~Q FRQLFWR GH LQWHreses.

Consideraciones especiales

Presentaciones previas

1. Tamao de muestra para estudios piloto

Ninguna.

Se recomienda incluir entre 30 y 50 participantes, los cuales deben poseer los atributos que se desean medir en la
poblacin objetivo.21

Referencias

2. Estrategias para minimizar el nmero necesario


de participantes
Se basan en conseguir una poblacin homognea (desde
los criterios de seleccin), disminuir la variabilidad de las
PHGLGDV DOHDWRUL]DQGRIRUPDQGREORTXHV \DXPHQWDUOD
frecuencia de aparicin del fenmeno de inters, por lo
que deben aplicarse siempre que sea posible.2,17

3. Software de utilidad
El uso de internet facilita obtener el tamao de muestra empleando programas en lnea. Los programas utili]DQ GLIHUHQWHV DOJRULWPRV PDWHPiWLFRV SDUD HIHFWXDU HO
FiOFXOR\DXQTXHHVHQFLDOPHQWHXWLOL]DQORVPLVPRVHOHPHQWRVSXHGHKDEHUOLJHUDVGLIHUHQFLDVHQHOQ~PHURGH
la muestra.
(QWUH ORV SURJUDPDV PiV XWLOL]DGRV HVWiQ (3,'$7,
G*Power y Epi Info,8 de acceso libre. Hojas de clculo
como Excel2, tambin son de utilidad. Entre los software
de paga destacan Stata,16 SAS,22 STATISTICA3 y SigmaPlot,23SRUPHQFLRQDUVyORDOJXQRV/RVGRV~OWLPRVWLHQHQODYHQWDMDGHSRGHUJUDFDUODVIXQFLRQHVGHHVWLPDciones del tamao de la muestra.
Hay que usarlos crticamente, siendo necesario comprender bien los principios del clculo.

1. $UJLPRQ 3-0 -LPpQH] 9- 0pWRGRV GH LQYHVWLJDFLyQ FOtQLFD \


epidemiolgica. 4 edicin. Espaa: Elsevier; 2012. p. 140-158.
2. 0DUWtQH]*0$6iQFKH]9$)DXOtQ)-%LRHVWDGtVWLFDDPLJDEOH
HGLFLyQ(VSDxD'tD]GH6DQWRVS
3. &RQVXOWDGRHOGHPDU]RGHhttp://www.statsoft.com/
textbook/power-analysis/
4. )R[1+XQQ$0DWKHUV16DPSOLQJDQGVDPSOHVL]HFDOFXODWLRQ
The National Institutes for Health Research. USA: NIHR RDS EM/
YH; 2009. p. 12-24.
5. &RRN '$ %HFNPDQ 7- 5HHFWLRQV RQ H[SHULPHQWDO UHsearch in medical education. Adv Health Sci Edu Theory Pract
2010;15(3):455-464.
6. Ringsted C, Hodges B, Scherpbier A. The research compass: An
introduction to research in medical education: AMEE Guide No
56. Med Teach 2011;33:695-709.
7. %HQQHWW-2%ULJJV:/7ULROD0)5D]RQDPLHQWRHVWDGtVWLFR0pxico: Pearson Educacin; 2011. p. 333-361.
8. /ySH]$OYDUHQJD -& 5HGLQJ%HUUQDO$ &iOFXOR GHO WDPDxR GH
la muestra: enfoque prctico de sus elementos necesarios. En:
*DUFtD*DUFtD -$ -LPpQH]3RQFH ) $UQDXG9LxDV 05 HGV 
Introduccin a la metodologa de la investigacin en ciencias
de la salud. Mxico: McGraw-Hill Interamericana; 2011. p. 6776.
9. Consultado el 27 de febrero de 2013. http://www.carnegiefounGDWLRQRUJVLWHVGHIDXOWOHVHOLEUDU\&DUQHJLHB)OH[QHUB5Hport.pdf (
10. /ySH]$OYDUHQJD-&5HGLQJ%HUUQDO$3pUH]1DYDUUR0HWDO
Cmo se puede estimar el tamao de la muestra de un estudio.
Dermatol Rev Mex 2010;54(6):375-379.

224

11. Box GE, Hunter JS, Hunter WG. Estadstica para investigadores.
Diseo, innovacin y descubrimiento. 2 edicin. Espaa: Editorial Revert; 2008. p. 133-172.
12. 6iQFKH]0HQGLROD0.LHIIHU(VFREDU/)0DUtQ%HOWUiQ6HWDO
Teaching of evidence-based medicine to medical students in
0H[LFRDUDQGRPL]HGFRQWUROOHGWULDO%0&0HG(GXF
107.
13. /DQGHUR+5*RQ]iOH]507(VWDGtVWLFDFRQ6366\PHWRGRORJtD
de la investigacin. Mxico: Trillas; 2007. p. 67-75.
14. &RER(0XxR]3*RQ]iOH]-$%LRHVWDGtVWLFDSDUDQRHVWDGtVWLcos. Espaa: Elsevier; 2007. p. 212-228.
15. (ORU]D37+(VWDGtVWLFDSDUDODVFLHQFLDVVRFLDOHVGHOFRPSRUtamiento y de la salud. 3 edicin. Mxico: CENGAGE Learning;
2008. p. 319-338.
16. Acock AC. A gentle introduction to Stata. 3th edition. Texas: Stata
Press; 2012. p.170-177.
17. Hulley SB, Cummings SR, Browner WS, et al. Design clinical research. 3th edition. Philadelphia, USA: Lippincott, Williams & Wilkins; 2007. p. 65-69.

Garca-Garca JA et al

18. 6XOOLYDQ*1)HLQQ58VLQJHIIHFWVL]HRUZK\WKHSYDOXHLVQRW
enough. J Grad Med Educ 2012;4:279-282.
19. Marrugat J, Vila J, Pavesi M, et al. Estimacin del tamao de
muestra en la investigacin clnica y epidemiolgica. Med Clin
1998;111:267-276.
20. Sullivan AM, Lakoma MD, Block SD. The status of medical education in end-of-life care. A National Report. J Gen Intern Med
2003;18:685-695.
21. Babbie E. Fundamentos de la investigacin social. 3 edicin.
Mxico: Thomson editores; 2000. p. 232-256.
22. Consultado el 08 de mayo de 2013. http://www.sas.com/technologies/analytics/statistics/stat/index.html
23. Consultado el 02 de mayo de 2013. http://www.sigmaplot.com/
products/sigmaplot/sigmaplot-details.php#sa.

Potrebbero piacerti anche