Cálculo Tamaño Muestral en Investigación Clínica

Clculo tamao muestral en investigacin
clnica . para no estadsticos

"It is far better to foresee even without certainty than not to
foresee at all"
Henri Poincare in The Foundations of Science
Enrique Granados
5 Octubre 2011
Tan necesarios son los conocimientos

clnicos como los estadsticos
Este maldito estadstico
no me dice la N para mi
estudio
Presentation title in footer | 00 Month 0000
Esta maldita clnica no

me dice que efecto
espera encontrar en su
estudio
Importancia buen clculo del tamao

muestral
Tamao
insuficiente
Gasto de recursos
Econmica sin obtener
conocimiento (*)
Etica
Riesgo para
pacientes sin
avance de
conocimiento (*)
(*): posibilidad de metanlisis posteriores

1: Bacchetti, Am J Epidemiol 2005
3
Tamao excesivo
Gasto de ms
recursos que los
necesarios
Ests comprando
la p a base de una N
muy grande?1
El clculo de tamao muestral debe hacerse al

comienzo del proceso de investigacin
Objetivo primario y
Endpoint primario
Reformular
objetivo 1ario
Clculo de tamao muestral
No
Seguir con el resto

de la sinopsis
4
Excesivo para
nuestros recursos?
Descartar la idea
Ingredientes para el clculo de

tamao muestral
Una variable primaria
Si hay ms de una variable primaria
habr que coger el mayor tamao
muestral
Un test estadstico
Una hiptesis nula
Una hiptesis de trabajo (alternativa)
(con las asunciones del efecto
esperado o deseado). Lo ms
complicado!!
Una probabilidad de error tipo I
Una probabilidad de error tipo II
Una estimacin de las prdidas
y un buen software
5
Dos tipos de error

H0 (hiptesis nula): los dos grupos son iguales
HA (hiptesis alternativa): los dos grupos son distintos
Realidad
No beneficio del
tratamiento (se
acepta H0)
Resultado
del ensayo Existe beneficio
del tratamiento
(se acepta HA)
6
No beneficio del
tratamiento
Existe beneficio del

tratamiento
(H0 es cierta)
(HA es cierta)
No hay error
Error de tipo II
Falso negativo
Error de tipo I
Falso positivo
No hay error
Dos tipos de error

Error alfa o tipo I: probabilidad de producir un falso positivo.
Se rechaza la hiptesis nula , aunque esta es cierta
Error del exceso de credulidad
Tambin llamado nivel de significacin del test
Por convencin se suele poner en el 5%. Ms raro en el 1% o 10%
Error beta o tipo II: probabilidad de producir un falso negativo.

No se rechaza la hiptesis nula, a pesar de ser falsa
La potencia (1 - beta), representa la probabilidad de rechazar la Ho cuando
en realidad es falsa (decisin correcta)
Error del exceso de escepticismo
Por convencin se suele poner en 10-20%
Convencin: =5%, =20%. Se considera que el error tipo II es menos

serio que el error tipo I. Preferimos pasarnos de escpticos.
Para un tamao muestral dado, los esfuerzos por

reducir un error conllevan un aumento del otro tipo
de error
La nica manera de minimizar ambos errores es

aumentar el tamao de la muestra
8
Qu error es ms serio: el tipo I

(crdulo) o el tipo II (escptico)?
Depende de la aplicacin a la vida real, no es un problema estadstico
P (Error tipo I) en los juicios:

Juicio penal: Ms all de una duda razonable. 12 de 12 jurados
deben votar culpable unnimamanete. Como si fijramos el nivel
en 0.001.
Juicios civilies: Preponderancia de la evidencia. 9 de 12 jurados
deben votar culpable. Es como si fijsemos el nivel alfa en 0,1.
Un ruido en la noche en la sabana

africana
Yo creo que es
Tigre
Rama
Error tipo II
Tigre
En realidad
es
Eres
devorado
Error tipo I
Rama
10
Acertaste
Falsa
alarma
Acertaste
Un ruido en la noche en la sabana

africana
Michael Shermer:
Nuestro sistema
cognitivo ha ido
evolutivamente
sesgndose para ser
crdulos, para tolerar
errores tipo I
11
La existencia de Dios y los errores

tipo I y II
Blaise Pascal1623-1662. Cientfico, filsofo
y escritor francs.
Prefiero equivocarme creyendo en un Dios

que no existe, que equivocarme no
creyendo en un Dios que existe. Porque si
despus no hay nada, evidentemente nunca
lo sabr, cuando me hunda en la nada
eterna; pero si hay algo, si hay Alguien,
tendr que dar cuenta de mi actitud de
rechazo.
12
Si aumentamos el tamao muestral,

aumentamos la precisin pero no la exactitud
Precisin: dispersin (desviacin estndar) del conjunto de valores
obtenidos de mediciones repetidas.
Cuanto menor es la dispersin mayor la precisin.
Exactitud (accuracy): cun cerca del valor real se encuentra el valor medido.
Cuanto menor es el sesgo ms exacta es una estimacin.
El problema de las variables de confusin de los estudios observacionales NO se
soluciona aumentando el tamao muestral.
Baja precisin,
Alta exactitud
14
Alta precisin,
Baja exactitud
Reduccin en la anchura del intervalo de

confianza al aumentar el tamao de la muestra
Jones, EMJ online 2009

15
Efecto de la reduccin del intervalo de confidencia

para demostrar una diferencia en las medias

16
Effect size (tamao del efecto)

Es una manera de cuantificar la diferencia entre dos o ms grupos
D de Cohen (tamao del efecto estandarizado)1: la diferencia entre
las medias dividido por la desviacin estndar de la poblacin.
Ventaja no tiene unidades.
A menor d, mayor tamao muestral se necesita

Es importante que esta diferencia esperada no sea alta de manera
poco realista, para no infraestimar el tamao muestral requerido
El tamao del efecto es un tema de juicio clnico: Qu resultados
estimas o esperas que aparezcan?
17
1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences
A menor tamao del efecto, ms

tamao muestral se necesita
18
Tamaos del efecto estandarizados para

diversos tests estadsticos
Estos tamaos estandarizados facilitan el clculo de tamao muestral, pero no
reemplazan la necesidad de buscar la bibliografa adecuada que lo sustente.
19
Cunningham, Evidence Based Midwifery 2007
Ejemplos de tamaos muestrales estimados para

efectos pequeos, medianos y grandes
El tamao puede ser de 788, 128 o 52 en funcin del efecto que vayamos a
encontrar.
Cmo es capaz un CEIC de asegurar cual de los efectos es el correcto?!!!!
20
Cunningham, Evidence Based Midwifery 2007
A favor y en contra de usar el tamao

del efecto estandarizado
A favor
No necesitas realizar un piloto o
buscar datos histricos para
determinar la desviacin
estndar.
Los estndar de pequeo,
medio y grande se basan en
una extensa revisin de la
literatura de las ciencias sociales
y por tanto son convenciones
realsticas 1
21
En contra
Si no miras al numerador y
denominador por separado ests
obviando como de preciso es tu
instrumento de medida.
1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences
La potencia (probabilidad de encontrar una

diferencia predeterminada si existe) aumenta si
La Diferencia entre el valor bajo la hiptesis nula y la observada
es mayor
Si P( Error tipo I) = es mayor
Si la desviacin estndar es menor (precisin mayor de la
medida)
Si aumenta el tamao muestral
Si usas pruebas paramtricas (p.e. t de Student) que no
paramtricas (U de Mann Whitney)
Por eso a veces se intentan convertir los datos bsicos a una
distribucin normal
22
La potencia (probabilidad de encontrar una diferencia

predeterminada si existe) aumenta si(II)
Se usan estudios cruzados en vez de paralelos
Siempre que los sujetos estn estables durante el lavado.
Los estudios de medidas repetidas (antes despus) tienen ms

potencia que los estudios de medidas no repetidas
El ratio del tamao de las muestras de los grupos (N1 / N2) es 1
Si se usan contrastes de una cola que si se usan de dos.
23
Qu hacer si me sale una muestra

demasiado grande?
Disminuir la precisin de la medida: aumentar el intervalo de confianza
esperado
Revisar bibliografa: existen datos publicados en que la variable se
presente con una desviacin estndar menor?
Disminuir la potencia si se puede
Aumentar la probabilidad de error tipo I (alfa) si se puede
Intentar cambiar el objetivo primario, buscar otros tests estadsticos
Ver si se puede usar contraste de una cola en vez de dos colas (en el caso
que solo nos interese demostrar diferencias en un sentido)
24
Qu hacer si me sale una muestra

demasiado pequea?
Enhorabuena!! Tienes dinero para pagar la mayor muestra.
Aumentar la precisin de la medida: aumentar el intervalo de
confianza esperado
Aumentar la potencia.
OJO: al aumentar la potencia podrs detectar diferencias
estadsticamente significativas entre la hiptesis nula y la
hiptesis alternativa que sean irrelevantes clnicamente
Importante conocer cual es el la mnima diferencia clnicamente
significativa.
Disminuir la probabilidad de error tipo I (alfa) si se puede
25
Ejemplos de estudios de una cola o de dos colas

I
Frmaco A
Eventos adversos / caro
Frmaco B
No eventos adversos / barato
ms eficaz
A&B
igual
ms eficaz
II
Intervencin en nutricin- Sesiones en grupo
Intervencin en nutricin- Sesiones individuales
Reduce ms la ingesta de sodio
X&Y
Igual
Reduce ms la ingesta de sodio
S.F.Kelsey/class2181/lecture 4-sample size

26
26
Una cola
Rechazo H0
No rechazo H0
.05
Zcrit
-1.65
Dos colas
Rechazo H0
.025
Zcrit
-1.96
27
Rechazo H0
No rechazo H0
.025
Zcrit
1.96
Una sola cola
critical t = 1.65175
Distribucin central H0
Distribucin no central H1
0.3
0.2
28
0.1
-3
-2
-1
Dos colas
critical t = 1.96835
Distribucin no central H1
Distribucin central H0
0.3
0.2
29
a
2
0.1
-3
-2
-1
Significacin clnica o estadstica

Lo importante es siempre la clnica!!!
Estadsticamente significativo, clnicamente NO significativo
La p depende de la N, La significacin estadstica se puede comprar
con una N grande
Ejemplos:
Aumento de una semana en la supervivencia del cncer
Aumento de 2-3 ovocitos en ciclos de FIV
Insuficiente para obtener autorizaciones de comercializacin
Estadsticamente NO significativo, clnicamente significativo

Ejemplo: Aparicin de eventos adversos muy graves que modifican el
perfil riesgo / beneficio
Pueden llevar a la no aprobacin o incluso a una posterior retirada de la
autorizacin de comercializacin
30
Estudios de no-inferioridad frente a

un control activo
Aceptables cuando no es tico un estudio frente a placebo y
el nuevo medicamento slo tiene ventajas en cuanto a efectos
secundarios o comodidad o costes, pero la misma eficacia
En general requieren un tamao muestral mayor
Fundamental establecer el margen de no inferioridad:
diferencias entre el margen experimental y el control activo no
son superiores a una cifra prefijada.
31
Herramientas especficas para

el clculo de tamao muestral
Software libre para el clculo de tamao

muestral
GP Power 3.1
Heinrich Heine University, Dusseldorf University
http://www.psycho.uniduesseldorf.de/abteilungen/aap/gpower3/download-andregister
PS Power and Sample size

Department Biostatistics, Vanderbilt University
http://biostat.mc.vanderbilt.edu/wiki/Main/PowerSampleSize
ST Plan
MD Anderson Cancer Center
https://biostatistics.mdanderson.org/SoftwareDownload/Singl
eSoftware.aspx?Software_Id=41
33
Webs para el clculo de tamao

muestral
http://department.obg.cuhk.edu.hk/researchsupport/statstesthome.asp
http://stat.ubc.ca/~rollin/stats/ssize/
http://www.stat.uiowa.edu/~rlenth/Power/index.html
http://www.raosoft.com/samplesize.html
http://epitools.ausvet.com.au/content.php?page=SampleSize
http://statpages.org/index.html#Power
34
GP Power 3.1
Permite tres tipos de anlisis:
A priori: calcula el tamao muestral a partir de alfa, beta y el tamao observable del efecto
Post hoc: calcula la potencia a partir de alfa, el tamao observable del efecto y el tamao de
la muestra.
Para estudios piloto de deteccin de seales permite estimar la potencia a partir de un tamao muestral
pragmtico.
Compromise: calcula un ratio alfa / beta a partir del tamao observable del efecto y el tamao
de la muestra
Anlisis de sensibilidad: calcula el tamao del efecto a partir de la N (cuando sabemos que
no tenemos recursos para aumentarla), alfa, y beta
Util para:
Medias: un grupo, un grupo antes y despus, dos grupos independientes, muchos grupos
(ANOVA, ANCOVA)
Proporciones: un grupo o dos
Correlaciones y regresiones
Tests paramtricos y no paramtricos
35
Ejemplo clculo
basado en
diferencias de
medias en dos
grupos
independientes
36
GP Power 3.1
Posibilidad de hacer grficos
t tests - Means: Difference between two independent means (two groups)
Tail(s) = Two, Allocation ratio N2/N1 = 1, a err prob = 0.05
1200
Total sample size
1000
Effect size d
= 0.2
800
= 0.25
= 0.3
600
400
200
0.6
37
0.65
0.7
0.75
0.8
Power (1- err prob)
0.85
0.9
0.95
PS Power and Sample Size

Permite tres tipos de clculo:
Tamao muestral
Potencia
Tamao efecto detectable
Util para estudios de:

Supervivencia
T Test
Regresin
Proporciones
Mantel Haenszel
Slo para estudios de dos colas

38
Ejemplo clculo
basado en
diferencias de
medias en dos
grupos
independientes
39
ST PLAN
Interfaz poco amigable
Util para:
Comparacion de medias
Comparacion de
proporciones
Supervivencia
Correlacion
40
Estudios de estimar una proporcion

Ejemplo: estudios de prevalencia de una enfermedad
Para la misma precisin de la medida, el tamao muestral es mayor
cuanto la proporcin es ms cercana al 50% (mxima
indeterminacin) est
Herramientas
http://www.cs.uiowa.edu/~rlenth/Power/
http://department.obg.cuhk.edu.hk/researchsupport/Sample_size_EstPrev.asp
41
Estudios con dos proporciones

El tamao muestral aumenta:
Si la diferencia entre ambas proporciones disminuye
Si la potencia aumenta.
Cuanto ms cercanas estn las proporciones al 50%
Equivalencia > Superioridad > No inferiordad
P2 = 0.99
P2 = 0.95
P2 = 0.9
P2 = 0.8
P2 = 0.7
P2 = 0.6
P2 = 0.5
P2 = 0.4
P2 = 0.3
P2 = 0.2
P2 = 0.1
P2 = 0.05
P1 = 0.01 P1 = 0.05 P1 = 0.1

5
5
6
5
6
7
6
7
8
7
8
10
9
11
13
12
14
17
15
19
25
21
27
38
30
43
72
50
88
219
121
474
333
P1 = 0.2
7
8
10
13
19
28
45
91
313
P1 = 0.3
9
11
13
19
29
49
103
376
P1 = 0.4
12
14
17
28
49
107
408
P1 = 0.5
15
19
25
45
103
408
P1 = 0.6
21
27
38
91
376
P1 = 0.7
30
43
72
313
P1 = 0.8
50
88
219
P1 = 0.9
121
474
Ejemplos de tamaos para un error alfa de 0,05 y un error beta de 0,8

42
P1 = 0.95
333
Estudios con dos proporciones
Herramientas:
GP Power
PS
43
Estudios de estimar una media de un

solo grupo
El tamao muestral debe justificarse mediante referencia a
un intervalo de confianza (normalmente 95%) alrededor de
una media de la variable de estudio (desviacin estndar)
Herramientas:
http://epitools.ausvet.com.au/content.php?page=1Mean
http://stat.ubc.ca/~rollin/stats/ssize/n1.html
http://department.obg.cuhk.edu.hk/researchsupport/Sample_size_E
stMean.asp
44
Estudios de comparar medias en dos

grupos
El tamao muestral aumenta si:
La diferencia entre las medias es menor
La desviacin estndar es mayor
Si aumentamos la potencia
45
Estudios de comparar medias en dos

grupos
Herramientas:
http://epitools.ausvet.com.au/content.php?page=2Means1
http://stat.ubc.ca/~rollin/stats/ssize/n2.html
46
Normograma(*) para el clculo de tamao muestral

para comparar medias mediante alfa, beta y tamao
del efecto (Gore & Altman 2001)
*: Vlido si siguen
distribucin normal

47
Estudios de variables de tiempos hasta un

evento (uso de log-rank)
El tamao muestral ser mayor:
Cuanto menor sea la diferencia entre los tiempos de
supervivencia o ms cercano est el Hazard Ratio a 1.
Si el tiempo de reclutamiento es ms pequeo
Si el tiempo de seguimiento es menor
Si el ratio N2 / N1 se aleja de 1
Herramientas:
http://hedwig.mgh.harvard.edu/sample_size/time_to_event/para_time.html
48
Estudios de concordancia (estadstico

kappa)
Sim, Physical Therapy 2005
49
Estudios diagnsticos
50
Estudios diagnsticos
Herramientas:
http://department.obg.cuhk.edu.hk/researchsupport/
Sample_size_ROC.asp
http://araw.mede.uic.edu/cgi-alansz/testcalc.pl
51
Buderer, Acad Emerg Med 1996
Estudios diagnsticos con datos de prevalencia
52
53
Carley, Emerg Med J 2005
54
Carley, Emerg Med J 2005
Buderer, Emerg Med J 2003
Normograma para estudios

diagnsticos
55
Conclusiones y mensajes (I)

Haz estos clculos lo ms pronto posible en la planificacin de un
estudio.
Si leemos un estudio con resultados negativos hay que analizar la
potencia estadstica de ese estudio.
Pon siempre los datos clnicos antes que los estadsticos tanto para
interpretar los resultados como para planificar la muestra.
Haz estudios piloto: no pretendas responder todas las preguntas del
mundo en un solo estudio.
Ojo con los diseos para estudiar los efectos en subgrupos porque
necesitars aumentar el tamao muestral.
56
Conclusiones y mensajes (II)

Qu es un trabajador del conocimiento?:
Su funcin es resolver problemas, mediante la creacin,
distribucin o aplicacin de informacin / conocimiento.
Son problemas no operativos, no existe una secuencia
protocolizada de acciones que los resuelvan.
Necesita gran variedad de talentos y habilidades: buscar y
evaluar crticamente informacin; discriminar diferentes
fuentes, evaluando los intereses que hay detrs de cada
argumento; hacer preguntas y establecer hiptesis; desarrollar
anlisis numricos complejos, tener ideas y puntos de vista
propios y expresarlos de manera argumentada, clara y concisa
de forma oral y por escrito.
Jorge Juan Fernndez, Las Reglas de Juego, 2010
57
58

Cálculo Tamaño Muestral en Investigación Clínica

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Cálculo Tamaño Muestral en Investigación Clínica

Caricato da

Copyright:

Formati disponibili

Clculo tamao muestral en investigacin

clnica . para no estadsticos

Tan necesarios son los conocimientos

Presentation title in footer | 00 Month 0000

Esta maldita clnica no

Importancia buen clculo del tamao

(*): posibilidad de metanlisis posteriores

Presentation title in footer | 00 Month 0000

El clculo de tamao muestral debe hacerse al

Clculo de tamao muestral

Seguir con el resto

Presentation title in footer | 00 Month 0000

Ingredientes para el clculo de

Presentation title in footer | 00 Month 0000

Dos tipos de error

Presentation title in footer | 00 Month 0000

Existe beneficio del

Dos tipos de error

Error beta o tipo II: probabilidad de producir un falso negativo.

Convencin: =5%, =20%. Se considera que el error tipo II es menos

Presentation title in footer | 00 Month 0000

Para un tamao muestral dado, los esfuerzos por

La nica manera de minimizar ambos errores es

Presentation title in footer | 00 Month 0000

Qu error es ms serio: el tipo I

P (Error tipo I) en los juicios:

Presentation title in footer | 00 Month 0000

Un ruido en la noche en la sabana

Presentation title in footer | 00 Month 0000

Un ruido en la noche en la sabana

Presentation title in footer | 00 Month 0000

La existencia de Dios y los errores

Prefiero equivocarme creyendo en un Dios

Presentation title in footer | 00 Month 0000

Si aumentamos el tamao muestral,

Presentation title in footer | 00 Month 0000

Reduccin en la anchura del intervalo de

Jones, EMJ online 2009

Presentation title in footer | 00 Month 0000

Efecto de la reduccin del intervalo de confidencia

Jones, EMJ online 2009

Presentation title in footer | 00 Month 0000

Effect size (tamao del efecto)

A menor d, mayor tamao muestral se necesita

Presentation title in footer | 00 Month 0000

1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences

A menor tamao del efecto, ms

Presentation title in footer | 00 Month 0000

Jones, EMJ online 2009

Tamaos del efecto estandarizados para

Cunningham, Evidence Based Midwifery 2007

Presentation title in footer | 00 Month 0000

Ejemplos de tamaos muestrales estimados para

Cunningham, Evidence Based Midwifery 2007

Presentation title in footer | 00 Month 0000

A favor y en contra de usar el tamao

Presentation title in footer | 00 Month 0000

1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences

La potencia (probabilidad de encontrar una

Presentation title in footer | 00 Month 0000

La potencia (probabilidad de encontrar una diferencia

Los estudios de medidas repetidas (antes despus) tienen ms

Presentation title in footer | 00 Month 0000

Qu hacer si me sale una muestra