Sei sulla pagina 1di 57

Clculo tamao muestral en investigacin

clnica . para no estadsticos


"It is far better to foresee even without certainty than not to
foresee at all"
Henri Poincare in The Foundations of Science

Enrique Granados
5 Octubre 2011

Tan necesarios son los conocimientos


clnicos como los estadsticos
Este maldito estadstico
no me dice la N para mi
estudio

Presentation title in footer | 00 Month 0000

Esta maldita clnica no


me dice que efecto
espera encontrar en su
estudio

Importancia buen clculo del tamao


muestral
Tamao
insuficiente
Gasto de recursos
Econmica sin obtener
conocimiento (*)

Etica

Riesgo para
pacientes sin
avance de
conocimiento (*)

(*): posibilidad de metanlisis posteriores


1: Bacchetti, Am J Epidemiol 2005
3

Presentation title in footer | 00 Month 0000

Tamao excesivo
Gasto de ms
recursos que los
necesarios
Ests comprando
la p a base de una N
muy grande?1

El clculo de tamao muestral debe hacerse al


comienzo del proceso de investigacin

Objetivo primario y
Endpoint primario

Reformular
objetivo 1ario

Clculo de tamao muestral

No

Seguir con el resto


de la sinopsis
4

Presentation title in footer | 00 Month 0000

Excesivo para
nuestros recursos?

Descartar la idea

Ingredientes para el clculo de


tamao muestral
Una variable primaria
Si hay ms de una variable primaria
habr que coger el mayor tamao
muestral

Un test estadstico
Una hiptesis nula
Una hiptesis de trabajo (alternativa)
(con las asunciones del efecto
esperado o deseado). Lo ms
complicado!!
Una probabilidad de error tipo I
Una probabilidad de error tipo II
Una estimacin de las prdidas
y un buen software
5

Presentation title in footer | 00 Month 0000

Dos tipos de error


H0 (hiptesis nula): los dos grupos son iguales
HA (hiptesis alternativa): los dos grupos son distintos
Realidad

No beneficio del
tratamiento (se
acepta H0)

Resultado
del ensayo Existe beneficio
del tratamiento
(se acepta HA)
6

Presentation title in footer | 00 Month 0000

No beneficio del
tratamiento

Existe beneficio del


tratamiento

(H0 es cierta)

(HA es cierta)

No hay error

Error de tipo II
Falso negativo

Error de tipo I
Falso positivo

No hay error

Dos tipos de error


Error alfa o tipo I: probabilidad de producir un falso positivo.
Se rechaza la hiptesis nula , aunque esta es cierta
Error del exceso de credulidad
Tambin llamado nivel de significacin del test
Por convencin se suele poner en el 5%. Ms raro en el 1% o 10%

Error beta o tipo II: probabilidad de producir un falso negativo.


No se rechaza la hiptesis nula, a pesar de ser falsa
La potencia (1 - beta), representa la probabilidad de rechazar la Ho cuando
en realidad es falsa (decisin correcta)
Error del exceso de escepticismo
Por convencin se suele poner en 10-20%

Convencin: =5%, =20%. Se considera que el error tipo II es menos


serio que el error tipo I. Preferimos pasarnos de escpticos.

Presentation title in footer | 00 Month 0000

Para un tamao muestral dado, los esfuerzos por


reducir un error conllevan un aumento del otro tipo
de error

La nica manera de minimizar ambos errores es


aumentar el tamao de la muestra
8

Presentation title in footer | 00 Month 0000

Qu error es ms serio: el tipo I


(crdulo) o el tipo II (escptico)?
Depende de la aplicacin a la vida real, no es un problema estadstico

P (Error tipo I) en los juicios:


Juicio penal: Ms all de una duda razonable. 12 de 12 jurados
deben votar culpable unnimamanete. Como si fijramos el nivel
en 0.001.
Juicios civilies: Preponderancia de la evidencia. 9 de 12 jurados
deben votar culpable. Es como si fijsemos el nivel alfa en 0,1.

Presentation title in footer | 00 Month 0000

Un ruido en la noche en la sabana


africana

Yo creo que es

Tigre

Rama
Error tipo II

Tigre
En realidad
es

Eres
devorado

Error tipo I
Rama

10

Acertaste

Presentation title in footer | 00 Month 0000

Falsa
alarma

Acertaste

Un ruido en la noche en la sabana


africana

Michael Shermer:
Nuestro sistema
cognitivo ha ido
evolutivamente
sesgndose para ser
crdulos, para tolerar
errores tipo I
11

Presentation title in footer | 00 Month 0000

La existencia de Dios y los errores


tipo I y II
Blaise Pascal1623-1662. Cientfico, filsofo
y escritor francs.

Prefiero equivocarme creyendo en un Dios


que no existe, que equivocarme no
creyendo en un Dios que existe. Porque si
despus no hay nada, evidentemente nunca
lo sabr, cuando me hunda en la nada
eterna; pero si hay algo, si hay Alguien,
tendr que dar cuenta de mi actitud de
rechazo.
12

Presentation title in footer | 00 Month 0000

Si aumentamos el tamao muestral,


aumentamos la precisin pero no la exactitud
Precisin: dispersin (desviacin estndar) del conjunto de valores
obtenidos de mediciones repetidas.
Cuanto menor es la dispersin mayor la precisin.

Exactitud (accuracy): cun cerca del valor real se encuentra el valor medido.
Cuanto menor es el sesgo ms exacta es una estimacin.
El problema de las variables de confusin de los estudios observacionales NO se
soluciona aumentando el tamao muestral.

Baja precisin,
Alta exactitud

14

Presentation title in footer | 00 Month 0000

Alta precisin,
Baja exactitud

Reduccin en la anchura del intervalo de


confianza al aumentar el tamao de la muestra

Jones, EMJ online 2009


15

Presentation title in footer | 00 Month 0000

Efecto de la reduccin del intervalo de confidencia


para demostrar una diferencia en las medias

Jones, EMJ online 2009


16

Presentation title in footer | 00 Month 0000

Effect size (tamao del efecto)


Es una manera de cuantificar la diferencia entre dos o ms grupos
D de Cohen (tamao del efecto estandarizado)1: la diferencia entre
las medias dividido por la desviacin estndar de la poblacin.
Ventaja no tiene unidades.

A menor d, mayor tamao muestral se necesita


Es importante que esta diferencia esperada no sea alta de manera
poco realista, para no infraestimar el tamao muestral requerido
El tamao del efecto es un tema de juicio clnico: Qu resultados
estimas o esperas que aparezcan?

17

Presentation title in footer | 00 Month 0000

1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences

A menor tamao del efecto, ms


tamao muestral se necesita

18

Presentation title in footer | 00 Month 0000

Jones, EMJ online 2009

Tamaos del efecto estandarizados para


diversos tests estadsticos
Estos tamaos estandarizados facilitan el clculo de tamao muestral, pero no
reemplazan la necesidad de buscar la bibliografa adecuada que lo sustente.

19

Cunningham, Evidence Based Midwifery 2007

Presentation title in footer | 00 Month 0000

Ejemplos de tamaos muestrales estimados para


efectos pequeos, medianos y grandes

El tamao puede ser de 788, 128 o 52 en funcin del efecto que vayamos a
encontrar.
Cmo es capaz un CEIC de asegurar cual de los efectos es el correcto?!!!!
20

Cunningham, Evidence Based Midwifery 2007

Presentation title in footer | 00 Month 0000

A favor y en contra de usar el tamao


del efecto estandarizado

A favor
No necesitas realizar un piloto o
buscar datos histricos para
determinar la desviacin
estndar.
Los estndar de pequeo,
medio y grande se basan en
una extensa revisin de la
literatura de las ciencias sociales
y por tanto son convenciones
realsticas 1
21

Presentation title in footer | 00 Month 0000

En contra

Si no miras al numerador y
denominador por separado ests
obviando como de preciso es tu
instrumento de medida.

1: Cohen, J. (1988): Statistical Power Analysis for the behavioral sciences

La potencia (probabilidad de encontrar una


diferencia predeterminada si existe) aumenta si
La Diferencia entre el valor bajo la hiptesis nula y la observada
es mayor
Si P( Error tipo I) = es mayor
Si la desviacin estndar es menor (precisin mayor de la
medida)
Si aumenta el tamao muestral
Si usas pruebas paramtricas (p.e. t de Student) que no
paramtricas (U de Mann Whitney)
Por eso a veces se intentan convertir los datos bsicos a una
distribucin normal

22

Presentation title in footer | 00 Month 0000

La potencia (probabilidad de encontrar una diferencia


predeterminada si existe) aumenta si(II)
Se usan estudios cruzados en vez de paralelos
Siempre que los sujetos estn estables durante el lavado.

Los estudios de medidas repetidas (antes despus) tienen ms


potencia que los estudios de medidas no repetidas
El ratio del tamao de las muestras de los grupos (N1 / N2) es 1
Si se usan contrastes de una cola que si se usan de dos.

23

Presentation title in footer | 00 Month 0000

Qu hacer si me sale una muestra


demasiado grande?
Disminuir la precisin de la medida: aumentar el intervalo de confianza
esperado
Revisar bibliografa: existen datos publicados en que la variable se
presente con una desviacin estndar menor?
Disminuir la potencia si se puede
Aumentar la probabilidad de error tipo I (alfa) si se puede
Intentar cambiar el objetivo primario, buscar otros tests estadsticos
Ver si se puede usar contraste de una cola en vez de dos colas (en el caso
que solo nos interese demostrar diferencias en un sentido)

24

Presentation title in footer | 00 Month 0000

Qu hacer si me sale una muestra


demasiado pequea?
Enhorabuena!! Tienes dinero para pagar la mayor muestra.
Aumentar la precisin de la medida: aumentar el intervalo de
confianza esperado
Aumentar la potencia.
OJO: al aumentar la potencia podrs detectar diferencias
estadsticamente significativas entre la hiptesis nula y la
hiptesis alternativa que sean irrelevantes clnicamente
Importante conocer cual es el la mnima diferencia clnicamente
significativa.

Disminuir la probabilidad de error tipo I (alfa) si se puede

25

Presentation title in footer | 00 Month 0000

Ejemplos de estudios de una cola o de dos colas


I

Frmaco A

Eventos adversos / caro

Frmaco B

No eventos adversos / barato

ms eficaz

A&B

igual

ms eficaz

II

Intervencin en nutricin- Sesiones en grupo

Intervencin en nutricin- Sesiones individuales

Reduce ms la ingesta de sodio

X&Y

Igual

Reduce ms la ingesta de sodio

S.F.Kelsey/class2181/lecture 4-sample size


26

Presentation title in footer | 00 Month 0000

26

Una cola

Rechazo H0

No rechazo H0

.05
Zcrit
-1.65

Dos colas

Rechazo H0

.025
Zcrit
-1.96
27

Presentation title in footer | 00 Month 0000

Rechazo H0

No rechazo H0

.025
Zcrit
1.96

Una sola cola

critical t = 1.65175

Distribucin central H0

Distribucin no central H1

0.3
0.2

28

0.1

-3

-2

-1

Presentation title in footer | 00 Month 0000

Dos colas

critical t = 1.96835

Distribucin no central H1

Distribucin central H0
0.3
0.2

29

a
2

0.1

-3

-2

-1

Presentation title in footer | 00 Month 0000

Significacin clnica o estadstica


Lo importante es siempre la clnica!!!
Estadsticamente significativo, clnicamente NO significativo
La p depende de la N, La significacin estadstica se puede comprar
con una N grande
Ejemplos:
Aumento de una semana en la supervivencia del cncer
Aumento de 2-3 ovocitos en ciclos de FIV

Insuficiente para obtener autorizaciones de comercializacin

Estadsticamente NO significativo, clnicamente significativo


Ejemplo: Aparicin de eventos adversos muy graves que modifican el
perfil riesgo / beneficio
Pueden llevar a la no aprobacin o incluso a una posterior retirada de la
autorizacin de comercializacin
30

Presentation title in footer | 00 Month 0000

Estudios de no-inferioridad frente a


un control activo
Aceptables cuando no es tico un estudio frente a placebo y
el nuevo medicamento slo tiene ventajas en cuanto a efectos
secundarios o comodidad o costes, pero la misma eficacia
En general requieren un tamao muestral mayor
Fundamental establecer el margen de no inferioridad:
diferencias entre el margen experimental y el control activo no
son superiores a una cifra prefijada.

31

Presentation title in footer | 00 Month 0000

Herramientas especficas para


el clculo de tamao muestral

Software libre para el clculo de tamao


muestral
GP Power 3.1
Heinrich Heine University, Dusseldorf University
http://www.psycho.uniduesseldorf.de/abteilungen/aap/gpower3/download-andregister

PS Power and Sample size


Department Biostatistics, Vanderbilt University
http://biostat.mc.vanderbilt.edu/wiki/Main/PowerSampleSize

ST Plan
MD Anderson Cancer Center
https://biostatistics.mdanderson.org/SoftwareDownload/Singl
eSoftware.aspx?Software_Id=41
33

Presentation title in footer | 00 Month 0000

Webs para el clculo de tamao


muestral
http://department.obg.cuhk.edu.hk/researchsupport/statstesthome.asp
http://stat.ubc.ca/~rollin/stats/ssize/
http://www.stat.uiowa.edu/~rlenth/Power/index.html
http://www.raosoft.com/samplesize.html
http://epitools.ausvet.com.au/content.php?page=SampleSize
http://statpages.org/index.html#Power

34

Presentation title in footer | 00 Month 0000

GP Power 3.1
Permite tres tipos de anlisis:
A priori: calcula el tamao muestral a partir de alfa, beta y el tamao observable del efecto
Post hoc: calcula la potencia a partir de alfa, el tamao observable del efecto y el tamao de
la muestra.
Para estudios piloto de deteccin de seales permite estimar la potencia a partir de un tamao muestral
pragmtico.

Compromise: calcula un ratio alfa / beta a partir del tamao observable del efecto y el tamao
de la muestra
Anlisis de sensibilidad: calcula el tamao del efecto a partir de la N (cuando sabemos que
no tenemos recursos para aumentarla), alfa, y beta

Util para:
Medias: un grupo, un grupo antes y despus, dos grupos independientes, muchos grupos
(ANOVA, ANCOVA)
Proporciones: un grupo o dos
Correlaciones y regresiones
Tests paramtricos y no paramtricos

35

Presentation title in footer | 00 Month 0000

Ejemplo clculo
basado en
diferencias de
medias en dos
grupos
independientes

36

Presentation title in footer | 00 Month 0000

GP Power 3.1
Posibilidad de hacer grficos
t tests - Means: Difference between two independent means (two groups)
Tail(s) = Two, Allocation ratio N2/N1 = 1, a err prob = 0.05

1200

Total sample size

1000

Effect size d
= 0.2

800

= 0.25
= 0.3

600

400

200
0.6
37

0.65

Presentation title in footer | 00 Month 0000

0.7

0.75

0.8

Power (1- err prob)

0.85

0.9

0.95

PS Power and Sample Size


Permite tres tipos de clculo:
Tamao muestral
Potencia
Tamao efecto detectable

Util para estudios de:


Supervivencia
T Test
Regresin
Proporciones
Mantel Haenszel

Slo para estudios de dos colas


38

Presentation title in footer | 00 Month 0000

Ejemplo clculo
basado en
diferencias de
medias en dos
grupos
independientes

39

Presentation title in footer | 00 Month 0000

ST PLAN
Interfaz poco amigable
Util para:
Comparacion de medias
Comparacion de
proporciones
Supervivencia
Correlacion

40

Presentation title in footer | 00 Month 0000

Estudios de estimar una proporcion


Ejemplo: estudios de prevalencia de una enfermedad
Para la misma precisin de la medida, el tamao muestral es mayor
cuanto la proporcin es ms cercana al 50% (mxima
indeterminacin) est

Herramientas
http://www.cs.uiowa.edu/~rlenth/Power/
http://department.obg.cuhk.edu.hk/researchsupport/Sample_size_EstPrev.asp
http://epitools.ausvet.com.au/content.php?page=SampleSize

41

Presentation title in footer | 00 Month 0000

Estudios con dos proporciones


El tamao muestral aumenta:
Si la diferencia entre ambas proporciones disminuye
Si la potencia aumenta.
Cuanto ms cercanas estn las proporciones al 50%
Equivalencia > Superioridad > No inferiordad

P2 = 0.99
P2 = 0.95
P2 = 0.9
P2 = 0.8
P2 = 0.7
P2 = 0.6
P2 = 0.5
P2 = 0.4
P2 = 0.3
P2 = 0.2
P2 = 0.1
P2 = 0.05

P1 = 0.01 P1 = 0.05 P1 = 0.1


5
5
6
5
6
7
6
7
8
7
8
10
9
11
13
12
14
17
15
19
25
21
27
38
30
43
72
50
88
219
121
474
333

P1 = 0.2
7
8
10
13
19
28
45
91
313

P1 = 0.3
9
11
13
19
29
49
103
376

P1 = 0.4
12
14
17
28
49
107
408

P1 = 0.5
15
19
25
45
103
408

P1 = 0.6
21
27
38
91
376

P1 = 0.7
30
43
72
313

P1 = 0.8
50
88
219

P1 = 0.9
121
474

Ejemplos de tamaos para un error alfa de 0,05 y un error beta de 0,8


42

Presentation title in footer | 00 Month 0000

P1 = 0.95
333

Estudios con dos proporciones

Herramientas:
http://epitools.ausvet.com.au/content.php?page=SampleSize
GP Power
PS

43

Presentation title in footer | 00 Month 0000

Estudios de estimar una media de un


solo grupo
El tamao muestral debe justificarse mediante referencia a
un intervalo de confianza (normalmente 95%) alrededor de
una media de la variable de estudio (desviacin estndar)
Herramientas:
http://epitools.ausvet.com.au/content.php?page=1Mean
http://stat.ubc.ca/~rollin/stats/ssize/n1.html
http://department.obg.cuhk.edu.hk/researchsupport/Sample_size_E
stMean.asp

44

Presentation title in footer | 00 Month 0000

Estudios de comparar medias en dos


grupos
El tamao muestral aumenta si:
La diferencia entre las medias es menor
La desviacin estndar es mayor
Si aumentamos la potencia

45

Presentation title in footer | 00 Month 0000

Estudios de comparar medias en dos


grupos
Herramientas:
http://epitools.ausvet.com.au/content.php?page=2Means1
http://stat.ubc.ca/~rollin/stats/ssize/n2.html

46

Presentation title in footer | 00 Month 0000

Normograma(*) para el clculo de tamao muestral


para comparar medias mediante alfa, beta y tamao
del efecto (Gore & Altman 2001)

*: Vlido si siguen
distribucin normal

Jones, EMJ online 2009


47

Presentation title in footer | 00 Month 0000

Estudios de variables de tiempos hasta un


evento (uso de log-rank)
El tamao muestral ser mayor:
Cuanto menor sea la diferencia entre los tiempos de
supervivencia o ms cercano est el Hazard Ratio a 1.
Si el tiempo de reclutamiento es ms pequeo
Si el tiempo de seguimiento es menor
Si el ratio N2 / N1 se aleja de 1
Herramientas:
http://hedwig.mgh.harvard.edu/sample_size/time_to_event/para_time.html

48

Presentation title in footer | 00 Month 0000

Estudios de concordancia (estadstico


kappa)

Sim, Physical Therapy 2005

49

Presentation title in footer | 00 Month 0000

Estudios diagnsticos

50

Presentation title in footer | 00 Month 0000

Estudios diagnsticos
Herramientas:
http://department.obg.cuhk.edu.hk/researchsupport/
Sample_size_ROC.asp
http://araw.mede.uic.edu/cgi-alansz/testcalc.pl

51

Presentation title in footer | 00 Month 0000

Buderer, Acad Emerg Med 1996

Estudios diagnsticos con datos de prevalencia

52

Presentation title in footer | 00 Month 0000

Estudios diagnsticos con datos de prevalencia

53

Presentation title in footer | 00 Month 0000

Carley, Emerg Med J 2005

Estudios diagnsticos con datos de prevalencia

54

Presentation title in footer | 00 Month 0000

Carley, Emerg Med J 2005

Buderer, Emerg Med J 2003

Normograma para estudios


diagnsticos

55

Presentation title in footer | 00 Month 0000

Conclusiones y mensajes (I)


Haz estos clculos lo ms pronto posible en la planificacin de un
estudio.
Si leemos un estudio con resultados negativos hay que analizar la
potencia estadstica de ese estudio.
Pon siempre los datos clnicos antes que los estadsticos tanto para
interpretar los resultados como para planificar la muestra.
Haz estudios piloto: no pretendas responder todas las preguntas del
mundo en un solo estudio.
Ojo con los diseos para estudiar los efectos en subgrupos porque
necesitars aumentar el tamao muestral.
56

Presentation title in footer | 00 Month 0000

Conclusiones y mensajes (II)


Qu es un trabajador del conocimiento?:
Su funcin es resolver problemas, mediante la creacin,
distribucin o aplicacin de informacin / conocimiento.
Son problemas no operativos, no existe una secuencia
protocolizada de acciones que los resuelvan.
Necesita gran variedad de talentos y habilidades: buscar y
evaluar crticamente informacin; discriminar diferentes
fuentes, evaluando los intereses que hay detrs de cada
argumento; hacer preguntas y establecer hiptesis; desarrollar
anlisis numricos complejos, tener ideas y puntos de vista
propios y expresarlos de manera argumentada, clara y concisa
de forma oral y por escrito.
Jorge Juan Fernndez, Las Reglas de Juego, 2010

57

Presentation title in footer | 00 Month 0000

58

Presentation title in footer | 00 Month 0000

Potrebbero piacerti anche