Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anlisis de Datos
Contenido:
Mtodos paramtricos y no
paramtricos
Prueba estadstica
Nominal
Ordinal
Prueba
no-paramtrica
De intervalo
De razn
Prueba no-paramtrica y
paramtrica
Relacionados
paramtricos
t Student
muestras
no relacionadas
t Student
muestras
relacionadas
ordinales
U Mann-Whitney
nominales
Probabilidad exacta
de Fisher
Datos
T Wilcoxon
McNemar
Pruebas no-paramtricas
Pruebas estadsticas que no requieren muchas
asunciones acerca de la naturaleza de la
poblacin de donde proceden las muestras. Son
referidos como pruebas de distribucin libre.
Pueden usarse con datos de escala nominal y
ordinal.
Muestreo independiente o aleatorio.
Pruebas paramtricas
Pruebas estadsticas que asumen una
serie
de
propiedades
sobre
los
parmetros de la poblacin de donde
proceden
la
muestras: datos
de
distribucin normal y de igual variancia en
la poblacin.
Datos de escala de intervalo y razn.
Muestreo independiente o aleatorio.
Exploracin de datos
Obtencin datos, calibrados, etc.
Diseo de experimentos
Antecedentes Bibliogrficos
Muestra
Subconjunto individuos
Inferencia estadstica
Media ()
Media
Desviacin Estndar ()
Muestra
Subconjunto individuos
Inferencia estadstica
Media ()
Media
Desviacin Estndar ()
( 1 2 )
( 1 2 )
(test bilateral o de 2 colas)
( 1 2 )
( 1 2 )
Tests no paramtricos:
No se presupone que los datos sigan una distribucin determinada.
Se realizan con procedimientos de ordenacin (rangos) y recuento.
Se usan con muestras pequeas (n < 10) en las que se desconoce la distribucin que
siguen los datos, tambin para corroborar los resultados obtenidos a partir de los
tests paramtricos.
Tests paramtricos: La
distribucin normal
Normal:
1
2
f ( x)
x 2
2 2
Normal estandarizada:
valores estandariz ados :
zi
( xi )
f ( z)
1
2
z2
2
Mujeres
Distribuciones normales
Misma varianza
Si...
X1 X 2
2
t t c ( , 0.05)
(Las medias en las poblaciones de
hombres y mujeres son iguales)
1 1
n1 n 2
Si...
t t c ( , 0.05)
(Las medias en las poblaciones de
hombres y mujeres no son iguales)
(p<0.05)
( 1 2 )
Curva distribucin t
X1 X 2
2
1
(n 1 - 1)s (n 2 - 1)s 2
n1 n 2 2
1 1
n1 n 2
- tc
Test unilateral cola superior con = 0.05
( 1 2 )
t t c ( , 0.05)
tc
Test unilateral cola inferior con = 0.05
( 1 2 )
t t c ( , 0.05)
t t c ( , 0.05)
tc
- tc
Transformaciones de datos
Ejemplo:
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
transformacin
Log
Bioestadstica Aplicada
Comando gladder:
Paramtrico
No paramtrico
Describir un grupo
, 2
Mediana, rango
intercuartil
Prueba Wilcoxon
Comparar medias
en 2 grupos
T Student de dos
muestras
Mann-Whitney
Comparar medias
en 2 grupos
apareados
Comparar medias
en 3 o mas grupos
T Student
apareada
Prueba Wilcoxon
ANOVA
Kruskal-Wallis
Correlacin entre
dos variables
Pearson (lineal)
Spearman
(monotnica)
.05
Fraction
.1
.15
.2
20
40
qu edad tena ud. cuando fum cigarrillos por primera vez?
60
Aunque no es necesario,
hagamos la prueba no
paramtrica:
p59 = 0
Igualdad de varianzas:
Prueba de Mann-Whitney:
.5
Varones
1
1.5
inf_sexo
Mujeres
2
2.5
Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres
Bioestadstica Aplicada
Interpretacin
Anlisis de Varianza:
Prueba paramtrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o ms
poblaciones (estratos sociales). Supuestos:
Comparacin de Varianzas:
Las hiptesis:
Bioestadstica Aplicada
Prueba de Kruskal-Wallis:
qu edad tena ud. cuando fum cigarrillos por prim era vez ?
0
20
40
60
.5
1
1.5
2
estrato social
2.5
3
3.5
En Stata:
Correlacin r de Pearson
Las hiptesis:
20
p59b
40
60
10
20
p89b
30
40
50
Resultados:
Correlacin de puntajes
(Spearman):
Las hiptesis:
Resultados:
Si
X1 X2
2
Normalidad
1
1
n
n
2
1
Misma varianza
t t c ( ,
Si t t( ,
0.05)
no hay diferencia
si hay diferencia
(p<0.05)
0.05)
No normalidad
Dieta 1
s12
[colesterol total]
Carbohidratos
Dieta 2
Grasas
Proteinas
Razonamiento
H0=Las 3 dietas producen el mismo colesterol.
Si H0 fuese verdad, entonces la varianza sb2
entre las dietas (mezclados) habra de ser
aproximadamente igual a la varianza sw2
dentro de las dietas (dietas 1, 2 y 3) .
Dieta 3
n
mezclados
N=3n
s22
x1
s32
x2
x3
s x2
x 1 x3 x
x2
sb
1
sw2
s ns
sw2
1 2 2 2
s1 s2 s3
3
2
b
2
w
s
F
s
SSQ
3.898E+04
3.203E+03
4.219E+04
SSQ(b) N ( x j x x ) 2
(Suma cuadrados)
NDOF
2
21
23
NDOF (b) k 1
(N grados libertad)
SSQ ( w) ( xi x 1 )2 ( xi x 2 ) 2 ( xi x 3 ) 2
MSQ
1.949E+04
1.525E+02
MSQ (b)
MSQ ( w)
F
1.278E+02
p
0.0000
SSQ (b)
k 1
(Cuadrado medio)
NDOF ( w) N k
MSQ ( w) sw2
SSQ ( w)
N k
[colesterol total]
Carbohidratos
Grasas
Proteinas
Fuente de variacin
Entre Grupos
Dentro grupos
Total
SSQ
NDOF
3.898E+04
2
3.203E+03
21
4.219E+04
23
MSQ
1.949E+04
1.525E+02
F
1.278E+02
p
0.0000
Anlisis de datos
(Tests estadsticos)
5%
1%
2.015E+01
0.0001
1.895E+01
0.0001
3 1
1.202E+00 0.6768
NS
NS
Hay diferencias significativas (p<0.01) entre las medias 2 y 1 y
2 y 3, pero no entre las medias 3 y 1.
colesterol
Carbohidratos
Grasas
Proteinas
Fuente
Entre Grupos
Intra grupos
Total
SSQ
3.898E+04
3.203E+03
4.219E+04
NDOF
2
21
23
MSQ
1.949E+04
1.525E+02
F
1.278E+02
NDOF
p
2 0.0004
p
0.0000
Factor dieta
Factor ejercicio
[LDL-Colesterol]
Carbohidratos
Poco
220
Carbohidratos
Poco
190
Carbohidratos
Mucho
145
Carbohidratos
Poco
192
Grasas
Poco
188
Grasas
Mucho
143
Grasas
Mucho
124
Grasas
Poco
210
Dieta
Ejercicio
Dieta x ejercicio
Tensin normal
Fuman
83
21
No fuman
37
69
Tablas de contingencia n x m
(Efecto luz UV)
Escozor
Eritrema
Sin reaccin
Ojos azules
25
28
Ojos verdes
Ojos castaos
10
15
Escozor
Eritrema
Sin reaccin
Ojos azules
25
28
Ojos verdes
Ojos castaos
10
15
Comunicacin de un caso
Se describe de forma completa la historia de un
paciente con una determinada enfermedad.
Son importantes en enfermedades raras o
intervenciones quirrgicas novedosas.
Al tratarse de un solo caso no suele ser posible la
elaboracin de hiptesis generales.
Series de casos
Son un resumen de los datos clnicos sobre un grupo de
pacientes atendidos en un servicio sanitario.
Los datos son recogidos a lo largo del tiempo, a veces durante
aos; no son representativos propiamente de ninguna poblacin
y, por lo tanto la estadstica a utilizar debe ser descriptiva sin
intervalos de confianza (+/-) .
Constituyen una fuente de informacin. Sirven para proponer
hiptesis sobre factores etiolgicos o teraputicos, pero no para
confirmarlas.
Estudios transversales
Se recogen los datos de sobre un grupo de enfermos (por ej.
diabticos salmantinos) en una fecha determinada (corte
transversal en el eje del tiempo).
Pretenden conocer la situacin sanitaria de una poblacin en una
fecha determinada.
Permiten el clculo de la prevalencia y en el caso de enfermedades
crnicas son tiles en la planificacin sanitaria.
No permiten conocer cuando enferm la persona y el factor de
riesgo relacionado con la enfermedad.
Factor de
riesgo
Setas si
Setas no
Efecto
Casos
/ Controles
Intoxic. si Intoxic. no
a
c
b
d
a
b
ac bd
es decir p1 p2
a
c
b
O2
d
O1
O1 a / c
OR
O2 b / d
Estudios de cohortes
Constan de un grupo de personas que en el momento de empezar el
estudio no padecen la enfermedad y que estn expuestos o no a un
factor de riesgo. Se les sigue a todos la pista (estudio prospectivo)
durante un tiempo para ver si desarrollan o no la enfermedad.
El objetivo es determinar si un factor de riesgo aumenta la probabilidad
de padecer una enfermedad (Habitantes de Chernobil frente a
habitantes de otra zona e incidencia de leucemias).
Los anlisis se basan en tablas de contingencia, test Ji cuadrado para la
asociacin factor-enfermedad, riesgos absolutos, diferencias de riego,
riesgos relativos, etc.
Leucemia si
Leucemia no
Chernobil si
Chernobil no
a
R1
ab
(en
Diferencia de riesgos (o
riesgo atribuible al factor
de riesgo):
Riesgo relativo:
R2
c
cd
RD R1 R2
R1
RR
R2
---- ----
.........
Si
No
104
21
------
-----
.....
193
57
etc
Ensayos Clnicos
Los ms frecuentes son los llamados: Estudios clnicos de
intervencin, prospectivos, con control concurrente y asignacin
aleatoria. Pueden ser: En paralelo o cruzados.
2.
3.
4.
5.
1.
Sexo
2.
3.
Hipertensos, etc.
Criterios de Exclusin
(Caractersticas de los que se excluyan aunque cumplan
los criterios de inclusin)
1.
Alergia a antibiticos.
2.
Consumo de alcohol
3.
Tabaquismo
Enmascaramiento
1. Etiqueta abierta (open label)
2. Ciego (blind)
3. Doble ciego (double blind)
Anlisis estadstico de
Ensayos Clnicos
Los contrastes estadsticos que pueden realizarse en los
ensayos clnicos son muy variados, por lo que nos
remitiremos a los libros de Estadstica y a los Paquetes
Estadsticos.
Algunos contrastes ms frecuentes son:
Placebo
Diferencia de proporciones:
Ratio
a
O1
b
OR
P1
P2
a
ab
P2
c
cd
Frmaco
Razn de proporciones:
P1
D P1 P2
O1 a / b
O2 c / d
O2
Ln de la Odds ratio
NNT
1
R1 R2
c
d
Ln OR
N
sujetos
Media
Frmaco
n1
Placebo
n2
X1
X2
Desviacin
estndar
s1
s2
Diferencia de medias:
X1 X2
2
1
1
n1 n2
MD X 1 X 2
X1 X 2
SMD
sp