Sei sulla pagina 1di 57

ESTADÍSTICA NO

PARAMÉTRICA
Proporciones
2
Chi-Cuadrado (c )

Mann-Whitney
Kruskal-Wallis
Correlación de Spearman
Tipo de Variables y test a utilizar
Variable Grupos Test
Intervalar 2 - ind dif. Student no pareado
Intervalar 2 - mismos ind. Student pareado
Intervalar 3 ó más grupos ANOVA/Scheffé/...
Dep/Ind Análisis de Reg. / r
Nominal 2 grupos Chi cuadrado
Ordinal 2 grupos Chi cuadrado
Ordinal 2 grupos Mann-Whitney
Ordinal 3 grupos Kruskal-Wallis
Ordinal 2 g /mismos ind Wilcoxon
Ordinal dep/ind Spearman
Tipo de experimento
Dos grupos de Tres o más Antes y Múltiples Asociación
tratamiento grupos después de un tratamientos entre dos
Escala de consistentes de consistentes tratamiento en en los variables
individuos de individuos los mismos mismos
medición diferentes diferentes individuos individuos

Intervalar (y Test t no pareado Análisis de Test t pareado Análisis de Regresión


obtenida de Varianza varianza de linear y
población con medidas correlación de
distribución repetidas Pearson;
normal)* análisis de
Bland-Altman

Nominal Chi-cuadrado de Chi-cuadrado Test de Q de Coeficiente de


tabla de de tabla de McNemar Cochrane contingencia
contingencia contingencia

Ordinal Test de suma de Estadístico de Test del signo Estadístico de Correlación de


rangos de Mann- Kruskal-Wallis de rangos de Friedman rangos de
Whitney Wilcoxon Spearman

Tiempo de Test de Gehan ó


sobrevida Test de rango del
Log

* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales
Proporción
• Resumen de variables binarias:
– Síntoma: Presente / Ausente
– Tratamiento: Efectivo / Fracaso
• Si r, número de sujetos observados con
la característica, en la muestra n la
proporción será:
– Con la característica p = r / n
– Sin la característica q = 1- p
Intervalo de confianza de una
proporción

se( p)  p(1  p) / n
IC95%  p  1,96  se( p)
No confía
30.8%
En una clínica dental le
preguntan a 263 pctes si
confían que sus CD tengan
los datos en un PC, 81
dicen que la privacidad se
pierde, el IC 95% es:
Si confía
69.2%

p  81 / 263  0,308
se( p)  0,308(1  0,308) / 263  0,0285
IC95%  0,308  1,96  0,0285  0,252 a 0,364
Tests de proporciones
• Si existe diferencia con una proporción
conocida
• Comparar si existen diferencias
significativas entre dos proporciones no
pareadas
• Comparar si existen diferencias
significativas entre dos proporciones
pareadas
Si existe diferencia con una
proporción conocida
• Similar a lo visto en test t (comparar con
promedio conocido), o sea:

Valor observado - valor esperado


error estándar de valor observado
En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel
nacional se sabe que el asma se presenta en 15%.
¿Existen diferencias significativas, entre 15% y 18%?

p  pesp
z
se( p )
p (1  p )
se( p ) 
n
0,15  0,85
se( p )   0,0244
215
0,18  0,15
z  1,23
0,0244
Tabla de valores z (buscar) :1,23  0,2187
A 25 pctes con osteoartrosis cervical se les dividió, al
azar, en dos grupos (Lewith y Machin, 1981):
• 12 fueron tratados con estimulación infra roja (IR).
• 13 recibieron placebo.
9/12 con IR mejoró o desapareció el dolor = 0,75
4/13 en el grupo placebo mejoró =0,31

¿Existen diferencias significativas?


se( p1  p2 )  var(p 1 )  var(p 2 )
p1 (1  p1 ) p2 (1  p2 )
se( p1  p2 )  
n1 n2
IC95%  p1  p2  1,96  se( p1  p2 )
En el ejemplo : 0,7500 - 0,3077  0,4423
y el Error estándar es
0,75  0,25 0,3077  0,6923
se( p1  p2 )  
12 13
se( p1  p2 )  0,1789
IC95%  p1  p2  1,96  0,1789
o sea IC 95%  0,09 a 0,79 Existen dif significativas
Chi cuadrado
Lado del dado f(0) f(E) (0-E)2/E
--------------------------------------------------------------------------------------
1 7 10 0,9
2 5 10 2,5
3 15 10 2,5
4 17 10 4,9
5 5 10 2,5
6 11 10 0,1
-------------------------------------------------------------------------------------
TOTAL 60 60 =13,40 = c

Gl = 6 - 1 = 5

Crític : c 0.05 = 11.07 Rechazar Ho


MEJORA SINTOMAS DEL RESFRIO
SI NO

VITAMINA C 75 34

25 63
PLACEBO

(O  E ) 2
c 
2

E
( 75  55,33 ) 2
(34  53,67 ) 2
( 25  44,67 ) 2
( 63  43,33) 2
c2      31,793
55,33 53,67 44,67 43,33

c2= 31,793, gl = 1, p<0,0001


Cálculo del test – chi-cuadrado
Mejoran de los síntomas del
resfrío
SI NO Total
= 100*109/197
Vitamina C fo =75 fo =34 109
fe =55,33 fe =53,67
Placebo fo =25 fo =63 88
fe =44,67 fe =43,33
Total 100 25 197
f columna = 100*88/197
Cálculo de valores esperados
A B

C D

Ea  ( A  B)( A  C ) /( A  B  C  D)
Eb  ( A  B)( B  D) /( A  B  C  D)
Ec  ( A  C )(C  D) /( A  B  C  D)
Ed  ( B  D)(C  D) /( A  B  C  D)
Cálculo de valores esperados

Si No Total Esperados

75 34 109 55,33 53,67

25 63 88 44,67 43,33

100 97 197

(O  E ) 2
c 
2

E
( 75  55,33 ) 2
(34  53,67 ) 2
( 25  44,67 ) 2
( 63  43,33) 2
c2      31,793
55,33 53,67 44,67 43,33
Chi-Square Table
ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-
CÁLCULO

PD Bajo E Moderado E Alto E TOTAL

A 49 (55) 30 (26) 21 (19) 100


B 67 (55) 21 (26) 12 (19) 100
C 49 (55) 27 (26) 24 (19) 100
TOTAL165 78 57 300
E = 100 E = 55
165 300

c2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65

gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4

Crítico: c2 0.05 = 9,49. SE RECHAZA HO


Chi-Square Table
Chi - cuadrado (c2)
c2 = (O - E)2/E (Chi cuadrado de Pearson)

c = (|O - E|2 - 1/2) / E Corrección de Yates


Corrección de Yates: para tablas 2x2, con
muestras pequeñas (en una celda existen
menos de 5 observaciones).
Tamaño de muestra: n de celdas x 10.
Ej: 2 x 2 = 4 x 10 = 40
Ej. Ant: 3x3 = 9 x 10 = 90
Áreas bajo la curva
Distribución de Chi-Cuadrado
• Supongamos que repetimos
experimento 1000 veces (el de
la Vit C / Placebo). Para cada
experimento calculamos el
valor de Chi-Cuadrado y
ploteamos dichos valores.

• Eje X es el valor calculado de


Chi-cuadrado de acuerdo a la
fórmula.

• Eje Y es el número de veces


que se obtiene el valor de chi-
cuadrado.
ODDS RATIO
• Proporciona:
– Estimado de la relación entre dos variables
binarias (si / no)
– Permite examinar los efectos de otras
variables en dicha relación
– Forma especial y conveniente de
interpretación en estudios caso-control
• “The odds that a single throw of a die
will produce a six are 1 to 5, or 1/5”.

• “ODDS: es la relación de la probabilidad


que el evento de interés ocurra contra
la probabilidad de que esto no ocurra”.

Bland y Altman. The odds ratio, BMJ 320;1468, 2000


Razón de desigualdad
(Odd ratio)
a
c ad
OR  
b bc
d
1 1 1 1
SE (log e OR )    
a b c d
IC95%OR  1,96  SE (log e OR ) Si No

75 (a) 34 (b)
OR = 5,559 Si
IC 95% : 3,00 a 10,29
No 25 (c) 63 (d)
a
c ad 75  63
OR     5,559
b bc 34  25
d
1 1 1 1
SE (log e OR )    
a b c d
1 1 1 1
SE (log e OR )    
75 25 34 63
SE (log e OR )  0,314035
IC95%OR  exp ln OR  1,96 SE (ln OR )
75  63
OR   5,559
34  25
LN (5,559)  1,7154
IC  1,7154  1,96  0,3140
2,3308 a 1,100
exp(2,3308 ), exp(1,100)
IC 95%  10,286 a 3,00
Cases are weighted by the value of variable N.

Frequencies
HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)

si no Total
Si 75.000 34.000 109.000
No 25.000 63.000 88.000
Total 100.000 97.000 197.000

Test statistic Value df Prob


Pearson Chi-square 31.793 1.000 0.000
Yates corrected Chi-square 30.197 1.000 0.000

Coefficient Value Asymptotic Std Error


Odds Ratio 5.559
Ln(Odds) 1.715 0.314

OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314


Riesgo Relativo
• Relación de frecuencias de dos categorías.
O desigualdad de ser clasificado en la
columna 1 en lugar de la columna 2.
• OR = (A/C) / (B/D)
• >1: personas con factor de riesgo tienen
más probabilidad que presenten el evento.
• <1: personas con factor de riesgo son
menos probable que experimenten el
evento.
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200

Existe asociación entre niños de bajo peso al nacer


y edad de la madre?
Odds ratio
(es solamente para estudios caso-control, variables
nominales, tablas 2x2)
(similar a riesgo relativo)

• Si OR >1: existe una asociación positiva entre el


factor de riesgo y el evento.

• Si OR <1: hay una asociación negativa, (presencia


del factor disminuye la probabilidad de encontrar el
evento.
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2


c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. n11 n12 n1.
> 20 a. n21 n22 n2.
Total n.1 n.2 n..

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2


c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2 50x150x25x175
Proporciones
(Fleiss y col, 3ª. Ed,)

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 0,050 0,200 0,25
> 20 a. 0,075 0,675 0,75
Total 0,125 0,875 1,00
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)

Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 20 80 100
> 20 a. 30 270 300
Total 50 350 400

Existe asociación entre niños de bajo peso al nacer


y edad de la madre?
• Sensibilidad: proporción de positivos
que son correctamente identificados por
el test.

• Especificidad: proporción de negativos


que son correctamente identificados por
el test
Comparación de sensibilidad y especificidad vs.
Valores predictivos positivo y negativo para evaluar la
seguridad de tests para diagnóstico
ENFERMEDAD
SI NO
(a) (b)
SI Verdad + Falso +
45 10
TEST
(c) (d)
NO Falso – Verdad -
5 40 N = 100

Sensibilidad = a / a + c = 45 / 50 = 0,90
Especificidad = d / b + d = 40 / 50 = 0,80
VPP = a / a + b = 45 / 55 = 0,82
VPN = d / c + d = 40 / 45 = 0,89
Comparación de sensibilidad y especificidad vs. Valores
predictivos positivo y negativo para evaluar la seguridad de tests
para diagnóstico
Tomado de Kramer, 1988
ENFERMEDAD
SI NO
(a) (b)
SI Verdad + Falso +
9 18
TEST
(c) (d)
NO Falso – Verdad -
1 72 N = 100

Sensibilidad = a / a + c = 9 / 10 = 0,90
Especificidad = d / b + d = 72 / 90 = 0,80
VPP = a / a + b = 9 / 27 = 0,33
VPN = d / c + d = 72 / 73 = 0,99
• Valor predictivo positivo (VPP): proporción de
pacientes con resultado de test positivo que
son correctamente diagnosticados.

• Valor predictivo negativo (VPN): proporción


de pacientes con resultado de test negativo
que son correctamente diagnosticados.
Tests no paramétricos para dos o
más muestras
Equivalente a test t pareado: Wilcoxon
Equivalente a test t no pareado: Mann-Whitney
Equivalente a ANOVA: Kruskal Wallis

Utilizar con variables ordinales o cuando


variables intervalares no presenten
distribución normal
Test U de Mann-Whitney

• Colocar rangos a las observaciones en


orden de menor a mayor
Test de Mann-Whitney
Producción de orina diaria mL/día.

Placebo Rango Droga Rango


------------------------------------------------------------------------
1000 1 1400 6
1380 5 1600 7
1200 3 1180 2
1220 4
T= 9 19
--------------------------------------------------------------------------

Mann-Whitney U= 3, p = 0.289
Test de Tukey-Duckworth
• Cálculos se pueden hacer en la cabeza
• Existe solamente un requisito que
cumplir:
4 ≤ n1 ≤ n2 ≤ 30
• Ho: Las muestras son idénticas
• Ha: Las muestras son diferentes
• El test estadístico a calcular es C
Test de Tukey-Duckworth
• Existen solamente dos valores críticos:
C0,05 = 7
C0,01 = 10
Test de Tukey-Duckworth
Procedimiento
1. Determine medición más grande y más
pequeña en cada muestra ranqueada.
2. En la muestra que contiene el valor
más grande de todos los valores
combinados, cuente todos los valores
que son mayores que la medición más
grande en el otro grupo.
3. En la otra muestra, cuente todas las
mediciones que son más pequeñas que
la medición más pequeña del grupo de
la primera medición.
4. Sume ambas cantidades (= C).
Grupo1 Grupo2
80 84
81 89
82 92
83 92
84 92
85 94 Valores de
86 95
exclusión
87 96
89 96
92 96
93 98
94 98
96 99
97 101
98 103 Mayor valor

Ccalc = 4 + 3 = 7 C0,05 = 7
Ccalc ≥ C0,05 por lo tanto se rechaza Ho.
Conclusión: las muestras son diferentes
Kruskal-Wallis
• Equivalente a Anova
• Extensión del test de Mann-Whitney a más
de dos grupos
• Al conjunto de observaciones (N) se les da
rango (1 a N), indiferente de qué grupo estén,
y para cada grupo se calcula la suma de
rangos, y posteriormente se calcula H,
definido por
12 ni ( Ri  R) 2

H
N ( N  1)
Donde R es el promedio de todos los rangos, y
es siempre igual a (N+1)/2. Ri = es la suma de
los rangos de ni observaciones.
Para calcular es más fácil:
2
12 R
H
N ( N  1)
 ni
 3( N  1)
i
% de reducción de cefalea en
tres grupos (Fentress et al, 1986)
(Rangos en paréntesis)
Relajación y biofeedback Relajación No tratados
62 (11) 69 (10) 50 (12)
74 ( 8,5) 43 (13) -120 (17)
86 ( 7) 100 ( 2) 100 ( 2)
74 ( 8,5) 94 ( 5) -288 (18)
91 ( 6) 100 ( 2) 4 (15)
37 (14) 98 ( 4) -76 (16)

 rango 55 36 80
Rango medio 9,17 6,00 13,33
2
12 R
H
N ( N  1)
 ni
 3( N  1)
i

12  55 36 80 
2 2 2
H      3 19  5,69
18 19  6 6 6 

Gl = GRUPOS – 1 = 2
Valor crítico: tabla de c = 5,99
Se acepta Ho.
Sicólogo, 1863 - 1945

Correlación de Spearman
• Medida No Ventajas:
Paramétrica para - No se necesita
establecer relación distribución normal
de dos variables - No se ve tan
ordinales (ó afectada por
intervalares sin DN) “outliers”
Correlación de Spearman
• Correlación para variables ordinales
• Para determinar la significancia de la
asociación de dos variables continuas
en que no existe normalidad de las
variables.
• Contrapartida no paramétrica de la
correlación de Pearson.
6 ( xi  yi ) 2

rs  1 
n(n  1)
2

6 d 2

rs  1 
n n
3

(n: número de pares de obs.)


(d= dif de rangos)
Grado de reabsorción ósea en mandíbula, lado
der e izq. Existe relación ?

Derecha (x) 83 97 91 72 76 88 95 89 75 74
Rango 5 10 8 1 4 6 9 7 3 2
-----------------------------------------
Izquierda(y) 87 98 84 82 74 92 91 83 80 77
Rango 7 10 6 4 1 9 8 5 3 2
-----------------------------------------
Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0
(x – y)
d2 = 4 0 4 9 9 9 1 4 0 0
 d2 = 40
rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757
Diferentes escalas, diferentes
medidas de su asociación

Escala de ambas Medida de


variables asociación
Nominal Chi-Square de
Pearson: χ2
Ordinal rho de Spearman

Intervalar r de Pearson
Resumen
• Método de investigación
– Protocolo
– Artículo científico
• Bioestadística
– Estadística descriptiva: n, %, x ± ds
– Inferencia estadística: test t, ANOVA, ARS,
RL, c2

Potrebbero piacerti anche