Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Tabla de contingencia de 2 x 2
Distribuciones
condicionales
Variable 1
Variable 2
Si
No
Total fila
Si
a+b
No
c+d
a+c
b+d
Total
columna
Medidas de resultado:
Sensibilidad
Especificidad
Valor predicivo +
Valor predictivo -
Medidas
relativas:
OR : razon de
momios
RR: riesgo
relativo
Distribuciones
marginales
No
TOTAL
276
No
Dao
187 2097
2560
TOTAL
255 2305
2560
RESULTADO
ADVERSO
208
Dao
68
Si
Si
68
No
208
No
187 2097
TOTAL
255 2305
= --------255 x 100 =
2560
9.96 %
2560
Si
Si
No
68
No
TOTAL
208
276
187 2097
2284
=276
--------- x 100 =
2560
10.78 %
2560
EXPUESTOS
Si
No
TOTAL
Si
N
o
68
208
208 2097
255 2305
p1
= ------68 x 100 =
255
26.67 %
RESULTADO ADVERSO
EXPUESTOS
Si
Si
No
TOTAL
68
N
o
208
187 2097
255 2305
p2
= ------208x 100 =
2305
9.02 %
p1
26.67
RR = ---------- = ------------- =
p2
2.96
9.02
RESULTADO ADVERSO
Si
N
o
68
208
TOTAL
255
68 x 2097
OR = --------------208 x 187
OR = 3.67
187
2097
2305
TOTAL 276
2284
2560
No
Anlisis paramtricos
Supuestos para su uso:
1. La distribucin poblacional de la variable dependiente es normal: el
universo tiene una distribucin normal.
2. El nivel de medicion de la variable dependiente es por intervalo o
razn.
3. Tienen varianzas homogneas (homocedasticidad)
4. Las poblaciones en cuestin tienen una dispersin similar en sus
distribuciones
.
.
.
.
.
Correlacin
Correlacin
Regresin lineal
Es un modelo matemtico usado
para estimar el efecto de una
variable sobre otra. Est asociado
con el coeficiente r de Pearson.
Hiptesis: correlaciones y causales.
Variables: dos, una considerada
como independiente y otra como
dependiente.
Nivel de medicin: Intervalos o de
razn.
Prueba t
ANOVA - 1 via
Analysis of Variance
SS
Source
df
MS
F
Prob > F
----------------------------------------------------------------------------------------------Between groups
74384461
3 24794820.3
77.53
0.0000
Within groups
1.0135e+11 316910
319805.19
----------------------------------------------------------------------------------------------Total
1.0142e+11 316913 320036.879
Hacer
una prueba
para
ver cuales
grupos
diferentes
Bartlett's
testpos
for hoc
equal
variances:
chi2(3)
= son
606.7972
Prob>chi2 = 0.000
ANOVA multiple
Evalua el efecto de dos o ms variables
independientes sobre una variable dependiente.
Evala los efectos por separado de cada variable
independiente y los efectos conjuntos de dos o
mas variables independientes.
Nivel de medicion: dependiente (continua) e
independientes
( categricas).
X1
X2
X3
Anlisis No paramtrico
Una alternativa en la solucin de
problemas son los mtodos no
paramtricos o de distribucin libre,
los cuales no existen supuestos tan
numerosos ni severos y son
aplicables a cualquier variable, en
particular a las de tipo nominal u
ordinal as como a distribuciones
diversas
requieren de
la distribucin
normales
de estar
, pueden
Estadsticas no
paramtricas:
Pruebas mas usadas:
1. Chi cuadrada
2. Dos muestras independientes: U de Mann
Whitney, Kolmogorov-Smirnov.
3. Varias muestras independientes: Kruskal
Wallis y mediana.
4. Dos muestras relacionadas: Wilconxon,
signos y McNemar.
5. Varias muestras relacionadas: Friedman, W
de Kendall y Q de Cochran.
Chi cuadrado
68
N
o
208
VALORES ESTIMADOS
TOTAL
276
187
2097
2284
TOTAL 255
2305
2560
No
2560
2560
Chi cuadrado
VALORES OBSERVADOS
Dao
VALORES ESTIMADOS
No
Dao
TOTAL
Si
68
187
255
No
208
2097
2305
27.49
248.51
227.51
2056.49
TOTAL 276
2560
2284
2
2
2
(187
- 227.51)(2097
2
2
(208
- 248.51)
(68
27.49)
2056.49)
= -------------------+ --------------------+ ---------------------+ -------------------------
27.49
2
248.
51
227.
51
= 74.30Grados de libertad =1
2056.
49
gl = (f-1)*(c-1)
Correlacion
Adems de la X2, existen otros coeficientes para
evaluar si las variables incluidas en la tabla de
contingencia o tabulacin cruzada estan
correlacionadas.
Coef Fi (): nominal
V de Cramer: nivel de medicion nominal
Lamda (b): nivel de medicion nominal
Gamma: nivel de medicion ordinal
La tau de Kendall (t) es un coeficiente de correlacin
por rangos.
Eta: nivel d emedicion nominal y de razon o intervalo
Comparacin de medianas
Comparacin de medianas
La prueba de Kruskal-Wallis (de William Kruskal y W.
Allen Wallis) es un mtodo no paramtrico para probar si
un grupo de datos proviene de la misma poblacin.
Intuitivamente, es idntico al ANOVA con los datos
reemplazados por categoras.
Es una extensin de la prueba de la U de Mann-Whitney
para 3 o ms grupos.
Ya que es una prueba no paramtrica, la prueba de
Kruskal-Wallis no asume normalidad en los datos, en
oposicin al tradicional ANOVA. S asume, bajo la hiptesis
nula, que los datos vienen de la misma distribucin.
Una forma comn en que se viola este supuesto es con
datos heterocedsticos.
Anlisis Multivariado
Los mtodos de anlisis multivariado
son aquellos en que se analiza la
relacin entre diversas variables
independientes y al menos una
dependiente.
X
1
X2
X3
X4
X5
Regresin mltiple
Es una extensin de la regresin lineal slo que con mayor nmero de
variables independientes.
Sirve para predecir el valor de una variable dependiente conociendo el
valor y la influencia de las variables independientes incluidas en el
anlisis.
La informacin bsica que proporciona la regresin mltiple es el
coeficiente de correlacin mltiple (R), que seala la correlacin entre la
variable dependiente y todas las demas variables independientes
tomadas en conjunto.
El coeficiente puede variar de 0 a 1.00; cuanto ms alto sea su valor,
las variables independientes explicaran en mayor medida la diversidad
de la variable dependiente o que son factores ms efectivos para
predecir el comportamiento de esta ltima.
R2 (coef de correlacin mltiple al cuadrado) nos indica el porcentaje de
variacin en la dependiente debida a las independientes
Regresin mltiple
Los valores beta () indican el peso o influencia que tiene cada
variable independiente sobre la dependiente.
Corrida .....
Source |
SS
df
MS
----------------+-----------------------------
Model | 3.7290e+09
8 466123355
-------------------------------------------------------------------------------------------------pesorn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------------+--------------------------------------------------------------------------------ag1 | -138.1885 2.416767 -57.18
0.000 -142.9253 -133.4517
ag3 | 29.42146 3.254785
9.04
0.000
23.04218 35.80075
an1 | -69.57674 6.897341 -10.09 0.000 -83.09533 -56.05814
an2 | 20.87316 2.306305
9.05
0.000
16.35286 25.39345
an4 | -36.82496 5.057489
-7.28 0.000
-46.7375 -26.91243
etude | -121.9748 10.33063
-11.81 0.000 -142.2225 -101.727
pn1 | -159.8445 2.831581
-56.45 0.000 -165.3943 -154.2946
pn2 | -182.6381 2.217018
-82.38 0.000 -186.9834 -178.2928
_cons | 3339.317 1.644091 2031.10 0.000
3336.095
3342.54
---------------------------------------------------------------------------------------------------
Ej.
Coef
EE
p
IC 95 %
educacion: -121.974 10.33063
-11.81 0.000
-142.2225 -101.727
Si se tiene baja educacion (sin estudios o primaria) el peso
al nacer disminuye en 121 gramos si el resto de variables
se mantienen constantes.