Sei sulla pagina 1di 48

I.

Casos Aplicados a las Ciencias Agrarias:


Diseo Experimental en SPSS
Mg. Marcelo Rodrguez
Dr. Marco Riquelme
Acadmicos de la Universidad Catlica de Maule
Departamento de Matemtica, Fsica y Estadstica
Seminario realizado para el:
Departamento de Estadstica
Universidad de Valparaso
23 de julio de 2012
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 1 / 58
El legado de Sir Ronald A. Fisher
Para mayor detalles visitar:
http://digital.library.
adelaide.edu.au/coll/
special//fisher/
Nace en Inglaterra en 1890. En 1919
fue contratado en Rothamsted
Experimental Station para el anlisis
estadsticos de investigaciones
agrcolas.
En 1926 public el artculo The
Arrangement of Field Experiments.
Describi tres componentes
fundamentales en los diseos de
experimentos: control local,
replicacin y aleatorizacin.
Desarroll el anlisis de varianza y
unic las ideas bsicas sobre los
principios del diseo de experimentos.
Muere en Australia en 1962.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 2 / 58
Conceptos bsicos
Denicin (Experimento)
Un experimento es el proceso de obtener una observacin y representa
cualquier situacin que tenga ms de un resultado.
Denicin (Unidad experimental)
Son los elementos sobre los cuales se obtienen las mediciones de la variable
de respuesta.
Denicin (Error experimental)
Describe la variacin entre las unidades experimentales tratadas de manera
idntica e independiente.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 3 / 58
Conceptos bsicos
Denicin (Tratamiento)
Los tratamientos son el conjunto de circunstancias creados para el
experimento (combinacin de los niveles o valores de cada factor), en
respuesta a la hiptesis de investigacin y son el centro de la misma. Se
dice que el tratamiento es testigo (control) cuando se procesa de la misma
manera que las unidades en tratamiento, pero sin incluir en su protocolo el
tratamiento activo.
Denicin (Diseo experimental)
Es el arreglo de las UEs utilizado para controlar y obtener estimaciones
vlidas de la variabilidad del error experimental, mediante la asignacin de
las UEs a los tratamientos (o vice versa), con el n de vericar si los
tratamientos tienen algn efecto en la variable de respuesta.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 4 / 58
Componentes fundamentales en el diseo de experimento
(Control local)
Describe las acciones que emplea un investigador para reducir o controlar el
error experimental, incrementar la exactitud de las observaciones y
establecer la base de la inferencia de un estudio.
(Replicacin)
Repeticin independiente del experimento. Cada tratamiento se aplica de
manera independiente a dos o ms unidades experimentales. Medio para
estimar la varianza del error experimental.
(Aleatorizacin)
Es la asignacin aleatoria de tratamientos a las unidades experimentales.
Proporciona estimaciones vlidas de la varianza del error experimental.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 5 / 58
Efectos del estrs hdrico en plantas de pino
En un estudio realizado con el Centro Secano, de la Universidad Catlica
del Maule, a cargo del Dr. Sergio Espinoza. Se trabaj con 56 familias de
plantas de pino (provenientes de Celco y Mininco), 15 plantas por familia,
las semillas fueron puestas en dos escenarios diferentes (control y estrs).
A cada planta se le midi: dac, altura, biomasa area, biomasa radicular,
biomasa total, ndice de esbeltez, ndice tallo/raz.
El objetivo es identicar si existe un efecto atribuible a las restricciones
hdricas.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 6 / 58
Libro de cdigos: Explicacin de la base de datos
Puede descargar la base de datos desde: http://bit.ly/data_riego
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 7 / 58
Ejemplo de un anlisis descriptivo en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 8 / 58
Ejemplo de un anlisis descriptivo en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 9 / 58
Ejemplo de un anlisis descriptivo en SPSS
El DAC promedio es de 2,2815 mm,
con un 95% de conanza se espera que el intervalo (2,2589; 2,3061)
contenga al verdadero valor medio de DAC.
Si no se considera al 5% de las plantas con el DAC ms pequeo ni al
5% con el DAC ms grande, el DAC promedio sera de 2,2750.
El 50% de las plantas tiene un DAC inferior 2,25.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 10 / 58
Ejemplo de un anlisis descriptivo en SPSS
El DAC mnimo es de 1,04 y
el mximo es de 4,71.
Existen cuatro datos atpicos
que son el 85, 180, 242 y el
796.
Si descontamos los datos
atpicos, visualmente la
distribucin del DAC es
simtrica.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 11 / 58
Prueba T para muestras independientes en SPSS
Suponga que el investigador cree que existen diferencias signicativas en el
DAC medio de la plantas que fueron sometidas a estrs y las que no fueron
sometidas. En otras palabras se debe probar la hiptesis
H
0
:
1
=
2
v/s H
1
:
1
=
2
.
Recuerde:
Estadstica de prueba: T =
X
1
X
2
S
p

1
n1
+
1
n2
t(n
1
+ n
2
2), bajo H
0
Hip. Nula Hip. Alternativa Rechace H
0
si Valor p
H
0
:
1
=
2
H
1
:
1
=
2
|t
c
| > t
1/2
(n
1
+ n
2
2) 2[1 P(T < |t
c
|)]
H
0
:
1

2
H
1
:
1
>
2
t
c
> t
1
(n
1
+ n
2
2) 1 P(T < |t
c
|)
H
0
:
1

2
H
1
:
1
<
2
t
c
< t
1
(n
1
+ n
2
2) 1 P(T < |t
c
|)
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 12 / 58
Prueba T para muestras independientes en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 13 / 58
Prueba T para muestras independientes en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 14 / 58
Prueba T para muestras independientes en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 15 / 58
Prueba T para muestras independientes en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 16 / 58
Prueba T para muestras independientes en SPSS
Segn la prueba de Levene, debemos rechazar la hiptesis de
homogeneidad o igualdad de varianzas entre ambos grupos
constituidos por el grupo control y estrs (F=10,891; valor-p=0,001).
Se debera rechazar la hiptesis de que las medias poblacionales son
iguales (t=29,336; valor-p=0,000). Es decir, las plantas que fueron
estresadas (DAC medio = 1,9827), tienen un DAC signicativamente
diferentes a las que no fueron estresadas (DAC medio = 2,5803).
Error tp. de la
media
Desviacin
tp. Media N
Control
Estrs
Dimetro a la altura del
cuello (mm)
,01352 ,39189 1,9827 840
,01523 ,44151 2,5803 840
Tipo de Riego Tipo de Riego
Estadsticos de grupo
Sig. F Sig. (bilateral) gl t
Prueba T para la igualdad de medias
Prueba de Levene para la
igualdad de varianzas
Se han asumido varianzas
iguales
No se han asumido
varianzas iguales
Dimetro a la altura del
cuello (mm)
,000 1654,702 29,336
,000 1678 29,336 ,001 10,891
Prueba de muestras independientes
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 17 / 58
ANOVA de un Factor en SPSS
Denicin (ANOVA de un Factor)
El mtodo de ANOVA de un Factor, es un mtodo de comparacin de
medias que consiste en la comparacin de varios grupos (tratamientos) de
una variable cuantitativa (variable dependiente).
La hiptesis nula y alternativa seran:
H
0
:
1
=
2
= . . . =
t
v/s H
1
:
k
=
j
, para algn par k, j .
El modelo completo de medias est dado por
y
ij
= +
j
+
ij
,
donde: i = 1, , r , j = 1, , t, r es el nmero de replicas y t el nmero
de tratamientos, y
ij
: i -sima observacin del j -simo tratamiento,
j
:
media del j -simo tratamiento,
j
=
j
: Efecto sobre la respuesta del
j -simo tratamiento, y
ij
: i -simo error experimental del j -simo
tratamiento.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 18 / 58
Ejemplo: Supresin del crecimiento bacterial en carnes
almacenadas
Hiptesis de investigacin:Con base en esta nueva informacin, el
investigador plantea la hiptesis de que alguna forma de atmsfera
controlada proporcionar un entorno ms efectivo de empaque para el
almacenamiento de carne.
Diseo del tratamiento: El diseo del tratamiento desarrollado por el
investigador para evaluar la hiptesis incluy empaques con: 1) al vaco; 2)
una mezcla de gases con 1% de monxido de carbono (CO), 40% de
oxigeno (0
2
), y 59% de Nitrgeno (N) y 3) 100% dixido de carbono
(CO
2
).
Diseo del experimento: Se us un diseo totalmente aleatorizado para el
experimento. A cada conjunto de condiciones de empaque se le asignaron
al azar 5 cortes del mismo tamao (75 g). Cada corte se empac por
separado en las condiciones asignadas.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 19 / 58
Ejemplo: Supresin del crecimiento bacterial en carnes
almacenadas
En este ejemplo, se evala la efectividad de cada tratamiento para suprimir
el desarrollo bacterial. Despus de 9 das de almacenamiento a 4

C en una
instalacin normal, se midi el nmero de bacterias sicotrpicas en la carne
por centmetro cuadrado. Las bacterias sicotrpicas se encuentran en la
supercie de la carne y se asocian con la carne deteriorada.
Condiciones de empaque
Al vacio Mezcla de gases 100% CO
2
620 730 550
640 720 500
680 690 440
630 680 510
670 670 550
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 20 / 58
Descomposicin de la suma de cuadrados
(Suma de cuadrados total)
SCT =
t

j =1
r

i =1
(y
ij
y )
2
(Suma de cuadrados de los tratamientos)
SCTR =
t

j =1
r

i =1
(y
j
y )
2
(Suma de cuadrados de los errores)
SCE =
t

j =1
r

i =1
(y
ij
y
j
)
2
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 21 / 58
Prueba de hiptesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media F
c
cuadrados libertad cuadrtica
Tratamiento (Inter-grupos) SCTR t 1 MCTR
Error (Intra-grupos) SCE n t MCE
MCTR
MCE
Total SCT n 1
(Hiptesis)
H
0
:
1
=
2
= =
t
v/s H
1
:
i
=
j
, para algn i , j
(Reglas para el rechazo de H
0
)
Fijar y Rechace H
0
si F
c
> F
1
(t 1, n t)
Rechace H
0
si valor-p < 0, 05, donde valor-p= P(F > F
c
).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 22 / 58
Ejemplo de una ANOVA de un Factor en SPSS
Con = 0, 05, pruebe la hiptesis de que existe efecto atribuible a las
condiciones de empaque. Las hiptesis seran
H
0
:
1
=
2
=
3
=
4
v/s H
1
:
k
=
j
, para algn par k, j
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 23 / 58
Ejemplo de una ANOVA de un Factor en SPSS
Puede descargar los datos desde http://bit.ly/carne_anova_1factor
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 24 / 58
Ejemplo de una ANOVA de un Factor en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 25 / 58
Ejemplo de una ANOVA de un Factor en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 26 / 58
Ejemplo de una ANOVA de un Factor en SPSS
Con = 0, 05, pruebe la hiptesis de que existe efecto atribuible a las
condiciones de empaque. Las hiptesis seran
H
0
:
1
=
2
=
3
=
4
v/s H
1
:
k
=
j
, para algn par k, j
Desviacin
tpica Media N
Lmite
superior Lmite inferior
Intervalo de confianza para la
media al 95%
Al vacio
Mezcla de gases
100% CO2
Total 667,39 569,94 87,983 618,67 15
566,22 453,78 45,277 510,00 5
730,14 665,86 25,884 698,00 5
680,14 615,86 25,884 648,00 5
Descriptivos
Nmero de bacterias
Sig. F
Media
cuadrtica gl
Suma de
cuadrados
Inter-grupos
Intra-grupos
Total 14 108373,333
1130,000 12 13560,000
,000 41,953 47406,667 2 94813,333
ANOVA
Nmero de bacterias
Condiciones de empaques
100% CO2 Mezcla de gases Al vacio
9
5
%
IC
N

m
e
r
o
d
e
b
a
c
t
e
r
ia
s
750
700
650
600
550
500
450
Como F
c
= 41, 953 > F
0,95
(2, 12) = 3, 89 (o equivalentemente el
valorp = 0, 000 < 0, 05) entonces, rechace H
0
, en favor de H
1
.
Conclusin: Existe un efecto atribuible a las condiciones de empaque.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 27 / 58
Vericacin de Supuestos
Homogeneidad de varianzas
Denicin (Prueba de Levene)
La prueba de Levene (1960) contrasta la hiptesis de que los grupos
denidos por la variable factor proceden de poblaciones con la misma
varianza (supuesto de homogeneidad de varianzas). Consiste en llevar a
cabo una ANOVA de un factor utilizando como variable dependiente la
diferencia en valor absoluto entre cada puntuacin individual y la media (o
la mediana, o la media recortada) de su grupo.
(Regla)
Se Rechaza la hiptesis de homogeneidad, si el valor-p (Sig.) es menor que
0, 05.
En SPSS: Analizar -> Estadsticos Descriptivos -> Explorar -> Grcos ->
Dispersin por nivel con prueba de Levene -> No transformados.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 28 / 58
Ejemplo de vericacin de homogeneidad en SPSS
Verique si los datos de la supresin del crecimiento bacterial en carnes
almacenadas, tiene varianzas iguales (entre cada condicin de empaque).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 29 / 58
Ejemplo de vericacin de homogeneidad en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 30 / 58
Ejemplo de vericacin de homogeneidad en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 31 / 58
Ejemplo de vericacin de homogeneidad en SPSS
Sig. gl2 gl1
Estadstico de
Levene
Basndose en la media
Basndose en la
mediana.
Basndose en la mediana
y con gl corregido
Basndose en la media
recortada
Nmero de bacterias
,550 12 2 ,628
,586 8,987 2 ,567
,582 12 2 ,567
,578 12 2 ,573
Prueba de homogeneidad de la varianza
Condiciones de empaques
100% CO2 Mezcla de gases Al vacio
N

m
e
r
o
d
e
b
a
c
te
r
ia
s
800
700
600
500
400
Considere las hiptesis H
0
:
2
1
=
2
2
=
2
3
. (varianzas iguales para las
distintas condiciones de empaque)
Si consideramos la prueba de homogeneidad basado en la media, no
podramos rechazar H
0
, pues el valorp = 0, 578 > 0, 05.
En el diagrama de caja, se nota esta armacin, por lo menos en el
empaque al vaco y mezcla de gases.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 32 / 58
Comparaciones Mltiples post hoc: Mtodo de Tukey
Tukey (1949a) desarroll un procedimiento, para las comparaciones en
pares de todas la medias de tratamiento, que se usa para obtener intervalos
de conanza simultneos de 100(1 )%. La prueba se conoce tambin
como diferencia honestamente signicativa. Todas las comparaciones son
referidas a una misma diferencia mnima.
(Mtodo de Tukey para todas las comparaciones por pares)
Para un grupo de t medias de tratamiento, se calcula la diferencia
honestamente signicativa como:
DHS(t, ) = q(, t, n t)

MCE
r
Las estimaciones de los intervalos simultneos de dos lados para el valor
absoluto de todas las diferencias por pares,
i

j
. para toda i < j son:
y
i
y
j
DHS(t, ).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 33 / 58
Comparaciones Mltiples post hoc: Mtodo de Dunnett
(Mtodo de Dunnett para comparar todos los tratamientos con un
control)
Para un grupo de t medias de tratamiento con un testigo (control), se
tiene:
D(t 1, ) = d(, t 1, n t)

2 MCE
r
Las estimaciones de los intervalos de conanza simultneos bilaterales (dos
colas) para las diferencias entre las medias de los tratamientos individuales
y la media del tratamiento testigo
i

c
, son:
y
i
y
c
D(t 1, ).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 34 / 58
Ejemplo de la prueba comparaciones mltiples en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 35 / 58
Ejemplo de la prueba comparaciones mltiples en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 36 / 58
Ejemplo de la prueba comparaciones mltiples en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 37 / 58
Ejemplo de la prueba comparaciones mltiples en SPSS
Sig. Error tpico
Diferencia de
medias (I-J)
Lmite
superior Lmite inferior
Intervalo de confianza al 95%
Mezcla de gases
100% CO2
Al vacio
100% CO2
Al vacio
Mezcla de gases
Al vacio
Mezcla de gases
100% CO2
Al vacio
Al vacio
Mezcla de gases
100% CO2
HSD de Tukey
t de Dunnett (bilateral)
a
-84,80 -191,20 ,000 21,260 -138,000
*
103,20 -3,20 ,065 21,260 50,000
-131,28 -244,72 ,000 21,260 -188,000
*
-81,28 -194,72 ,000 21,260 -138,000
*
244,72 131,28 ,000 21,260 188,000
*
106,72 -6,72 ,086 21,260 50,000
194,72 81,28 ,000 21,260 138,000
*
6,72 -106,72 ,086 21,260 -50,000
(I) Condiciones de
empaques
(J) Condiciones de
empaques
(I) Condiciones de
empaques
(J) Condiciones de
empaques
Comparaciones mltiples
Variable dependiente:Nmero de bacterias
*. La diferencia de medias es significativa al nivel 0.05.
a. Las pruebas t de Dunnett tratan un grupo como control y lo comparan con todos los dems grupos.
SPSS entrega los intervalos de conanza y valoresp. Cuando los
signos de los intervalos son diferentes, no se podra armar que existen
diferencias signicativas entre esos tratamientos.
Por ejemplo, si consideramos el mtodo de Tukey y queremos
comparar el empaque al vaco con el de mezcla de gases,
IC
0,95
(
1

2
) = (106, 72; 6, 72). Lo que indicara que no existen
diferencias en la cantidad de bacterias, entre estos dos empaques.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 38 / 58
Ejemplo de la prueba comparaciones mltiples en SPSS
Subconjuntos homogneos
N 2 1
Subconjunto para alfa = 0.05
100% CO2
Al vacio
Mezcla de gases
Sig.
HSD de Tukey
a
,086 1,000
698,00 5
648,00 5
510,00 5
Condiciones de
empaques
Condiciones de
empaques
Nmero de bacterias
Se muestran las medias para los grupos en los subconjuntos homogneos.
a. Usa el tamao muestral de la media armnica = 5,000.
La misma conclusin se obtiene si consideramos el criterio del
valorp. Por ejemplo, si planteamos los hiptesis H
0
:
1
=
2
v/s
H
1
:
1
=
2
. No podramos rechazar la hiptesis nula (H
0
), pues el
valorp = 0, 068 > 0, 05.
Por otro lado, IC
0,95
(
1

3
) = (81, 28; 194, 72), indicara que existen
diferencias signicativas entre el empaque al vaco y de 100% de CO
2
.
(
1
>
3
, pues el signo del intervalo es positivo). Equivalentemente,
Deberamos rechazar la hiptesis nula (H
0
:
1
=
3
), pues el
valorp = 0, 000 < 0, 05.
Tambin se presenta una tabla resumen, de sub-grupos homogneos
(estadsticamente iguales).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 39 / 58
Introduccin al ANOVA Factorial
Denicin (Anlisis de Varianza Factorial)
El objetivo es investigar, en forma simultnea, los efectos que tienen varios
factores (variables independientes) sobre la variable dependiente. Todos los
niveles de un factor se combinan con todos los niveles de cualquier otro
para formar los tratamientos. Es posible evaluar los efectos individuales de
los factores sobre la variable dependiente y determinar el efecto causado
por sus interacciones. El modelo matemtico sera
y
ijk
= +
i
+
j
+ ()
ij
+
ijk
Ejemplo
Suponga un diseo con dos factores el A y el B. El factor A tiene 2 niveles
(a = 2) y el factor B tiene 3 niveles (b = 3). Entonces existiran 6
tratamientos, cada uno formado por las combinaciones de estos niveles.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 40 / 58
Caractersticas de los datos
(Los datos)
La variable dependiente es cuantitativa.
Los factores son categricos; pueden tener valores numricos o valores
de cadena de hasta ocho caracteres.
(Supuestos)
Los datos son una muestra aleatoria de una poblacin normal; en la
poblacin, todas las varianzas de las casillas son iguales.
El anlisis de varianza es robusto a las desviaciones de la normalidad,
aunque los datos debern ser simtricos.
Para comprobar los supuestos, puede utilizar la prueba de
homogeneidad de varianzas y los grcos de dispersin por nivel.
Tambin puede examinar los residuos y los grcos de residuos.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 41 / 58
Ejemplo: Cantidad de trigo cosechado
El objetivo es determinar si existen diferencias
apreciables en la cantidad de trigo cosechado,
de entre 3 variedades y 2 tipos de fertilizantes.
Para el experimento se encontr una rea muy
grande de siembra en la que las condiciones del
suelo eran, prcticamente, homogneas.
Variedad de trigo
Fertilizante 1 2 3
1 35 45 24
26 39 23
38 39 36
20 43 29
2 55 64 58
44 57 74
68 62 49
64 61 69
El rea fue dividida en 6 zonas de igual tamao para las 6 combinaciones
de variedad de trigo y tipo de fertilizante. Para medir el error experimental,
cada zona se dividi a su vez en cuatro y cada una de stas recibi el
mismo tratamiento. En el momento de la cosecha se observaron los datos
que aparecen en la tabla siguiente.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 42 / 58
Ejemplo: Cantidad de trigo cosechado
Variedad de trigo (B)
Fertilizante (A) 1 2 3 Media
1 35 45 24
26 39 23
38 39 36
20 43 29
y
11
=29,75 y
12
=41,50 y
13
=28,00 y
1
=33,083
2 55 64 58
44 57 74
68 62 49
64 61 69
y
21
=57,75 y
22
=61,00 y
23
=62,50 y
2
=60,416
Media y
1
=43,75 y
2
=51,25 y
3
=45,25 y=46,75
SCT =
2

i =1
3

j =1
4

k=1
(y
ijk
46, 75)
2
= (35 46, 75)
2
+ (26 46, 75)
2
+ + (69 46, 75)
2
= 6042, 5
SCTR =
2

i =1
3

j =1
4

k=1
(y
ij
46, 75)
2
= 4[(29, 75 46, 75)
2
+ (57, 75 46, 75)
2
+ + (62, 50 46, 75)
2
] = 4961
SCE = 6042, 5 4961 = 1081, 5
SCA =
2

i =1
3

j =1
4

k=1
(y
i
46, 75)
2
= 12[(33, 083 46, 75)
2
+ (60, 416 46, 75)
2
] = 4482, 6
SCB =
2

i =1
3

j =1
4

k=1
(y
j
46, 75)
2
= 8[(43, 753 46, 75)
2
+ (51, 25 46, 75)
2
+ (45, 25 46, 75)
2
] = 252
SCAB = 4961 4482, 6 252 = 226, 3
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 43 / 58
Prueba de hiptesis
(Tabla de ANOVA)
Modelo Suma de Grados de Media F
c
Valorp
cuadrados libertad cuadrtica
Fertilizante (A) 4482,667 1 4482,667 74,607 < 0, 01
Variedad (B) 252 2 126 2,097 [0, 10; 0, 25]
Interaccin (A y B) 226,333 2 113,167 1,883 [0, 10; 0, 25]
Error 1081,5 18 60,083
Total 6042,5 23
Si = 0, 05, entonces existen diferencias atribuibles al fertilizante,
pues F
A
= 74, 607 > F
0,95
(1, 18) = 4, 41
Si = 0, 05, entonces NO existen diferencias atribuibles a la variedad,
pues F
B
= 2, 097 < F
0,95
(2, 18) = 3, 55
Si = 0, 05, entonces NO existen diferencias atribuibles al fertilizante
y variedad, pues F
AB
= 1, 883 < F
0,95
(2, 18) = 3, 55
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 44 / 58
Ejemplo de un ANOVA factorial en SPSS
(Ejemplo de un ANOVA factorial en SPSS)
En SPSS, Analizar -> Modelo lineal general -> Univariante.
1
Seleccionar la variable dependiente y trasladarla al cuadro Variable
dependiente.
2
Seleccionar tanto las variables-factores y trasladarlas a la lista
Factores jos.
3
Luego, Aceptar.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 45 / 58
Ejemplo de un ANOVA factorial en SPSS
Puede descargar los datos desde http://bit.ly/trigo_factorial.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 46 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 47 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 48 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 49 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 50 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 51 / 58
Ejemplo de un ANOVA factorial en SPSS
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 52 / 58
Ejemplo de un ANOVA factorial en SPSS
N
Desviacin
tpica Media
1
2
3
Total
1
2
3
Total
1
2
3
Total
1
2
Total
24 16,209 46,75
8 20,226 45,25
8 10,780 51,25
8 17,376 43,75
12 8,479 60,42
4 11,210 62,50
4 2,944 61,00
4 10,658 57,75
12 8,361 33,08
4 5,944 28,00
4 3,000 41,50
4 8,261 29,75
Fertilizante Variedad de trigo Fertilizante Variedad de trigo
Estadsticos descriptivos
Variable dependiente:Cantidad
Se entregarn los promedios y desviaciones estndar para cada tratamiento
(combinaciones de los niveles de los factores), estos indicadores, nos
permiten tener una visin general de la comparacin de las medias.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 53 / 58
Ejemplo de un ANOVA factorial en SPSS
Sig. gl2 gl1 F
,023 18 5 3,471
Contraste de Levene sobre la igualdad de
las varianzas error
a
Contrasta la hiptesis nula de que la varianza
error de la variable dependiente es igual a lo
largo de todos los grupos.
a. Diseo: Interseccin + Fertilizante +
Variedad + Fertilizante * Variedad
Variable dependiente:Cantidad
Este mtodo prueba la hiptesis de homogeneidad de varianzas, se debera
rechazar la hiptesis de que las varianzas (entre los grupos), son iguales, si
el valorp es menor que 0,05. En este caso el valorp = 0, 023, lo que
indicara es que NO se est cumpliendo el supuesto de homogeneidad.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 54 / 58
Ejemplo de un ANOVA factorial en SPSS
Sig. F
Media
cuadrtica gl
Suma de
cuadrados
tipo III
Modelo corregido
Interseccin
Fertilizante
Variedad
Fertilizante * Variedad
Error
Total
Total corregida 23 6042,500
24 58496,000
60,083 18 1081,500
,181 1,883 113,167 2 226,333
,152 2,097 126,000 2 252,000
,000 74,607 4482,667 1 4482,667
,000 873,012 52453,500 1 52453,500
,000 16,514 992,200 5 4961,000
a
Origen Origen
Pruebas de los efectos inter-sujetos
Variable dependiente:Cantidad
a. R cuadrado = ,821 (R cuadrado corregida = ,771)
Esta tabla de ANOVA es la misma que encontramos anteriormente, note
que slo en el caso del fertilizante, el valorp = 0, 000 es menor que 0,05.
Lo que indicara que slo existe un efecto atribuible al fertilizante, en la
cantidad de trigo cosechado (se rechaza H
0
:
1
=
2
).
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 55 / 58
Ejemplo de un ANOVA factorial en SPSS
Tambin se han solicitado las comparaciones mltiples, entre las
variedades, no se pide la comparacin de los fertilizantes, pues son slo dos
y el mtodo anterior ya se concluy que dieren.
Sig. Error tp.
Diferencia de
medias (I-J)
Lmite
superior Lmite inferior
Intervalo de confianza 95%
2
3
1
3
1
2
1
2
3
3,89 -15,89 ,293 3,876 -6,00
11,39 -8,39 ,921 3,876 1,50
15,89 -3,89 ,293 3,876 6,00
17,39 -2,39 ,158 3,876 7,50
8,39 -11,39 ,921 3,876 -1,50
2,39 -17,39 ,158 3,876 -7,50
(I)Variedad de trigo (J)Variedad de trigo (I)Variedad de trigo (J)Variedad de trigo
Comparaciones mltiples
Basadas en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 60,083.
Cantidad
DHS de Tukey
El mtodo indicara que cuando se hacen las comparaciones de a pares en
las variedades, no existiran diferencias signicativas (valoresp >0,05).
Esto es lgico, pues la ANOVA nos haba dicho lo mismo.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 56 / 58
Ejemplo de un ANOVA factorial en SPSS
Estos grcos de medias son tiles para detectar efectos de interaccin,
cuando la interaccin es signicativa, las lneas tienden a cruzarse, de
manera muy marcada (en forma de X), en este caso existe una interaccin,
pero no es signicativa (segn el ANOVA, pues el valorp = 0, 181).
Fertilizante
2 1
M
e
d
i
a
s

m
a
r
g
i
n
a
l
e
s

e
s
t
i
m
a
d
a
s
60
50
40
30
Medias marginales estimadas de Cantidad
3
2
1
Variedad
de trigo
Variedad de trigo
3 2 1
M
e
d
i
a
s

m
a
r
g
i
n
a
l
e
s

e
s
t
i
m
a
d
a
s
60
50
40
30
Medias marginales estimadas de Cantidad
2
1
Fertilizante
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 57 / 58
Ejemplo de un ANOVA factorial en SPSS: Anlisis de
residuos
Se ha solicitado que SPSS entregue los valores pronosticados
(PRED
1
=promedio del tratamiento) por el modelo y los Residuos
(RES
1
=distancia entre el valor real y el valor pronosticado).
Esto permite realizar un anlisis de los residuos.
mrodriguez@ucm.cl (UCM) Diseo Experimental en SPSS 23/07/2012 58 / 58
II. Casos Aplicados a las Ciencias Sociales:
Anlisis Categrico en SPSS
Mg. Marcelo Rodrguez
Dr. Marco Riquelme
Acadmicos de la Universidad Catlica de Maule
Departamento de Matemtica, Fsica y Estadstica
Seminario realizado para el:
Departamento de Estadstica
Universidad de Valparaso
23 de julio de 2012
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 1 / 24
Factores que inuyen en el cambio de establecimiento
En un estudio social, se desean identicar cules son los factores que
inuyen en el cambio de establecimiento comercial. Basado en el estudio
realizado por el Dr. Jorge Zamora.
Planteamiento del problema: En empresa sabe que sus clientes se
estn cambiando de establecimiento comercial, para realizar sus
compras y quiere saber cuales son los motivos.
Poblacin objetivo: Est constituida por todos los clientes del
establecimiento comercial, de una ciudad especca, que poseen
tarjeta de crdito del establecimiento. Segn los registros el tamao
de la poblacin es de 145.000 clientes.
Objetivos: Identicar cuales son los factores que inuyen en que el
cliente se cambie de establecimiento comercial.
Hiptesis: Los estudios, la estructura familiar y la edad son factores
relevantes en el cambio de establecimiento comercial.
Establecer la metodologa estadstica: Las tcnicas estadsticas son:
Tablas de frecuencias, tablas de contingencia, prueba chi-cuadrado y
grcos de barra.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 2 / 24
Factores que inuyen en el cambio de establecimiento
Plan de muestreo: Se han considerado 2000 clientes de los registros de
la empresa, estos clientes fueron seleccionados de forma aleatoria.
Recopilacin de los datos: La recopilacin se realiz mediante una
encuesta que media las siguientes variables:
Variable Caracterstica Escala
Edad Edad de los individuos Ordinal
Estudios Estudios realizados por el entrevistado, las categoras son: Ordinal
sin estudio, primarios, medios, diplomado y licenciado
Gnero Masculino y femenino Nominal
Situlabo Empleado o desempleado Nominal
Nios Pertenece a una familia, con o sin hijos menores de 4 aos Nominal
Estrucf Estructura familiar distinguiendo entre: unipersonal Nominal
matrimonio con hijos, bigeneracional, slo hijos y otros
Reclamo Ha realizado un reclamo el ltimo mes Nominal
Fidelidad Nivel de delidad con el establecimiento Ordinal
Camest En los ltimos dos aos ha cambiado (o no) de establecimiento Nominal
comercial habitual donde realiza sus compras.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 3 / 24
Factores que inuyen en el cambio de establecimiento
La encuesta tendra la siguiente estructura:




S
M u
u M


E
S
S M
u L u


'
S
M l


^
S
u L



S
S n



S
u M M
8 S C


,
S
S n


E
S
l 8


^
S
S n

mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 4 / 24
Factores que inuyen en el cambio de establecimiento
Diseo de la base de datos: Luego de aplicar la encuesta se ordena en
una base de datos, donde en cada columna representa una variable y
en cada la un individuo. Puede descargar los datos en SPSS desde
http://bit.ly/data_camest
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 5 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 6 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 7 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 8 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 9 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 10 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 11 / 24
Factores que inuyen en el cambio de establecimiento:
Prueba chi-cuadrado mediante SPSS
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 12 / 24
Factores que inuyen en el cambio de establecimiento
Procesar los datos: Utilizando SPSS y la metodologa de tablas de
contingencia se obtiene la siguiente tabla.
No Si Total
Cambio de establecimiento
habitual en los ltimos dos aos
Sin estudios
Primarios
Medios
Diplomado
Licenciado
Total
Estudios realizados
100,0% 75,7% 24,3%
2000 1514 486
100,0% 68,7% 31,3%
166 114 52
100,0% 72,6% 27,4%
248 180 68
100,0% 71,6% 28,4%
514 368 146
100,0% 75,5% 24,5%
760 574 186
100,0% 89,1% 10,9%
312 278 34
Tabla de contingencia Estudios realizados * Cambio de establecimiento habitual en los
ltimos dos aos
Analizar los resultados: A modo global, la probabilidad de cambio es
del 24,3%, pero si el individuo no tiene estudios, esta probabilidad
disminuye a un 10,9%, por otro lado, si el individuo tiene estudios con
licenciatura, su probabilidad de cambio, aumenta signicativamente a
un 31,3%.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 13 / 24
Factores que inuyen en el cambio de establecimiento
Conclusin: Se aprecia que nivel de estudio es un factor que inuye en
cambio de establecimiento comercial.
Decisin: Para retener a los clientes, se deben considerar los niveles de
estudios y tener un cuidado especial, con los clientes con alto nivel de
estudios, pues tienen una alta probabilidad de cambiarse de
establecimiento comercial.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 14 / 24
Medicin del grado de relacin en tablas de contingencia
(Introduccin)
La prueba de independencia slo permite establecer si dos variables estn
asociadas. Esta prueba no indica el grado de dependencia. Si dos variables
estn asociadas o relacionadas es posible predecir el estado de una de ellas
conociendo el estado de la otra. Mientras ms fuerte sea la relacin que
presentan los datos, con mayor precisin (menor error) se podr predecir el
valor de una variable conociendo el valor de la otra.
Recuerde que la variable dependiente (Y), es la variable que se quiere
predecir y la variable independiente (X) es la variable que se usa para
predecir.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 15 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Ejemplo
Considere la variables X = Sexo e Y = Ingreso. Se puede concluir que el
Ingreso depende del Gnero (
2
= 138, 596; valorp = 0, 000).
Ingresos
Sexo Menos de 400 Entre 400 y 800 Ms de 800 Total
Mujer 124 86 6 216
Hombre 19 174 48 241
Total 143 260 54 457
Como conocemos la distribucin de la variable Ingreso, al estimar a qu
grupo de Ingreso pertenece un sujeto cualquiera, diremos que pertenece al
grupo de Entre 400 y 800, porque hay una probabilidad de
260/457 = 0, 569 de pertenecer a ese grupo frente a una probabilidad de
(143 + 54)/457 = 0, 431 de pertenecer a cualquiera de los otros grupos.
Procediendo de esta manera, estaremos cometiendo un error de
clasicacin de 0,431.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 16 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Ejemplo
Si ahora tenemos en cuenta la variable Sexo para efectuar esa
estimacin y clasicamos a las Mujeres en el grupo de Menos de 400,
porque ese es el grupo de Ingreso ms probable entre las mujeres (con
un error de (86+6)/457 = 0,201),
y a los Hombres en el grupo de Entre 400 y 800, porque ese es el
grupo de salario ms probable entre los hombres (con un error de
(19+48)/457 =0,147),
item Conociendo el gnero, estaremos cometiendo un error de
clasicacin de 0, 201 + 0, 147 = 0, 348.
Actuando de esta segunda manera hemos conseguido reducir el error
de clasicacin en 0,083 (de 0,431 a 0,348), lo cual representa una
proporcin de reduccin del error de prediccin de
= 0, 083/0, 431 = 0, 193.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 17 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Denicin (Coeciente lambda)
El coeciente lambda () mide el grado de predictibilidad entre las
variables. Est basado en predecir la clase modal de la variable dependiente
(ver Goodman y Kruskal, 1979).
1
Para cada nivel de la variable independiente encuentre la clase modal
de la variable dependiente.
2
Determine K = suma de las frecuencias de todas las celdas de la
variable dependiente, distintas a las clases modales, para cada nivel de
la variable independiente.
3
Determine U = suma de las frecuencias marginales (totales) de la
variable dependiente distintas al total modal.
4
Determine =
(U K)
U
, donde 0 1.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 18 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
(Propiedades del coeciente )
Si = 1, las variables en la muestra son absolutamente dependientes.
En este caso no hay error de prediccin; la variable dependiente se
puede predecir con absoluta certeza a partir de la variable
independiente.
Si = 0, las variables en la muestra son absolutamente
independientes. En este caso siempre se predice el mismo valor de la
variable dependiente.
se puede interpretar como un porcentaje de reduccin del error de
prediccin puesto que: =
(U K)
U
,
K = error global de prediccin usando la variable independiente.
U = error global de prediccin sin usar la variable independiente.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 19 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Ejemplo
Para el ejemplo anterior, calcule el coeciente , mediante la metodologa
anterior.
Ingresos
Sexo Menos de 400 Entre 400 y 800 Ms de 800 Total
Mujer 124 86 6 216
Hombre 19 174 48 241
Total 143 260 54 457
U = 143 + 54 = 197
K = 86 + 6 + 19 + 48 = 159
=
(197 159)
197
= 0, 193.
El ingreso depende del sexo y si utilizamos el sexo para predecir el ingreso
se produce una reduccin del 19,3% del error de prediccin.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 20 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Aqu se supone que no se tienen los datos originales y se ingresa la tabla de
contingencia en SPSS. El proceso es equivalente si se poseen los datos
originales (no se deben ponderar los casos).
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 21 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 22 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
Ms de 800
Entre 400 y
800 Menos de 400 Total
Ingreso
Mujer
Hombre
Total
Sexo
457 54 260 143
241 48 174 19
216 6 86 124
Recuento
Sig. asinttica
(bilateral) gl Valor
Chi-cuadrado de Pearson
Razn de verosimilitudes
Asociacin lineal por lineal
N de casos vlidos 457
,000 1 128,475
,000 2 152,384
,000 2 138,596
a
Pruebas de chi-cuadrado
a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5.
La frecuencia mnima esperada es 25,52.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 23 / 24
Medicin del grado de relacin en tablas de contingencia
Coeciente lambda Goodman y Kruskal
SPSS entrega 3 valores de , el simtrico, se utiliza si se desconoce cul es
la variable dependiente. Como el ingreso es la variable dependiente,
= 0, 193. Lo que indica es que si utilizamos el sexo, para predecir el
salario se produce una reduccin del 19,3% del error de prediccin, y esta
reduccin es signicativa, pues el valorp = 0, 008.
Sig.
aproximada
T
aproximada
b
Error tp.
asint.
a
Valor
Simtrica
Sexo dependiente
Ingreso dependiente
Sexo dependiente
Ingreso dependiente
Lambda
Tau de Goodman y
Kruskal
Nominal por nominal
,000
c
,026 ,168
,000
c
,037 ,303
,008 2,642 ,066 ,193
,000 9,630 ,040 ,486
,000 6,063 ,049 ,346
Medidas direccionales
a. Asumiendo la hiptesis alternativa.
b. Empleando el error tpico asinttico basado en la hiptesis nula.
c. Basado en la aproximacin chi-cuadrado.
mrodriguez@ucm.cl (UCM) Anlisis Categrico en SPSS 23/07/2012 24 / 24
III. Casos Aplicados a las Ciencias de la Salud:
Tcnicas Multivariantes en SPSS
Mg. Marcelo Rodrguez
Dr. Marco Riquelme
Acadmicos de la Universidad Catlica de Maule
Departamento de Matemtica, Fsica y Estadstica
Seminario realizado para el:
Departamento de Estadstica
Universidad de Valparaso
23 de julio de 2012
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 1 / 37
Introduccin a la Regresin Logstica Binaria
La regresin logstica binaria, resulta til para los casos en los que se
desea predecir la presencia o ausencia de una caracterstica o resultado
segn los valores de un conjunto de predictores (variables
independientes).
Es similar a un modelo de regresin lineal pero est adaptado para
modelos en los que la variable dependiente es dicotmica.
Los coecientes de regresin logstica pueden utilizarse para estimar la
razn de las ventajas (odds ratio) de cada variable independiente del
modelo.
Se puede aplicar a un rango ms amplio de situaciones de
investigacin que el anlisis discriminante.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 2 / 37
Un ejemplo, cuando la variable independiente es cuantitativa
Un investigador est interesado en conocer hasta qu punto la presencia de
una enfermedad est relacionada con la edad de los pacientes. Con esta
intencin se realiza un instrumento, en la cual la variable dependiente seria:
Presenta la enfermedad?,
ha sido codicada con el
valor 1 en caso de res-
puesta armativa y con
valor 0 en caso contrario.
Por otro parte, la variable
independiente re-presenta
la edad de los pacientes.
Enfermedad Edad Enfermedad Edad Enfermedad Edad
1 50,2 1 62,0 1 50,8
1 70,3 0 50,8 0 37,5
1 62,9 1 56,2 0 41,3
1 48,5 0 43,2 1 63,6
1 57,2 1 50,4 1 54,0
1 75,0 0 44,1 0 45,0
1 46,2 0 38,3 1 68,0
1 57,0 0 55,0 1 62,1
1 64,1 0 46,1 0 35,0
0 32,0 0 35,0 0 34,5
1 73,4 0 37,3 0 39,4
1 71,9 0 41,8 0 37,0
0 56,2 0 37,0 1 54,5
1 49,3 0 33,4 1 38,2
https://dl.dropbox.com/u/12995489/Datos/enf_edad_log.sav
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 3 / 37
Una solucin errnea: Modelo de regresin lineal
Para relacionar estas variables se podra utilizar un modelo de regresin
y =

0
+

1
x. El modelo ajustado sera

Enfermedad = 0, 983 + 0, 030 Edad


Edad
80 75 70 65 60 55 50 45 40 35 30
E
n
f
e
r
m
e
d
a
d
1,0
,9
,8
,7
,6
,5
,4
,3
,2
,1
,0
R
2
Lineal = 0,524
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 4 / 37
Modelo de regresin logstica
En este caso lo correcto sera utilizar la siguiente funcin,
y = log

p
1 p

0
+

1
x
Equivalentemente, podra representarse como:
p =
e

0
+

1
x
1 + e

0
+

1
x
la cual representa la probabilidad (estimada) de que un sujeto tenga opcin
1 (enfermo), dado un determinado valor de x (edad).
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 5 / 37
Una solucin correcta: Estimacin de los parmetros del
Modelo de regresin logstica
El modelo ajustado sera
p =
e
11,449+0,237Edad
1 + e
11,449+0,237Edad
80 75 70 65 60 55 50 45 40 35 30
1,0
,9
,8
,7
,6
,5
,4
,3
,2
,1
,0
Enfermedad
Edad
Probabilidad
pronosticada
Edad
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 6 / 37
Caracterizacin de la regresin logstica: odds ratio
La regresin logstica utiliza la relacin
p
i
=
e

0
+

1
x
i
1 + e

0
+

1
x
i
,
la cual representa la probabilidad (estimada) de que un sujeto elija la
opcin 1, dado un determinado valor de x
i
.
En forma anloga se dene la probabilidad (estimada) de que un
sujeto NO elija la opcin 1, dado un determinado valor de x
i
, mediante
1 p
i
=
1
1 + e

0
+

1
x
i
,
Se dene la ventaja (odds ratio) estimada de la opcin 1 frente a la
opcin 0 de la variable de dependiente, para cada valor de la variable
independiente, como:

i
=
p
i
1 p
i
= e

0
+

1
x
i
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 7 / 37
Siguiendo con el ejemplo: odds ratio
Por ejemplo, si desea estimar la probabilidad de que un paciente con
edad de 54,1 posea la enfermedad, esta seria de
p =
e
11,449+0,23754,1
1 + e
11,449+0,23754,1
= 0, 80
Por otro lado, la probabilidad de no poseer la enfermedad, seria de
1 p = 0, 20.
Adems, la ventaja de la opcin poseer la enfermedad, frente a no
poseerla, de un paciente con edad de 54,1, sera

=
0, 80
0, 20
= 4.
Es decir, un paciente de 54,1 aos, tiene 4 veces ms posibilidades de
poseer la enfermedad, que no poseerla.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 8 / 37
Signicacin de los coecientes: El estadstico de Wald
Denicin (El estadstico de Wald)
Este estadstico sirve para comprobar si la variable (o variables)
independiente est relacionada signicativamente con la variable
dependiente. El estadstico est dado por
W =

i
SE(

i
)

2
Las hiptesis seran H
0
:
j
= 0 v/s H
1
:
j
= 0
Rechace H
0
si valor-p < 0,05.
Si rechazamos que H
0
:
1
= 0, esto indica que la variable x est
relacionada signicativamente con la variable y.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 9 / 37
Siguiendo con el ejemplo: Consideraciones nales
La metodologa sirve para encontrar una funcin matemtica que
relacione la posibilidad de que ocurra la enfermedad y la edad
p =
e
11,449+0,237Edad
1 + e
11,449+0,237Edad
.
Se puede predecir la probabilidad de que un individuo con edad
especca poseea la enfermeda, por ejemplo si la edad es de 54,1 se
tiene una probabilidad del 80% de poseer la enfermedad.
Tambin se puede utilizar la clasicar a un individuo. Por ejemplo, en
el caso anterior, sera clasicado como un individuo enfermo.
Se puede probar si las variables se relacionan signicativamente. Por
ejemplo, existe una relacin signicativa entre la edad y la enfermedad
(W=11,556; valor-p=0,001).
Exp(B) Sig. gl Wald E.T. B
Edad
Constante
Paso 1
a
,000 ,001 1 11,476 3,380 -11,449
1,268 ,001 1 11,556 ,070 ,237
Variables en la ecuacin
a. Variable(s) introducida(s) en el paso 1: Edad.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 10 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 11 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 12 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 13 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 14 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 15 / 37
Un ejemplo, cuando la variable independiente es cualitativa
En un estudio de tabaquismo (0=No y 1= S) y riesgo de enfermedad
pelvica inamatoria aguda (0=No y 1= S), se pretende determinar cuanto
mayores son los grados de probabilidad (riesgo relativo) de encontrar casos
de enfermedad entre los individuos que siempre han fumado que entre los
individuos que nunca han fumado. A continuacin se presenta una tabla
resumen de los datos:
S No Total
Enfermedad
No
S
Total
Fuma
425 131 294
200 77 123
225 54 171
Tabla de contingencia Fuma * Enfermedad
Recuento
Los datos los puede descargar desde
https://dl.dropbox.com/u/12995489/Datos/enf_fum_log.sav.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 16 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 17 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 18 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 19 / 37
Regresin Logstica en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 20 / 37
Interpretaciones del problema
La probabilidad de que un individuo tenga la enfermedad,
considerando su condicin de tabaquismo sera:
p =
e
1,153+0,684Fuma
1 + e
1,153+0,684Fuma
.
La probabilidad de que un individuo que no fuma (0) tenga la
enfermedad, sera p = e
1,153
/(1 + e
1,153
) = 0, 240. Entonces se
tiene una ventaja (odds ratio) de

= 0, 240/0, 760 = 0, 316.
La probabilidad de que un individuo que fuma (1) tenga la enfermedad,
sera p = e
1,153+0,684
/(1 + e
1,153+0,684
) = 0, 385. Entonces se tiene
una ventaja (odds ratio) de

= 0, 385/0, 615 = 0, 626.
Se estima que el riesgo de encontrar un caso de inamacin plvica es
de casi dos veces ( rg = 0, 626/0, 316 = 1, 982) mas alto entre los
individuos que siempre han fumado que entre los individuos que nunca
han fumado.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 21 / 37
Un ejemplo, con varias variables independientes
Un estudio relacionado con la evolucin de los pacientes en la UCI, se
selecciona una muestra aleatoria de 200 pacientes y se miden las siguientes
variables:
Estado: Es el estado vital de los pacientes (0=vivo y 1=muerto).
Edad: Edad medida en aos.
Gnero: Gnero de los pacientes (0=masculino y 1=femenino)
Raza: Raza de los pacientes (1=blanco, 2=negro y 3=otro)
Servicio: Servicio de admicin en la UCI (0=mdico y 1=quirrgico)
Cancer: Presenta problemas de cancer (0=no y 1=si)
Renal: Historia de insuciencia renal crnica (0=no y 1=si)
Sistlica: Presin arterial sistlica al ingresar a la UCI.
Cardiaca: Frecuencia cardiaca al ingresar a la UCI
Previo: Ingreso previo a la UCI dentro de 6 meses (0=no y 1=si)
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 22 / 37
Un ejemplo, con varias variables independientes
https://dl.dropbox.com/u/12995489/Datos/UCI_reglog.sav
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 23 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 24 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 25 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 26 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 27 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 28 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 29 / 37
Un ejemplo, con varias variables independientes
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 30 / 37
Introduccin a la Segmentacin Jerquica (rboles de
Clasicacin)
El procedimiento rbol de clasicacin crea un modelo de clasicacin
basado en rboles, y clasica casos en grupos o pronostica valores de una
variable dependiente (criterio) basada en valores de variables
independientes (predictores).
1
Esencialmente el mtodo de segmentacin jerrquica CHAID, es un
mtodo de relacin entre variables.
2
No existe restriccin con respecto a la escala de medicin de la
variable dependiente (puede ser cuantitativa o cualitativa).
3
Las escalas de medicin de la variables independientes deben ser
cualitativas (en caso que no sea as, el mtodo realiza la
categorizacin).
4
Es un mtodo automtico, el decide que mtodo utilizar para realizar
una particin. Entre los mtodos que utiliza, se encuentran:
Prueba Chi-Cuadrado (cuando la variable dependiente es cualitativa).
ANOVA de un Factor (cuando la variable dependiente es cuantitativa).
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 31 / 37
Para que se puede utilizar el mtodo
Segmentacin y Estraticacin. Identica a las personas que es
probable que pertenezcan a un grupo especco.
Prediccin. Crea reglas y las utiliza para predecir eventos futuros.
Reduccin de datos y clasicacin de variables. Selecciona un
subconjunto til de predictores a partir de un gran conjunto de
variables.
Identicacin de interaccin. Identica las relaciones que pertenecen
slo a subgrupos especcos.
Fusin de categoras y discretizacin de variables continuas. Vuelve a
codicar las variables continuas y las categoras de los predictores del
grupo, con una prdida mnima de informacin.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 32 / 37
CHAID en SPSS
Recuerde el estudio relacionado con la evolucin de los pacientes en la UCI.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 33 / 37
CHAID en SPSS
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 34 / 37
CHAID en SPSS
Seleccione las variables y luego Criterios.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 35 / 37
CHAID en SPSS
He disminuido los criterios (de 100 y 50 a 100 y 10).
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 36 / 37
CHAID en SPSS
Nodo 0
Categora % n
80,0 160 Vivo
20,0 40 Muerto
Total 100,0 200
Presin arterial sistlica al ingresar a
la UCI
Valor P corregido=0,000, Chi-
cuadrado=24,440, df=1
Estado vital
Nodo 1
Categora % n
36,8 7 Vivo
63,2 12 Muerto
Total 9,5 19
<= 91,0
Nodo 2
Categora % n
84,5 153 Vivo
15,5 28 Muerto
Total 90,5 181
Historia de insuficiencia renal
crnica
Valor P corregido=0,018, Chi-
cuadrado=5,639, df=1
> 91,0
Nodo 3
Categora % n
86,6 142 Vivo
13,4 22 Muerto
Total 82,0 164
Edad
Valor P corregido=0,041, Chi-
cuadrado=8,027, df=1
No
Nodo 4
Categora % n
64,7 11 Vivo
35,3 6 Muerto
Total 8,5 17
S
Nodo 5
Categora % n
90,2 120 Vivo
9,8 13 Muerto
Total 66,5 133
<= 74,0
Nodo 6
Categora % n
71,0 22 Vivo
29,0 9 Muerto
Total 15,5 31
> 74,0
Vivo
Muerto
Los factores que inuyen en el estado vital
de un paciente son: Presin arteral,
Insuciencia renal y la edad.
La probabilidad de que un individuo
sobreviva es de 80%.
Si tiene una presin arterial inferior o igual
a 91, su probabilidad de sobrevivencia
disminuye a 36,8%.
Si tiene una presin arterial superior a 91 y
no tiene historia de insuciencia renal, su
probabilidad de sobrevivencia es de 86,6%.
Si tiene una presin arterial superior a 91,
no tiene historia de insuciencia renal, y su
edad es inferior o igual a 74, su probabilidad
de sobrevivencia es de 90,2%.
mrodriguez@ucm.cl (UCM) Tcnicas Multivariantes en SPSS 23/07/2012 37 / 37
IV. Casos Aplicados al rea Comercial:
Mtodos de Dependencia, Respuesta Mltiple
y Anlisis de Fiabilidad
Mg. Marcelo Rodrguez
Dr. Marco Riquelme
Acadmicos de la Universidad Catlica de Maule
Departamento de Matemtica, Fsica y Estadstica
Seminario realizado para el:
Departamento de Estadstica
Universidad de Valparaso
23 de julio de 2012
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 1 / 73
Regresin Lineal Mltiple
Introduccin
R
e
n
ta
25
22,5
20
17,5
15
T
a
r
j
e
t
a
10
9
8
7
6
5
4
Tamao
6
5
4
3
2
Tcnica de dependencia que puede
utilizarse para analizar la relacin entre
una nica variable dependiente (Y) y
varias variables independientes x
1
, x
2
,
. . . , x
k
.
Cada variable independiente es
ponderada (
j
), de forma que las
ponderaciones indican su contribucin
relativa a la prediccin conjunta.
El objetivo es usar las variables
independientes cuyos valores son
conocidos para predecir la nica
variable dependiente seleccionada por
el investigador.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 2 / 73
Ejemplo de problema de Regresin Lineal Mltiple
En un estudio se desea saber cuales son los factores que inuyen en la
posesin de tarjetas de crdito. Para este objetivo se mide el nmero de
tarjetas de crdito utilizadas (y), el tamao de la familia (x
1
) y la renta
familiar (x
2
). Se seleccionan 8 familias y los datos se entregan a
continuacin (puede descargarlos desde
http://bit.ly/Regresion_Tarjeta):
Familia Tarjeta (y) Tamao (x1) Renta (x2)
1 4 2 14
2 5 2 16
3 6 4 14
4 7 4 17
5 8 5 18
6 7 5 21
7 8 6 17
8 10 6 25
El objetivo es encontrar una funcin que relacione:
Tarjeta =
0
+
1
Tamao +
2
Renta + Error .
Bastara slo tener una estimacin de
0
,
1
, y
2
para tener denida por
completo la funcin anterior.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 3 / 73
Regresin Lineal Mltiple
El modelo lineal general
El modelo de regresin lineal sera
y
i
=
0
+
1
x
i 1
+
2
x
i 2
, . . . ,
k
x
ik
+
i
.
Donde
Y =
_
_
_
_
_
y
1
y
2
.
.
.
y
n
_
_
_
_
_
, X =
_
_
_
_
_
1 x
11
x
12
. . . x
1k
1 x
21
x
22
. . . x
2k
.
.
.
.
.
.
.
.
.
.
.
.
1 x
n1
x
n2
. . . x
nk
_
_
_
_
_
, =
_
_
_
_
_

1
.
.
.

k
_
_
_
_
_
, =
_
_
_
_
_

2
.
.
.

n
_
_
_
_
_
,

j
, son los parmetros desconocidos, j = 1, . . . , k. El n

total de
parmetros es p = k + 1.

i
es el i simo error aleatorio asociado con y
i
, i = 1, . . . , n.
El objetivo es estimar
j
, a esta estimacin la llamaremos

j
.
La estimacin se los parmetros sera

= (X
T
X)
1
X
T
Y. Entonces el
modelo estimado sera y
i
=

0
+

1
x
i 1
+

2
x
i 2
, . . . ,

k
x
ik
.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 4 / 73
Regresin Lineal Mltiple
Ejemplo de estimacin de los parmetros.
Identicando las matrices y vectores, tenemos
Y =
_
_
_
_
_
4
5
.
.
.
10
_
_
_
_
_
, X =
_
_
_
_
_
1 2 14
1 2 16
.
.
.
.
.
.
.
.
.
1 6 25
_
_
_
_
_
,

= (X
T
X)
1
X
T
Y =
_
_
0, 188
0, 814
0, 182
_
_
,
Entonces, un modelo estimado para predecir el nmero de tarjetas de
crdito sera:

Tarjeta = 0, 188 + 0, 814 Tamao + 0, 182 Renta


Equivalentemente,
y = 0, 188 + 0, 814 x
1
+ 0, 182 x
2
Si los parmetros

j
son muy cercanos a 0, las variables x
i
no estaran
inuenciando en el modelo en la prediccin de y.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 5 / 73
Regresin Lineal Mltiple
Prueba de hiptesis para los parmetros.
(Prueba de hiptesis para los parmetros del modelo)
Hiptesis:
H
0
:
0
=
1
= =
k
= 0 v/s H
1
:
j
= 0, para algn j .
Estadstico de prueba:
Modelo Suma de Grados de Media F
c
cuadrados libertad cuadrtica
Regresin
n

i =1
( y
i
y)
2
p 1
SCReg
(p 1)
MCReg
MCRes
Residual
n

i =1
(y
i
y
i
)
2
n p
SCRes
(n p)
Total
n

i =1
(y
i
y)
2
n 1
Regin de rechazo: Rechace H
0
si F
c
> F
1
(p 1, n p).
Signicancia: Valor-p = 1 P(F < F
c
). Donde F se distribuye
Fisher con p 1 y n p grados de libertad.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 6 / 73
Regresin Lineal Mltiple
Ejemplo de estimacin de los parmetros.
Para vericar si las variables independientes (x
j
) tienen un aporte
signicativo en la prediccin del nmero de tarjetas de crdito ( y), debe
probar:
H
0
:
0
=
1
=
2
= 0 v/s H
1
:
j
= 0, para algn j .
Caracteristica Datos Variacin
Reales Estimados Total De la regresin Residual
Familia yi yi (yi y)
2
( yi y)
2
(yi yi )
2
1 4 4,361 8,266 6,320 0,130
2 5 4,724 3,516 4,625 0,076
3 6 5,990 0,766 0,783 0,000
4 7 6,535 0,016 0,116 0,216
5 8 7,531 1,266 0,431 0,220
6 7 8,076 0,016 1,443 1,159
7 8 8,164 1,266 1,662 0,027
8 10 9,618 9,766 7,522 0,146
Suma 55,000 55,000 24,875 22,901 1,974
Modelo Suma de Grados de Media Fc
cuadrados libertad cuadrtica
Regresin 22,901 2 11,451 29,005
Residual 1,974 5 0,395
Total 24,875 7
Si = 0, 05. Rechace H
0
si
F
c
> F
0,95
(2, 5) = 5, 79.
El valorp = 0, 002.
Entonces, se rechaza H
0
, en favor de H
1
. Es decir, existe suciente
evidencia para armar que el tamao de la familia y la renta son
indicadores para la prediccin del nmero de tarjetas de crdito.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 7 / 73
Regresin Lineal Mltiple
Bondad de ajuste
(Coeciente de Determinacin (R
2
))
Expresa la proporcin de varianza de la variable dependiente que est
explicada por las variables independientes.
R
2
=
SCReg
SCT
.
R
2
corregida es una correccin a la baja de R
2
que se basa en el nmero de
casos y de variables independientes:
R
2
correjida
= R
2

_
k(1 R
2
)
(n k + 1)
_
.
Para el ejemplo anterior, el porcentaje de la variabilidad total que explica el
modelo es 100 R
2
% =
22,901
24,875
100% = 92, 1%.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 8 / 73
Regresin Lineal Mltiple
Bondad de ajuste
(Coeciente de correlacin mltiple (R))
Es la raz de R
2
. Si tenemos dos variables el Coeciente de correlacin
mltiple es el valor absoluto del coeciente de correlacin de Pearson, es
decir, R = |r |.
(Error (residuo) estndar de la estimacin)
Es la desviacin media que existe entre la variable dependiente y y su
estimacin y (el residuo es
i
= y
i
y
i
).
s

_
n

i =1
(y
i
y
i
)
2
n p
=

MCRes.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 9 / 73
Regresin Lineal Mltiple
Prueba de hiptesis para cada uno de los parmetros
Hiptesis: H
0
:
j
= 0 v/s H
1
:
j
= 0, para j = 0, 1, . . . , k.
Estadstica de prueba: t
c
=

j
s(

j
)
Hip. Nula Hip. Altern. Rechace H
0
si Valorp
H
0
:
j
= 0 H
1
:
j
= 0 |t
c
| > t
1/2
(n p) 2[1 P(T < |t
c
|)]
H
0
:
j
= 0 H
1
:
j
> 0 t
c
> t
1
(n p) 1 P(T < |t
c
|)
H
0
:
j
= 0 H
1
:
j
< 0 t
c
< t
1
(n p) 1 P(T < |t
c
|)
T se distribuye tstudent con n p grados de libertad. Adems
s(

j
) =

c
j +1
s

, donde c
j +1
es el elemento (j + 1) de la diagonal de
(X
T
X)
1
.
Un intervalo de conanza del 100(1 )% para el parmetro
j
es

j
t
1/2
(n p) s(

j
)
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 10 / 73
Regresin Lineal Mltiple
Regresin Lineal Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 11 / 73
Regresin Lineal Mltiple
Regresin Lineal Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 12 / 73
Regresin Lineal Mltiple
Regresin Lineal Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 13 / 73
Regresin Lineal Mltiple
Regresin Lineal Mltiple en SPSS

Tarjeta = 0, 188 + 0, 814 Tamao + 0, 182 Renta


No existe suciente evidencia muestral, para armar que la Renta
(t = 2, 091, valorp = 0, 091) inuyen en la estimacin del nmero de
tarjetas de crdito.
La muestra proporciona evidencia para armar que el Tamao de la
familia, incide en la estimacin del nmero de tarjetas de crdito.
(t = 4, 012, valorp = 0, 010).
La variable ms importante en la prediccin del nmero de tarjetas, es
tamao de la familia, luego la renta (mayor coef. estandarizado).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 14 / 73
Regresin Lineal Mltiple
Supuestos del Modelo
(Supuestos del Modelo de Regresin)
Los supuestos de un modelo estadstico se reeren a una serie de
condiciones que deben darse para garantizar la validez del modelo.
Linealidad: La variable dependiente es la suma de un conjunto de
elementos: el origen de la recta, una combinacin lineal de variables
independientes y los residuos.
Independencia: Los residuos son independientes entre s.
Homocedasticidad: Para cada valor de la variable independiente, la
varianza de los residuos es constante.
Normalidad: Para cada valor de la variable independiente, los
residuos se distribuyen normalmente con media cero.
No-colinealidad: No existe relacin lineal exacta entre ninguna de las
variables independientes.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 15 / 73
Introduccin al Anlisis Discriminante
El anlisis discriminante es una tcnica estadstica capaz de decirnos
qu variables permiten diferenciar a los grupos y cuntas de estas
variables son necesarias para alcanzar la mejor clasicacin posible.
La pertenencia a los grupos, conocida de antemano, se utiliza como
variable dependiente (una variable categrica con tantos valores
discretos como grupos).
Las variables en las que suponemos que se diferencian los grupos se
utilizan como variables independientes o variables de clasicacin
(tambin llamadas variables discriminantes).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 16 / 73
Ejemplo
Un investigador, de un centro de ubicacin laboral, desea predecir la
Universidad de procedencia (1=Consejo de Rectores y 2= No es del
consejo de Rectores), en funcin del Puntaje en PSU y Nmero de ofertas
laborales. Los datos son:
Estudiante PSU Ofertas Tipo
1 650 3 1
2 470 3 1
3 450 1 2
4 500 0 2
5 738 5 1
6 530 4 2
7 430 2 2
8 500 2 2
9 776 6 1
10 674 2 1
Puntaje PSU
800 700 600 500 400
N

m
e
r
o

d
e

o
f
e
r
t
a
s

l
a
b
o
r
a
l
e
s
6
5
4
3
2
1
0
No es del
consejo de
Rectores
Consejo de
Rectores
Tipo de
Universidad
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 17 / 73
Anlisis discriminante en SPSS
Puede descargar los datos desde http://bit.ly/ofer_lab
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 18 / 73
Anlisis discriminante en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 19 / 73
Anlisis discriminante en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 20 / 73
Anlisis discriminante en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 21 / 73
Anlisis discriminante en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 22 / 73
Anlisis discriminante en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 23 / 73
Anlisis discriminante en SPSS: Salida computacional
Correlacin
cannica % acumulado % de varianza Autovalor
1 ,753 100,0 100,0 1,309
a
Funcin Funcin
Autovalores
a. Se han empleado las 1 primeras funciones discriminantes
cannicas en el anlisis.
En estas tablas es posible comparar de manera global la capacidad
discriminativa de cada funcin. Esta tabla cobra mayor signicado en
el caso de ms de dos grupos.
El autovalor es el cociente entre la variacin debida a las diferencias
entre los grupos y la variacin que se da dentro de cada grupo
combinada en una nica cantidad. Esta nica funcin explica el 100%
de las diferencias existentes entre los sujetos de los grupos.
Una correlacin cannica alta indica que las variables discriminantes
permiten diferenciar entre los grupos. En nuestro caso la correlacin
cannica es alta (0,753 es cercano a 1), por lo que debemos suponer
que las variables discriminantes utilizadas (Puntaje y Ofertas)
permiten distinguir bien entre los dos grupos.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 24 / 73
Anlisis discriminante en SPSS: Salida computacional
Sig. gl Chi-cuadrado
Lambda de
Wilks
1 ,053 2 5,859 ,433
Contraste de las
funciones
Contraste de las
funciones
Lambda de Wilks
El estadstico lambda de Wilks expresa la proporcin de variabilidad
total no debida a las diferencias entre los grupos; permite contrastar la
hiptesis nula de que las medias multivariantes de los grupos (los
centroides) son iguales.
Valores de lambda prximos a 1 indicarn un gran parecido entre los
grupos, mientras que valores prximos a 0 indicarn una gran
diferencia entre ellos. En nuestro ejemplo, el valor de lambda es
moderadamente bajo (0,433), lo cual signica que NO existe bastante
solapamiento entre los grupos, por lo que podemos rechazar la
hiptesis nula de que los grupos comparados tienen promedios iguales
en las dos variables discriminantes (valorp = 0, 053).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 25 / 73
Anlisis discriminante en SPSS: Salida computacional
1
Funcin
Puntaje PSU
Nmero de ofertas
laborales
,149
,914
Coeficientes estandarizados de las
funciones discriminantes cannicas
Contiene una versin estandarizada de los coecientes de la funcin
cannica discriminante.
Estos coecientes estandarizados son independientes de la mtrica
original de las variables discriminantes y, por tanto, son preferibles a los
coecientes brutos cuando las variables poseen una mtrica distinta.
Podemos concluir que la variable Puntaje PSU tiene mayor
importancia que la variable Ofertas laborales a la hora de predecir el
Tipo de universidad de los individuos.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 26 / 73
Anlisis discriminante en SPSS: Salida computacional
1
Funcin
Puntaje PSU
Nmero de ofertas
laborales
(Constante) -6,177
,095
,010
Coeficientes de las funciones
cannicas discriminantes
Coeficientes no tipificados
Considere la funcin discriminante
y = 6, 177 + 0, 010 Puntaje + 0, 095 Ofertas.
El criterio de clasicacin sera: Considerando que conocemos el puntaje y
nmero de ofertas de un individuo, si y 0, entonces, clasique a ese
individuo como del consejo de Rectores (grupo 1), sino, clasifquelo como
que no pertenece al consejo de Rectores (grupo 2).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 27 / 73
Anlisis discriminante en SPSS: Salida computacional
Por ejemplo, el primer individuos, tiene
y = 6, 177 + 0, 010 650 + 0, 095 3 = 0, 82737.
Por lo tanto, debe ser clasicado como del Consejo de Rectores (con una
probabilidad de 0,84469 de pertenecer a este grupo y de 0,15531 de
pertenecer al otro grupo).
La salida computacional, entrega los resultados de las clasicaciones, para
cada uno de los individuos.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 28 / 73
Introduccin al Anlisis de Conglomerado
El anlisis de conglomerados (en ingls, cluster analisys) es una tcnica
multivariante que permite agrupar los casos o variables de un archivo
de datos en funcin del parecido o similaridad existente entre ellos.
El programa SPSS dispone de dos tipos de anlisis de conglomerados:
el anlisis de conglomerados jerrquico y el anlisis de conglomerados
de K medias.
El mtodo jerrquico es idneo para determinar el nmero ptimo de
conglomerados existente en los datos y el contenido de los mismos.
El mtodo de K medias permite procesar un nmero ilimitado de
casos, pero slo permite utilizar un mtodo de aglomeracin y requiere
que se proponga previamente el nmero de conglomerados que se
desea obtener.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 29 / 73
Ejemplo
Un centro de ubicacin laboral en Chile, desea determinar si los puntajes de
ingreso a la universidad, puede explicar el nmero de ofertas laborales que
ellos reciben despus de graduarse. Para tal motivo mide estas dos
variables y el tipo de Universidad (1=Consejo de Rectores y 2= No es del
consejo de Rectores). El investigador cree que se pueden formar grupos de
individuos con caractersticas en comn, si slo consideramos las variables
Puntaje en PSU y Nmero de ofertas. Los datos son:
Estudiante PSU Ofertas Tipo
1 650 3 1
2 470 3 1
3 450 1 2
4 500 0 2
5 738 5 1
6 530 4 2
7 430 2 2
8 500 2 2
9 776 6 1
10 674 2 1
Puntaje PSU
800 700 600 500 400
N

m
e
r
o

d
e

o
f
e
r
t
a
s

l
a
b
o
r
a
l
e
s
6
5
4
3
2
1
0
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 30 / 73
Anlisis de conglomerados de k medias
Es un mtodo de agrupacin de casos que se basa en las distancias
existentes entre ellos en un conjunto de variables (este mtodo de
aglomeracin no permite agrupar variables).
Se comienza seleccionado los k casos ms distantes entre s (el usuario
debe determinar inicialmente el nmero k de conglomerados que desea
obtener).
Y a continuacin se inicia la lectura secuencial del archivo de datos
asignando cada caso al centro ms prximo y actualizando el valor de
los centros a medida que se van incorporando nuevos casos.
Una vez que todos los casos han sido asignados a uno de los k
conglomerados, se inicia un proceso iterativo para calcular los
centroides nales de esos k conglomerados.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 31 / 73
Conglomerados de k medias en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 32 / 73
Conglomerados de k medias en SPSS
Segn informacin grca se denirn dos grupos (conglomerados).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 33 / 73
Conglomerados de k medias en SPSS
Slo considere las variables PSU y Ofertas (no considere el Tipo).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 34 / 73
Conglomerados de k medias en SPSS
Active esta opcin, para que en la BD identique el grupo de pertenencia.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 35 / 73
Conglomerados de k medias en SPSS
Por ejemplo, el modelo asigna al primer conglomerado a un individuo que
tenga un puntaje PSU cercano a 710 y halla tenido, aproximadamente, 4
ofertas laborales. En caso contrario lo asigna al segundo conglomerado.
Adems la tabla indica que de los 10 individuos, 4 fueron clasicados en el
grupo 1 y 6 en el grupo 2.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 36 / 73
Conglomerados de k medias en SPSS
En la BD Aparecer una nueva columna (QCL_1), la cual representa la
clasicacin de los individuos. Fjese que esta coincide con el tipo de
Universidad (slo en una ocasin no coincide, este es el alumnos 2, que
viene de una universidad del consejo de rectores, con puntaje de 470 y con
3 ofertas).
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 37 / 73
Conglomerados en forma grca en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 38 / 73
Conglomerados en forma grca en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 39 / 73
Conglomerados en forma grca en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 40 / 73
Conglomerados en forma grca en SPSS
Con este grco se identican claramente los grupos y lo bueno que es el
modelo para clasicar.
Puntaje PSU
800 700 600 500 400
N

m
e
r
o

d
e

o
f
e
r
t
a
s

l
a
b
o
r
a
l
e
s
6
5
4
3
2
1
0
2
1
Grupo
Esta clasicacin coincide al
90% con la categora, que
exista previamente del tipo de
universidad (no siempre se
tiene una variable para
comparar la clasicacin).
Podemos realizar el mismo
proceso y gracar segn el tipo
de universidad, para comparar
con el conglomerado.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 41 / 73
Conglomerados en forma grca en SPSS
El grco de la derecha representa, los datos reales considerando la
variable Tipo de universidad.
El grco de la derecha representa, la relacin entre la PSU y las
Ofertas, con el resultado de los grupos, del mtodo de Conglomerados.
Puntaje PSU
800 700 600 500 400
N

m
e
r
o

d
e

o
f
e
r
t
a
s

l
a
b
o
r
a
l
e
s
6
5
4
3
2
1
0
2
1
Grupo
Puntaje PSU
800 700 600 500 400
N

m
e
r
o

d
e

o
f
e
r
t
a
s

l
a
b
o
r
a
l
e
s
6
5
4
3
2
1
0
No es del
consejo de
Rectores
Consejo de
Rectores
Tipo de
Universidad
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 42 / 73
Introduccin a las Respuestas Mltiples
El procedimiento Denir conjuntos de respuestas mltiples agrupa
variables elementales en conjuntos de categoras mltiples y de
dicotomas mltiples, para los que se pueden obtener tablas de
frecuencias y tablas de contingencia.
Se pueden denir hasta 20 conjuntos de respuestas mltiples.
Cada conjunto debe tener un nombre exclusivo.
Procedimiento de Respuestas mltiples en SPSS:
Analizar -> Respuesta mltiple -> Denir conjuntos... Seleccione dos
o ms variables.
Si las variables estn codicadas como dicotomas, indique qu valor
desea contar. Si las variables estn codicadas como categoras, dena
el rango de las categoras.
Escriba un nombre distintivo para cada conjunto de respuestas
mltiples.
Pulse Aadir para aadir el conjunto de respuestas mltiples a la lista
de conjuntos denidos.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 43 / 73
Ejemplo
Considere un estudio que desea saber cual es la conducta de compra de
individuos sobre las multitiendas. Se he creado una encuesta con 35
preguntas y una de ellas es de respuesta mltiple (Pregunta 11). La base
de datos real consta de alrededor de 500 imdividuos, pero para ejemplicar
la tcnica utilizar 10 individuos. Cada uno de los 10 individuos debe
seleccionar, a lo ms tres opciones (puede seleccionar 0,1,2,3 opciones).
Puede descargar los datos desde http://bit.ly/ejepreg11
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 44 / 73
Ejemplo
Se ha creado una columna por cada respuesta, se asigna cdigo 1, cuando
el individuo selecciona esa respuesta, en caso contrario se asigna un 0 en la
base de datos.
Por ejemplo, el primer individuos seleccion: Computacin, Muebles y otra.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 45 / 73
Ejemplo
Aqu se denen los nombres de las categoras.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 46 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 47 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 48 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 49 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 50 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 51 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 52 / 73
Respuesta Mltiple en SPSS
Por ejemplo, 5 individuos marcaron la opcin de Computacin, esto
representa el 50% de total de individuos, adems tenemos en total 30
respuestas y estas 5 respuestas representan el 16,7% del total de respuestas.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 53 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 54 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 55 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 56 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 57 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 58 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 59 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 60 / 73
Respuesta Mltiple en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 61 / 73
Introduccin al Anlisis de Conabilidad
La conabilidad de un instrumento de medicin se reere al grado en
que su aplicacin repetida al mismo individuo u objeto, produce
resultados iguales. (Hernndez-Sampieri, 2010).
La conabilidad se reere a la consistencia de resultados. Este anlisis
busca que los resultados de un Instrumento concuerden con los
resultados del mismo Instrumento en otra ocasin, si esto ocurre se
puede decir que existe un alto grado de conabilidad.
La conabilidad es necesaria para determinar si un resultado es vlido,
ya que no es posible evaluar con un instrumento cuyos resultados son
distintos en el tiempo. Tambin se habla de conabilidad cuando dos
o ms evaluadores evalan al mismo estudiante sobre el mismo
material y se obtienen puntuaciones semejantes.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 62 / 73
Conabilidad interna: Alpha de Cronbach
Tcnica propuesta por Lee J. Cronbach, el ao 1951, en su artculo
COEFFICIENT ALPHA AND THE INTERNAL STRUCTURE OF
TESTS.
Es un coeciente para determinar la conabilidad interna del
instrumento. Consiste en determinar el grado de homogeneidad que
tienen los temes de una prueba o escala.
El mtodo consiste en considerar cada tem como un sub-instrumento
del instrumento total y los temes se consideran como instrumentos
paralelos.
Este coeciente permite cuanticar el nivel de conabilidad de una
escala de medida para la magnitud inobservable construida a partir de
las k variables observadas.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 63 / 73
Alpha de Cronbach
Este coeciente se debe utilizar cuando las variables sean cuantitativas o
cualitativas ordinales. Su formula de clculo est dada por:
=
k
k 1
_
_
_
_
_
_
_
1
k

i =1
S
2
i
S
2
t
_
_
_
_
_
_
_
donde:
k : Es el nmero de temes o preguntas del instrumento.
S
2
i
: Es la varianza del i -simo tem
S
2
t
: Es la varianza de la suma de todos los temes
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 64 / 73
Interpretacin del Alpha de Cronbach
En general, una posible escala de medicin es la siguiente:
Puntuacin xConabilidadx
0,81 1,00 Muy alta
0,61 0,80 Alta
0,41 0,60 Moderada
0,21 0,40 Baja
0,00 0,20 Muy baja
No existe un valorp asociado a rechazar alguna hiptesis de
conabilidad del instrumento.
No obstante, su valor entre ms cercano a 1 es, mayor es la
conabilidad de la escala.
Si el coeciente es negativo esto indica que las variables estn
relacionadas de manera inversa e indicara una inconsistencia del
instrumento.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 65 / 73
Ejemplo de clculo
ID Item 1 Item 2 Item 3 Suma
1 1 1 2 4
2 1 1 2 4
3 1 1 2 4
4 1 2 3 6

S
2
i
= 1,972
5 1 2 3 6 S
2
t
= 4,444
6 1 2 3 6 = 0,834
7 1 3 4 8
8 1 3 4 8
9 2 4 4 10
Varianza 0,111 1,111 0,750 4,444
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 66 / 73
Ejemplo de clculo
ID Item 1 Item 2 Item 3 Suma
1 1 1 3 5
2 1 1 3 5
3 1 1 3 5
4 2 2 2 6

S
2
i
= 1,750
5 2 2 2 6 S
2
t
= 1,750
6 2 2 2 6 = 0,000
7 3 3 2 8
8 3 3 2 8
9 3 3 2 8
Varianza 0,750 0,750 0,250 1,750
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 67 / 73
Ejemplo de clculo
ID Item 1 Item 2 Item 3 Suma
1 1 2 3 6
2 1 2 3 6
3 1 2 3 6
4 2 3 4 9

S
2
i
= 2,250
5 2 3 4 9 S
2
t
= 6,750
6 2 3 4 9 = 1,000
7 3 4 5 12
8 3 4 5 12
9 3 4 5 12
Varianza 0,750 0,750 0,750 6,750
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 68 / 73
Calculo de alpha de Cronbach en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 69 / 73
Calculo de alpha de Cronbach en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 70 / 73
Calculo de alpha de Cronbach en SPSS
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 71 / 73
Calculo de alpha de Cronbach en SPSS
Activando esta opcin calcular alpha de Cronbach si se elimina cada uno
de los items.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 72 / 73
Calculo de alpha de Cronbach en SPSS
El alpha de Cronbach, utilizando los tres items sera de 0,843 lo que
indicara que la conabilidad del instrumento es muy alta.
Si eliminamos el item 1, la conabilidad aumentara a 0,969.
Entonces, podramos eliminar este item.
Si eliminamos el item 2 o 3, la conabilidad disminuye a 0,450 y 0,557
respectivamente. Entonces, no deberamos eliminar estos items.
mrodriguez@ucm.cl (UCM) rea Comercial 23/07/2012 73 / 73

Potrebbero piacerti anche