Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
El objetivo de estas prcticas es familiarizar a los alumnos con las herramientas informticas que
harn posible la aplicacin de las tcnicas de anlisis de tipo descriptivo que han aprendido en la
asignatura Anlisis de datos en Psicologa I.
Como se ha podido comprobar en la resolucin de problemas en clase, los clculos a mano e
incluso con calculadora son muy costosos cuando se manejan amplias muestras de sujetos. De ah
la necesidad de utilizar computadoras que los agilicen y nos permitan la interpretacin de los
resultados, que es lo que ms nos interesa. Existen diversos programas informticos que pueden
emplearse para analizar datos. Por ejemplo, el SPSS, el SAS, el STATGRAPHICS, el SYSTAT o
incluso una hoja de clculo de EXCEL. Se ha seleccionado el programa SPSS porque es uno de
los ms conocidos y empleados en la prctica profesional y porque se encuentra disponible en las
aulas de informtica de la Facultad.
En un primer momento se pretende que el alumno se familiarice con la estructura y las
principales funciones que el SPSS ofrece. En el tema 1 trataremos de cubrir este objetivo. No
obstante, el verdadero propsito de estas prcticas es que el alumno aprenda a realizar los
principales anlisis estudiados en clase mediante el ordenador. En el tema 2 se resumen los
anlisis descriptivos con una variable (distribuciones de frecuencias, ndices de tendencia central,
de variabilidad, etc.) y en el tema 3 los de dos variables (ndices de asociacin lineal, combinacin
lineal de variables y anlisis de regresin lineal). Por ltimo, se pretende que el alumno sepa cmo
interpretar los resultados obtenidos a partir del SPSS. Para ello, no es suficiente conocer cmo
funciona el programa sino que se precisa una comprensin de los contenidos explicados en clase.
Las prcticas consisten en analizar los datos reales correspondientes a 200 candidatos a un puesto
de trabajo que respondieron un cuestionario (las 16 variables del cuestionario se describen en el
anexo II). A partir de estos datos, realizaremos diferentes anlisis descriptivos y extraeremos
conclusiones sobre la muestra. Los datos se incluyen en el anexo III y se proporcionarn en
soporte informtico (fichero practica.sav que el alumno habr de descargar de la pgina web de
la asignatura y grabarlo en un disquete 3 , que traer a cada clase). En las clases prcticas slo
realizaremos un tipo concreto de anlisis, a modo de ejemplo, pero el alumno debe acudir al aula
de informtica por su cuenta y experimentar nuevos anlisis con los datos. Con este fin se ha
incluido un ejercicio prctico integrado en el anexo IV, que se resuelve con otro fichero diferente
(ejercicios.sav que tambin se puede descargar de la pgina web de la asignatura).
Para realizar las prcticas es necesario un conocimiento elemental del manejo del ordenador:
copiar archivos, disquetes, entorno Windows, entrar y salir de los programas, etc. Debido al
amplio tamao de los grupos y las limitaciones de espacio en las aulas de informtica, para
impartir las clases prcticas cada grupo de alumnos se desdoblar en dos subgrupos (por ejemplo
el grupo 12 se desdoblar en el subgrupo 12A y el 12B). Es importante que cada alumno sepa a
qu subgrupo pertenece y dnde y cundo recibir cada clase prctica. En el tabln de anuncios
de cada clase se incluir dicha informacin. Asimismo, los alumnos pueden conectarse a la pgina
http://www.uam.es/personal_pdi/psicologia/carmenx/practicas.html donde encontrarn
dicho listado y toda la informacin relativa a las prcticas (ficheros de datos, ejercicios, etc.).
Las prcticas influirn sobre la calificacin final de la asignatura. El examen de Anlisis de datos en
Psicologa I de Junio (calificado sobre 9 puntos) se puntuar junto a una prctica que vale 1 punto.
En el examen de Septiembre, se incluir algn ejercicio basado en el contenido de las prcticas.
El aprendizaje del SPSS no termina en este curso sino que tendr continuidad en otras
asignaturas de segundo curso: Anlisis de datos en Psicologa II e Introduccin a la Psicometra.
Asimismo, muchas de las prcticas de otras asignaturas requieren el manejo de datos con el SPSS.
Por tanto, todo lo aprendido ser necesario para una comprensin adecuada de stas.
NDICE
Tema 1. Introduccin al SPSS
El editor de datos
La primera pantalla que aparece al entrar en el SPSS es la ventana del editor de datos, la cual ofrece
el siguiente aspecto:
Figura 1.1.
Esta ventana es donde deben encontrarse los datos empleados en el anlisis. Pueden darse varias
situaciones, aunque nosotros solo veamos dos:
1. Los datos fueron introducidos previamente; probablemente en una sesin anterior de
trabajo y slo es necesario recuperar el archivo. Para ello se selecciona el men Archivo o
se pulsa en el icono .
2. Los datos no fueron introducidos previamente y queramos hacerlo. La forma de
introducir los datos es muy similar a las tablas de datos que hemos empleado en clase.
Como se observa en la figura 1.1., la ventana editor de datos contiene una tabla donde las
filas se refieren a los n sujetos u observaciones de la muestra y las columnas a las J
variables X1, X2, ..., XJ. El resultado final es una matriz de n sujetos x J variables.
*
Si el icono no est disponible en el Escritorio, pulsar en Inicio -> Programas -> SPSS o buscar su ubicacin con el
Explorador de Windows.
El Visor de resultados
Una vez se solicite un anlisis con los datos que se encuentran en el editor de datos, los resultados
obtenidos se muestran en la ventana visor de resultados, cuyo aspecto es el siguiente:
Pulsar con el
botn izdo. del
ratn para volver
a la ventana
Editor de datos
Figura 1.2.
En la parte derecha se muestran los resultados obtenidos (tablas, grficos, etc.) y en la parte
izquierda (donde dice Resultados) aparece una lista con los ttulos de los contenidos mostrados en la
ventana Visor de resultados.* Si se desea pasar de la ventana de resultados a la de datos se
selecciona con el ratn la barra de botones de Windows que aparece sealada en la figura 1.2. en la
parte inferior de la pantalla.
1.2. Barra de mens y de herramientas
Como se observa en las figuras 1.1. y 1.2., en cada una de las ventanas descritas aparecen dos barras
en la parte superior. Por ejemplo, en la ventana Editor de datos su aspecto es el siguiente:**
Barra de mens
Barra de herramientas
La barra de la parte superior consta de una serie de mens (Archivo, Edicin, Ver, Datos, etc.). Si se
selecciona con el ratn cada una de ellas aparece un men desplegable donde se ofrecen otros submens, cada uno de los cuales tiene a su vez un cuadro de dilogo. Algunos de estos sub-mens
(los ms utilizados) pueden definirse en la barra inferior. En lugar de mens, sta consta de una serie
de botones cada uno de ellos con un icono dibujado (p.e. : abrir archivo; : guardar archivo;
etc.) y se denomina barra de herramientas.
Mens generales
Entre los mens de la barra de mens se encuentran los que son comunes a todos los programas de
tipo Windows: Archivar, Editar, Ver, Ventana, etc. En el SPSS, los que ofrecen mayores diferencias
son los mens Datos, Transformar y Analizar, los cuales permiten realizar operaciones con los
datos. Dichos mens sern revisados en detalle en los temas 2 y 3.
*
**
Men Analizar
Este es el men ms importante de todos. Si lo seleccionamos, aparece lo siguiente:
Figura 1.3.
Decimos que es el men ms importante porque desde aqu es donde indicaremos al SPSS el tipo de
anlisis que queremos realizar con los datos. Cada fila (terminada en una punta de flecha: ) ofrece a
su vez otros mens, cada uno con su correspondiente cuadro de dilogo que es el lugar donde se
especifica el nmero de variables que entran en el anlisis y otra serie de detalles que veremos ms
adelante.
En estas prcticas slo veremos los mens que se corresponden con las tcnicas estudiadas en la
asignatura Anlisis de datos en Psicologa I. En concreto, los mens Estadsticos descriptivos,
Correlaciones y Regresin. En las asignaturas troncales de segundo curso: Anlisis de datos en
Psicologa II e Introduccin a la Psicometra, se vern muchos otros de los restantes mens. Y en la
asignatura optativa Proceso de datos se profundiza mucho ms en el manejo del programa.
Men Ayuda
Por ltimo, el men que aparece con la expresin ? se refiere a la ayuda que ofrece el programa y
que ser muy til en todo momento para el usuario. Puede accederse a l desde la ventana Editor de
datos y Visor de resultados y en ambos casos ofrece el siguiente aspecto:
Figura 1.4.
Desde Temas puede escribirse un tipo de anlisis (por ejemplo Frecuencias) y el SPSS muestra
una descripcin de sus opciones. Tambin es posible obtener ayuda pulsando el botn derecho del
ratn. Por ejemplo, si nos encontramos en el cuadro de dilogo en el que se calculan los estadsticos
descriptivos y se quiere saber la definicin de curtosis, basta con seleccionarlo y pulsar el botn
derecho del ratn.
3
Sexo
0
1
1
0
0
Inteligencia
101
83
95
89
107
Nivel cultural
2
1
2
1
2
Estrs
4
5
6
4
7
Los datos corresponden a 5 sujetos medidos en cuatro variables: Sexo (0: mujer y 1: varn), nivel
cultural (1: bajo y 2: alto), inteligencia y estrs. Por tanto, tenemos que elaborar una matriz de 5 filas
por cuatro columnas. Los datos se introducen colocando un sujeto en cada fila y una variable en
cada columna. Para ello, simplemente se escriben las puntuaciones correspondientes a cada caso.
Para moverse de una celda a otra se pulsan las teclas marcadas con flechas. En nuestro ejemplo, los
datos de los 5 primeros sujetos se colocan del siguiente modo:
Aqu se muestra el contenido de la casilla donde est situado el
cursor. En este ejemplo en el primer caso para var00001
Una vez introducidos los datos es necesario dar nombre a las variables. Como se observa en la
figura superior, el SPSS ha dado por defecto los nombres var00001, var00002, var00003 y
var00004. Asimismo, ha escrito los valores numricos con dos decimales.
Si se desea cambiar el nombre de una variable y definir sus caractersticas (por ejemplo nivel de
medida, etiquetas de valores, formato de columna, definicin de valores perdidos, etc.) hay que
pulsar con el ratn en la solapa Vista de variables. A continuacin aparece una ventana que
contiene tantas filas como variables haya definidas en el editor de datos:
Figura 1.5.
En cada fila se da la posibilidad de: modificar el nombre de la variable (teniendo en cuenta que no
puede tener ms de 8 caracteres de largo) adems de otras propiedades como el tipo (numrico,
cadena, etc.), la anchura, el nmero de decimales, la etiqueta, el significado de los valores que
admite, los valores perdidos, la alineacin del texto, etc. Basta posicionar el ratn o el cursor en
cada casilla y escribir la informacin deseada. En nuestro ejemplo, llamemos a las variables: sexo,
intelig, nc, y estres. Algunas de las casillas de la ventana Vista de variables incorporan su propio
cuadro de dilogo que se activa al seleccionarlas. Por ejemplo, al pulsar en Valores aparece lo
siguiente:
Desde este cuadro de dilogo se puede dar etiqueta a
los valores de una variable. Por ejemplo en nc el valor
1 significa nivel cultural bajo y el valor 2, nivel
cultural alto. Cada vez que se introduzca la etiqueta de
un valor se pulsa la tecla Aadir. Para terminar se
pulsa en Aceptar.
Una vez definidas todas las caractersticas de las variables, para volver a visualizar los datos
numricos se pincha en la solapa Vista de datos. El resultado para nuestro ejemplo es el siguiente:
Figura 1.6.
Guardar
Para guardar la informacin introducida en el editor de datos se selecciona el men Archivo de la
barra de herramientas, se elige Guardar y aparece el correspondiente cuadro de dilogo:
Seleccionar unidad
A:/ en este men
Escribir el ttulo
del archivo aqu
Pulsar Guardar
para finalizar la
operacin
Figura 1.7.
El SPSS guarda los archivos de datos con la extensin "sav" por tanto basta con dar un nombre a los
datos (ejemplo) y por defecto se grabarn en un archivo con la extensin sav (aqu le hemos llamado:
a:\ejemplo.sav). Tambin es posible guardar archivos de resultados. Para ello nos situamos en la
ventana Visor de resultados seleccionamos el men 'Guardar' de la figura 1.2. y aparece un cuadro
de dilogo idntico al de la figura 1.7. El procedimiento a seguir es exacto al de archivar datos con la
nica diferencia de que la extensin de este tipo de archivos es "spo". Por tanto, los archivos SPSS
con la extensin sav contienen datos y los de la extensin spo resultados.
Veamos ahora cmo se procede en el caso de no tener introducidos los datos de las prcticas. Aqu
trabajaremos con un fichero que contiene las respuestas de 200 candidatos a un puesto de trabajo a
un cuestionario de 16 preguntas (ver anexo II para una descripcin de cada variable). Por tanto,
tenemos las respuestas de 200 sujetos en 16 variables. Para introducirlas en el SPSS hay que situarse
en la ventana Editor de datos y elaborar una matriz de 200 filas x 16 columnas. En este caso la
ventana Vista de variables tiene 16 filas, una para cada variable considerada.* En cada fila existe la
posibilidad de modificar sus caractersticas (nombre, etiqueta, decimales, valores, etc.). El resultado
obtenido es igual al de la tabla de datos que se incluye en el anexo III.
Abrir archivos de datos existentes
Cuando el archivo de datos se encuentra ya introducido en el ordenador o en un disquete, bastar
simplemente con abrirlo. Para ello, se selecciona el men Abrir de la figura 1.7. y la unidad donde
se encuentra el archivo. En la figura 1.8. aparece el cuadro de dilogo correspondiente a Abrir.
Nuestros datos se encuentran grabados en el archivo a:\practica.sav. Para acceder a ellos los
seleccionamos y pulsamos en el botn abrir.
*
En este caso las variables son: sexo, edad, peso, estatura, prov, idprov, rama, licen, inteli, compren, orient, extra,
respon, emocio, sincer y fumar.
6
Figura 1.8.
Una vez completada esta operacin aparecen los datos en el Editor de datos. A continuacin se
muestra un ejemplo para los 5 primeros sujetos en las siete primeras variables:*
Figura 1.9.
Siempre que se desee iniciar una sesin con el SPSS en la que se lleve a cabo uno o ms anlisis de
datos, es necesario que el archivo donde se encuentran los datos a analizar est abierto en el Editor
de datos del SPSS. Como veremos ms adelante, los mens donde se encuentran las diferentes
opciones de anlisis no estn activos a no ser que el editor de datos tenga algn tipo de contenido.
Para que el SPSS realice algn tipo de anlisis estadstico, no basta con que los datos
estn grabados en un archivo, es necesario que dicho archivo est abierto.
*
El SPSS es capaz de leer datos no slo de tipo *.sav (el formato de SPSS) sino tambin de otros formatos, por
ejemplo archivos de tipo EXCEL. Para abrir un archivo de tipo EXCEL (por ejemplo, el fichero practica.xls) se
selecciona la opcin Tipo de archivos de la figura 1.8 y Excel (*.xls). Sin embargo los ficheros de datos de tipo *.sav
slo pueden leerse con el programa SPSS.
Figura 2.1.
Para realizar anlisis descriptivos univariados basta con los tres primeros procedimientos
(Frecuencias, Descriptivos y Explorar). A continuacin se presenta una explicacin detallada
del cuadro de dilogo correspondiente a cada una de ellos. Para ello, seguiremos el mismo orden de
contenidos que el que aparece en el libro de la asignatura.
2.1. Distribuciones de frecuencias
Con el SPSS pueden confeccionarse distribuciones de frecuencias para organizar los datos
correspondientes a una variable. En este apartado veremos cmo se construyen las tablas de
frecuencias y cmo se realizan algunas de las representaciones grficas vistas en clase. Ambas
cuestiones se llevan a cabo desde el cuadro de dilogo correspondiente al procedimiento
Frecuencias de la figura 2.1.
Tablas de frecuencias
El cuadro de dilogo Frecuencias ofrece el siguiente aspecto:
Figura 2.2.
En el cuadro izquierdo aparece el listado de variables de que consta el archivo de datos que est
abierto. El cuadro derecho est vaco pues est esperando a que le indiquemos qu variables
queremos analizar. Dichas variables se trasladan de un cuadro a otro mediante el botn
. Por
defecto, la opcin mostrar tablas de frecuencias est activada pero si no queremos que aparezca
puede desactivarse. Veamos un ejemplo con la variable Edad. Para ello hay que trasladarla al
cuadro de la derecha de la figura 2.2. y pulsar en el botn Aceptar para que se ejecute la orden. Los
resultados obtenidos aparecen en el Visor de resultados:
Figura 2.3.
La tabla de frecuencias tiene el mismo aspecto que las que hemos empleado en clase. En la primera
columna aparecen los valores de la variable en sentido ascendente (de 22 a 46); en la segunda
('Frecuencia') sus frecuencias absolutas: ni; en la tercera ('Porcentaje') las frecuencias relativas en
porcentaje: Pi; y en la ltima ('Porcentaje acumulado') las relativas acumuladas en porcentaje: Pa.
Representaciones grficas
Desde el cuadro de dilogo de la figura 2.2. tambin es posible pedir al SPSS que realice tres tipos
de grficos para observar las frecuencias de los datos:
Figura 2.4.
Como se observa, se puede obtener un histograma (con el ajuste a la curva normal), un diagrama de
barras y un diagrama de sectores (o pictograma). Desde este cuadro de dilogo slo es posible
seleccionar uno de los grficos. Si se quisiera obtener los tres hay que repetir la operacin tres veces.
Seguimos con el ejemplo de la variable Edad. Vamos a pedir al SPSS que nos muestre los tres
tipos de grficos de la distribucin de frecuencias para la edad.* Si pulsamos en continuar
volvemos automticamente al men de la figura 2.2.
*
En realidad puesto que la Edad es una variable cuantitativa el grfico ms adecuado es el histograma pero aqu
veremos todos a modo de ejemplo.
Para ir de un resultado a otro puede utilizarse la parte izquierda de la pantalla, donde aparece el
listado de resultados obtenidos (en el ejemplo: EDAD e Histograma). Situndose con el ratn en
cada uno de ellos puede accederse automticamente al resultado correspondiente. En la figura 2.5. se
muestra el histograma para la variable edad.*
Para ir de un resultado a
otro (por ejemplo a la tabla
de frecuencias o al
histograma) nos situamos
con el ratn en el ttulo
correspondiente (en el
ejemplo, Histograma).
Figura 2.5.
37
36
35
Frecuencia
30
20
22
23
34
24
33
25
32
26
31
27
30
10
Edad
28
29
0
22 24 26 28 30 32 34 36 38 41 46
Figura 2.6.
Como se observa, no es posible elaborar el grfico de sectores, pues al ser una variable cuantitativa,
hay demasiadas categoras. En todas las grficas la mayor parte de los sujetos tienen entre 25 y 30
aos, estando el promedio en 29 aos y la moda en 28. Sin embargo, el 29% de los sujetos superan
los 30 aos (Ejercicio: realizar cada uno de los grficos que mejor describa a las variables: sexo,
estatura, licen e inteli).
Otra de las representaciones que hemos aprendido para reflejar distribuciones de frecuencias es el
diagrama de tallo y hojas. Para confeccionarlo se utiliza el men Analizar -> Estadsticos
descriptivos -> Explorar (ver figura 2.1.), cuyo cuadro de dilogo es el siguiente:
*
Si de desea cambiar alguna de las opciones puede hacerse pulsando dos veces con el botn izquierdo del ratn y se
entra en el editor de grficos desde el que puede cambiarse tanto el aspecto como la disposicin del grfico.
10
Figura 2.7a.
Este cuadro de dilogo ofrece diferentes posibilidades de anlisis de datos. Por el momento nos
centraremos tan slo en la que nos interesa, que es elaborar un diagrama de tallo y hojas. Para ello,
en primer lugar se seleccionan las variables para las que se desee elaborar este tipo de diagrama y se
trasladan al cuadro Dependientes mediante el botn
. A continuacin se selecciona el botn de
la opcin grficos y aparece el siguiente cuadro de dilogo:
Figura 2.7b.
Veamos un ejemplo con la variable peso. Los resultados obtenidos son los siguientes:
Peso Stem-and-Leaf Plot
Frequency
Stem
2.00
3
8.00
4
32.00
4
32.00
5
38.00
5
41.00
6
20.00
6
13.00
7
5.00
7
6.00
8
3.00 Extremes
Stem width:
Each leaf:
&
.
.
.
.
.
.
.
.
.
.
Leaf
99
00112223
55555555555666677777777778999999
00000011111112222222233333334444
55555555566666667777777778888888899999
00000000000000011111122223333333333444444
55556666666677888999
0011333333333
Valores extremos: 3 sujetos pesan
56688
ms de 84 Kg.
023333
(>=85)
10.00
1 case(s)
11
Desde aqu le hemos dicho al SPSS que slo queremos analizar a los
varones (sexo = 1). Los restantes casos, las mujeres (sexo = 0), han
quedado filtrados, aunque tambin podran haberse eliminado del fichero.
Figura 2.8.
Si activamos las opciones seleccionadas en la figura 2.8 (pulsando en Aceptar, como en cualquier
men), ntese que se crea automticamente la variable filter_$ (con etiqueta sexo = 1 (FILTER)).*
Mientras esta opcin est activada, todos los anlisis solicitados se referirn tan slo a los varones.
Por ejemplo, si se solicita la distribucin de frecuencias para edad, se obtiene lo siguiente:
Edad
Vlidos
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
40
41
42
46
Total
Frecuencia
5
8
15
8
22
14
11
8
7
6
2
2
1
3
2
1
1
2
1
119
Porcentaje
4.2
6.7
12.6
6.7
18.5
11.8
9.2
6.7
5.9
5.0
1.7
1.7
.8
2.5
1.7
.8
.8
1.7
.8
100.0
Porcentaje
vlido
4.2
6.7
12.6
6.7
18.5
11.8
9.2
6.7
5.9
5.0
1.7
1.7
.8
2.5
1.7
.8
.8
1.7
.8
100.0
Porcentaje
acumulado
4.2
10.9
23.5
30.3
48.7
60.5
69.7
76.5
82.4
87.4
89.1
90.8
91.6
94.1
95.8
96.6
97.5
99.2
100.0
Para quitar el filtro y volver a analizar todos los casos, se puede: 1) volver al men de la figura 2.8 y
activar la opcin Seleccionar todos los casos, 2) o bien entrar en la solapa Vista de variables y
borrar la nueva variable que se ha creado automticamente (denominada filter_$).
*
Para utilizar ms de un criterio de seleccin (por ejemplo, varones fumadores) se indica: (sexo = 1) & (fumar = 1).
12
Figura 2.9.
Desde aqu puede indicarse que se obtengan diferentes tipos de cuantiles: los cuartiles o los
percentiles. Se puede indicar el nmero exacto del centil que se desee obtener e irlo aadiendo a la
lista inferior. Continuemos con nuestro ejemplo de la variable edad. Si le pedimos que nos d los
cuartiles y los centiles 10, 30, 60 y 90 se obtiene lo siguiente:
Estadsticos
Edad
N
Vlidos
200
Perdidos
0
10
25.00
25
27.00
30
27.00
Percentiles
50
29.00
60
29.60
75
31.00
90
34.00
Como se observa, hay un 75% de sujetos que tienen 31 aos o menos y solo el 10% superan los 34
aos de edad.
Media, mediana y moda
Estos estadsticos pueden obtenerse prcticamente desde cualquier cuadro de dilogo del men
Analizar de la figura 2.1. Uno de los ms empleados es el del cuadro de dilogo Frecuencias ya
que cuando se elabora una tabla de frecuencias normalmente tambin se desea obtener las medidas
de posicin. Para ello se pulsa en el botn Estadsticos del cuadro de dilogo de la figura 2.2. y
aparece el cuadro de dilogo de la figura 2.9. Aqu puede seleccionarse las opciones media,
mediana y moda y el SPSS calcula estos tres estadsticos para el listado de variables
seleccionadas en el cuadro derecho de la figura 2.2. La media que se obtiene se corresponde con la
media aritmtica, la mediana con el valor central cuando los datos se ordenan en modo creciente y la
13
moda con el valor que obtiene la frecuencia absoluta mayor. Continuando con el ejemplo para la
variable edad los resultados obtenidos son los siguientes:
Estadsticos
Edad
N
Vlidos
200
Perdidos
0
Media
29.35
Mediana
29.00
Moda
28
Para conocer los estadsticos descriptivos de las variables tambin puede seleccionarse el
procedimiento Descriptivos de la figura 2.1. Este procedimiento presenta un cuadro de dilogo
muy parecido al del procedimiento Frecuencias -> Estadsticos. Ms especficamente:
Figura 2.10.
Para obtener los estadsticos descriptivos, primero se trasladan las variables correspondientes al
cuadro variables y ms tarde se pulsa en Opciones:
Figura 2.11.
En este caso, solamente est disponible el estadstico de tendencia central media que, como antes,
ofrece la media aritmtica para las variables seleccionadas. Veamos un ejemplo para algunas
variables del fichero:
Estadsticos descriptivos
N
Media
Edad
200
29.35
Peso
200
58.2950
Estatura
200
1.6756
14
S'
2
x
(X
=
X) 2
n1
S =
'
x
(X
X) 2
n 1
Otra forma de proceder para obtener medidas de variacin es desde el men Analizar -> Estadsticos
descriptivos -> Descriptivos (ver figura 2.10.) o desde el men Analizar -> Explorar (y el botn
Estadsticos) de la figura 2.7. Desde ambos procedimientos se ofrecen exactamente las mismas
opciones (desviacin tpica, varianza y amplitud total).
Veamos un ejemplo para algunas variables de las prcticas. Desde cualquiera de los cuadros de
dilogo sealados se obtienen los siguientes resultados:*
Estadsticos descriptivos
Edad
Peso
Estatura
N vlido (segn lista)
N
200
200
200
200
Rango
24
53.00
.41
Desv. tp.
3.88
10.3520
8.413E-02
Varianza
15.033
107.164
7.077E-03
Diagramas de cajas
El SPSS tambin ofrece la posibilidad de elaborar los grficos que expresan la dispersin de los
datos en una variable. En concreto, desde el men Analizar -> Explorar (y el botn Grficos) de la
figura 2.7b. puede definirse un diagrama de cajas para una variable. Este tipo de diagramas ofrecen
informacin sobre el rango de la variable y los cuartiles.
Veamos un ejemplo para la variable estatura:
Ver anexo I para la interpretacin de resultados en notacin cientfica (p.e. desviacin tpica para estatura = 8.413E-02
significa que la desviacin tpica de la variable estatura adopta el valor 0,0841)
15
2.0
1.9
147
148
194
169
Valor atpico
121
136
1.8
Q3: Centil 75
Q2: Mediana
Q1: Centil 25
1.7
1.6
Valor mnimo que toma la variable
1.5
1.4
N=
200
Estatura
Figura 2.12.
Como se observa en la figura 2.12., la estatura oscila entre 1,52 y 1,93 metros estando la mediana en
1,66 m. y el 75% de los sujetos por debajo de los 1,71 m. Los valores superiores indican valores
atpicos en los datos. En este caso hay ocho sujetos que miden ms de 1,85 m.
2.4. Puntuaciones tpicas y escalas derivadas
El SPSS ofrece la posibilidad de obtener las puntuaciones tpicas para cada uno de los sujetos en
cada una de las variables. Para solicitarlas se seala la opcin Guardar valores tipificados como
variables del cuadro de dilogo del procedimiento Descriptivos:
Obtener las
puntuaciones tpicas
Figura 2.13.
zi =
Xi X
S X'
Las escalas derivadas son aquellas construidas a partir de las puntuaciones tpicas. Se definen a
partir de la expresin: Ti = a zi + b; donde la media de T es b y la varianza a2. A partir del SPSS es
posible construir escalas derivadas. Para ello es imprescindible aprender a manejar el men
Transformar de la barra de mens del Editor de Datos de SPSS. Como se comprobar a medida
que el alumno se familiarice con el uso del SPSS este men es bastante til en la prctica.
Para definir la escala derivada hay que situarse en la ventana Editor de datos y seleccionar con el
ratn el men Transformar cuyo aspecto es el siguiente:
Figura 2.14.
Nombre de la
nueva variable T
Aqu se define la
expresin numrica.
Para escalas derivadas:
Ti = a zi + b
Listado de
variables
Figura 2.15.
En el recuadro variable de destino se indica el nombre de la nueva variable (por ejemplo Tedad) y
en el recuadro expresin numrica la operacin de la que resulta. Para ello, pueden seleccionarse
las variables del recuadro inferior de la izquierda y trasladarse a la expresin numrica con la tecla
. Los smbolos del centro indican la operacin que se desea realizar (p.e. +: sumar, -: restar, *:
multiplicar y /: dividir). Se recomienda poner parntesis cada vez que se incluya una operacin para
una variable. En nuestro ejemplo: Tedad = (10 * zedad) + 50. Es decir:
17
Ejecutar la
seleccin
Figura 2.16.
Una vez definida la nueva variable se ejecuta la orden en el botn Aceptar y el resultado aparece
como una nueva columna al final del editor de datos del SPSS. Con esta nueva variable pueden
calcularse los estadsticos descriptivos siguiendo las instrucciones dadas en los apartados anteriores
y comprobar que la media es 50 y la desviacin tpica 10. Asimismo, tambin se puede calcular la
puntuacin tpica correspondiente a T (ver figura 2.13.) y comprobar que su media es cero y su
desviacion tpica 1.
El procedimiento Recodificar
Otra opcin importante dentro del men Transformar (ver figura 2.14.) es la que permite
codificar los valores originales de una variable en otros diferentes. El resultado puede reemplazar al
de la variable original o puede grabarse en otra variable distinta. En caso de optar por la primera
opcin se perdern los valores originales; y en caso de optar por la segunda, la nueva variable
aparecer en el editor de datos con el nombre que le asignemos. El cuadro de dilogo
correspondiente a esta segunda opcin tiene el siguiente aspecto:
Escoger la variable
a la que se desee
recodificar sus
valores
Escribir aqu el
nombre de la nueva
variable
Figura 2.17.
En el recuadro Var. numrica -> Var. de resultado se indica cul es la variable original que se
quiere recodificar y cmo se llama la variable resultante. Supngase que queremos recodificar los
valores de la variable inteli para resumirlos. Los valores de esta variable oscilan entre 1 y 30. La
recodificacin consiste en llamar ahora 1 a los valores entre 1 y 10 (nivel bajo); 2 a los valores
entre 11 y 20 (nivel medio) y 3 a los valores entre 21 y 30 (nivel alto). Para ello trasladamos la
variable inteli al recuadro derecho. En el recuadro Nombre hay que etiquetar a la variable
resultado (llammosla por ejemplo nueva). Finalmente pulsamos en cambiar. En el recuadro
tiene que aparecer inteli -> nueva. Para indicar los nuevos valores seleccionamos la opcin
18
valores antiguos y nuevos y desde el cuadro de dilogo correspondiente indicamos cada uno de
ellos. Puesto que en nuestro ejemplo los valores antiguos sern agrupados en intervalos, hay que
utilizar la opcin Rango. Por ejemplo, en la primera recodificacin, el valor antiguo se define en
Rango desde 1 hasta 10; y el valor nuevo es 1. Una vez especificado el cambio, se pulsa en
Aadir. Hay que repetir la operacin para cada uno de los cambios. El cuadro final tiene que tener
el siguiente aspecto:
Indicar aqu el
nuevo valor (en el
ejemplo, 1, 2 y 3,
respectivamente)
Poner aqu el
valor menor
(en el ejemplo, 1)
y a la derecha (en
hasta) el mayor
(en el ejemplo, 10)
Figura 2.18.
As =
n
z i3
(n 1)(n 2)
Veamos un ejemplo para algunas variables de las prcticas. Desde cualquiera de los cuadros de
dilogo sealados se obtienen los siguientes resultados:
Estadsticos descriptivos
Edad
Peso
Estatura
N vlido (segn lista)
N
Estadstico
200
200
200
200
Asimetra
Estadstico Error tpico
1.205
.172
.584
.172
.775
.172
Curtosis
Estadstico Error tpico
2.270
.342
.245
.342
.659
.342
Los resultados tambin muestran una columna que no hemos visto en clase (el error tpico asociado
a cada estadstico). Los estadsticos encontrados en el ejemplo indican que casi todas las variables
presentan asimetra positiva y distribuciones leptocrticas.
*
No se incluye la frmula de la estimacin insesgada de la curtosis porque es poco til para la estadstica descriptiva y
es compleja de calcular.
19
EJERCICIOS:
Para afianzar lo aprendido en este tema en cuanto al manejo del SPSS para anlisis descriptivos con una variable,
es bueno acudir al aula de informtica (por cuenta propia) y comprobar si se es capaz de responder a las
siguientes preguntas, todas ellas referidas a los datos del fichero practica.sav:
20
Para obtener los ndices de asociacin lineal con variables cuantitativas que hemos estudiado en la
asignatura Anlisis de Datos en Psicologa I (la covarianza, Sxy y el coeficiente de correlacin de
Pearson, rxy) se selecciona el men Analizar -> Correlaciones -> Bivariadas:
Figura 3.1.
Figura 3.2.
La matriz de varianzas-covarianzas
La matriz de varianzas-covarianzas no aparece por defecto en el men general de la figura 3.2. sino
que hay que definirla desde el botn Opciones. Si se pulsa este botn, aparece el cuadro de
dilogo de la figura 3.3. Desde aqu puede indicarse que se muestren los estadsticos descriptivos
(media y desviacin tpica) para cada una de las variables seleccionadas y tambin la matriz de
varianzas-covarianzas (seleccionar la opcin Productos cruzados y covarianzas).
21
Seleccionar si se desea
obtener la matriz de
varianzas-covarianzas
Figura 3.3.
'
xy
x y
i =1
n 1
La matriz de correlaciones
Desde el cuadro de dilogo de la figura 3.2., una vez se asignan las variables seleccionadas al
cuadro Variables, si se pulsa en Aceptar aparece la matriz de correlaciones de Pearson entre todas
las posibles variables seleccionadas en el visor de resultados.
Veamos cmo se resuelve en el SPSS alguno de los ejemplos que hemos calculado manualmente
en clase. Por ejemplo, tomemos el ejemplo que aparece en la tabla de la pgina 145 del libro. En
este ejemplo aparecen los datos de 15 sujetos para dos variables; X: inteligencia e Y: rendimiento.
Como siempre, lo primero de todo es introducir los datos en el SPSS. En este caso tenemos una
matriz de 15 sujetos x 2 variables. Una vez introducidos los datos y grabados en un archivo (en
a:\correlacion.sav), se selecciona el men Analizar -> Correlaciones y se siguen los pasos
indicados en las figuras 3.4. y 3.5. Finalmente se pulsa en el botn Aceptar de la figura 3.4. Los
resultados obtenidos son los siguientes:
Correlaciones
X
Sig. (bilateral) se ver en
la asignatura Anlisis de
Datos II
Estadsticos descriptivos
X
Y
Media
8.00
3.00
Desviacin
tpica
2.90
1.56
N
15
15
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
X
1.000
.
118.000
8.429
15
.868**
.000
Y
.868**
.000
55.000
3.929
15
1.000
.
55.000
34.000
3.929
15
2.429
15
Se ha sealado el coeficiente de Pearson con un crculo. Como se observa, se obtienen los mismos
resultados que en el libro: X = 8 e Y = 3; rxy = 0,868* y Sxy = 3,929* (ver pg. 154).
*
En este cuadro tambin aparece la prueba de significacin estadstica para cada una de las correlaciones de Pearson.
Sus resultados se expresan mediante asteriscos (* **) y el SPSS marca en amarillo las correlaciones significativas. En
este curso no hemos aprendido a interpetar este dato pero se ver el prximo ao en Anlisis de datos II.
22
Veamos un ejemplo a partir de los datos de las prcticas. Obtengamos el coeficiente de correlacin
y la covarianza de las variables estatura y peso. Los resultados obtenidos son los siguientes:
Correlaciones
Peso
Estatura
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Peso
1.000
.
Estatura
.857**
.000
21325.595
148.490
107.164
200
.857**
.000
.746
200
1.000
.
148.490
1.408
.746
200
7.077E-03
200
Como se observa, el SPSS ofrece una salida que organiza los resultados en una tabla J x J (en este
caso 2 x 2 pues hay dos variables). La salida incluye la correlacin y la covarianza entre estatura y
peso, peso y estatura, peso y peso y estatura y estatura. Su valor no cambia con el orden de las
variables (es decir Sxy = Syx; rxy = ryx). En este caso existe una relacin lineal alta positiva entre
estatura y peso (r = 0,86). Cuando se trata de las mismas variables la correlacin es siempre 1 y la
covarianza es la varianza (es decir Sxx = S2x; rxx = 1). Por tanto, esta salida de SPSS incluye tanto la
matriz de correlaciones como la matriz de covarianzas pues adems de ofrecer la correlacin y la
covarianza entre la variables ofrece sus varianzas. Por ejemplo, la varianza de peso es 107,64.
3.2. Combinacin lineal de variables
En este apartado veremos cmo se realizan transformaciones lineales con los datos de dos o ms
variables para obtener nuevas puntuaciones (p.e. Ti = Xi + Yi; Ti = AXi + BYi; etc) y cmo se
cumplen las propiedades sobre la media y la varianza de estas nuevas variables.
Lo primero es definir la nueva variable: Ti. Para ello se utiliza el men Transformar -> Calcular,
que vimos en el apartado 2.4. Con los datos de las prcticas, crearemos una combinacin lineal de
las cuatro facetas de personalidad (extra, respon, emocio y sincer). A la variable resultante la
llamaremos PERSONA. El cuadro de dilogo de la figura 2.15. ha de quedar del siguiente modo:
Figura 3.4.
23
La nueva variable es del tipo Ti = Xi + Yi + Vi + Wi. Obtengamos ahora sus estadsticos descriptivos
univariados desde el men Analizar -> Estadsticos descriptivos -> Descriptivos y las covarianzas
desde Analizar -> Correlaciones -> Bivariadas (Opciones). El resultado es el siguiente:
Estadsticos descriptivos
N
Media
Varianza
Extraversin
200
41.3600
18.483
Responsabilidad
200
46.1250
21.979
Estabilidad emocional
200
48.6250
24.748
Sinceridad
200
23.1900
23.682
PERSONA
200
159.3000
164.693
Correlaciones
EXTRA
RESPON
EMOCIO
SINCER
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
Correlacin de Pearson
Sig. (bilateral)
Suma de cuadrados y
productos cruzados
Covarianza
N
EXTRA
1.000
.
RESPON
.467**
.000
EMOCIO
.396**
.000
SINCER
.177*
.012
3678.080
1875.000
1685.000
735.320
18.483
200
.467**
.000
9.422
200
1.000
.
8.467
200
.422**
.000
3.695
200
.186**
.008
1875.000
4373.875
1956.375
845.250
9.422
200
.396**
.000
21.979
200
.422**
.000
9.831
200
1.000
.
4.247
200
.092
.193
1685.000
1956.375
4924.875
445.250
8.467
200
.177*
.012
9.831
200
.186**
.008
24.748
200
.092
.193
2.237
200
1.000
.
735.320
845.250
445.250
4712.780
3.695
200
4.247
200
2.237
200
23.682
200
Como se observa la media en la nueva variable es 159,30; valor que se corresponde exactamente
con el resultado de la suma de las medias en las cuatro variables originales ( T = X + Y + V + W ).
En cuanto a la varianza, el resultado es 164,69. Puede comprobarse que se llega al mismo resultado
mediante: ST2 = S 2X + SY2 + SV2 + SW2 + 2 ( S XY + S XV + S XW + SYV + SYW + SVW ) ; o lo que es lo mismo,
la suma del total de los elementos de la matriz de varianzas-covarianzas (aqu las correlaciones se
han rodeado con crculos, las covarianzas con cuadrados y las varianzas con cuadrados en lnea
discontinua).
Veamos otro ejemplo. Supngase que queremos crear una nueva variable con los datos de las
prcticas que se define como el cociente entre el peso (en kilogramos) y la estatura al cuadrado (en
metros). A este cociente se le denomina ndice de masa corporal. Si el valor resultante se
encuentra entre 20 y 25 quiere decir que la persona est en su peso normal. Si est entre 25 y 28
30 indica que tiene sobrepeso. Si est por encima de 28 30 indica que existe un problema de
24
obesidad y si est por debajo de 20, de excesiva delgadez. Nuestra nueva variable se definira como
Ti = Xi / Yi2. Para indicar al SPSS la definicin de esta nueva variable se utiliza el procedimiento
Calcular variable. Llamemos a la variable resultante IMC:
Figura 3.5.
Una forma rpida de interpretar los resultados en la nueva variable (IMC) es representando
grficamente el histograma. Para ello basta ir al men Analizar -> Frecuencias y pulsar el botn
Grficos (ver figura 2.2.). El resultado obtenido con nuestra muestra es el siguiente:
Frecuencia
20
10
25
24
23
22
21
20
19
18
17
16
IMC
Como se observa, la mayor parte de los sujetos tienen un peso normal (IMC entre 20 y 25),
ninguno tiene tendencia a la obesidad, aunque hay un sector de sujetos considerable que punta por
debajo de 20, por lo que est por debajo del peso normal.
3.3. Anlisis de regresin lineal simple
El anlisis de regresin lineal es una tcnica estadstica que se utiliza para estudiar la relacin entre
variables. En la investigacin psicolgica suele emplearse para pronosticar valores en una variable
criterio (Y) desde las puntuaciones en una variable predictora (X). En esta asignatura solamente
hemos estudiado la regresin lineal con una sola variable predictora (regresin simple) sin
embargo, la regresin tambin puede efectuarse a partir de 2 o ms variables predictoras (X1, X2,
etc.). A medida que vayamos entrando en las opciones del SPSS para regresin simple, veremos de
forma intuitiva cmo se procede para la regresin con ms de un predictor (regresin mltiple).
Diagrama de dispersin
195). Como en otros ejemplos previos, tendremos que introducir los datos correspondientes a los 4
sujetos en las dos variables en un archivo nuevo del editor de datos. Una vez introducidos los datos
(en el fichero a:regresion.sav) para realizar el diagrama de dispersin se selecciona el men
Grficos y se elige el procedimiento Dispersin. El cuadro de dilogo correspondiente es el
siguiente:
Variable Criterio: eje de ordenadas
Variable Predictora: eje de abcisas
Figura 3.6.
Con esta definicin se obtiene el siguiente diagrama de dispersin simple en el visor de resultados:
6
5
4
3
2
1
0
0
10
12
Como se observa, este diagrama es idntico al de la figura 10.4.a) de la pgina 196 del libro. Su
forma indica que los puntos en el diagrama no estn perfectamente alineados pero se acercan a una
hipottica lnea recta.
Ecuacin de regresin
Podran trazarse diferentes rectas para realizar pronsticos de una variable a partir de la otra (por
ejemplo de Y a partir de X en una regresin de Y sobre X). Las rectas de regresin tienen una
frmula muy simple:
Yi ' = AYX + BYX X i
El objetivo es encontrar aquella recta que minimice la distancia entre lo encontrado (Y) y lo
pronosticado (Y). Es decir, que minimice la expresin:
(Yi Yi ' ) 2
n
26
Para ello calculamos los coeficientes del modelo mediante las frmulas:
BYX =
n X i Yi
nX
X Y
-( X )
2
i
i
2
A YX = Y - B YX X
Veamos cmo se procede en el SPSS para calcular dichos coeficientes, obtener la recta de
regresin y valorar la bondad del modelo. Se selecciona el men Analizar -> Regresin -> Lineal:
Figura 3.7.
Figura 3.8.
Dentro de este men hay otras opciones. Por el momento, la que nos interesa es la que se encuentra
en el botn Estadsticos, cuyo cuadro de dilogo aparece en la figura 3.9. Desde aqu podemos
solicitar que se ofrezcan las estimaciones de la pendiente y el origen de la recta de regresin (segn
27
el mtodo de mnimos cuadrados), la matriz de covarianzas para las variables, el ajuste del modelo
(coeficiente de Pearson al cuadrado o coeficiente de determinacin) y los estadsticos descriptivos
(media y varianza):
Figura 3.9.
Otra opcin relevante del men regresin lineal es la de Guardar (ver figura 3.10.).* Desde su
correspondiente cuadro de dilogo es posible indicar que se guarden los valores pronosticados por
el modelo (las Y i) y los residuos (las Yi - Y i) en el editor de datos:
Seleccionar si se
desea guardar los
valores pronosticados
por el modelo (las Yi)
para cada uno de los
sujetos.
Seleccionar si se desea
guardar lo no explicado por
el modelo (las Yi -Yi): los
residuos para cada uno de
los sujetos.
Figura 3.10.
Veamos cul es el resultado para el ejemplo del cuadro 10.2.a) del libro. Si indicamos todas estas
instrucciones, el resultado que ofrece el SPSS es el siguiente (ntese que se ofrecen muchas tablas
de resultados. Aqu explicaremos slo las ms importantes y aquellas que el alumno de psicologa
de primero puede manejar con soltura):
*
No vamos a entrar en las restantes opciones del men Regresin lineal porque la mayora requieren conocimientos
de estadstica inferencial, que el alumno an no posee. Dichas opciones se vern en detalle en las prcticas de la
asignatura de segundo Anlisis de Datos en Psicologa II.
28
Regresin
Estadsticos descriptivos
Y
X
Media
2.75
6.00
Desviacin tp.
1.71
3.65
N
4
4
Correlaciones
Correlacin
de Pearson
Sig.
(unilateral)
N
Y
X
Y
X
Y
X
Y
1.000
.535
.
.233
4
4
X
.535
1.000
.233
.
4
4
Variables introducidas/eliminadasb
Modelo
1
Variables
introducidas
Xa
Variables
eliminadas
.
Mtodo
Introducir
Esto es el coeficiente de
determinacin, r2XY o la
proporcin de varianza en
comn entre X e Y.
Modelo
1
R
.535a
R
cuadrado
.286
R
cuadrado
corregida
-.071
Error tp.
de la
estimacin
1.77
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
2.500
6.250
8.750
gl
1
2
3
Media
cuadrtica
2.500
3.125
F
.800
Sig.
.465a
Coeficientesa
Modelo
1
(Constante)
X
Coeficientes no
estandarizados
Error
tp.
B
1.250
1.896
.250
.280
a. Variable dependiente: Y
Coeficientes
estandarizados
Beta
.535
t
.659
.894
Sig.
.577
.465
29
Como se observa, el SPSS ofrece muchas tablas de datos como resultado de la regresin. Por el
momento solamente nos fijaremos en dos: La primera se refiere a los coeficientes del modelo y la
segunda a su bondad. En cuanto a la primera, se toman los coeficientes no estandarizados. En este
caso el mejor modelo para pronosticar Yi a partir de Xi es Yi = 1,25 + 0,25 Xi
Bondad de ajuste del modelo
Figura 3.11.
1y = 1.25 + 0.25 * x
R-cuadrado = 0.29
4
3
10
Como se observa, los puntos se alejan bastante de la recta, luego no hay un buen ajuste.
30
Adems de la interpretacin grfica del problema, la forma de cuantificar la bondad del modelo es
mediante el coeficiente de determinacin, r2xy. Se trata de una medida estandarizada que toma
valores entre 0 y 1 y cuya interpretacin es muy sencilla: representa la proporcin de varianza
explicada de la variable del criterio a partir de la predictora. En nuestro ejemplo, r2xy = 0,286 por lo
que el modelo no es adecuado para hacer pronsticos de Y a partir de X.
La bondad del modelo tambin puede valorarse a partir del anlisis de los errores en los
pronsticos, frecuentemente llamados residuos (Yi - Yi). Ntese que ejecutando las rdenes
indicadas en el anterior apartado han resultado dos nuevas variables en el editor de datos (la
variable pre_1 que se corresponde con las Yi y lleva la etiqueta Unstandardized predicted
value y la variable res_1 que se refiere a las Yi - Yi y lleva la etiqueta Unstandardized
residual).
Teniendo los datos para Yi, Yi e (Yi - Yi) podemos evaluar la bondad del modelo a partir de la
descomposicin de la varianza del criterio (S2Y = S2Y + S2Y-Y). Para ello entramos en el men
Analizar -> Estadsticos descriptivos -> Descriptivos: Opciones (ver figuras 2.11 y 2.12) e
indicamos en el cuadro de dilogo que se calcule la varianza para estas tres variables (Y, pre_1 y
res_1). Los resultados obtenidos en el visor son los siguientes:
Estadsticos descriptivos
Y
Unstandardized Predicted Value
Unstandardized Residual
N vlido (segn lista)
N
4
4
4
4
Varianza
2.917
.833
2.083
Como se comprueba, la varianza del criterio (S2Y = 2,917) se descompone en la varianza de los
pronsticos (S2Y = 0,833) y la de los errores (S2Y-Y = 2,083).
Veamos ahora un ejemplo a partir de los datos de las prcticas. Supngase que queremos predecir
la variable peso a partir de la variable estatura. Para ello construimos la recta de regresin
pesoi = A + B estaturai. La definicin del modelo en el SPSS es la siguiente:
Figura 3.12.
31
Los resultados obtenidos para el modelo planteado son los siguientes (slo se muestran las tablas
necesarias para la interpretacin):
Variables introducidas/eliminadas
Modelo
1
Variables
introducidas
Estatura a
Variables
eliminadas
Mtodo
Introducir
R
R cuadrado
.857a
.734
R cuadrado
corregida
.733
Error tp. de la
estimacin
5.3510
Coeficientesa
Modelo
1
(Constante)
Estatura
Coeficientes no
estandarizados
B
Error tp.
-118.375
7.565
105.437
4.509
Coeficientes
estandarizados
Beta
t
-15.648
23.384
.857
Sig.
.000
.000
El modelo resultante es: pesoi = -118,375 + 105,437 estaturai. Como se observa, el coeficiente de
determinacin (R al cuadrado) es 0,734 por lo que el modelo es adecuado para explicar la relacin
entre la variable estatura y la variable peso. Es decir, la variable estatura tiene una alta
capacidad predictiva para explicar la variable del criterio, el peso.
El grfico obtenido definiendo las opciones del diagrama de dispersin interactivo de la figura
3.11. es el siguiente:
90
Peso
80
70
60
50
40
W
W
W
WWW
W W
W
W W
WW W
W
W
W W WW WWW W
W
W
W
WW W
W
W
W
W WWW
W
WW
W
WWWW
W
W
W W W WW W W WW
W
W
W W
WWW WW
W W
W
WW
W W W W
W
W W WWWW
WW W
W W W
W
W
W
W
W WW
W W
W
W
W
W
WWW W
W W W WW
W W
W
W
W W W W
WW
W
WW WW W WWW
W
W
WW
WW
WW
W
W
1.60
1.70
1.80
W
W
W
W
W
W
W
1.90
Estatura
El grfico muestra que existe un buen ajuste. No obstante, encontrar un resultado similar a ste con
variables psicolgicas no es frecuente. Para comprobarlo a continuacin haremos una regresin de
32
la variable Responsabilidad sobre la variable Estabilidad emocional, que son dos variables
psicolgicas del fichero practica.sav. Los resultados que ofrece el SPSS son los siguientes:
Variables introducidas/eliminadasb
Modelo
1
Variables
eliminadas
Variables introducidas
Estabilidad emocional a
Mtodo
Introducir
R cuadrado
corregida
.174
R
R cuadrado
.422a
.178
Error tp. de la
estimacin
4.2621
Modelo
1
Coeficientes no
estandarizados
B
Error tp.
26.809
2.968
.397
.061
(Constante)
Estabilidad emocional
Coeficientes
estandarizados
Beta
.422
t
9.031
6.541
Sig.
.000
.000
Como puede observarse, en este caso la correlacin de Pearson entre las variables es 0,42 y la
bondad del modelo tan slo alcanza el valor 0,18. Sin embargo, los psiclogos del equipo podran
concluir que existe un buen ajuste para el modelo que predice la responsabilidad a partir de la
estabilidad emocional, pues as lo indican las pruebas inferenciales (que no se han estudiado en esta
asignatura pero se vern en la asignatura Anlisis de Datos en Psicologa II).
El grfico inferior muestra el ajuste para el modelo estimado. La comparacin con el grfico de la
pgina anterior pone de manifiesto que las correlaciones entre variables psicolgicas adoptan un
rango muy inferior al de otras variables observadas, como son el peso y la estatura.
60
Responsabilidad
W
W
W
W
50
W
W
40
W
W
WW
WWW
WWWW
W
WW
W
W
WWW
WWWW
W
W
40
W
W W
WWW
W
W
W
W W
W WW
W
W
WWW
W
W
WW
W
WW
W
W
WWWW
WWW
WW
WWW
WW
WWWW
W
WW
WWWW W
W
W
WW
W
W
W
WW
W
W
W
W
W
W
W W
W
W
W
WW
W
W
W
W
WW
WWW
W
W
W
W
45
50
55
60
Estabilidad emocional
33
Una alternativa a la situacin de poco ajuste es incluir una variable predictora adicional (o ms de
una) y observar si su inclusin produce algn cambio en R cuadrado. Si consideramos dos
variables predictoras estamos planteando el siguiente modelo: Yi = A + B1Xi1 + B2Xi2.
Veamos si el ajuste al modelo de regresin de responsabilidad sobre estabilidad emocional
mejora al aadir la variable extraversin como segunda variable predictora. El modelo planteado
es: responi = A + B1 emocioi + B2 extravi. La primera aproximacin al problema puede hacerse a
partir del grfico de dispersin (ver figura 3.8.). En este caso puede elaborarse un grfico 3-D para
observar la relacin entre las dos predictoras y el criterio y tambin el grfico simple para observar
la relacin entre respon y extra:
60
Responsabilidad
70
R
e 60
s
p 50
o
n
40
70
60
50
Emocio
40
30
40
50
60
50
40
30
20
Extrav
30
40
50
60
Extraversin
En el grfico tridimensional puede verse que en el plano respon-emocio se observa como los
puntos indican una relacin con tendencia lineal positiva. La grfica de la derecha muestra el plano
respon-extra. Los puntos indican que la variable extraversin tiene una tendencia a la relacin
lineal positiva con la variable responsabilidad. Comparndola con la grfica en la que veamos el
diagrama de dispersin entre respon y emocio, en sta los puntos estn algo ms alineados, por lo
que cabe esperar que la inclusin de la variable extra en el modelo mejore la bondad de ajuste.
Para obtener los coeficientes del modelo y valorar su ajuste se selecciona el men Analizar ->
Regresin -> Lineal. De forma similar a la regresin simple, primero se traslada la variable respon a
la casilla Dependiente y a continuacin las variables emocio y extra a la casilla Independientes.
Al ejecutar el anlisis, en primer lugar aparece la tabla que informa sobre la especificacin de las
variables en el modelo:
Variables introducidas/eliminadasb
Modelo
1
Variables introducidas
Extraversin,
a
Estabilidad emocional
Variables eliminadas
Mtodo
.
Introducir
R
.534a
R cuadrado
.285
R cuadrado
corregida
.278
Error tp. de la
estimacin
3.9848
Modelo
1
(Constante)
Estabilidad emocional
Extraversin
Coeficientes no
estandarizados
B
Error tp.
17.199
3.291
.264
.062
.389
.072
Coeficientes
estandarizados
Beta
.280
.356
t
5.226
4.273
5.433
Sig.
.000
.000
.000
Se deja como ejercicio comprobar que al aadir la variable edad al modelo de regresin de peso
sobre estatura, el ajuste mejora un 0,10%.
35
Para describirlas hay que elaborar una Tabla de contingencia. La forma de proceder en el SPSS es
desde el men Analizar -> Estadsticos descriptivos -> Tablas de contingencia:
Figura 3.13.
Seleccionar si se
desea obtener un
diagrama de barras
para las variables
Figura 3.14
Recuento
Sexo
Total
Mujer
Varn
Tabaquismo
No fumador
Fumador
38
43
100
19
138
62
Total
81
119
200
60
40
Tabaquismo
20
No fumador
Fumador
Mujer
Varn
Sexo
En la tabla de resultados aparecen las distribuciones conjuntas (nij) y marginales (ni y nj) de las
variables y la representacin grfica del diagrama de barras conjunto. Como se observa, de los 200
sujetos de la muestra 62 fuman y 138 no fuman. De los fumadores, la mayora son mujeres y de los
no fumadores, varones. Hay 100 no fumadores que son varones y 19 varones que son fumadores.
Las distribuciones conjuntas tambin pueden obtenerse en frecuencias relativas o porcentajes para
ambas variables (filas y columnas). Para ello se selecciona el botn Casillas del cuadro de dilogo
de la figura 3.14). cuyo aspecto es el siguiente:
Sealar si se desea
obtener las frecuencias
conjuntas relativas para
las filas, las columnas y
para el total
Figura 3.15
Seleccionando las opciones sealadas se obtienen los mismos resultados que antes pero expresados
en porcentajes respecto a distintos totales:
Tabla de contingencia Sexo * Tabaquismo
Sexo
Mujer
Varn
Total
Recuento
% de Sexo
% de Tabaquismo
% del total
Recuento
% de Sexo
% de Tabaquismo
% del total
Recuento
% de Sexo
% de Tabaquismo
% del total
Tabaquismo
No fumador
Fumador
38
43
46.9%
53.1%
27.5%
69.4%
19.0%
21.5%
100
19
84.0%
16.0%
72.5%
30.6%
50.0%
9.5%
138
62
69.0%
31.0%
100.0%
100.0%
69.0%
31.0%
Total
81
100.0%
40.5%
40.5%
119
100.0%
59.5%
59.5%
200
100.0%
100.0%
100.0%
Globalmente, los resultados indican que la mayor parte de los sujetos son varones y no fuman (el
50%). Veamos ahora ejemplos de interpretacin de distribuciones condicionales. Como se observa,
hay un 27,5% de los no fumadores que son mujeres (frente al 53,1% de las fumadoras); y de los
37
varones el 84% son no fumadores. En cuanto a las mujeres, el 46,9% son no fumadoras y dentro de
los fumadores el 69,4% son mujeres.
Las tablas de contingencia slo tienen sentido para variables de tipo cualitativo (o categricas). Si
se desea representar la distribucin conjunta de dos variables cuantitativas es necesario agrupar los
valores de cada una de dichas variables en intervalos de la misma amplitud (para ello puede
utilizarse el men Transformar -> Recodificar). Una vez obtenidos los intervalos para X e Y puede
elaborarse la tabla de contingencia siguiendo el mismo procedimiento que si las variables fueran
cualitativas. El grfico ms adecuado para dos variables cuantitativas es el diagrama de dispersin,
como vimos en el apartado de anlisis de regresin lineal (ver figura 3.8. en pgina 26).
Una variable cualitativa y otra cuantitativa
Si queremos cruzar una variable cualitativa con una cuantitativa, se procede igual excepto que para
resumir los datos de la cuantitativa hay que emplear estadsticos (p.e. sumas, medias, etc.). Veamos
un ejemplo. Tomemos la variable Fumar (cualitativa con 2 categoras) y la variable peso que por
ser cuantitativa la resumimos mediante su MEDIA. Para describir conjuntamente estas variables
podemos elaborar un grfico desde el men Grficos -> Lneas -> Simple (Resmenes para grupos
de casos):
Figura 3.16
Media Peso
59
58
58
57
57
No fumador
Fumador
Tabaquismo
Este grfico representa la media de la variable peso para fumadores y no fumadores. Como se
observa, los sujetos fumadores tienden a tener un promedio de peso menor (57 kg.) que los que no
fuman (59 kg.).
38
Figura 3.17
Media Peso
70
60
Sexo
50
Mujer
40
No fumador
Varn
Fumador
Tabaquismo
Con la grfica anterior observbamos que los sujetos no fumadores de la muestra tienen un peso
medio mayor que los fumadores. Lo que nos indica esta nueva grfica es lo mismo pero segmentado
para la muestra de varones (lnea continua) y la de mujeres (lnea discontinua). Como puede
observarse, en las mujeres se observa que efectivamente el promedio del peso es menor para las
fumadoras. Sin embargo, en los varones se produce el efecto contrario. Es decir, los fumadores
tienen un promedio en peso mucho mayor que los no fumadores. Por tanto, de no haber elaborado
esta grfica, se hubiera concluido algo errneo para la muestra de varones. De todos modos, esta
interpretacin es solamente descriptiva pues para concluir que el gnero afecta al peso de los
fumadores y no fumadores, sera necesario emplear pruebas inferenciales. En el prximo curso se
estudiarn las pruebas estadsticas que determinan si cada variable independiente (y ambas en
interseccin) tiene algn efecto sobre la variable dependiente.
39
EJERCICIOS:
1. Se desea comparar las caractersticas fsicas de los sujetos evaluados (todos ellos Espaoles)
con las de los Norteamericanos. Para ello, utilizaremos algunos datos de las prcticas: la
variable estatura y la variable peso.
El objetivo es comparar nuestros datos descriptivos en estas variables con los de una muestra
norteamericana de similares caractersticas.
Tenemos el problema de que en Estados Unidos el peso y la estatura se miden en escalas
diferentes a las nuestras. En concreto, el peso en libras y la estatura en pulgadas, donde:
1 LIBRA =
453,6 gramos
1 PULGADA= 2,54 cm
En muchas ocasiones las tablas de resultados del SPSS incluyen datos en la denominada notacin
cientfica, debido a que los nmeros escritos de esta forma ocupan menos espacio que en la
notacin tradicional. Por ejemplo:
Estadsticos descriptivos
Peso
Estatura
N
200
200
Mnimo
39.00
1.52
Mximo
92.00
1.93
Media
58.2950
1.6756
Desv. tp.
10.3520
8.413E-02
La notacin cientfica se utiliza para sealar la posicin del primer valor decimal. Por ejemplo, la
desviacin tpica para la variable Estatura aparece escrita en notacin cientfica: 8.413E-02. Esta
expresin significa lo siguiente en notacin tradicional:
8.413E - 02 = 8.413 10 - 2 =
8.413
= 0.08413
100
41
18 = Cuenca
19 = Guadalajara
20 = Toledo
21 = Avila
22 = Burgos
23 = Len
24 = Palencia
25 = Salamanca
26 = Segovia
27 = Soria
28 = Valladolid
29 = Zamora
30 = Barcelona
31 = Girona
32 = Lleida
33 = Tarragona
34 = Ceuta
35 = Alicante
36 = Castelln
37 = Valencia
38 = Badajoz
39 = Cceres
40 = La Corua
41 = Lugo
42 = Ourense
43 = Pontevedra
44 = Baleares
45 = La Rioja
46 = Madrid
47 = Melilla
48 = Murcia
49 = Navarra
50 = Arava
51 = Guipuzkoa
52 = Bizkaia
7. Rama: variable nominal que indica el rea de conocimiento: (0): ciencias experimentales y de la
salud, (1): Ciencias sociales y jurdicas, (2): enseanzas tcnicas, (3): humanidades y (4)
otros/varios.
8. Licen: variable nominal que indica la titulacin del sujeto (licenciado en derecho, etc.).
9. Intelig: inteligencia general: capacidad cognitiva para resolver problemas en general.
10. Compren: comprensin verbal (o capacidad para comprender los mensajes transmitidos
verbalmente).
11. Orient: orientacin espacial (o capacidad para situarse en el espacio respecto a alguna referencia).
12. Extra: extraversin (valora la cantidad e intensidad de las relaciones personales).
13. Respon: responsabilidad (grado de organizacin y motivacin de la conducta del sujeto).
14. Emocio: estabilidad emocional (refleja el nivel de ajuste emocional de la persona).
15. Sincer: sinceridad (o grado en que responde con honestidad). *
16. Fumar: variable nominal que indica si el sujeto fuma (1) o no fuma (0).
Las variables 9, 10, 11, 12, 13, 14 y 15 se consideran aqu como puntuaciones (variables cuantitativas).
42
idprov
46
22
28
24
46
22
46
22
28
22
23
22
24
29
12
50
22
30
29
12
46
46
52
30
11
46
46
46
46
12
30
46
22
49
12
22
rama
1
4
1
1
2
3
2
1
3
1
0
2
1
0
3
1
1
1
4
1
1
0
3
3
0
0
2
2
2
1
4
3
4
2
2
1
licen
LDO. DERECHO
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
DDO. BIBLIOTECONOMIA Y DOCUMENTACION
LDO. DERECHO
PRIMER CICLO I. INDUSTRIAL
LDO. FILOLOGIA INGLESA
I. T. TELECOMUNICACION
DDO. CC. EMPRESARIALES
LDO. FILOLOGIA INGLESA
LDO. FILOSOFIA Y LETRAS
LDO. CC. BIOLOGICAS
I. TELECOMUNICACION
LDO. DERECHO
LDO. CC. FISICAS
LDO. FILOLOGIA INGLESA
DDO. CC. EMPRESARIALES
LDO. CC. EMPRESARIALES
LDO. DERECHO
ENSEANZA MILITAR GRADO MEDIO
LDO. DERECHO
DDO. CC. DE LA EDUCACION
PRIMER CICLO CC. FISICAS
LDO. GEOGRAFIA / HISTORIA
LDO. FILOLOGIA FRANCESA
LDO. MEDICINA Y CIRUGIA
PRIMER CICLO CC. FISICAS
I. T. INDUSTRIAL
ARQUITECTO TECNICO
I. T. AERONAUTICO
DDO. CC. EMPRESARIALES
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
LDO. FILOLOGIA INGLESA
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
PRIMER CICLO ARQUITECTO
I. T. MINAS
LDO. FILOSOFIA Y LETRAS
inteli
21.00
11.00
18.00
13.00
22.00
11.00
22.00
23.00
18.00
13.00
15.00
16.00
20.00
25.00
15.00
23.00
20.00
16.00
20.00
22.00
15.00
18.00
12.00
11.00
23.00
28.00
20.00
16.00
28.00
16.00
21.00
24.00
18.00
16.00
16.00
23.00
compren
24.00
25.00
26.00
28.00
29.00
25.00
26.00
30.00
29.00
17.00
24.00
23.00
31.00
27.00
24.00
26.00
25.00
20.00
31.00
21.00
25.00
30.00
23.00
18.00
30.00
29.00
30.00
23.00
26.00
28.00
29.00
29.00
30.00
21.00
24.00
25.00
orient
29.72
64.72
13.27
10.07
27.20
36.65
109.24
29.82
16.77
90.01
110.37
20.67
24.28
15.40
72.14
86.93
21.92
106.99
8.77
10.38
85.80
80.28
88.11
102.41
14.23
13.86
79.69
12.83
15.62
13.82
31.04
47.74
16.80
49.12
13.39
46.26
extra
38.00
42.00
36.00
41.00
42.00
41.00
43.00
40.00
36.00
42.00
40.00
35.00
43.00
39.00
43.00
33.00
40.00
44.00
42.00
44.00
41.00
39.00
47.00
45.00
39.00
50.00
37.00
30.00
36.00
42.00
39.00
41.00
42.00
37.00
39.00
44.00
43
0
1
0
0
1
1
0
0
0
1
1
0
1
1
1
1
1
1
1
1
0
0
1
1
1
0
1
1
0
0
0
0
1
1
0
0
1
1
1
27
32
31
29
38
26
32
29
24
31
28
25
31
31
28
37
26
30
26
28
30
33
29
30
29
28
30
42
25
34
23
29
35
26
30
24
41
32
28
49
63
49
57
64
58
39
53
50
53
66
45
60
61
55
55
63
63
64
52
45
53
59
59
61
47
56
57
47
55
49
43
66
60
56
50
60
57
66
1.66
1.72
1.66
1.75
1.73
1.66
1.54
1.70
1.66
1.60
1.75
1.60
1.68
1.69
1.62
1.62
1.71
1.71
1.72
1.58
1.60
1.69
1.66
1.66
1.68
1.62
1.62
1.63
1.62
1.71
1.64
1.57
1.73
1.66
1.72
1.65
1.66
1.62
1.72
VALLADOLID
ASTURIAS
ASTURIAS
VALLADOLID
MADRID
PONTEVEDRA
MADRID
BURGOS
BURGOS
BALEARES
MADRID
MADRID
MADRID
MADRID
VALLADOLID
MADRID
ASTURIAS
MADRID
MADRID
VALLADOLID
MADRID
BURGOS
VALLADOLID
MADRID
ASTURIAS
MADRID
BURGOS
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
ASTURIAS
MADRID
ASTURIAS
VALLADOLID
ASTURIAS
2
1
1
1
0
0
2
3
1
4
2
4
1
1
0
1
1
1
1
4
2
0
1
4
3
1
1
2
1
0
4
1
1
1
1
1
4
0
0
I. T. FORESTAL
DDO. MAGISTERIO
LDO. CC. ECONOMICAS Y EMPRESARIALES
PRIMER CICLO DERECHO
PRIMER CICLO CC. BIOLOGICAS
LDO. CC. EXACTAS
I. AERONAUTICO
LDO. FILOLOGIA INGLESA
DDO. CC. ECONOMICAS Y EMPRESARIALES
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
I. T. AERONAUTICO
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
LDO. CC. POLITICAS / SOCIOLOGIA
LDO. CC. INFORMACION
LDO. CC. FISICAS
LDO. DERECHO
DDO. EDUCACION FISICA
PRIMER CICLO ADMINISTRAC. Y DIRECCION
LDO. DERECHO
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
I. AERONAUTICO
LDO. VETERINARIA
LDO. CC. ECONOMICAS Y EMPRESARIALES
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
PRIMER CICLO FILOLOGIA INGLESA
LDO. CC. INFORMACION
LDO. CC. ECONOMICAS Y EMPRESARIALES
I. T. TOPOGRAFIA
LDO. DERECHO
LDO. CC. FISICAS
TECN. EMPRESAS Y ACTIVIDADES TURISTICAS
LDO. PERIODISMO
LDO. CC. POLITICAS / SOCIOLOGIA
LDO. ADMINISTRAC. Y DIRECCION EMPRESAS
DDO. CC. EMPRESARIALES
LDO. CC. ECONOMICAS
CAPITAN MARINA MERCANTE
LDO. VETERINARIA
PRIMER CICLO CC. QUIMICAS
22.00
16.00
21.00
15.00
14.00
23.00
21.00
13.00
14.00
25.00
21.00
17.00
20.00
22.00
16.00
12.00
16.00
17.00
16.00
19.00
16.00
24.00
24.00
17.00
22.00
24.00
12.00
24.00
16.00
15.00
15.00
14.00
26.00
19.00
18.00
28.00
19.00
18.00
14.00
30.00
31.00
31.00
22.00
22.00
28.00
30.00
8.00
19.00
31.00
32.00
29.00
24.00
24.00
25.00
16.00
26.00
29.00
24.00
27.00
26.00
32.00
25.00
25.00
18.00
29.00
17.00
25.00
32.00
19.00
16.00
23.00
30.00
25.00
28.00
30.00
21.00
31.00
21.00
84.55
13.36
31.98
86.08
13.79
6.90
39.79
125.98
114.18
9.44
15.24
12.63
18.77
35.92
38.11
52.67
37.72
8.48
8.52
10.72
104.50
21.88
14.74
52.75
13.06
29.17
113.11
8.64
37.70
86.18
18.59
73.35
10.71
35.59
42.52
10.77
31.30
14.67
56.26
43.00
49.00
41.00
41.00
32.00
43.00
40.00
44.00
39.00
42.00
39.00
49.00
38.00
38.00
41.00
36.00
40.00
41.00
46.00
43.00
43.00
46.00
36.00
39.00
38.00
44.00
47.00
47.00
46.00
46.00
45.00
43.00
41.00
44.00
45.00
31.00
40.00
50.00
44.00
44.00
54.00
46.00
43.00
42.00
51.00
45.00
45.00
40.00
44.00
46.00
45.00
44.00
41.00
47.00
34.00
43.00
45.00
46.00
49.00
44.00
50.00
47.00
38.00
46.00
48.00
48.00
43.00
57.00
56.00
50.00
53.00
42.00
48.00
51.00
48.00
41.00
55.00
35.00
47.00
58.00
47.00
49.00
39.00
54.00
45.00
43.00
46.00
45.00
49.00
56.00
48.00
45.00
47.00
43.00
47.00
47.00
47.00
50.00
50.00
53.00
47.00
47.00
37.00
47.00
42.00
53.00
57.00
57.00
41.00
49.00
47.00
49.00
49.00
56.00
46.00
54.00
36.00
22.00
34.00
25.00
24.00
24.00
23.00
29.00
25.00
20.00
24.00
18.00
22.00
13.00
25.00
27.00
24.00
22.00
21.00
25.00
30.00
20.00
24.00
24.00
13.00
18.00
26.00
25.00
27.00
33.00
40.00
22.00
22.00
17.00
23.00
24.00
12.00
20.00
19.00
23.00
1
0
1
1
0
0
1
1
1
0
0
1
0
0
0
0
0
0
0
0
1
1
0
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
0
44
0
1
1
1
1
1
0
0
1
1
1
1
0
1
1
1
0
0
1
1
1
1
0
0
1
1
1
1
0
1
1
0
1
0
1
1
1
1
1
31
29
27
24
25
32
29
31
30
28
26
26
22
29
29
29
30
28
38
42
28
37
27
35
33
27
30
31
27
28
29
23
25
24
24
26
30
33
29
57
60
60
67
56
63
51
52
63
63
64
64
52
58
52
59
52
52
66
60
60
60
40
42
60
61
62
58
40
59
60
53
67
53
68
62
66
57
70
1.73
1.65
1.65
1.73
1.60
1.68
1.66
1.67
1.68
1.68
1.68
1.68
1.67
1.61
1.54
1.62
1.67
1.67
1.70
1.63
1.63
1.63
1.53
1.55
1.63
1.63
1.64
1.59
1.52
1.60
1.61
1.67
1.69
1.67
1.70
1.63
1.67
1.56
1.71
MADRID
LEON
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
LEON
ASTURIAS
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
BARCELONA
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
MADRID
VIZCAYA
VIZCAYA
ZAMORA
1
1
2
2
2
1
4
3
2
1
0
1
3
1
1
1
3
1
1
4
1
2
2
1
0
0
3
3
2
2
0
1
0
1
4
0
1
1
1
10.00
18.00
15.00
19.00
16.00
22.00
17.00
16.00
23.00
15.00
16.00
14.00
18.00
19.00
19.00
14.00
22.00
11.00
13.00
14.00
15.00
19.00
20.00
15.00
13.00
17.00
24.00
23.00
26.00
25.00
14.00
26.00
24.00
18.00
13.00
26.00
17.00
20.00
20.00
19.00
12.00
22.00
32.00
30.00
29.00
30.00
25.00
24.00
32.00
24.00
17.00
28.00
28.00
20.00
26.00
30.00
28.00
29.00
23.00
27.00
32.00
25.00
27.00
25.00
20.00
30.00
23.00
29.00
29.00
23.00
29.00
27.00
28.00
17.00
28.00
31.00
25.00
23.00
91.69
91.57
10.91
14.93
5.97
9.01
35.31
109.89
17.02
72.51
19.42
18.45
142.29
25.67
38.32
17.41
13.53
77.23
69.92
14.98
13.29
8.84
117.38
55.62
10.63
50.09
12.79
9.29
74.67
8.13
10.37
24.93
11.64
19.99
101.06
11.62
15.09
29.45
17.60
43.00
48.00
34.00
39.00
36.00
40.00
37.00
45.00
40.00
41.00
47.00
40.00
39.00
48.00
48.00
45.00
41.00
45.00
42.00
41.00
34.00
37.00
40.00
38.00
37.00
39.00
40.00
41.00
44.00
42.00
39.00
42.00
47.00
43.00
46.00
53.00
39.00
47.00
36.00
48.00
45.00
42.00
46.00
42.00
41.00
45.00
48.00
50.00
45.00
48.00
46.00
33.00
39.00
45.00
45.00
47.00
47.00
45.00
51.00
41.00
45.00
45.00
47.00
43.00
53.00
42.00
49.00
45.00
47.00
42.00
44.00
44.00
47.00
53.00
54.00
43.00
50.00
45.00
54.00
51.00
46.00
37.00
50.00
50.00
47.00
52.00
51.00
43.00
54.00
44.00
46.00
55.00
48.00
58.00
46.00
54.00
48.00
54.00
49.00
43.00
45.00
53.00
44.00
55.00
43.00
52.00
53.00
56.00
46.00
51.00
53.00
51.00
50.00
59.00
45.00
45.00
48.00
31.00
28.00
24.00
26.00
21.00
25.00
26.00
26.00
29.00
25.00
27.00
26.00
27.00
20.00
22.00
20.00
22.00
23.00
20.00
25.00
21.00
24.00
20.00
19.00
16.00
18.00
24.00
24.00
28.00
22.00
21.00
29.00
22.00
23.00
23.00
31.00
23.00
22.00
26.00
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
45
1
0
1
1
1
1
1
0
1
0
1
1
1
1
0
1
0
0
1
0
0
1
0
0
1
1
1
1
0
1
1
1
1
1
0
0
0
0
1
28
34
29
29
29
28
25
30
46
40
28
26
40
32
31
32
28
29
27
28
29
25
24
30
26
29
27
33
30
33
29
30
27
32
32
31
29
27
30
65
41
60
71
68
63
75
42
65
55
57
70
63
58
45
66
58
47
69
47
41
73
54
48
65
56
66
63
61
64
73
73
83
83
50
50
51
51
57
1.65
1.53
1.59
1.71
1.67
1.61
1.88
1.54
1.83
1.69
1.71
1.86
1.77
1.71
1.57
1.80
1.72
1.59
1.83
1.59
1.52
1.87
1.67
1.60
1.77
1.66
1.77
1.73
1.75
1.73
1.83
1.83
1.93
1.93
1.62
1.62
1.63
1.63
1.62
ZAMORA
MADRID
MADRID
VALLADOLID
VALLADOLID
VALLADOLID
VALLADOLID
BARCELONA
MURCIA
ALICANTE
PALENCIA
MADRID
NAVARRA
VALLADOLID
BURGOS
BURGOS
BURGOS
BURGOS
MADRID
BARCELONA
BURGOS
BURGOS
MADRID
BURGOS
ASTURIAS
ASTURIAS
ASTURIAS
LAS PALMAS
LAS PALMAS
LAS PALMAS
SANTA CRUZ
SANTA CRUZ
BALEARES
LEON
LEON
MADRID
MADRID
LEON
LEON
3
1
1
2
1
0
0
1
1
4
2
1
3
0
4
0
0
0
2
1
1
4
1
1
3
1
2
2
1
1
0
2
1
3
2
1
1
3
3
23.00
14.00
10.00
25.00
13.00
21.00
21.00
13.00
20.00
18.00
14.00
19.00
11.00
25.00
21.00
16.00
21.00
12.00
17.00
17.00
22.00
13.00
18.00
24.00
20.00
20.00
20.00
18.00
13.00
20.00
19.00
17.00
23.00
16.00
23.00
18.00
10.00
17.00
21.00
29.00
19.00
22.00
22.00
24.00
21.00
28.00
32.00
20.00
26.00
26.00
29.00
19.00
26.00
27.00
30.00
28.00
30.00
18.00
31.00
19.00
21.00
25.00
27.00
29.00
32.00
26.00
22.00
25.00
25.00
27.00
24.00
30.00
29.00
31.00
20.00
27.00
23.00
24.00
9.89
48.41
102.72
16.66
15.66
15.70
84.72
46.94
19.77
93.36
12.38
9.05
85.72
15.05
76.81
37.34
83.78
30.45
6.34
71.44
80.90
23.74
21.85
23.66
45.13
86.94
17.02
23.72
23.51
9.64
19.28
34.84
40.44
17.49
17.80
87.70
80.15
86.35
24.91
47.00
39.00
39.00
44.00
44.00
38.00
40.00
39.00
40.00
38.00
40.00
42.00
35.00
42.00
39.00
45.00
38.00
38.00
36.00
47.00
40.00
40.00
47.00
40.00
29.00
47.00
48.00
40.00
47.00
37.00
40.00
41.00
39.00
42.00
41.00
53.00
42.00
43.00
33.00
55.00
49.00
44.00
56.00
41.00
47.00
52.00
45.00
45.00
42.00
44.00
50.00
42.00
48.00
45.00
45.00
43.00
50.00
43.00
52.00
45.00
42.00
46.00
45.00
44.00
52.00
53.00
38.00
46.00
44.00
46.00
45.00
46.00
42.00
44.00
54.00
49.00
49.00
43.00
58.00
43.00
43.00
50.00
46.00
51.00
47.00
50.00
51.00
41.00
42.00
50.00
37.00
46.00
46.00
45.00
47.00
47.00
44.00
56.00
44.00
45.00
46.00
51.00
50.00
60.00
60.00
46.00
47.00
46.00
44.00
51.00
48.00
60.00
44.00
59.00
51.00
46.00
44.00
22.00
19.00
25.00
29.00
17.00
34.00
24.00
21.00
30.00
28.00
25.00
24.00
24.00
26.00
23.00
26.00
24.00
24.00
25.00
17.00
25.00
26.00
25.00
29.00
20.00
29.00
18.00
17.00
26.00
24.00
23.00
23.00
24.00
25.00
19.00
22.00
18.00
27.00
23.00
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
1
1
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
1
1
0
46
0
0
1
0
1
1
1
1
1
0
0
0
0
0
0
1
0
1
0
0
0
1
0
1
0
1
1
1
1
1
1
0
0
1
1
1
0
0
0
29
32
37
37
36
28
34
29
31
30
29
29
30
28
28
27
30
24
26
28
25
26
25
25
25
30
34
31
31
28
27
25
26
25
33
30
29
28
26
45
58
57
46
69
65
73
73
73
60
62
57
51
51
52
86
59
69
53
53
47
76
47
76
47
73
71
80
83
73
78
60
55
85
68
83
49
49
49
1.56
1.71
1.62
1.57
1.75
1.70
1.79
1.78
1.78
1.73
1.75
1.69
1.62
1.62
1.63
1.93
1.71
1.73
1.64
1.64
1.57
1.81
1.57
1.81
1.57
1.77
1.74
1.83
1.85
1.73
1.78
1.72
1.66
1.86
1.66
1.83
1.59
1.59
1.59
LEON
VALENCIA
ASTURIAS
ASTURIAS
MADRID
ASTURIAS
ASTURIAS
ASTURIAS
BARCELONA
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
MADRID
MADRID
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
ASTURIAS
MADRID
ASTURIAS
MADRID
ASTURIAS
MADRID
ASTURIAS
ASTURIAS
1
1
2
3
2
3
3
0
0
3
1
2
1
1
0
2
1
1
3
1
2
1
3
0
0
1
3
2
0
2
3
2
3
3
0
1
0
3
1
20.00
15.00
27.00
29.00
9.00
26.00
18.00
24.00
26.00
21.00
15.00
19.00
15.00
21.00
17.00
17.00
11.00
16.00
19.00
14.00
17.00
18.00
23.00
19.00
26.00
19.00
15.00
20.00
21.00
20.00
21.00
24.00
16.00
15.00
27.00
25.00
16.00
14.00
20.00
28.00
28.00
31.00
28.00
25.00
29.00
24.00
31.00
30.00
31.00
26.00
20.00
23.00
27.00
17.00
29.00
17.00
21.00
26.00
30.00
29.00
25.00
26.00
32.00
30.00
29.00
27.00
31.00
27.00
18.00
25.00
26.00
26.00
24.00
31.00
29.00
32.00
23.00
27.00
114.86
121.23
41.25
62.63
14.66
18.02
32.66
13.60
9.61
46.77
46.57
38.36
109.19
22.62
53.51
17.02
104.56
15.61
49.23
98.59
29.01
9.50
49.60
7.80
29.81
32.27
101.57
11.65
14.35
30.40
13.68
85.70
22.16
10.94
23.18
12.49
55.12
102.19
78.66
46.00
47.00
40.00
40.00
42.00
37.00
47.00
46.00
35.00
41.00
39.00
36.00
43.00
40.00
46.00
45.00
39.00
51.00
49.00
40.00
40.00
42.00
45.00
46.00
34.00
46.00
37.00
41.00
41.00
37.00
37.00
46.00
45.00
35.00
33.00
35.00
44.00
36.00
40.00
58.00
39.00
42.00
52.00
44.00
44.00
50.00
50.00
43.00
41.00
43.00
49.00
46.00
44.00
55.00
41.00
43.00
55.00
46.00
43.00
49.00
49.00
59.00
54.00
46.00
52.00
37.00
52.00
48.00
45.00
42.00
48.00
53.00
41.00
45.00
50.00
46.00
50.00
41.00
51.00
49.00
44.00
50.00
43.00
43.00
59.00
57.00
48.00
44.00
45.00
57.00
44.00
44.00
56.00
47.00
45.00
54.00
47.00
47.00
50.00
52.00
47.00
51.00
45.00
46.00
48.00
52.00
52.00
50.00
43.00
49.00
45.00
44.00
44.00
49.00
51.00
45.00
44.00
25.00
16.00
20.00
13.00
19.00
24.00
15.00
23.00
24.00
26.00
25.00
29.00
31.00
28.00
43.00
22.00
27.00
29.00
20.00
25.00
24.00
25.00
14.00
20.00
13.00
26.00
22.00
34.00
23.00
27.00
24.00
23.00
23.00
24.00
14.00
15.00
26.00
22.00
14.00
1
0
0
0
0
0
1
1
1
0
0
1
0
0
1
1
0
1
1
0
0
1
0
1
0
1
1
1
1
1
1
0
0
1
1
1
1
0
0
47
0
1
1
0
1
0
1
0
27
26
26
25
24
26
24
27
56
92
73
50
82
51
78
45
1.67
1.93
1.73
1.60
1.82
1.61
1.78
1.54
ASTURIAS
ASTURIAS
ASTURIAS
ALAVA
ASTURIAS
ASTURIAS
ASTURIAS
MADRID
1
3
4
1
2
3
0
0
16.00
14.00
18.00
25.00
18.00
25.00
21.00
14.00
26.00
25.00
22.00
27.00
30.00
29.00
26.00
21.00
9.99
19.29
54.34
22.16
9.56
21.60
9.18
43.92
46.00
49.00
43.00
39.00
46.00
43.00
39.00
44.00
44.00
54.00
52.00
46.00
45.00
49.00
37.00
45.00
47.00
56.00
56.00
49.00
57.00
52.00
48.00
47.00
18.00
23.00
14.00
24.00
17.00
17.00
17.00
24.00
0
1
1
0
1
0
0
0
48
ANEXO IV:
EJERCICIO PRCTICO
A RESOLVER CON EL SPSS
___________________________________________________________________
http://www.uam.es/personal_pdi/psicologia/carmenx/Practicas2.html
Para resolver esta prctica en las clases, es imprescindible que
lleves este documento y tu diquette 3 con el fichero
ejercicios.sav.
y
ANALISIS DE DATOS I
PRCTICAS DE SPSS
CUESTIONARIO
Durante el ao 1999, se realiz una Encuesta sobre la Juventud Espaola. La muestra era de 10.000 jvenes, de la que hemos seleccionado
tan slo aquellos entrevistados con estudios universitarios (717 sujetos). De las 60 preguntas de que constaba el cuestionario, el archivo de
datos (A:\EJERCICIOS.xls) slo recoge las 16 preguntas que aparecen a continuacin, tal como se plantearon a los entrevistados.
Los nombres que tienen las variables en el archivo de datos aparecen EN MAYSCULA y NEGRITA.
A partir de la prctica n 2, el alumno recibir una hoja con una serie de preguntas que tendr que responder,
utilizando SPSS, y que versarn sobre los conceptos utilizados en dicha prctica.
OCIO
P.1 Para empezar y refirindonos a lo que haces en tus das de ocio, quisiramos saber cul es la actividad que ms te gusta hacer fuera
de casa cuando dispones de tiempo libre?
- Beber, ir de copas, bailar
- Hacer deporte
- Viajes, excursiones
- Ir al cine, al teatro
- Ir a museos, ir a conciertos
- Leer
1
2
3
4
5
6
OCIO
P.2 En total, cuntas horas libres tienes a la semana para tu ocio o diversin?
_______
HORAS
P.3 Aproximadamente y por trmino medio, cuntas horas semanales dedicas a ver la televisin?
__________
TV
FAMILIA
P.4 Cmo diras que ha sido tu infancia, la definiras como...
- La etapa ms feliz de tu vida
- Una etapa ms feliz que otras
- Una etapa igual de feliz que otras
- Una etapa menos feliz que otras
- La etapa menos feliz de tu vida
1
2
3
4
5
INFANCIA
P.5 Podras decirme cul es tu grado de dedicacin en las siguientes tareas de tu hogar?
1. No suelo hacerlo nunca
2. Slo lo hago en ocasiones
3. Comparto esta tarea con otra/s personas
4. Recae en m toda la responsabilidad, y suelo hacerlo siempre
- Hacer la cama
- Limpiar la casa
- Cuidar de los hijos o hermanos pequeos
1 2 3 4
1 2 3 4
1 2 3 4
CAMA
LIMPIAR
NIOS
Llegar a tener
1
2
3 HIJOS1
4
5
0
Le gustara
1
2
3 HIJOS2
4
5
0
1
2
3
AMOR
49
PRACTICAS SPSS.
ANALISIS DE DATOS I.
CULTURA
P. 9 Vamos a hablar ahora de tus estudios. En qu centro realizaste la totalidad o la mayor parte de tus estudios?
- En un centro estatal, pblico
- En un centro privado no religioso 2
- En un centro privado religioso
1
COLEGIO
3
P.10 Excluyendo los libros de texto, cuntos libros has ledo en los ltimos doce meses?
____________
LIBROS
ACTITUDES
P.11 Cmo te defines en materia religiosa?
- Catlico practicante
- Catlico no practicante
- Creyente de otra religin
- No creyente
- Indiferente
1
2
3
4
5
RELIGION
P.12 Cuando se habla de poltica se utilizan normalmente las expresiones izquierda y derecha. En qu casilla te colocaras?
ESCALA
+---------------------------------------+
Izda. |
|
|
|
|
|
|
|
|
|
| Dcha.
+---------------------------------------+
01 02 03 04 05 06 07 08 09 10
INGRESOS
P.13 Qu cantidad aproximadamente de dinero (en miles de pesetas) ingresas al mes por cada uno de los conceptos siguientes?
Ingresos personales
________________ INGRESO1
Ingresos de tu pareja ________________ INGRESO2
Aportaciones familiares _______________ INGRESO3
P.14 Actualmente, entre todos los miembros de tu hogar y por todos lo conceptos, de cuntos ingresos netos (sin descuentos) disponis
por trmino medio en tu hogar al mes?
- Menos o igual a 50.000 pts.
- De 50.001 a 100.000 pts.
- De 100.001 a 150.000 pts.
- De 150.001 a 200.000 pts.
- De 200.001 a 300.000 pts.
- De 300.001 a 400.000 pts.
- De 400.001 a 500.000 pts.
- De 500.001 a 750.000 pts.
- De 750.001 a 1 Milln de pts.
- Ms de 1 Milln de pts.
01
02
03
04
05
06
07
08
09
10
INGRESOT
DATOS
P.15 Sexo:
- Hombre
- Mujer
1
2
GENERO
EDAD
50
ANALISIS DE DATOS I
PRACTICA SPSS n 1
Porcentaje
50
40
30
20
10
0
ae
ec
R
en
l
m
a
o
sp
re
as
oc
n
nu
a
re
ta
en
ta
es
go
ha
rlo
ce
ha
rto
pa
om
C
lo
o
el
su
lo
S
o
N
10. Qu % de entrevistados tienen o han tenido algn tipo de relacin afectiva? (pregunta 8 del cuestionario)
11. Conteste a las siguientes preguntas, todas ellas referidas a la variable TV (pregunta 3 del cuestionario)
11.10 Qu valores, en el grupo de varones, comprende el 5 tallo del diagrama de tallo y hojas?
13.3 Convierta la variable TOTALES (que est en pesetas) en la variable EUROS (1 euro = 166,386
pts) y diga cul es la media de EUROS: ________________________________________
52
I. ABRIR ARCHIVO
Archivo > Abrir > Datos
Cada variable del fichero corresponde a cada pregunta del cuestionario. Por ejemplo, la variable ocio
corresponde a la pregunta 1, que tiene 6 opciones de respuesta, la variable horas a la pregunta 2, que
es una pregunta abierta en la que se indica el nmero de horas que se dedican al ocio, etctera.
Es conveniente, tener el cuestionario delante para comprobar a qu variable se refiere cada pregunta,
pues el cuestionario indica en maysculas la variable de SPSS que corresponde a cada pregunta.
53
II. FRECUENCIAS
Analizar > Estadsticos Descriptivos > Frecuencias
54
III. DESCRIPTIVOS
Analizar > Estadsticos Descriptivos > Descriptivos
IV. EXPLORAR
Analizar > Estadsticos Descriptivos > Explorar
55
ANALISIS DE DATOS I
PRACTICA SPSS n 2
Calcule los estadsticos de tendencia central de dicha variable _________, _________, _________ .
1.3. Calcule los ndices de asimetra y curtosis de dicha variable _____________ , _________________ .
1.3. Queremos hacer 4 grupos iguales en dicha variable. Los grupos son: izquierda, centro-izquierda, centroderecha y derecha. Qu valores de la variable ESCALA delimitan cada uno de los grupos?
________________, ________________, ________________ .
1.4. Calcule los centiles 20, 40 y 80 de dicha distribucin: C20 = ______ C40 = ______ C80 = ______
INGRESO 2
INGRESO 1
INGRESO 2
INGRESO 3
INGRESO 2
INGRESO 3
2.4. Compruebe cmo se obtendra la correlacin de Pearson entre INGRESO1 e INGRESO2 si solo se
utilizan los datos que aparecen en la matriz de varianzas-covarianzas obtenida en el apartado 2.2.
3.2. Calcule a partir de la matriz de varianzas-covarianzas entre las variables INGRESO1 e INGRESO2
(obtenida en el apartado 2.2.), el valor de la varianza de la variable INPAREJA.
56
4.5. Descomponga la varianza del criterio. Segn lo obtenido, la varianza explicada es: __________________
y la no explicada es: ___________________________.
5.1.
I. CORRELACIONES
Archivo > Correlaciones > Bivariadas
58
III. REGRESIN
Analizar > Regresin > Lineal
59
60