Sei sulla pagina 1di 69

Estadística Aplicada a

las Ciencias Sociales

Grado de Sociología

Ejercicios Complementarios SPSS


Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Problema.1. Los niveles de colesterol en la sangre, en mg/100 ml, de dos


grupos de edades de varones estadounidenses en 1976 – 1980 se recogen
en la siguiente tabla:

Grupo A: edades 25 – 34 Grupo B: edades 55 – 64

Nivel de colesterol Nivel de colesterol


Número de varones Número de varones
(mg/100 ml) (mg/100 ml)

79 – 119 13 79 – 119 5

119 – 159 150 119 – 159 48

159 – 199 442 159 – 199 265

199 – 239 299 199 – 239 458

239 – 279 115 239 – 279 281

279 – 319 34 279 – 319 128

319 – 359 9 319 – 359 35

359 – 399 5 359 – 399 7

a) Obtener las tablas de frecuencias para las variables “Grupo de


edades” y “Nivel de colesterol en la sangre”.
b) Realizar un estudio de la variable “Nivel de colesterol en la sangre”
distinguiendo para cada grupo de edades.
c) ¿Cuál es el nivel de colesterol mínimo que es superado por el 70% de
los varones del grupo de edades A?
d) ¿Cuál es el nivel de colesterol mínimo que es superado por el 70% de
los varones del grupo de edades B?
e) Obtener un diagrama de barras del nivel de colesterol en la sangre de
los varones para los dos grupos de edades.

SOLUCIÓN:
En primer lugar, definimos las variables e introducimos los datos que aparecen en
la tabla del enunciado de la siguiente manera:

1
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

a) Para realizar el análisis hay que ponderar por la variable “Número de varones”:
Datos / Ponderar casos

Para obtener las tablas de frecuencias para las variables “Grupo de edades” y
“Nivel de colesterol en la sangre” hacemos la secuencia:
Analizar / Estadísticos descriptivos / Frecuencias

2
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Introducimos en el cuadro “variables” las variables correspondientes y


seleccionando Aceptar obtenemos:
Frecuencias

Estadísticos

Nivel de
Grupo de colesterol en
edades la sangre
N Válidos 2294 2294
Perdidos 0 0

Tabla de frecuencia

Grupo de edades

Porc entaje Porc entaje


Frecuencia Porc entaje válido acumulado
Válidos A 1067 46,5 46,5 46,5
B 1227 53,5 53,5 100,0
Total 2294 100,0 100,0

Nivel de colesterol en la sangre

Porc entaje Porc entaje


Frecuencia Porc entaje válido acum ulado
Válidos 99 18 ,8 ,8 ,8
139 198 8,6 8,6 9,4
179 707 30,8 30,8 40,2
219 757 33,0 33,0 73,2
259 396 17,3 17,3 90,5
299 162 7,1 7,1 97,6
339 44 1,9 1,9 99,5
379 12 ,5 ,5 100,0
Total 2294 100,0 100,0

b) Para realizar un estudio de la variable “Nivel de colesterol en la sangre”


distinguiendo para cada grupo de edades hacemos la secuencia:
Analizar / Estadísticos descriptivos / Explorar.

3
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

En la variable Dependiente, introducimos la variable sobre la que queremos


realizar el análisis descriptivo (Nivel de colesterol en la sangre) y en Factores
introducimos la variable que nos distinguirá los diferentes grupos dentro de la
muestra (Grupo de edades)

y seleccionando Aceptar obtenemos los estadísticos de tendencia central,


dispersión y forma por separado para cada grupo de edades:
Grupo de edades

Resumen del procesamiento de los casos

Casos
Válidos Perdidos Total
Grupo de edades N Porc entaje N Porc entaje N Porc entaje
Nivel de colesterol A 1067 100,0% 0 ,0% 1067 100,0%
en la sangre B 1227 100,0% 0 ,0% 1227 100,0%

4
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Descriptivos

Grupo de edades Estadístico Error típ.


Nivel de colesterol A Media 198,34 1,345
en la sangre Intervalo de confianz a Límite inferior 195,70
para la media al 95% Límite superior
200,98

Media recortada al 5% 196,02


Mediana 179,00
Varianza 1930,901
Desv. típ. 43,942
Mínimo 99
Máximo 379
Rango 280
Amplitud interc uartil 40
Asimetría ,778 ,075
Curtosis 1,328 ,150
B Media 228,58 1,325
Intervalo de confianz a Límite inferior 225,98
para la media al 95% Límite superior
231,18

Media recortada al 5% 227,75


Mediana 219,00
Varianza 2155,374
Desv. típ. 46,426
Mínimo 99
Máximo 379
Rango 280
Amplitud interc uartil 80
Asimetría ,371 ,070
Curtosis ,218 ,140

Diagrama de caja

c) Puesto que nos piden un dato relacionado sólo con los varones del grupo de
edades A, tenemos que filtrar los datos por la variable “Grupo de edades” para lo
que hacemos la secuencia:

Datos / Seleccionar casos

5
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionando Si dentro de la opción Si se satisface la condición, obtenemos


una ventana que tenemos que rellenar como sigue:

De esta forma, sólo tenemos seleccionados los casos del grupo de edades A.
Observamos en el editor de datos, que se ha creado una nueva variable, filter_$,

6
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

que toma el valor 0 para aquellos casos que no son seleccionados y el valor 1 para
aquellos casos que si son seleccionados.
Ahora para hallar el nivel de colesterol mínimo que es superado por el 70% de los
varones del grupo de edades A, tenemos que hallar el percentil 30 de la variable
“Nivel de colesterol en la sangre” de los varones del grupo de edades A. Para ello
hacemos la secuencia:
Analizar / Estadísticos descriptivos / Frecuencias

y seleccionamos Estadístico. Marcamos la opción percentiles e introducimos el


valor 30. Seleccionamos también algunos estadísticos descriptivos.

Obtenemos los siguientes resultados:


Frecuencias

7
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos

Nivel de colesterol en la sangre


N Válidos 1067
Perdidos 0
Media 198,34
Mediana 179,00
Moda 179
Desv. típ. 43,942
Asimetría ,778
Error típ. de asimetría ,075
Curtosis 1,328
Error típ. de curtosis ,150
Rango 280
Mínimo 99
Máximo 379
Perc entiles 25 179,00
30 179,00
50 179,00
75 219,00

Nivel de colesterol en la sangre

Porc entaje Porc entaje


Frecuencia Porc entaje válido acumulado
Válidos 99 13 1,2 1,2 1,2
139 150 14,1 14,1 15,3
179 442 41,4 41,4 56,7
219 299 28,0 28,0 84,7
259 115 10,8 10,8 95,5
299 34 3,2 3,2 98,7
339 9 ,8 ,8 99,5
379 5 ,5 ,5 100,0
Total 1067 100,0 100,0

d) Puesto que nos piden un dato relacionado sólo con los varones del grupo de
edades B, tenemos que filtrar los datos por la variable “Grupo de edades” para lo
que hacemos la secuencia:
Datos / Seleccionar casos

8
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionando Si obtenemos una ventana que tenemos que rellenar como sigue:

9
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

De esta forma, sólo tenemos seleccionados los casos del grupo de edades B.
Ahora para hallar el nivel de colesterol mínimo que es superado por el 70% de los
varones del grupo de edades B, tenemos que hallar el percentil 30 de la variable
“Nivel de colesterol en la sangre” de los varones del grupo de edades B. Para ello
hacemos la secuencia:
Analizar / Estadísticos descriptivos / Frecuencias

seleccionamos Estadísticos y repetimos los pasos que hicimos para el apartado


anterior.

Obtenemos:
Frecuencias

10
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos

Nivel de colesterol en la sangre


N Válidos 1227
Perdidos 0
Media 228,58
Mediana 219,00
Moda 219
Desv. típ. 46,426
Asimetría ,371
Error típ. de asimetría ,070
Curtosis ,218
Error típ. de curtosis ,140
Rango 280
Mínimo 99
Máximo 379
Perc entiles 25 179,00
30 219,00
50 219,00
75 259,00

Nivel de colesterol en la sangre

Porc entaje Porc entaje


Frecuencia Porc entaje válido acumulado
Válidos 99 5 ,4 ,4 ,4
139 48 3,9 3,9 4,3
179 265 21,6 21,6 25,9
219 458 37,3 37,3 63,2
259 281 22,9 22,9 86,1
299 128 10,4 10,4 96,6
339 35 2,9 2,9 99,4
379 7 ,6 ,6 100,0
Total 1227 100,0 100,0

e) Observamos que sólo tenemos seleccionados los casos del grupo de edades B,
por lo que en primer lugar hay que quitar el filtrado que hicimos en el apartado
anterior. Para ello seleccionamos Datos / Seleccionar casos y marcamos la
opción Todos los casos.

11
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Para obtener un diagrama de barras del nivel de colesterol en la sangre de los


varones para los dos grupos de edades hacemos la secuencia:
Gráficos /Cuadros de diálogo antiguos/ Barras.
Seleccionamos la opción Agrupado y a continuación pulsamos en Definir.

Obtenemos una ventana que tenemos que rellenar como sigue:

12
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

De esta forma, obtenemos:

NOTA: Otra forma de distinguir los grupos de edades A y B sin necesidad de filtrar
para cada una de las categorías de la variable “Grupo de edades”, como se ha
hecho en los apartados c y d, sería segmentar el archivo por la variable “Grupo de
13
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

edades”. Segmentar un archivo consiste en dividir el archivo de datos en distintos


grupos para el análisis basándose en los valores de una o más variables de
agrupación. Concretamente, hacemos la secuencia:
Datos / Segmentar archivo

A continuación, hacemos la secuencia


Analizar / Estadísticos descriptivos / Frecuencias

y seleccionamos Estadísticos, repitiendo los mismos pasos que vimos en c y d.

14
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

En este caso obtenemos:


Estadísticos

Nivel de colesterol en la sangre


A N Válidos 1067
Perdidos 0
Media 198,34
Mediana 179,00
Moda 179
Desv. típ. 43,942
Asimetría ,778
Error típ. de as im etría ,075
Curtosis 1,328
Error típ. de curtosis ,150
Rango 280
Mínim o 99
Máximo 379
Perc entiles 25 179,00
30 179,00
50 179,00
75 219,00
B N Válidos 1227
Perdidos 0
Media 228,58
Mediana 219,00
Moda 219
Desv. típ. 46,426
Asimetría ,371
Error típ. de as im etría ,070
Curtosis ,218
Error típ. de curtosis ,140
Rango 280
Mínim o 99
Máximo 379
Perc entiles 25 179,00
30 219,00
50 219,00
75 259,00

15
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Nivel de colesterol en la sangre

Porc entaje Porc entaje


Grupo de edades Frecuencia Porc entaje válido acumulado
A Válidos 99 13 1,2 1,2 1,2
139 150 14,1 14,1 15,3
179 442 41,4 41,4 56,7
219 299 28,0 28,0 84,7
259 115 10,8 10,8 95,5
299 34 3,2 3,2 98,7
339 9 ,8 ,8 99,5
379 5 ,5 ,5 100,0
Total 1067 100,0 100,0
B Válidos 99 5 ,4 ,4 ,4
139 48 3,9 3,9 4,3
179 265 21,6 21,6 25,9
219 458 37,3 37,3 63,2
259 281 22,9 22,9 86,1
299 128 10,4 10,4 96,6
339 35 2,9 2,9 99,4
379 7 ,6 ,6 100,0
Total 1227 100,0 100,0

Problema.2. La siguiente tabla muestra el peso, en kilogramos, de 50


jugadores de cuatro equipos de fútbol distintos:

Equipo A Equipo B

Número de Número de
Peso (kg) Peso (kg)
jugadores jugadores

78 1 76 2

80 2 78 3

81 2 80 1

82 1 81 3

83 1 82 2

87 1 83 1

88 2 85 1

89 1 87 1

16
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Equipo C Equipo D

Número de Número de
Peso (kg) Peso (kg)
jugadores jugadores

73 1 69 1

75 3 74 2

77 1 75 3

78 2 76 1

79 2 77 3

80 1 80 1

83 1 83 1

84 1 85 1

a) Calcular la media, mediana, moda, desviación típica, coeficiente de


asimetría y de curtosis de la variable “Peso”. ¿Cuál es el peso mínimo
que tendrían el 70% de los jugadores que más pesan?
b) Realizar un diagrama de rectángulos para la variable “Equipo” de
forma que cada rectángulo represente el peso medio de cada equipo.
c) Realizar un diagrama de sectores para la variable “Equipo” de forma
que cada porción nos indique el porcentaje de jugadores en cada
equipo.
d) Obtener una tabla de frecuencias del número de jugadores
especificando el equipo al que pertenecen y el peso.
e) Calcular la media, mediana, moda, desviación típica, coeficiente de
asimetría y de curtosis de la variable “Peso” en los distintos equipos.

SOLUCIÓN:
En primer lugar, definimos las variables e introducimos los datos según aparecen
en la tabla del enunciado de la siguiente manera:

17
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

a) Para realizar el análisis hay que ponderar por la variable “Número de jugadores”:
Datos / Ponderar casos

Para calcular la media, mediana, moda, desviación típica, coeficiente de asimetría y


de curtosis de la variable “Peso” hacemos la secuencia:
Analizar / Estadísticos descriptivos / Frecuencias

18
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionamos Estadísticos:

para obtener:
Frecuencias

Estadísticos

Peso
N Válidos 50
Perdidos 0
Media 79,56
Mediana 79,50
Moda 75a
Desv. típ. 4,329
Asimetría ,236
Error típ. de asimetría ,337
Curtosis -,137
Error típ. de curtosis ,662
Perc entiles 30 77,00
a. Existen varias modas . Se mostrará el menor de los
valores.

19
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Peso

Porc entaje Porc entaje


Frecuencia Porc entaje válido acumulado
Válidos 69 1 2,0 2,0 2,0
73 1 2,0 2,0 4,0
74 2 4,0 4,0 8,0
75 6 12,0 12,0 20,0
76 3 6,0 6,0 26,0
77 4 8,0 8,0 34,0
78 6 12,0 12,0 46,0
79 2 4,0 4,0 50,0
80 5 10,0 10,0 60,0
81 5 10,0 10,0 70,0
82 3 6,0 6,0 76,0
83 4 8,0 8,0 84,0
84 1 2,0 2,0 86,0
85 2 4,0 4,0 90,0
87 2 4,0 4,0 94,0
88 2 4,0 4,0 98,0
89 1 2,0 2,0 100,0
Total 50 100,0 100,0

b) Para realizar un diagrama de rectángulos para la variable “Equipo” de forma que


cada rectángulo represente el peso medio de cada equipo hacemos la secuencia:
Gráficos /Cuadros de diálogo antiguos/ Barras.
Seleccionamos la opción Simple y a continuación pulsamos en Definir.

Seleccionamos la opción Otro estadístico e introducimos la media de la variable


“Peso”.

20
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener:

c) Para realizar un diagrama de sectores para la variable “Equipo” de forma que


cada porción nos indique el porcentaje de jugadores en cada equipo hacemos la
secuencia:
Gráficos / Cuadros de diálogos antiguos/ Sectores

21
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionamos Definir. Introducimos la variable “Equipo” en Definir sectores


por y seleccionamos la opción % de casos en Los sectores representan

para obtener:

22
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Sobre el gráfico, haciendo doble clic, activamos el editor de gráfico y pulsando el


botón derecho, seleccionamos la opción Mostrar etiqueta de datos, para marcar
en cada sector el porcentaje correspondiente.
d) Para obtener una tabla de frecuencias del número de jugadores especificando el
equipo al que pertenecen y el peso tenemos que segmentar el archivo por la
variable “Equipo”. Segmentar un archivo consiste en dividir el archivo de datos en
distintos grupos para el análisis basándose en los valores de una o más variables
de agrupación. Concretamente, hacemos la secuencia:
Datos / Segmentar archivo

A continuación, hacemos la secuencia


Analizar / Estadísticos descriptivos / Frecuencias

23
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionamos Estadísticos, para quitar la selección que por defecto se queda


de apartados anteriores,

para obtener:
Frecuencias

24
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos

Peso
A N Válidos 11
Perdidos 0
B N Válidos 14
Perdidos 0
C N Válidos 12
Perdidos 0
D N Válidos 13
Perdidos 0

Peso

Porc entaje Porc entaje


Equipo Frecuencia Porc entaje válido acumulado
A Válidos 78 1 9,1 9,1 9,1
80 2 18,2 18,2 27,3
81 2 18,2 18,2 45,5
82 1 9,1 9,1 54,5
83 1 9,1 9,1 63,6
87 1 9,1 9,1 72,7
88 2 18,2 18,2 90,9
89 1 9,1 9,1 100,0
Total 11 100,0 100,0
B Válidos 76 2 14,3 14,3 14,3
78 3 21,4 21,4 35,7
80 1 7,1 7,1 42,9
81 3 21,4 21,4 64,3
82 2 14,3 14,3 78,6
83 1 7,1 7,1 85,7
85 1 7,1 7,1 92,9
87 1 7,1 7,1 100,0
Total 14 100,0 100,0
C Válidos 73 1 8,3 8,3 8,3
75 3 25,0 25,0 33,3
77 1 8,3 8,3 41,7
78 2 16,7 16,7 58,3
79 2 16,7 16,7 75,0
80 1 8,3 8,3 83,3
83 1 8,3 8,3 91,7
84 1 8,3 8,3 100,0
Total 12 100,0 100,0
D Válidos 69 1 7,7 7,7 7,7
74 2 15,4 15,4 23,1
75 3 23,1 23,1 46,2
76 1 7,7 7,7 53,8
77 3 23,1 23,1 76,9
80 1 7,7 7,7 84,6
83 1 7,7 7,7 92,3
85 1 7,7 7,7 100,0
Total 13 100,0 100,0

e) Para calcular la media, mediana, moda, desviación típica, coeficiente de


asimetría y de curtosis de la variable “Peso” en los distintos equipos hacemos la
secuencia:
25
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Analizar / Estadísticos descriptivos / Frecuencias

y seleccionamos Estadísticos, marcando los estadísticos que nos pide el


enunciado.

26
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos

Peso
A N Válidos 11
Perdidos 0
Media 83,36
Mediana 82,00
Moda 80a
Desv. típ. 3,906
Asimetría ,343
Error típ. de asimetría ,661
Curtosis -1,600
Error típ. de c urtosis 1,279
B N Válidos 14
Perdidos 0
Media 80,57
Mediana 81,00
Moda 78a
Desv. típ. 3,204
Asimetría ,357
Error típ. de asimetría ,597
Curtosis -,193
Error típ. de c urtosis 1,154
C N Válidos 12
Perdidos 0
Media 78,00
Mediana 78,00
Moda 75
Desv. típ. 3,303
Asimetría ,436
Error típ. de asimetría ,637
Curtosis -,315
Error típ. de c urtosis 1,232
D N Válidos 13
Perdidos 0
Media 76,69
Mediana 76,00
Moda 75a
Desv. típ. 4,111
Asimetría ,498
Error típ. de asimetría ,616
Curtosis ,949
Error típ. de c urtosis 1,191
a. Existen varias modas. Se mos trará el menor de los valores .

27
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Problema.3. En un estudio llevado a cabo en Italia, 10 pacientes con


hipertrigliceridemia se sometieron a una dieta baja en grasas y alta en
carbohidratos. Antes de comenzar la dieta, se analizaron los niveles de
colesterol y triglicéridos en cada paciente:

X ≡ Nivel de colesterol (mmol/l) Y ≡ Nivel de triglicéridos (mmol/l)

5’12 2’30

6’18 2’54

6’77 2’95

6’65 3’77

6’36 4’18

5’90 5’31

5’48 5’53

6’02 8’83

10’34 9’48

8’51 14’20

a) Realizar un diagrama de dispersión (nube de puntos) representando en


el eje de abscisas la variable “Nivel de colesterol” y en el eje de
ordenadas la variable “Nivel de triglicéridos”.
b) Obtener la recta de regresión lineal que explica la variable “Nivel de
triglicéridos” en función de la variable “Nivel de colesterol”. Dar una
medida que indique la fiabilidad del modelo.
c) Estimar el nivel de triglicéridos que tendrá un paciente con un nivel de
colesterol de 7,5 mmol/l.
SOLUCIÓN:
a) En primer lugar, definimos las variables e introducimos los datos como se
muestra en la siguiente figura:

28
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Se pide dicho diagrama de dispersión con el objeto de ver si podemos establecer


una relación lineal entre ambas variables. Tal procedimiento es totalmente
orientativo, por lo que no nos podemos basar únicamente en la observación de
dicho diagrama para concluir que sería factible considerar que se puede establecer
una relación de tipo lineal entre ambas variables.
Para realizar un diagrama de dispersión (nube de puntos) representando en el eje
de abscisas la variable “Nivel de colesterol” y en el eje de ordenadas la variable
“Nivel de triglicéridos” hacemos la secuencia:
Gráficos / Cuadro de diálogos antiguos/Dispersión/Puntos

Marcamos la opción dispersión simple y seleccionamos Definir. Introducimos las


variables correspondientes en el eje X y el eje Y.

29
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

El gráfico que se obtiene es el siguiente:

16,00

14,00

12,00
Nivel de triglicéridos

10,00

8,00

6,00

4,00

2,00

5,00 6,00 7,00 8,00 9,00 10,00 11,00


Nivel de colesterol

Si hacemos un doble clic sobre el gráfico, se activa una ventana que corresponde
al editor de gráficos. Si dentro del editor de gráficos seleccionamos todos los
puntos de la nube de puntos, y pinchamos el botón derecho del rato, podemos
añadir la Línea de ajuste total

30
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y obtener el siguiente gráfico:

16,00

14,00

12,00
Nivel de triglicéridos

10,00

8,00

6,00

4,00
R2 lineal = 0,422

2,00

5,00 6,00 7,00 8,00 9,00 10,00 11,00


Nivel de colesterol

b) Para obtener la recta de regresión lineal que explica la variable “Nivel de


triglicéridos” (variable dependiente) en función de la variable “Nivel de colesterol”
(variable independiente) hacemos la secuencia:
Analizar / Regresión / Lineales

31
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Seleccionamos adecuadamente quien es la variable independiente y la


dependiente y seleccionamos Estadísticos. Además de las opciones que aparecen
por defecto, marcamos también la opción descriptivos para estudiar diferentes
estadísticos.

para obtener:
Regresión

32
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos descriptivos

Desviación
Media típ. N
Valor del coeficiente de
Nivel de triglicéridos 5,9090 3,81842 10 correlación, r
Nivel de colesterol 6,7330 1,56331 10

Correlaciones

Nivel de Nivel de
triglicéridos colesterol
Correlación de Pearson Nivel de triglicéridos 1,000 ,650
Nivel de colesterol ,650 1,000
Sig. (unilateral) Nivel de triglicéridos . ,021
Nivel de colesterol ,021 .
N Nivel de triglicéridos 10 10
Nivel de colesterol 10 10

Variables introducidas/eliminadasb

Variables Variables
Modelo introducidas eliminadas Método
1 Nivel de a
. Introducir
colesterol
a. Todas las variables solic itadas introducidas
b. Variable dependiente: Nivel de triglicéridos
Coeficientes de
Resumen del modelo determinación, R2

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,650a ,422 ,350 3,07896
a. Variables predic toras: (Constante), Nivel de colesterol

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 55,383 1 55,383 5,842 ,042a
Residual 75,840 8 9,480
Total 131,223 9
a. Variables predic toras: (Constante), Nivel de colesterol
b. Variable dependiente: Nivel de triglic éridos

33
Ejercicios Complementarios SPSS Coeficientes
ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES
de la recta de
regresión
Coeficientesa

Coeficientes
Coeficientes no estandariz ad
estandariz ados os
Modelo B Error típ. Beta t Sig.
1 (Cons tante) -4,775 4,526 -1,055 ,322
Nivel de colesterol 1,587 ,657 ,650 2,417 ,042
a. Variable dependiente: Nivel de triglicéridos

De la tabla “Coeficientes” se obtiene que la recta de regresión pedida es Y = -4,775


+ 1,587 X donde X es el “Nivel de colesterol” e Y es el “Nivel de triglicéridos”.
A partir de las tablas “Correlaciones” y “Resumen del modelo” obtenemos que el
coeficiente de correlación de Pearson es R = 0,650.
De la tabla “Resumen del modelo” se obtiene que el coeficiente de determinación
es R2 = 0,422, que nos muestra la fiabilidad del modelo. En este caso, como R2 =
0,422 < 0,75 concluimos que el ajuste no es aceptable. Este valor del coeficiente
de determinación nos indica que el 42,2% de la variabilidad de la variable “Nivel de
triglicéridos” viene explicada por la variable “Nivel de colesterol” y que el 57,8%
restante de la variabilidad de la variable “Nivel de triglicéridos” viene explicada por
otras variables que no se han considerado en este modelo.
c) Para estimar el nivel de triglicéridos que tendrá un paciente con un nivel de
colesterol de 7,5 mmol/l introducimos en la última fila de la “Vista de datos” del
“Editor de datos PASW” el valor 7,5 en la columna correspondiente a la variable
“Nivel de colesterol”. A continuación hacemos la secuencia:
Analizar / Regresión / Lineales

y seleccionamos Guardar. Marcamos en valores pronosticados, la opción “no


tipificados”.

34
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener en la “Vista de datos” del “Editor de datos PASW” una nueva variable
llamada PRE_1 que recoge los valores estimados a través de la regresión
construida. Así, si nos fijamos en la última observación de esta variable PRE_1,
tenemos que se estima un nivel de triglicéridos de 7,13 mmol/l para un paciente
con un nivel de colesterol de 7,5 mmol/l.

35
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Problema.4. La presente tabla recoge los valores de las siguientes variables


tomados de diez herboristerías de una conocida franquicia española:
Y  Ventas mensuales (cientos de €).
X1  Número de horas diarias que la herboristería permanece abierta.
X2  Inversión mensual en publicidad (cientos de €).

Y X1 X2

12 8 0,5

5 10 0,2

25 11 2,0

7 8 0,1

6 7 0,2

14 9 1,0

50 12 5,0

21 8 2,0

33 10 2,0

5 9 0,3

La directiva de la franquicia está interesada en estudiar las ventas mensuales en


función del número de horas diarias que la herboristería permanece abierta y de la
inversión realizada en publicidad, y realizar predicciones fiables. Se pide:
a) Estudiar diferentes modelos de regresión para predecir las ventas
mensuales y estudiar la fiabilidad de los ajustes propuestos. Analiza
los modelos lineales y no lineales que pueden explicar la variable
Ventas. Aporta los coeficientes de bondad de ajuste. ¿Qué modelo
ajusta mejor los datos?

SOLUCIÓN:
En primer lugar, definimos las variables e introducimos los datos como muestra la
siguiente pantalla.

36
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

A continuación, debemos decidir qué modelos vamos a estudiar:


Modelo lineal simple X1: Y = b0 + b1 X1
Modelo parabólico o cuadrático X1: Y = b0 + b1 X1 + b2 X12
Modelo cúbico X1: Y = b0 + b1 X1 + b2 X12 + b3 X13
Modelo hiperbólico o inverso X1: Y =b0 + ( b1 / X1 )
Modelo potencial X1: Y = b0 X1b1
Modelo exponencial X1: Y = b0 eb1 X1
Todos los modelos anteriores también se pueden expresar para Y con X2.

Para elegir los modelos más interesantes, vamos a hacer gráficos de dispersión de
las variables. Haremos dos gráficos de dispersión, uno que enfrente a Y contra X1,
y otro que enfrente a Y contra X2.
En primer lugar, para realizar un diagrama de dispersión (nube de puntos)
representando en el eje de abscisas la variable X1 y en el eje de ordenadas la
variable Y hacemos la secuencia:
Gráficos /Cuadro de diálogo antiguos/ Dispersión/puntos

37
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y seleccionamos Definir:. Introducimos en el eje Y la variable “ventas” y en el eje X


la variable “Número de horas”, y aceptamos:

para obtener:

:
38
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

En segundo lugar, para realizar un diagrama de dispersión (nube de puntos)


representando en el eje de abscisas la variable X2 y en el eje de ordenadas la
variable Y hacemos la secuencia anterior pero ahora introducimos en el eje X la
variable “Inversión mensual”.

para obtener:

Ahora para ver qué tipo de ajuste es más razonable, podemos mostrar las líneas de
ajuste sobre los puntos. Si hacemos un doble clic sobre los gráficos, se activa una
ventana que corresponde al editor de gráficos.
39
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Si dentro del editor de gráficos del primer diagrama de dispersión seleccionamos


todos los puntos de la nube de puntos, podemos hacer la secuencia: Elementos /
Línea de ajuste total

Obtenemos el siguiente gráfico que se consigue repitiendo el proceso y cambiando


el método de ajuste (“lineal”, “cuadrático” o “cúbico”):

50

40
Ventas mensuales (cientos de €)

30

20

R2 cúbico =0,702
10
R2 cuadrático =0,662

R2 lineal = 0,534

7 8 9 10 11 12
Número de horas diarias que la herboristería permanece
abierta

Si dentro del editor de gráficos del segundo diagrama de dispersión seleccionamos


todos los puntos de la nube de puntos, y repetimos el proceso anterior,
obtendremos el siguiente gráfico

40
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

50

40
Ventas mensuales (cientos de €)

30

20

R2 cúbico =0,953
10
R2 cuadrático =0,952

R2 lineal = 0,941

0,0 1,0 2,0 3,0 4,0 5,0


Inversión mensual en publicidad (cientos de €)

También podemos generar los diagramas de dispersión (nubes de puntos) de todos


los posibles pares de variables en una matriz, haciendo la secuencia:
Gráficos /Cuadro de diálogo antiguos/ Dispersión/puntos. Seleccionamos en este
caso la opción “Dispersión Matricial“ y le damos a Definir:

En variables de la matriz, seleccionamos las tres variables de nuestro estudio y


aceptamos.

41
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Obtenemos el siguiente gráfico:


Ventas mensuales ...
Inversión mensual en ... Número de horas diaria...

Ventas mensuales Número de horas diarias Inversión mensual en


(cientos de €) que la herboristería publicidad (cientos de €)
permanece abierta

Al diagrama de dispersión matricial también se le pueden añadir las líneas de


ajuste, siguiendo el mismo proceso que en los diagramas de dispersión simples:

42
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Ventas mensuales ...


Inversión mensual en ... Número de horas diaria...

Ventas mensuales Número de horas diarias Inversión mensual en


(cientos de €) que la herboristería publicidad (cientos de €)
permanece abierta

Tras realizar los diferentes diagramas de dispersión, observamos que no


dilucidamos el problema, por lo que realizaremos la estimación de todos los
modelos.
En primer lugar, estimamos los MODELOS LINEALES SIMPLES.
Para obtener la recta de regresión lineal que explica la variable Y en función de la
variable X1 hacemos la secuencia: Analizar / Regresión / Lineales y
seleccionamos la variable “Ventas” como variable dependiente (Y) y la variable
“Número de horas como la variable independiente (X1).

Seleccionamos Estadísticos:

43
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener:
Regresión

Estadísticos descriptivos

Desviación
Media típ. N
Ventas mens uales
17,80 14,763 10
(c ientos de €)
Número de horas diarias
que la herboristería 9,20 1,549 10
permanece abierta

Correlaciones

Número de Valor del coeficiente de


horas diarias
que la correlación, r
Ventas herboristería
mensuales permanece
(c ientos de €) abierta
Correlación de Pearson Ventas mensuales
1,000 ,731
(c ientos de €)
Número de horas diarias
que la herboris tería ,731 1,000
permanece abierta
Sig. (unilateral) Ventas mensuales
. ,008
(c ientos de €)
Número de horas diarias
que la herboris tería ,008 .
permanece abierta
N Ventas mensuales
10 10
(c ientos de €)
Número de horas diarias
que la herboris tería 10 10
permanece abierta

44
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Variables introducidas/eliminadasb

Variables Variables
Modelo introducidas eliminadas Método
1 Número de
horas diarias
que la
. Introducir
herboristería
permanece
a
abierta
a. Todas las variables solic itadas introducidas
b. Variable dependiente: Ventas mensuales
(c ientos de €)

Coeficientes de
Resumen del modelo determinación, R2
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
1 ,731a ,534 ,476 10,691
a. Variables predic toras: (Constante), Número de horas diarias
que la herboristería permanece abierta

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1047,230 1 1047,230 9,162 ,016a
Residual 914,370 8 114,296
Total 1961,600 9
a. Variables predic toras: (Constante), Número de horas diarias que la herboristería
permanece abierta
b. Variable dependiente: Ventas mensuales (cientos de €)
Coeficientes de la
recta de regresión
Coeficientesa

Coeficientes
Coeficientes no estandariz ad
estandariz ados os
Modelo B Error típ. Beta t Sig.
1 (Constante) -46,259 21,431 -2,158 ,063
Número de horas diarias
que la herboris tería 6,963 2,300 ,731 3,027 ,016
permanece abierta
a. Variable dependiente: Ventas mensuales (c ientos de €)

De la tabla “Coeficientes” se obtiene la recta de regresión Y = -46,259 + 6,963 X1


donde X1 es el “Número de horas diarias que la herboristería permanece abierta” e
Y son las “Ventas mensuales (cientos de €)”. De las tablas “Correlaciones” y
“Resumen del modelo” obtenemos el coeficiente de correlación de Pearson R =
0,731 y de la tabla “Resumen del modelo” obtenemos el coeficiente de
determinación R2 = 0,534, que nos muestran la fiabilidad del modelo. En este caso,
como R2 = 0,534 < 0,75 concluimos que el ajuste no es aceptable. Este valor del
coeficiente de determinación nos indica que el 53,4% de la variabilidad de la
variable Y viene explicada por la variable X1 y que el 46,6% restante de la

45
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

variabilidad de la variable Y viene explicada por otras variables que no se han


considerado en este modelo.
Para obtener la recta de regresión lineal que explica la variable Y en función de la
variable X2 hacemos el mismo proceso que para el caso anterior: Analizar /
Regresión / Lineal

y seleccionamos Estadísticos:

para obtener:
Regresión

46
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Estadísticos descriptivos

Desviación
Media típ. N
Ventas mens uales
17,80 14,763 10
(c ientos de €)
Inversión mensual en
1,330 1,5181 10
publicidad (cientos de €)

Corre laciones

Inversión
Ventas mensual en
mensuales publicidad
(c ientos de €) (c ientos de €)
Correlación de Pearson Ventas mens uales
1,000 ,970
(c ientos de €)
Inversión mensual en
,970 1,000
publicidad (cientos de €)
Sig. (unilateral) Ventas mens uales
. ,000
(c ientos de €)
Inversión mensual en
,000 .
publicidad (cientos de €)
N Ventas mens uales
10 10
(c ientos de €)
Inversión mensual en
10 10
publicidad (cientos de €)

Variables introducidas/eliminadasb

Variables Variables
Modelo introducidas eliminadas Método
1 Inversión
mensual en
publicidad . Introducir
(c aientos de
€)
a. Todas las variables solic itadas introducidas
b. Variable dependiente: Ventas mensuales
(c ientos de €)

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 ,970a ,941 ,934 3,805
a. Variables predic toras: (Constante), Inversión mensual en
publicidad (cientos de €)

ANOVAb

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1845,757 1 1845,757 127,466 ,000a
Residual 115,843 8 14,480
Total 1961,600 9
a.
Variables predic toras: (Constante), Invers ión mensual en publicidad (cientos de €)
b. Variable dependiente: Ventas mensuales (cientos de €)

47
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Cons tante) 5,253 1,638 3,207 ,012
Inversión mensual en
9,433 ,836 ,970 11,290 ,000
publicidad (cientos de €)
a. Variable dependiente: Ventas mensuales (cientos de €)

De la tabla “Coeficientes” se obtiene la recta de regresión Y = 5,253 + 9,433 X2


donde X2 es la “Inversión mensual en publicidad (cientos de €)” e Y son las “Ventas
mensuales (cientos de €)”. De las tablas “Correlaciones” y “Resumen del modelo”
obtenemos el coeficiente de correlación de Pearson R = 0,970 y de la tabla
“Resumen del modelo” obtenemos el coeficiente de determinación R2 = 0,941, que
nos muestran la fiabilidad del modelo. En este caso, como R2 = 0,941 es próximo
a uno concluimos que el ajuste es muy bueno. Este valor del coeficiente de
determinación nos indica que el 94,1% de la variabilidad de la variable Y viene
explicada por la variable X2 y que el 5,9% restante de la variabilidad de la variable
Y viene explicada por otras variables que no se han considerado en este modelo.

En segundo lugar, estimamos los MODELOS NO LINEALES. Concretamente,


estudiamos los siguientes modelos (nótese que los modelos no siempre tienen los
mismos nombres que nosotros consideramos):
LINEAL (Method.. LINEAR): modelo lineal simple.
CUADRÁTICO (Method.. QUADRATI): modelo parabólico (lo describe un polinomio
de segundo grado).
CÚBICO (Method.. CUBIC): modelo cúbico (lo describe un polinomio de tercer
grado).
INVERSO (Method.. INVERSE): modelo hiperbólico.
POTENCIA (Method.. POWER): modelo potencial.
EXPONENCIAL (Method.. EXPONENT): modelo exponencial.
Observamos que haciendo clic con el botón derecho del ratón sobre el nombre de
cada modelo, PASW nos muestra su ecuación. Por ejemplo, para el modelo
parabólico tenemos:

Para obtener los modelos de regresión que explican la variable Y en función de la


variable X1 hacemos la secuencia:
Analizar / Regresión / Estimación curvilínea

48
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener:
Estimación curvilínea

49
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

50
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

51
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

52
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

53
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Observamos que este procedimiento también nos permite obtener el modelo lineal
simple de Y sobre X1.
Si no necesitamos calcular las varianzas explicadas por la regresión ni las
varianzas residuales, debemos comprobar que la casilla “Mostrar tabla de ANOVA”
no está activada, ya que dicha tabla suministra mucha información y si ésta no es
54
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

necesaria la presentación de los resultados es mucho más clara. Concretamente, si


hacemos la secuencia:
Analizar / Regresión / Estimación curvilínea

obtenemos: Desactivamos la opción ANOVA, para sacar únicamente una


tabla resumen de todos los modelos
Estimación curvilínea

A partir de los resultados que devuelve PASW, concluimos que los modelos de
regresión pedidos que explican la variable Y en función de la variable X1 son:

55
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Coeficiente de
Modelos que explican Y en función de X1
determinación R2

Modelo lineal simple X1: Y = -46,259 + 6,9630 X1 0,534

Modelo parabólico X1: Y = 155,407 - 36,579 X1 + 2,2917 X12 0,662

Modelo cúbico X1: Y = 46,6708 - 1,7364 X12 + 0,1451 X13 0,674

Modelo hiperbólico X1: Y = 78,0005 - ( 540,24 / X1 ) 0,448

Modelo potencial X1: Y = 0,0195 X12,9521 0,353

Modelo exponencial X1: Y = 0,6465 e0,3273 X1 0,376

Para obtener los modelos de regresión que explican la variable Y en función de la


variable X2 hacemos la misma secuencia que para el caso anterior. Sacamos los
resultados sin mostrar la tabla ANOVA.
Analizar / Regresión / Estimación curvilínea

para obtener:
Estimación curvilínea

56
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

57
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

A partir de los resultados que devuelve PASW, concluimos que los modelos de
regresión pedidos que explican la variable Y en función de la variable X2 son:

Coeficiente de
Modelos que explican Y en función de X2
determinación R2

Modelo lineal simple X2: Y = 5,2535 + 9,4335 X2 0,941

Modelo parabólico X2: Y = 3,6272 + 12,5292 X2 - 0,6482 X22 0,952

Modelo cúbico X2: Y = 4,4207 + 8,9425 X2 + 1,6455 X22 - 0,3221


0,953
X23

Modelo hiperbólico X2: Y = 26,3650 - ( 3,0553 / X2 ) 0,420

Modelo potencial X2: Y = 16,4366 X20,6013 0,884

Modelo exponencial X2: Y = 6,8869 e0,4854 X2 0,794

58
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Problema.5. Un investigador está interesado en estudiar si existe relación


entre el color del cabello y el color de los ojos entre los trabajadores de una
empresa dedicada al sector de la alimentación. Para ello selecciona una
muestra de cuarenta trabajadores de esta empresa, obteniendo los
siguientes datos:

Color del cabello


Color de los ojos
Rubio Castaño Negro Rojo

Azul 6 2 3 1

Verde 4 5 4 2

Pardo 1 3 6 3

Estudiar si existe dependencia entre el color del cabello y el color de los ojos a un
nivel de significación del 5%.
SOLUCIÓN:
En primer lugar, definimos las variables e introducimos los datos como tal y como
aparece en la siguiente pantalla:

Como los datos no son individuales sino que están agrupados, debemos indicar a
PASW que la variable “Número de trabajadores” constituye las frecuencias
absolutas conjuntas, para ello tenemos que ponderar los datos por esta variable:
Datos / Ponderar casos

59
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Para estudiar si existe dependencia entre el color del cabello y el color de los ojos,
hay que aplicar el test de la Chi-cuadrado para determinar la asociación entre las
variables:

H0: El color del cabello y el color de los ojos no están asociados.

H1: El color del cabello y el color de los ojos sí están asociados.

Es decir,

H0: El color del cabello y el color de los ojos son independientes.

H1: El color del cabello y el color de los ojos sí están asociados.

Para realizar el análisis hacemos la secuencia:


Analizar / Estadísticos descriptivos / Tablas de contingencia

60
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y pulsamos en los botones Estadísticos y Casillas respectivamente:

61
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener:

Tabla de contingencia Color de ojos * Color de cabello

Color de cabello

Rubio Castaño Negro Rojo Total

Color de ojos Azul Recuento 6 2 3 1 12

% de Color de ojos 50,0% 16,7% 25,0% 8,3% 100,0%

Verde Recuento 4 5 4 2 15

% de Color de ojos 26,7% 33,3% 26,7% 13,3% 100,0%

Pardo Recuento 1 3 6 3 13

% de Color de ojos 7,7% 23,1% 46,2% 23,1% 100,0%

Total Recuento 11 10 13 6 40

% de Color de ojos 27,5% 25,0% 32,5% 15,0% 100,0%

62
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Pruebas de chi-cuadrado

Sig.
asintótica
Valor gl (bilateral)

Chi-cuadrado de
6,896a 6 ,331
Pearson

Razón de
7,145 6 ,308
verosimilitudes

Asociación lineal por


4,917 1 ,027
lineal

N de casos válidos 40

a. 12 casillas (100,0%) tienen una frecuencia


esperada inferior a 5. La frecuencia mínima esperada
es 1,80.

A partir de la tabla “Pruebas de chi-cuadrado”, el p-valor asociado al contraste es


0’331 > 0’05 luego no hay evidencias para rechazar la hipótesis nula al 5% de
significación, es decir:
“no existe asociación entre las variables “Color del cabello” y “Color de los ojos” al
5% de significación”.

Problema.6. La siguiente tabla muestra los datos obtenidos de un estudio


entre jóvenes andaluces, a los que entre otras cuestiones se les preguntaba
acerca de su autoestima y su nivel de estudios:

Autoestima
Nivel de estudios
Alta Media Baja

Primarios 17 20 7

Graduado
47 88 40
escolar

Medios 29 88 50

Superiores 7 33 36

Estudiar si existe asociación entre estos dos atributos a un nivel de significación del
5%.

63
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

SOLUCIÓN:
En primer lugar introducimos los datos tal y como aparece en la siguiente pantalla

Hemos incluido las etiquetas de los códigos en la casilla de “valores”.


Antes de realizar el análisis tenemos que indicar a PASW que la variable “Número
de jóvenes” o “frecuencia” constituye las frecuencias absolutas conjuntas, para ello
tenemos que ponderar los datos por esta variable (debido a que los datos vienen
expresados de forma conjunta):
Datos / Ponderar casos

Para estudiar si existe dependencia entre la autoestima y el nivel de estudios, hay


que aplicar el test de la Chi-cuadrado para determinar la asociación entre las
variables:

H0: La autoestima y el nivel de estudios no están asociados.

H1: La autoestima y el nivel de estudios sí están asociados.

Para realizar el análisis hacemos la secuencia:


Analizar / Estadísticos descriptivos / Tablas de contingencia

64
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

y pulsamos en los botones Estadísticos y Casillas respectivamente:

65
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

para obtener:

66
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Tabla de contingencia Estudios * Autoestima

Recuento

Autoestima

Alta Media Baja Total

Estudios Primarios 17 20 7 44

Graduado
47 88 40 175
escolar

Medios 29 88 50 167

Superiores 7 33 36 76

Total 100 229 133 462

Pruebas de chi-cuadrado

Sig.
asintótica
Valor gl (bilateral)

Chi-cuadrado de ,000
29,849a 6
Pearson

Razón de
29,364 6 ,000
verosimilitudes

Asociación lineal por


27,369 1 ,000
lineal

N de casos válidos 462

a. 0 casillas (,0%) tienen una frecuencia esperada


inferior a 5. La frecuencia mínima esperada es 9,52.

A partir de la tabla “Pruebas de chi-cuadrado”, el p-valor asociado al contraste es


0’000 < 0‘05 luego hay evidencias para rechazar la hipótesis nula al 5% de
significación, es decir, existe asociación entre las variables “Autoestima” y “Nivel de
estudios” al 5% de significación. No son independientes.

67
Ejercicios Complementarios SPSS ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES

Problema.7. (Propuesto) Se ha medido el contenido de oxígeno, Y, en


miligramos/litro, del lago Worther, en Austria, a una profundidad de X
metros, obteniéndose los siguientes datos:

X = profundidad (mtros) 15 20 30 40 50 60 70

Y = contenido de oxigeno 6’5 5’6 5’4 6’0 4’6 1’4 0’1

a) Calcular la media, desviación típica y coeficiente de asimetría del la


variable “contenido de oxígeno”.
b) ¿Qué contenido de oxígeno fue superado por el 90 % de las
mediciones?
c) Calcular la recta de regresión que explica la variable “Contenido de
oxígeno” en función de la variable “Profundidad” y dar una medida de
la fiabilidad del modelo.
d) ¿Qué cantidad de oxigeno se espera que haya a una profundidad de
65 metros y 90 metros? ¿Son coherentes los resultados obtenidos?

Problema.8. (Propuesto) En un estudio sobre los hábitos de los estudiantes


universitarios, se quiere saber si el consumo diario de fruta y la evolución en
los estudios están relacionados. Después de un muestreo aleatorio, los
datos recogidos son:

Y Evolucionan
X Muy bien Bien Regular Mal
3 o más piezas 10 15 13 17
Consumo
de fruta

1 ó 2 piezas 12 14 18 16
Ninguna pieza 20 15 15 10

Estudia la posible asociación entre dichas variables. Aporta el test, las hipótesis y el p-valor
obtenido.

68

Potrebbero piacerti anche