Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SPSS
La ventana de Editor de datos es la ventana principal de SPSS, y es la primera que aparece cuando se ingresa
a este programa, esta ventana tiene dos pestañas, la pestaña Vista de datos y la pestaña Vista de variables.
1.1 Gestor de variables (Pestaña de Vista de Variables). El gestor de variables o vista de variables, es
la plataforma donde se crean y se organizan las variables y donde se clasifica el tipo de variable.
La Vista de variables contiene descripciones de los atributos de cada variable del archivo de datos,
aquí, Las filas son variables, Las columnas son atributos de las variables.
Se pueden añadir o eliminar variables, y modificar los atributos de las variables, los atributos de las
variables incluidos en esta versión de SPSS son los siguientes:
Nombre Nombre de variable
Tipo Tipo de dato
Ancho Número de dígitos o caracteres
Decimales Número de decimales
Etiqueta Las etiquetas descriptivas de variable y de valor
Perdidos Valores perdidos definidos por el usuario
Columna Ancho de columna
Alineación Alineación de los datos en la vista de datos
Medida Nivel de medida
Rol Rol de las variables (dependiente o Independiente)
a) Nombres de variable
b) Tipo de variable
Coma. Cuando se desea introducir números con separadores de coma de miles y con punto
decimal.
Punto. Cuando se desea introducir números con separadores de punto de miles y coma decimal.
Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada y
un exponente con signo que representa una potencia de base 10.
Fecha. Cuando se desea introducir datos de fecha, con diferentes formatos de fecha-calendario u
hora-reloj.
Dólar. Cuando se desea ingresar datos que representa una cantidad en dólares, se muestra con un
signo dólar inicial ($).
Moneda personalizada. Cuando se desea ingresar datos de cantidad de dinero con una
denominación personalizada de moneda.
Cadena. Cuando se desea ingresar datos cuyos valores no son numéricos. Los valores pueden
contener cualquier carácter siempre que no se exceda la longitud definida. Las mayúsculas y las
minúsculas se consideran diferentes. Este tipo también se conoce como variable alfanumérica.
e) Etiquetas de variable.- En esta parte se puede definir la descripción completa de las variables
de hasta 256 caracteres de longitud. Las etiquetas de variable pueden contener espacios y
caracteres reservados que no se admiten en los nombres de variable.
f) Valores (Asignar etiquetas a códigos).- En esta parte se puede asignar códigos y etiquetas a
cada categoría de una variable, Las etiquetas de valor pueden ocupar hasta 120 caracteres.
Ejemplo: La variable Estado civil tiene 4 categorías: Soltero, Casado, Viudo y divorciado, en este
caso se puede asignar un código numérico (etiqueta de valor) a cada categoría.
Para definir como perdidos los valores nulos o vacíos de una variable de cadena, escriba un
espacio en blanco en uno de los campos debajo de la selección Valores perdidos discretos.
Se trata de variables cuantitativas cuando sus valores representan orden, comparación y con
sus datos se puede realizar cálculos matemáticos.
Nominal. Son consideradas las variables cualitativas donde sus categorías no obedecen a un
ordenamiento explícito.
Ordinal. Son consideradas las variables cualitativas cuando sus valores representan
categorías con alguna ordenación.
k) Rol o Papeles de las variables.- Este atributo servirá en algunos cuadros de diálogo en el que
se admiten roles predefinidos de las variables que se pueden utilizar para preseleccionar variables
para el análisis. Cuando utiliza algunos de los cuadros de diálogo y si las variables tienen roles
establecidos estos se muestran automáticamente en la lista(s) de destinos. Los papeles disponibles
son:
Entrada. La variable se utilizará como una entrada (por ejemplo, predictor, variable
independiente).
Objetivo. La variable se utilizará como una salida u objetivo (por ejemplo, variable
dependiente).
Partición. La variable se utilizará para dividir los datos en muestras diferentes para
entrenamiento, prueba y validación.
Segmentar. Se incluye para compatibilidad global con IBM® SPSS® Modeler. Las
variables con este papel no se utilizan como variables de archivos divididos en IBM®
SPSS® Statistics.
Por defecto, todas las variables se asignan al papel Entrada . Se incluyen los datos de formatos
de archivo externos y los archivos de datos creados en versiones anteriores de SPSS Statistics
anteriores a la versión 18.
La asignación de papeles sólo afecta a los cuadros de diálogo que admiten asignaciones de
papeles. No tiene ningún efecto en la sintaxis de comandos.
1.2 Gestor de datos (Pestaña de Vista de Datos). El gestor de datos muestra el contenido
del archivo de datos, muestra los datos en forma de Filas y Columnas, las columnas
hacen referencia a variables y las filas hacen referencia a Registros. En esta ventana
se puede ingresar, ordenar, ver, agrupar, etc. los datos.
La ventana vista de datos está organizado en columnas y Filas, las columnas representan las variables
que van a contener los datos y las filas representan un registro este es un conjunto de variables que
describen las características de un caso o de un individuo, en términos estadísticos una fila es el registro
de todos los datos de una unidad elemental.
Columnas
FILA. o Registro
Ingreso Manual
Copiar y Pegar
Importación de datos
En cada uno de estos tres casos se debe tener en cuenta la preparación de los nombres de las variables, esto
se debe de realizar en el la vista de variables, aquí le mostramos rápidamente como debemos organizar las
variables para el respectivo ingreso de datos.
Cada uno de los atributos de las variables así como Nombre, tipo, anchura etc. Se describe en la primera
sección de este manual, pero es apropiado recordar que el nombre debe de ser corto y rápidamente
identificable, no debe tener caracteres extraños ni espacios: Por ejemplo:
La variable Genero, tiene un nombre corto es rápidamente identificable, en este caso se ha especificado el
tipo de ingreso como numérico ¿Por qué? si es una variable cualitativa nominal, el atributo “TIPO” no
especifica el tipo de variable si no el tipo de ingreso en este caso se puede ingresar “0” para mujer y “1”
para varón es por eso que se especifica el tipo de ingreso como numérico, el atributo “ANCHO” especifica
el número de caracteres que se puede ingresar, en este caso solo se podrá ingresar un (1) carácter numérico
(del 0 al 9), el atributo “DECIMALES” indica cuantos decimales se podrá ingresar en este caso 0 decimales,
por otro lado, el atributo “ETIQUETA” permite ingresar una descripción más extensa del nombre de la
variable, en este atributo se puede ingresar hasta 256 caracteres de cualquier tipo, se tiene que tener en
cuenta que esta etiqueta es la que se visualizara en los gráficos y en las tablas estadísticas procesadas, así
también, el atributo “VALORES”, es un atributo para complementar las variables cualitativas nominales u
ordinales, en esta parte se especifica la codificación de “0” para mujer y “1” para varones, es la forma de
etiquetar las categorías de las variables cualitativas, recuerde que la variable Genero se ingresa “0 ó 1”, y
si no existiera este atributo de valores no sabríamos que significan.
El atributo “PERDIDOS” especifica que ingresos se van a considerar como valores perdidos o no válidos
y SPSS no los considerara en sus cálculos (Ver referencia en la primera parte), el atributo “COLUMNAS”
es un atributo visual y sirve para visualizar los datos en el número de caracteres que se especifique en este
caso en un ancho de 3 caracteres, así también, otro atributo de visualización es el atributo de
“ALINEACIÓN” en este caso los datos se verán alineados a la derecha, el atributo “MEDIDA” es uno de
los atributos muy importantes, aquí se define el tipo de medida nominal u ordinal (en caso de ser variables
cualitativas) en caso de ser cuantitativas se debe seleccionar el tipo de medida escalar, por último, debemos
seleccionar el tipo de papel o Rol de la variable en este caso se debe definir si la variable es endógena
(objetivo) o exógena (ingreso) u otros casos (ver referencia en la primera parte de esta guía).
Antes de ingresar los datos, se debe de estructurar el conjunto de variables tal y como se observa en el
ejemplo arriba esquematizado.
El ingreso de datos se realiza en la ventana vista de datos, y se puede ingresar en forma vertical como
en forma horizontal, eso depende de cómo se estructure el ingreso de datos, generalmente se ingresan
los datos por cada encuesta y eso implica que se ingresa en forma horizontal o por registros de datos.
El ingreso de datos se realiza por cada encuesta se ingresa el número de encuesta, luego el género del
encuestado, el distrito donde vive el encuestado, su edad, sus años de educación etc. Es decir se ingresa
todos los datos de un encuestado en forma horizontal, se debe observar que se ingresa solo los códigos,
en este caso el registro número 2 para el caso de genero se escribe el código 1 que hace referencia que
el encuestado es varón y cuando se termina de ingresar este código, SPSS de inmediato nos muestra la
etiqueta de este código. Si se quiere ver solo los códigos ingresados y no sus etiquetas debemos
seleccionar el menú Ver/Etiquetas de valor o activar la opción:
Para cambiar estos caracteres en blanco y el carácter guion “-“ rápidamente podemos realizar
los siguientes pasos:
- Seleccionar las celdas en las que se desea
reemplazar los caracteres extraños.
- Seleccionar la opción Reemplazar
(CTRL+B)
- En la parte Buscar: escribir el carácter a ser
reemplazado en este caso el guión “-“
- En la parte Reemplazar con: escribir el
carácter con el que se va a reemplazar en
este caso el carácter “sub guión” este
carácter si es aceptado por SPSS.
Luego de renombrar las variables con
caracteres aceptados por SPSS, debemos
Ordenar las variables, se debe ordenar las
variables por columnas de la forma que se
desea copiar a SPSS.
CTRL+V en el
archivo en SPSS
CTRL+V en el
CTRL+C en el Archivo en SPSS
Archivo en Excel
De igual manera debemos copiar las etiquetas de cada variable, esto lo podemos sacar del
mismo archivo de diccionario de datos, dado que, en este archivo se describe cada nombre de
variable.
CTRL+C en el
CTRL+V en el
Archivo en Excel
Archivo en SPSS
Esta es una forma rápida de organizar los datos en SPSS, si no se tiene este archivo de
diccionario de datos se debe editar los atributos de las variables manualmente, esto de acuerdo
a las especificaciones de cada una de las variables.
Por ejemplo la variable GI_02 su tipo de ingreso debe de ser 1, cero decimales y la codificación
para sus categorías (respuestas) son: “0” No y “1” para Si. Y La medida de esta variable debe
ser nominal.
Si las demás variables tienen las mismas especificaciones para el atributo valores, este se puede
copiar a las demás variables y así no estar repitiendo esta acción para cada variable.
CTRL+C CTRL+V
SPSS tiene una gran gama de archivos para importar las más importantes son las siguientes:
En cualquiera de estos casos para importar datos se debe tener en cuenta lo siguiente.
a. Organizar las variables y los datos en el archivo origen (ver ítem 2.2 parte a.)
En esta parte como ya se explicó se debe tener verificar que el nombre de las variables cumplan
con las especificaciones que exige SPSS, deben ser cortos y no deben contener caracteres
extraños ni espacios.
Para el ejemplo, se va a
trabajar el Archivo
Oficinistas.xls que se
encuentra en el Directorio
H:\Casos prácticos\
b. Identificar que tipo de archivo vamos a importar, en este caso se debe tener conocimiento del
formato del archivo que vamos a importar, puede tener extensiones XLS, DTA, DAT, TXT, etc
y esto dependerá del tipo de programa de origen del cual se desea importar sus archivos.
Luego de Organizar las variables e identificar el tipo de archivo, para importar datos se debe
seguir los siguientes pasos:
Una vez ingresado a SPSS y con la posibilidad de introducir nuevos datos se debe ingresar a
la opción: Archivo/Abrir/Datos…
Para importar datos de Excel, en la casilla de Archivos de Tipo se debe seleccionar el programa
del cual vamos a importar su archivo de datos, en este caso EXCEL es el formato de archivo
seleccionado para importar.
Seguidamente en la misma caja de Dialogo de “Abrir Datos” en la casilla Buscar en:, se debe
buscar el archivo del cual se va a importar los datos a SPSS, en este caso es el archivo:
Oficinistas.xls que se encuentra en el directorio Casos prácticos.
Al abrir el archivo de Excel, se observara La Caja de Dialogo Apertura de Origen, esta tiene la
opción de Leer Nombre de variables de la primera fila de datos, si esta opción esta activada,
indica que la primera fila del archivo contiene el nombre de las variables y estas primera fila
se utilizara para asignar los nombres de las variables en SPSS.
También podemos observar la casilla Hoja de Trabajo: en esta parte SPSS nos muestra todas
las hojas de trabajo del archivo de Excel, así también nos muestra la celda inicial y final donde
se encuentran los datos a importar, este es el rango de importación que por defecto SPSS
propone para la importación, generalmente se utiliza por defecto esta información que brinda
SPSS, pero si se desea importar un conjunto de datos diferente a lo propuesto por SPSS,
podemos utilizar la Casilla Rango.
La Casilla Rango: permite que el usuario defina un rango diferente para la importación de
datos, para ello se debe tener en cuenta la celda inicial y la celda final, por ejemplo si los datos
que desea importar se encuentran en la Celda B4 y termina en D20, se debe escribir en la celda
Rango de la siguiente manera: Rango: B4:D20
Cuando las variables contienen información tipo CADENA, SPSS permite establecer cuantos
caracteres por tipo de variable cadena se va importar en este caso se importara 32767 caracteres
en cada variable de cadena.
Luego de establecer estas condiciones se importación se hace click en aceptar
Al importar correctamente, SPSS muestra los datos importados, aquí se puede observar los
nombres de las variables, como se explicó, los nombres se han modificado automáticamente,
se ha eliminado los caracteres extraños y también los espacios en blanco, por otro lado al
observar la ventana vista de variables se muestra los atributos de cada variable, se debe resaltar
que estos atributos son asignados automáticamente y se debe proceder a editar manualmente
de acuerdo a las especificaciones requeridas, también se resalta que el Atributo Etiqueta es
rellenada automáticamente por SPSS cuando se modifica el nombre de la variable, es decir
cuando SPSS elimina un carácter cualquiera que sea del nombre original, este nombre original
lo asigna inmediatamente al Atributo Etiqueta.
Luego de observar y preparar los datos en STATA recién podemos proceder a la importación de
estos datos en SPSS.
Una vez abierto el archivo se puede observar los datos importados en SPSS con las mismas
características que su archivo origen.
En esta ventana de variables podemos observar que SPSS importa las etiquetas, así como también
los valores, en general se observan todos los mismos atributos de las variables del archivo original.
3. Estadística Descriptiva con SPSS
La estadística es la ciencia que se encarga del tratamiento de datos, en este sentido se encarga de la
recolección, organización, presentación, análisis e interpretación de datos.
Las variables cualitativas miden una cualidad o característica en cada unidad experimental, estas
variables producen datos que se pueden clasificar de acuerdo con similitudes o diferencias de clase; a
menudo se denominan datos categóricos.
Al realizar estas acciones podremos observar la Figura: 2 en la cual se podrá seleccionar las
variables de las cuales se desea obtener el cuadro de frecuencias.
Figura: 3
Estadísticos Gráfico de sectores
Genero del
Encuestado Distrito
N Válidos 753 753
Perdidos 0 0
Tabla de frecuencia
La Figura: 4 es el resultado en el que se muestra las Tablas de Frecuencia de cada una de las
variables previamente seleccionadas, en las que se observan las frecuencias, los porcentajes, los
porcentajes válidos y los porcentajes acumulados, seguidamente a este resultado se muestran los
gráficos en sectores con la respectiva leyenda de cada una de las variables (Figura Nº 5), cabe
resaltar que estos resultados se observan en la ventana de resultados y se dan en forma consecutiva.
Los gráficos recomendables para variables cualitativas son los gráficos de sectores y los gráficos
de barras, en caso de variables cualitativas nominales con pocas categorías es recomendable el
grafico de sectores mientras que para variables cualitativas ordinales es preferible los gráficos de
barras.
SPSS tiene tres opciones de gráficos, la opción de generador de gráficos es la opción interactiva
más recomendable y dinámica, las otras dos opciones pueden realizan los mismos gráficos pero
de una manera diferente.
Generador de Gráficos
Figura: 8
Doble Click Para editar gráfico
Figura: 9
En la ventana de editor de gráficos se puede cambiar los colores, se puede incluir los valores para
cada parte del gráfico, se puede definir el tamaño del gráfico, gráficos a 3D, la profundidad del
gráfico, etc.
Si se desea realizar otro tipo de gráfico se puede elegir en la galería de gráficos de acuerdo a los
alas variables que se dispone y de acuerdo a los requerimientos del investigador, posteriormente
se podrá editar de acuerdo a las preferencias tal y como se ha descrito en esta parte.
Las variables cuantitativas miden una cantidad numérica en cada unidad experimental, para organizar,
resumir y presentar datos de variables cuantitativas se debe tener en cuenta que estadísticos se desea
presentar, en SPSS hay una gran cantidad de opciones para resumir este tipo de variables, para ello
debemos ingresar la opción: Analizar/Estadísticos Descriptivos/Descriptivos
En esta parte se puede resumir la media, la varianza, la desviación
típica, el rango, el error típico de la media, así como también
estadísticos de distribución tales como la curtosis, la asimetría, los
resultados se mostraran en la ventana de resultados de SPSS, para el
ejemplo se ha seleccionado la variable Edad y se ha pedido
estadísticos de media, desviación típica, valor máximo y mínimo y se
ha pedido estadísticos de distribución en esta caso curtosis.
De las variables cuantitativas también se puede obtener tablas de frecuencia, pero debido a que
estas pueden tener muchos valores, es difícil presentarlos en tablas de frecuencia simples, para ello
se debe de implementar tablas de Intervalos de frecuencia, para ello primero debemos de agrupar
la variable.
Segunda forma: Intervalos iguales, el usuario elegirá para ello la opción Crear puntos
de corte
Número de clases (c): Es para definir el número de clases que va a tener la tabla.
2𝑐 > 𝑛
ln(𝑛) ln(753)
𝑐> > > 9.5565
ln(2) ln(2)
Para el ejemplo se tiene n=753 datos, por lo tanto el número de clases debe de
ser mayor a 9.55 en este caso el número entero más cercano seria c=10.
Anchura (intervalo de frecuencia): el intervalo de frecuencia se halla con la
siguiente formula.
(𝑀𝑎𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜) (60 − 30)
𝐴𝑛𝑐ℎ𝑢𝑟𝑎 = = =3
#𝑐𝑙𝑎𝑠𝑒𝑠 10
Posición del primer punto de corte, es para definir la primera clase, en este caso
es número de mínimo más la anchura y la primera clase seria de 30 a 33
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛𝑑𝑒𝑝𝑟𝑖𝑚𝑒𝑟𝑝𝑢𝑛𝑡𝑜𝑑𝑒𝑐𝑜𝑟𝑡𝑒 = 𝑀í𝑛𝑖𝑚𝑜 + 3 = 30 + 3 = 33
𝑁ú𝑚𝑒𝑟𝑜𝑑𝑒𝑝𝑢𝑛𝑡𝑜𝑠𝑑𝑒𝑐𝑜𝑟𝑡𝑒 = #𝑐𝑙𝑎𝑠𝑒 − 1 = 10 − 1 = 9
Al introducir la anchura, la posición
del primer punto de corte y el número
de puntos de corte, se define 10 clases
con intervalos iguales, en este caso
comienza en 30 con un intervalo de
33, se debe notar que son intervalos
que incluyen los valores de los limites
(incluidos <=), esto es caso las
variables sean cuantitativas discretas,
pero cuando son datos continuos es
mejor escoger la opción excluidos (<).
Luego de definir los intervalos iguales
mediante este método se puede poner crear etiquetas para definir las etiquetas y luego
aceptar, se recuerda que se debe ingresar un nuevo nombre de variable para este caso se
pone Edadg2.