Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Contenido
Objetivo: ............................................................................................. 3
Contenidos: ......................................................................................... 3
1. Tablas de frecuencias .................................................................... 3
2. Estadsticos ................................................................................. 6
2.1
2.2
2.3
2.4
3.2
Pgina | 2
REPORTES DE FRECUENCIAS
Objetivo:
Al finalizar el curso de SPSS, usted estara en capacidad de
Generar reportes y tablas de estadstica descriptiva sin
construirlos en una hoja electrnica.
Contenidos:
1. Tablas de frecuencias
2. Estadsticos
3. Representacin grfica de variables
1. Tablas de frecuencias
Una de las formas ms simples de resumir la informacin de un conjunto de
datos es por medio de una tabla de frecuencias, que consiste en calcular para
cada valor de una variable el nmero (frecuencia) de casos en que aparece.
Una tabla de frecuencias debe indicar el nombre de la variable en su
encabezamiento, los valores que toma la variable, la frecuencia de cada uno
de ellos y la suma de todas las frecuencias, que coincidir con el nmero
total de casos vlidos. Tambin es aconsejable calcular las frecuencias
relativas, o proporciones, que resultan al dividir cada frecuencia por su suma
total. SPSS genera tablas de frecuencias de forma automtica. En primer
lugar necesitamos abrir un banco de datos, por ejemplo el del archivo
ambiente.sav,
y
con
el
men
Analizar/Estadsticos
descriptivos/Frecuencias se puede obtener la tabla de frecuencias
asociada a cualquiera de las variables. La tabla para la variable ozono
obtenida por SPSS es la siguiente:
Pgina | 3
Pgina | 4
Frecuencias
Estadsticos
Gas ozono por zonas
Vlidos
15
N
Perdidos
Vlidos
Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
normal
46,7
46,7
46,7
alto
53,3
53,3
100,0
15
100,0
100,0
Total
La tabla nos indica que hay 15 casos vlidos y ninguno perdido, que la
variable ozono tiene dos valores posibles Normal y Alto (en realidad son las
etiquetas asociadas a los valores 0 y 1, respectivamente). Hay 7 casos
(46,7%) en los que ozono toma el valor Normal y 8 (53,3%) el valor Alto.
Ejercicio 1
Los puntos del 1 al 3 guardar los resultados en un archivo llamado
Ejercicio 1, que le servir para la nota de la semana 2 cuando lo
suba a la plataforma, el punto 4 lo debe presentar su anlisis en el
foro inquietudes.
1. Ordena los datos por la variable ozono con la opcin: Datos/Ordenar
casos o haciendo clic con el botn derecho del ratn sobre el nombre de
la variable y comprueba que las frecuencias anteriores son correctas,
volviendo a generar la opcin frecuencias.
2. Obtener la tabla de frecuencias de la variable provin.
3. Obtener la tabla de frecuencias de la variable sulfato.
4.
Pgina | 5
2. Estadsticos
Los estadsticos son valores calculados con los datos de una variable
cuantitativa y que miden alguna de las caractersticas de la distribucin
muestral. Las principales caractersticas son: tendencia central, posicin,
dispersin, asimetra y apuntamiento.
2.1
Medidas de posicin
Describe cmo se encuentra el resto de la muestra con respecto a
ella.
2.1.1 Medidas de Centralizacin:
media es la suma de todas las observaciones dividida por el
tamao de la muestra.
mediana es el valor que divide a la muestra ordenada en
dos mitades con el mismo nmero de datos.
media recortada es una media calculada despus de
eliminar algunos datos extremos. Es ms robusta que la
media pues no tiene en cuenta los valores atpicos.
moda es el dato que posee la mayor frecuencia. En caso de
empates pueden darse varias modas.
2.1.2 Otras medidas de posicin.
Los cuartiles Q1,Q2 y Q3, son tres valores que dividen a la
distribucin en cuatro partes iguales. El primer cuartil tiene
un 25% de casos menores o iguales que dicho valor; el
segundo cuartil coincide con la mediana y el tercer cuartil
deja un 25% de valores superiores o iguales a l. Para
obtenerlos, se calcula primero las posiciones de los cuartiles
p(Q1) y p(Q3) y a partir de ellas se extraen los valores
correspondientes. Las posiciones del primer y tercer cuartil
(el segundo coincide con la mediana) son: p(Q1)=(n+1)/4 y
p(Q3)=3(n+1)/4. Obtenidas las posiciones, si son enteras, se
buscan los valores que las ocupan en la muestra ordenada.
Pgina | 6
2.2
Medidas de dispersin
Las ms utilizadas son:
2.3
2.4
Medidas de apuntamiento
Indican el nivel de concentracin de los datos respecto de su
media. Si el nivel de concentracin es alto, la distribucin es de
forma puntiaguda y se llama leptocrtica, tendremos en este caso
colas ms cortas que en una distribucin normal. Si las colas son
ms largas que en una distribucin normal y por tanto con menos
valores en el centro, la distribucin es ms achatada y se llama
platicrtica. En el caso intermedio, se utiliza el trmino
mesocrtica.
El grado de apuntamiento, o curtosis, se puede medir por el
momento de orden 4 dividido por la desviacin tpica elevada a 4.
El cociente anterior se corrige de forma que la distribucin normal
para este estadstico da el valor cero, restndole tres unidades.
Para
obtener
los
estadsticos
con
SPSS
se
usa
el
men
Analizar/Estadsticos
descriptivos/Descriptivos
donde
hay
que
seleccionar la variable o variables de inters y despus Opciones para
escoger los estadsticos que interesan. Sin embargo con este men no se
pueden obtener los percentiles. Para obtenerlos hay que usar
Analizar/Estadsticos descriptivos/Frecuencias y entrar en la opcin
Estadsticos en donde se seleccionan los percentiles deseados.
Por ejemplo con la variable sulfato debemos usar Analizar/Estadsticos
descriptivos/Frecuencias y entrar en la opcin Estadsticos:
Pgina | 8
Pgina | 9
Pgina | 10
Pgina | 11
15
N
Perdidos
Media
3,125580
Mediana
2,925800
Moda
,4614
Desv. tp.
2,1521373
Varianza
4,632
Asimetra
,918
,580
Curtosis
,495
1,121
Rango
7,1515
Mnimo
,4614
Mximo
7,6129
Suma
Percentiles
46,8837
25
1,178700
50
2,925800
75
3,824500
Pgina | 12
Ejercicio 2
Descargar del siguiente link el archivo comprimido de SPSS
http://www.inec.gob.ec/estadisticas/index.php?option=com_remository&Itemid=&f
unc=startdown&id=1249&lang=es&TB_iframe=true&height=250&width=800
Pgina | 13
3.1
Pgina | 14
Grficos de sectores.
Un grfico de sectores consiste en un crculo dividido en sectores de
tamao proporcional a la frecuencia de cada valor de la variable. Se
utilizan cuando hay pocos valores que representar (mximo de 7).
Pgina | 15
Pgina | 16
Y el resultado es:
Pgina | 17
Pgina | 19
Pgina | 20
Pgina | 21
Pgina | 22
Pgina | 23
Pgina | 24
Pgina | 25
Y el resultado es:
Pgina | 26
3.2
Histogramas
Pgina | 27
Pgina | 28
Y el resultado es:
Pgina | 29
Diagramas de caja
Pgina | 30
Pgina | 31
Y el resultado es el siguiente:
Pgina | 32
Aqu, cada provincia est representada por una caja que muestra
los niveles de ph. Se puede observar diferencias en cuanto la
situacin de la mediana y a la dispersin. Por ejemplo, se observa
que en Valencia los niveles de ph., son superiores a los de
Castelln y que presentan una ligera mayor dispersin. Los casos
extremos si los hay se representan por smbolos especiales a cuyo
lado aparece el nmero de caso.
Pgina | 33
Ejercicio 3
CON EL ARCHIVO p1coches.sav que se encuentra en ARCHIVOS DE
PRCTICA 2
Pgina | 34