Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
11
11
13
14
14
15 COMO VALIDAR EL SUPUESTO DE
15 NORMALIDAD?
15
15
Métodos:
16
16
1. Pruebas gráficas
16
1.1 Histograma
17
1.2 Boxplot, Tallo y Hojas
17
1.3 Q-Q Plot (gráfico de probabilidad normal)
17
18
2. Uso de las medidas de forma y apuntamiento: Coeficiente de
18
Asimetría y Coeficiente de curtosis
18
19 3. Pruebas de Bondad de Ajuste (prueba estadística, en unas
19 cuantas clases mas!)
19
20
20 1.1 Histograma
20
21 Adicionalmente, los coeficientes de Asimetría y Curtosis aportan
21 información complementaria a la inspección visual del histograma.
21
22 Ejercicio 1: Realice uno a uno los pasos para realizar un histograma al
22 siguiente conjunto de datos. Una vez construido análice el gráfico
23 utilizando herramientas de estadística descriptiva.
23
23
24 Edades de las Personas que Asisten a Cine &%&
26
26 Muestra de datos
26
27
29
30
30
31
32
32
33
33
34
34
35
35
36
37
37 1
37
39
40
_______________________________________________________________
Recordemos ……
Un histograma es un resumen gráfico de la variación de un conjunto de datos. La
naturaleza gráfica del histograma nos permite ver pautas que son difíciles de observar
en una simple tabla numérica. Esta herramienta se utiliza especialmente en la
búsqueda de un modelo de distribución de probabilidades para una variable.
Construcción de un histograma:
PASO 1
Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor;
Rango=Máximo-Mínimo
PASO 2
2
PASO 3
PASO 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos
en relación al resultado del PASO 2 en intervalos iguales.
PASO 5
3
Graficar el histograma: se hace un gráfico de barras, las bases de las barras son los
intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos
medios de la base
VARIACIONES:
La ventaja es que histogramas construidos en esta forma son comparables ya que las
Áreas siempre suman 1.
Calculos en Excel:
Frec. Rel.
Intervalo de clase Frecuencia Frec. Relativa Acum. Densidad
10 15,5 10 0,151515152 0,151515152 0,02754821
15,5 21 18 0,272727273 0,424242424 0,04958678
21 26,5 9 0,136363636 0,560606061 0,02479339
26,5 32 7 0,106060606 0,666666667 0,01928375
32 37,5 10 0,151515152 0,818181818 0,02754821
37,5 43 7 0,106060606 0,924242424 0,01928375
43 48,5 3 0,045454545 0,96969697 0,00826446
48,5 54 2 0,03030303 1 0,00550964
Suma 66
4
Polígonos de frecuencia:
El polígono de frecuencias es una representación gráfica de la distribución de
frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo
mediante segmentos los centros de las bases superiores de los rectángulos del
histograma (es decir, los puntos de las marcas de clase).
5
Ojiva:
La misma idea de unir los centros de las bases superiores de los rectángulos de la
distribución del histograma de frecuencias acumuladas, da lugar al polígono de
frecuencias acumuladas u ojiva.
Ejercicio: 1. Utilice los datos los datos de las personas que asisten al cine para ilustrar
paso a paso como construir un gráfico de este tipo.
6
Para hallar Nível de probabilidad haga
(j-1/2)/n Así enNivel
Dato el caso
dede Cuantil en
j=1 se hace (1-1/2)/66= 0.0075
J Observado Probabilidad N(26,11)
1 10 0.0075 0.116
2 11 0.0227
Para hallar el cuantiles teóricos 4.83
3 utilizamos
11 la
0.0378distribución
, es decir aproximamos la
65 51 y la desviación
media 0.9772estándar con los
76 valores
54 muestrales.
0.9772
DISTR.NORM.ESTAND.INV.
Luego graficar en Excel Nivel de Probabilidad vs Cuantil en N (o en la escala de la
variable. Ejemplo: en la escala de la variable Edad, que sería una normal con media
26.84 y desviación estándar 11 el nivel de probabilidad 0.0075 es acumulado por
0.1162, el nível 0.0227 por 4.83 , etc.)
7
Gráfico con los dos ejes en escala estandarizada
60
50
Valor Normal esperado
40
30
20
10
0
0 10 20 30 40 50 60
Valor observado
Interpretación:
Los gráficos Q-Q se obtienen representando los cuantiles respecto a los cuantiles de la
distribución normal. Además de permitir valorar la desviación de la normalidad, los
gráficos de probabilidad permiten conocer la causa de esa desviación, así Una curva en
forma de "U" o con alguna curvatura, significa que la distribución es asimétrica con
respecto a la gaussiana, mientras que un gráfico en forma de "S" significará que la
distribución tiene colas mayores o menores que la normal, esto es, que existen pocas
o demasiadas observaciones en las colas de la distribución.
¿Qué podemos decir del comportamiento de la variable edad a la luz del QQ plot
producido en SPSS?
8
1.2 Construir otros gráficos como Boxplot o tallo y hojas y analizar características
como simetría, número de modas, sesgos, vacíos en la distribución, presencia de
valores extremos.
Ejercicio 2: Realice prueba de normalidad a los datos de las edades utilizando SPSS .
9
Sálida de SPSS: además de los gráficos aparece esta tabla
Pruebas de normalidad
Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Precio ,192 42 ,000 ,849 42 ,000
a Corrección de la significación de Lilliefors
10