Sei sulla pagina 1di 10

10

11
11
13
14
14
15 COMO VALIDAR EL SUPUESTO DE
15 NORMALIDAD?
15
15
Métodos:
16
16
1. Pruebas gráficas
16
1.1 Histograma
17
1.2 Boxplot, Tallo y Hojas
17
1.3 Q-Q Plot (gráfico de probabilidad normal)
17
18
2. Uso de las medidas de forma y apuntamiento: Coeficiente de
18
Asimetría y Coeficiente de curtosis
18
19 3. Pruebas de Bondad de Ajuste (prueba estadística, en unas
19 cuantas clases mas!)
19
20
20 1.1 Histograma
20
21 Adicionalmente, los coeficientes de Asimetría y Curtosis aportan
21 información complementaria a la inspección visual del histograma.
21
22 Ejercicio 1: Realice uno a uno los pasos para realizar un histograma al
22 siguiente conjunto de datos. Una vez construido análice el gráfico
23 utilizando herramientas de estadística descriptiva.
23
23
24 Edades de las Personas que Asisten a Cine &%&
26
26 Muestra de datos
26
27
29
30
30
31
32
32
33
33
34
34
35
35
36
37
37 1
37
39
40
_______________________________________________________________
Recordemos ……
Un histograma es un resumen gráfico de la variación de un conjunto de datos. La
naturaleza gráfica del histograma nos permite ver pautas que son difíciles de observar
en una simple tabla numérica. Esta herramienta se utiliza especialmente en la
búsqueda de un modelo de distribución de probabilidades para una variable.

Cómo interpretar los histogramas:


Sabemos que los valores varían en todo conjunto de datos. Esta variación sigue cierta
pauta. El propósito del análisis de un histograma es, por un lado, identificar y clasificar
la pauta de variación, y por otro desarrollar una explicación razonable y relevante de la
pauta. La explicación debe basarse en los conocimientos generales y en la observación
de las situaciones específicas y debe ser confirmada mediante un análisis adicional. Las
características de variación más comunes son en la distribución de los datos es: si hay
forma de campana, simetría, con dos picos, plana, sesgada, truncada, con un pico
aislado, o con un pico en el extremo.

Construcción de un histograma:

PASO 1

Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor;
Rango=Máximo-Mínimo

PASO 2

Obtener en número de clases, existen varios criterios para determinar el número de


clases ( o barras). Sin embargo ninguno de ellos es exacto. Algunos autores
recomiendan de cinco a quince clases, dependiendo de como estén los datos y cuántos
sean. Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos, por ejemplo, la raíz
cuadrada de 66 ( número de artículos) es 8.12, por lo que se seleccionan ocho clases.

2
PASO 3

Establecer la longitud de clase o Incremento: es igual al rango entre el número de


clases.

PASO 4

Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos
en relación al resultado del PASO 2 en intervalos iguales.

PASO 5

3
Graficar el histograma: se hace un gráfico de barras, las bases de las barras son los
intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos
medios de la base

VARIACIONES:

1. En el eje y puede ir las frecuencias absolutas o las relativas o también se puede


utilizar una escala de densidad que se consigue haciendo:

Area (rectágulo) = Base * Altura

Frecuencia Relativa Incremento

Altura (densidad) = Frecuencia Relativa / base

La ventaja es que histogramas construidos en esta forma son comparables ya que las
Áreas siempre suman 1.

Calculos en Excel:

Frec. Rel.
Intervalo de clase Frecuencia Frec. Relativa Acum. Densidad
10 15,5 10 0,151515152 0,151515152 0,02754821
15,5 21 18 0,272727273 0,424242424 0,04958678
21 26,5 9 0,136363636 0,560606061 0,02479339
26,5 32 7 0,106060606 0,666666667 0,01928375
32 37,5 10 0,151515152 0,818181818 0,02754821
37,5 43 7 0,106060606 0,924242424 0,01928375
43 48,5 3 0,045454545 0,96969697 0,00826446
48,5 54 2 0,03030303 1 0,00550964
Suma 66

NOTA: A MENUDO VEREMOS OTRAS FORMAS DE PRESENTAR UN HISTOGRAMA

4
Polígonos de frecuencia:
El polígono de frecuencias es una representación gráfica de la distribución de
frecuencias que resulta esencialmente equivalente al histograma y se obtiene uniendo
mediante segmentos los centros de las bases superiores de los rectángulos del
histograma (es decir, los puntos de las marcas de clase).

5
Ojiva:
La misma idea de unir los centros de las bases superiores de los rectángulos de la
distribución del histograma de frecuencias acumuladas, da lugar al polígono de
frecuencias acumuladas u ojiva.

1.2 Boxplot (ya fue estudiado)

1.3 Realizar un Q-Q plot

Los gráficos de probabilidad normal constituyen otra importante herramienta gráfica


para comprobar si un conjunto de datos puede considerarse o no procedente de una
distribución normal. La idea básica consiste en enfrentar, en un mismo gráfico, los
datos que han sido observados frente a los datos teóricos que se obtendrían de una
distribución gaussiana. Si la distribución de la variable coincide con la normal, los
puntos se concentrarán en torno a una línea recta, aunque conviene tener en cuenta
que siempre tenderá a observarse mayor variabilidad en los extremos.

Ejercicio: 1. Utilice los datos los datos de las personas que asisten al cine para ilustrar
paso a paso como construir un gráfico de este tipo.

La esencia del gráfico es la siguiente comparación:

6
Para hallar Nível de probabilidad haga
(j-1/2)/n Así enNivel
Dato el caso
dede Cuantil en
j=1 se hace (1-1/2)/66= 0.0075
J Observado Probabilidad N(26,11)
1 10 0.0075 0.116
2 11 0.0227
Para hallar el cuantiles teóricos 4.83
3 utilizamos
11 la
0.0378distribución
, es decir aproximamos la
65 51 y la desviación
media 0.9772estándar con los
76 valores
54 muestrales.
0.9772

DISTR.NORM.ESTAND.INV.
Luego graficar en Excel Nivel de Probabilidad vs Cuantil en N (o en la escala de la
variable. Ejemplo: en la escala de la variable Edad, que sería una normal con media
26.84 y desviación estándar 11 el nivel de probabilidad 0.0075 es acumulado por
0.1162, el nível 0.0227 por 4.83 , etc.)

7
Gráfico con los dos ejes en escala estandarizada

En SPSS sólo debe entrar la variable no tabular nada.

Gráfico Q-Q Normal de EDAD

60

50
Valor Normal esperado

40

30

20

10

0
0 10 20 30 40 50 60

Valor observado

Interpretación:
Los gráficos Q-Q se obtienen representando los cuantiles respecto a los cuantiles de la
distribución normal. Además de permitir valorar la desviación de la normalidad, los
gráficos de probabilidad permiten conocer la causa de esa desviación, así Una curva en
forma de "U" o con alguna curvatura, significa que la distribución es asimétrica con
respecto a la gaussiana, mientras que un gráfico en forma de "S" significará que la
distribución tiene colas mayores o menores que la normal, esto es, que existen pocas
o demasiadas observaciones en las colas de la distribución.

¿Qué podemos decir del comportamiento de la variable edad a la luz del QQ plot
producido en SPSS?

8
1.2 Construir otros gráficos como Boxplot o tallo y hojas y analizar características
como simetría, número de modas, sesgos, vacíos en la distribución, presencia de
valores extremos.

2 Medidas de forma y apuntamiento: punto para el taller.

3 Realizar una prueba de Bondad de Ajuste (PRUEBAS ESTADISTICAS)

Muchos de los resultados teóricos y prácticos de la estadística paramétrica descansan


en la distribución normal. El investigar si una muestra aleatoria de tamaño n proviene
de una distribución normal resulta de interés, y de hecho existen muchas pruebas
estadísticas al respecto entre las que destacan las siguientes:
 Prueba de Smirnov Kolmogorov, descansa en los desvíos de la distribución
teórica y empírica.
 Prueba de Karl Pearson, basada en la distribución chi cuadrada y que
corresponde a una prueba de bondad de ajuste.
 Prueba de Cramer-Von Mises, es útil para pequeñas muestras y usa los
momentos como criterio.
 Prueba de Gram-Charlier, usa la distribución de mismo nombre para inferir si la
muestra es normal.
 Prueba de Jarque y Bera, utiliza un estadístico en prueba que involucra la
curtosis y la asimetría.
 Prueba de R.C. Geary, usa los cumulantes muestrales y sus medias y
desviaciones estándar.
 Otras, como la de Shapiro- Wilk y aquéllas basadas en métodos numéricos.
 Prueba de Bondad de ajuste (chi-cuadrado)

Ejercicio 2: Realice prueba de normalidad a los datos de las edades utilizando SPSS .

Allí debe utilizar la secuencia Analizar, Estadísticos Descriptivos, Explorar, en el cuadro


de diálogo seleccionar la variable y luego al dar clic en el botón Gráficos activar la
opción Gráficos con pruebas de normalidad.

9
Sálida de SPSS: además de los gráficos aparece esta tabla

Pruebas de normalidad

Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Precio ,192 42 ,000 ,849 42 ,000
a Corrección de la significación de Lilliefors

10

Potrebbero piacerti anche