Sei sulla pagina 1di 10

MEDIAS DE DISPERSION

VARIANZA
■ La varianza es una medida de variabilidad que utiliza todos los datos.
■ Esta basada en la diferencia entre los valores de cada observación (xi) y la media. (x para una
muestra, m para una población).
■ La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media.
■ Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2.

2 ∑( xi −x ) 2
s =
n −1
CUANDO LOS DATOS SON AGRUPADOS
 Si el conjunto de DATOS ES UNA MUESTRA, la varianza es:

s 2
=
∑ f (X
i i − x)2
n −1
■ Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por σ 2.

2
∑ ( xi − µ ) 2
σ = σ2
N
CUANDO LOS DATOS SON AGRUPADOS
 Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es:

σ2 =
∑ fi ( X i − µ )2
N
DESVIACION ESTANDAR

■ La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza.


■ Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a
la media.
■ Si el conjunto de DATOS ES UNA MUESTRA, la desviación estándar se denota por s.

s = s2
■ Si el conjunto de DATOS ES UNA POBLACIÓN, la desviación estándar se denota por σ
(sigma).

σ = σ2
COEFICIENTE DE VARIACION

■ El coeficiente de variación indica que tan grande es la desviación estándar rn relación al


promedio.
Prof. Gabriel Matos
Estadística Aplicada.
■ Si un conjunto de datos es una muestra, el coeficiente de variación se calcula como sigue:
s
(100 )
x
■ Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue:

σ
(100 )
µ
 Mide la variación relativa de la variable con respecto a su promedio.
 Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud
de la desviación estándar en relación con la magnitud de la media
 Expresa a la variación de los datos como porcentaje de su promedio.

Las medidas de forma son:


 Sesgo
 Es el grado de asimetría que tiene la distribución
 Una curva insesgada tiene sesgo cero
 Medimos en cuánto se aleja la distribución de una insesgada:
 Si el polígono de frecuencias tiene la mayor acumulación a la izquierda, tiene sesgo
positivo o a la derecha.
 Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo
negativo o a la izquierda

Coeficiente de
Sesgo
Asimetría

No hay sesgo. La distribución


=0
es insesgada

La distribución tiene sesgo


>0
positivo o a la derecha.

La distribución tiene sesgo


<0
negativo o a la izquierda.

 Curtosis
 Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal.
 La distribución Normal se considera mesocúrtica, es el término medio.
 Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas
 Las distribuciones menos puntiagudas que la Normal se conocen como
platocúrticas

Prof. Gabriel Matos


Estadística Aplicada.
Leptocúrtica

Mesocúrtica

P latocúrtica

Función Curtosis Curtosis

=3 Mesocúrtica

>3 Leptocúrtica

<3 Platocúrtica

TEOREMA DE CHEBYSHEV

Al menos (1 - 1/k2) de los elementos en un conjunto de datos estará dentro de las k desviaciones
estándar del promedio donde k es cualquier valor mayor que 1.
• Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la
media.
• Al menos 89% de los elementos deben estar entre
k = 3 desviaciones estándar de la media.
Al menos 94% de los elementos deben estar entre
k = 4 desviaciones estándar de la media.

Cualquiera que sea la forma de la distribución de los datos:


 al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto
de la media de la distribución:
( X ± 2S)
 al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto
de la media de la distribución:
( X ± 3S)
1) EJEMPLO RESUELTO

Prof. Gabriel Matos


Estadística Aplicada.
El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales
características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda,
varianza y desviación típica.
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se
dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo.
Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez
60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmética de la distribución.

Sx2=

La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 días
El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
CV = 20,67/52,3 = 0,39
2) EJEMPLO
El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25,
29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras
y el diagrama de caja.
SOLUCIÓN:
(Utilizar la calculadora de debajo)

Prof. Gabriel Matos


Estadística Aplicada.
3) EJERCICIO RESUELTO

Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que
son consumidos en promedio al día por un conjunto de 20 encuestados.

2 4 10 6 0 4 1 0 3 6

10 2 4 2 3 2 5 5 8 0

x=
∑x i
=
77
= 3.85
La media es igual a n 20

a continuación reportamos la tabla de la diferencia de cuadrados


( xi − x ) 2 :

3.4225 0.0225 37.8225 4.6225 14.8225 0.0225 8.1225 14.8225 0.7225 4.6225
Prof. Gabriel Matos
Estadística Aplicada.
37.8225 3.4225 0.0225 3.4225 0.7225 3.4225 1.3225 1.3225 17.2225 14.8225

∑( x − x)
2
i 171.83
S 2
= = = 8.5915
Por lo que n 20

por lo para determinar la desviación estándar basta con obtener la raíz cuadrada, con lo que finalmente la
desviación estándar es igual a:

S = 0.6554 cigarros.

4) EJERCICIO RESUELTO

A continuación se le dan los resultados de una evaluación de Química aplicada a un grupo de alumnos
de 9no grado. Encuentre: a) la Media Aritmética (Promedio) b)la Varianza c) la Desviación Típica

9 14 18 20 13 14
11 10 10 15 9 15
12 11 10 19 12 12
15 16 12 7 13 13
17 16 14 15 17 11

PASO 1: Sume todos los valores y divida entre el número de sumandos:


X = 400 / 30= 13,333...

INTERVALO
PASO A REALIZAR
DE CLASE
2) Elabore una
Distribución Agrupada
18 - 20
de frecuencias con
15 – 17
una amplitud de 3
12 - 14
(por ejemplo) para
9 - 11
cada intervalo.
6-8

INTERVALO
PASO A REALIZAR Xi
DE CLASE
18 - 20 19
3) Agregue la 15 – 17 16
columna de la 12 – 14 13
marca de clase 9 - 11 10
6-8 7

INTERVALO
PASO A REALIZAR Xi fi
DE CLASE
4) Agregue la 18 - 20 19 3

Prof. Gabriel Matos


Estadística Aplicada.
15 – 17 16 8
columna de las 12 – 14 13 10
frecuencias y efectúe 9 - 11 10 7
la sumatoria 6-8 7 2
∑ = 30

INTERVALO
PASO A REALIZAR Xi fi Xi*fi
DE CLASE
5) Calculemos la 18 - 20 19 3 57
Media
15 – 17 16 8 128
Aritmética. Revisa la
lección 12 – 14 13 10 130
correspondiente a 9 - 11 10 7 70
Media aritmética de 6-8 7 2 14
datos
agrupados ∑ = 30 399

X = 399 / 30= 13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...)
Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmética:

INTERVALO
PASO A REALIZAR Xi fi Xi*fi fi*(x – xi)2
DE CLASE
18 - 20 19 3 57 97,47
15 – 17 16 8 128 58,32
6) Construyamos 12 – 14 13 10 130 0,9
la columna fi*(x – xi)2 9 - 11 10 7 70 76,23
6-8 7 2 14 79,38
∑ = 30 399 312,3

Dividamos la sumatoria de esta última columna entre la sumatoria de fi: s2 = 312,3/30


La Varianza vale s2 = 10,41; Para la Desviación Típica (s), sacamos la raíz cuadrada de la varianza: La
Desviación Típica vale s = 3,2265

EJERCICIOS MEDIDAS DE DISPERSIÓN PARA RESOLVER

1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver
inconsistencias en los formularios de la declaración de la Renta.

Intervalo Fi
40 - 45 7
45 – 50 10
50 - 55 15
55 - 60 13
60 - 65 18
Prof. Gabriel Matos
Estadística Aplicada.
65 - 70 21
70 - 75 16
75 - 80 10

a) Calcule el tiempo medio que se demoran los fiscalizadores.


b) Calcule la varianza de los tiempos y su desviación típica.
c) Se implementa un software que promete reducir en un 25% los tiempos de las declaraciones.
¿Cuál es el nuevo promedio y la nueva varianza de los tiempos?

1) La varianza de dos números es 1 y su media aritmética es 8. Calcule los números.

2) En una empresa donde los salarios por hora tienen una media de $70 y una desviación estándar de
$15, el sindicato solicita que cada salario xi se transforme en yi mediante la siguiente relación.

yi = 1,3xi + 10

El directorio acoge parcialmente la petición, rebajando los salarios resultantes yi en un 10%, lo que es
aceptado por el sindicato. Se pide calcular la media aritmética y la varianza de la distribución final de
los salarios.

6) La siguiente distribución, corresponde a las notas finales obtenidas por un curso de 30 personas en
un curso de estadística:

Xi Fi
1 3
2 6
3 7
4 7
5 3
6 0
7 4
Calcule:
a) Varianza, desviación estándar y coeficiente de dispersión de las notas
b) Cuantifique la simetría en la distribución de las notas

8) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes:

Ingresos Fi Fabac
200-250 2
250-300
300-350 12 22
350-400 29
400-450 34
450-500 4
500-550

a) Coloque las cifras que faltan


Prof. Gabriel Matos
Estadística Aplicada.
b) Calcule la media aritmética de los ingresos.

12) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas

4,0 3 4,3 3,1 3,9 4,5 4,8 3,6 2,1 4,5


3,0 2,7 4,5 3,4 4,2 2,5 1,9 4,3 3,6 1,1

a) Determine la media y la mediana de las notas del curso (3,45 pts.; 3,6pts)
b) El profesor considera que las notas son demasiado bajas y por ello propone elevarlas mediante
la siguiente función:
y i = 1,2 xi + 0,5

Determine el nuevo promedio de notas: (4,64 pts.)

13) La siguiente tabla muestra el salario de 100 trabajadores en miles de pesos

SALARIO Fi
100 – 110 8
110 – 120 22
120 – 130 40
130 – 140 18
140 - 150 12

a) Calcule el salario promedio de los trabajadores.


b) Calcule la varianza de los salarios
c) Si la empresa donde trabaja, les ofrece un aumento de remuneraciones que permitirán a ellos
$10.000 más o un aumento del 10%
d) Recalcule la varianza en razón a los aumentos expuestos

14) La siguiente tabla muestra la distribución de las edades según el sexo de los trabajadores de una
empresa

HOMBRE MUJER
EDAD
21 – 25 2 3
25 – 35 53 60
35 – 45 60 37
45 - 60 25 18

a) Calcule el promedio ponderado del hombre y la mujer


b) Calcule la varianza y desviación estándar de ambos

15) En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15 estudiantes
mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad media de la clase?

Prof. Gabriel Matos


Estadística Aplicada.
16) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que
ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿Cómo están
relacionadas las medias?

17) El retraso en la entrega de los últimos 100 pedidos de material informático en una empresa se ha
agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución:

• El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y una
amplitud de 4 días.
• En el segundo intervalo se acumulan 60 entregas retrasadas.
• Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente.
• El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 días.

a) Construya la tabla de distribución de frecuencia del tiempo de retraso en las entregas.


b) ¿Cuál es el tiempo medio de demora en las entregas?
c) Calcular la mediana, moda, varianza, desviación estándar, el coeficiente de variación
d) ¿Entre qué valores se encuentra el 50% central del tiempo de retraso en las entregas?
e) Si descontamos el 15% del tiempo de retraso menos en las entregas y el 15% del tiempo de
retraso máximo en las entregas. ¿ En qué intervalo de puntuaciones se encuentran los
restantes?

Prof. Gabriel Matos


Estadística Aplicada.