Sei sulla pagina 1di 75

CLASE 04 ESTADISTICA Y

PROBABILIDADES

MEDIDAS DE
DISPERSIÓN

Ing. William León Velásquez


wjleonv@yahoo.com
Las Medidas de Dispersión,
son indicadores de
variabilidad y cuya
importancia reside en la
necesidad de tomar
decisiones, basadas en
estadísticas básicas.

ING. WILLIAM LEON V.


2
DEFINICIÓN
Ejemplo:
 Se tiene una producción de franelas
y se sabe que semanalmente se
producen un promedio de 500
franelas, se puede decir que todos
los días se producen 100 franelas,
pero nada nos garantiza eso porque
podrían producirse en sólo dos días
250 franelas y el promedio semanal
nos daría idéntico,

ING. WILLIAM LEON V.


3
DEFINICIÓN
 Si adicionalmente se tiene una
Desviación Estándar de 5 franelas,
tendremos entonces una mejor
comprensión del proceso, pues
este último número nos indica que
semanalmente se producen entre
495 y 505 franelas, es decir, que
diariamente sí se deben producir
aproximadamente 100 franelas.

ING. WILLIAM LEON V.


4
DEFINICIÓN
La Dispersión se refiere a la
variabilidad entre los valores, es
decir, qué tan grandes son las
diferencias entre los valores.
La idea de dispersión se
relaciona con la mayor o menor
concentración de los datos en
torno a un valor central,
generalmente la media
aritmética.

ING. WILLIAM LEON V.


5
DEFINICIÓN
Ejemplos:

 Observe las dos figuras. La primera presenta una


distribución con datos más concentrados alrededor de su
promedio 400 que la otra figura con respecto a su
promedio 800, es decir la primera figura es una
distribución con menos dispersión.

ING. WILLIAM LEON V.


6
DEFINICIÓN
Ejemplos:

Las figuras siguientes muestran a tres


distribuciones con promedio 70, sin embargo
las tres difieren en cuanto a su variabilidad
alrededor de la media.

poca variabilidad alguna variabilidad gran variabilidad

ING. WILLIAM LEON V.


DEFINICIÓN 7
 Se tienen dos grupos de estudiantes que sometidos a
una prueba arrojaron los siguientes puntajes:
GRUPO A GRUPO B
Puntaje Nº Puntaje Nº
estudiantes estudiantes
9 2 11 5
10 4 12 10
11 6
13 5
13 4
Total 20
15 2
17 2
Total 20

ING. WILLIAM LEON V.


8
EJEMPLO
Al calcular el promedio aritmético para ambos
grupos se obtiene:

x A  x B  12

ING. WILLIAM LEON V.


9
EJEMPLO
Este resultado puede conducir a
conclusiones equivocadas cuando se
está comparando distribuciones, pues
se podría pensar que ambas secciones
son idénticas en su rendimiento,
siendo esto falso ya que observando
los datos se aprecia que la sección B es
más homogénea.
En este caso el promedio no tiene
suficiente grado de representatividad
por lo tanto poco podrá decirnos
acerca de los datos en estudio.
ING. WILLIAM LEON V.
10
EJEMPLO
Xi
Es necesario entonces calcular otras
medidas estadísticas para mostrar
cómo varían los datos alrededor del
promedio y esto se logra mediante las
medidas de dispersión.

ING. WILLIAM LEON V.


11
EJEMPLO
1.- Para evaluar la confiabilidad del promedio
que se está utilizando:
Una dispersión pequeña indica que los datos
se encuentran acumulados cercanamente,
alrededor de la medida de tendencia central
establecida.
Por tanto, la medida de tendencia central se considera
confiable o bastante representativa de los datos.
Por el contrario, una dispersión grande indica que la
medida escogida para representar los datos no es muy
confiable, es decir, no es muy representativa de los datos.
ING. WILLIAM LEON V.
12
Es necesario estudiar las medidas de dispersión:
2.- Para apreciar cuán dispersas están dos o más
distribuciones:
Para poder comparar dos distribuciones de
frecuencias entre sí, no sólo necesitamos la
medida de tendencia central, sino también la
dispersión entre las observaciones para no
elaborar conclusiones erróneas.
A mayor medida de dispersión  el grupo es
más heterogéneo.
A menor medida de dispersión  el grupo es
más homogéneo o uniforme.

ING. WILLIAM LEON V.


13
Es necesario estudiar las medidas de dispersión:
Cuantifican el grado de concentración o de
dispersión de los valores de la variable en
torno de un promedio de la distribución.

ING. WILLIAM LEON V.


14
MEDIDAS DE DISPERSIÓN ABSOLUTA
Principales medidas de dispersión absoluta:
Rango o Recorrido : R
Varianza : S2
Desviación Estándar : S

ING. WILLIAM LEON V.


15
MEDIDAS DE DISPERSIÓN ABSOLUTA
Es la diferencia entre los valores
máximo y mínimo de los datos.

R  Xmáx  Xmín
Esta medida es muy fácil de calcular sin
embargo no es muy recomendable
porque sólo toma en cuenta los valores
extremos, sin considerar los demás
valores.
ING. WILLIAM LEON V.
16
MEDIDAS DE DISPERSIÓN ABSOLUTA
Interpretación de Rango:
El Rango lo podremos interpretar
como la amplitud existente entre
una serie de datos, es decir,
mide cuán lejos está el valor más
pequeño y el valor más grande de
la muestra o población.

ING. WILLIAM LEON V.


17
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo

Se tiene una producción de franelas y


se sabe que diariamente se producen
un promedio de 500 franelas. Si un
día se produce un mínimo de 415
franelas y otro día se produce un
máximo de 573 franelas entonces el
RANGO de producción estará entre
158 franelas, es decir,
Podemos tener una producción de
158 franelas a partir del valor
mínimo.
ING. WILLIAM LEON V.
18
MEDIDAS DE DISPERSIÓN ABSOLUTA
ING. WILLIAM LEON V.
19
MEDIDAS DE DISPERSIÓN ABSOLUTA
 Es un valor numérico que
cuantifica el grado de dispersión
de los valores de una variable
respecto a su media aritmética.
 Es el promedio de los cuadrados
de las desviaciones de la variable
respecto a su media aritmética.

ING. WILLIAM LEON V.


20
MEDIDAS DE DISPERSIÓN ABSOLUTA
 M  Xi  x  
 2
VX 
 

ING. WILLIAM LEON V.


21
MEDIDAS DE DISPERSIÓN ABSOLUTA
Notación:

 S 2
:
Varianza muestral.

  2
: Varianza poblacional .

ING. WILLIAM LEON V.


22
MEDIDAS DE DISPERSIÓN ABSOLUTA
Nota:
 La varianza nunca es negativa.
Xi
 Cuando la variable toma un único
valor; es decir cuando es constante
entonces la varianza es cero.
 Mientras más se aproxima a cero,
más concentrados están los valores
de la serie alrededor de la media. Por
el contrario, mientras mayor sea la
varianza, más dispersos están.

ING. WILLIAM LEON V.


23
MEDIDAS DE DISPERSIÓN ABSOLUTA
 2
1 2   Xi 
V( x )   X  n   
n 1  i n  
  

ING. WILLIAM LEON V.


24
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

 Calcular e interpretar la varianza de los pesos de un grupo de


personas.

Los datos son los siguientes:


56 65 68 70 72 76 78 80

ING. WILLIAM LEON V.


25
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

 n=8 8 8 2
 X i  565  X i  40 329
i 1 i 1

2
2 1  565 
SX   40 329  8     60,84  61 kilos 2
7  8  

ING. WILLIAM LEON V.


26
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

En promedio los pesos del


grupo de personas, se alejan
con respecto al promedio
aritmético en
aproximadamente 61 kilos al
cuadrado.

ING. WILLIAM LEON V.


27
MEDIDAS DE DISPERSIÓN ABSOLUTA
a) Si n < 30 :

 k 2
  
  fi X i  
2 1 k 2  i 1  
SX    fi X i  n   
n  1 i 1  n  
   
   

ING. WILLIAM LEON V.


28
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:
29

1.- Calcular e interpretar la varianza para la


siguiente tabla de frecuencias.

Edad Nº de personas n = 20
Ii fi

4- 6 4
6 - 10 5
10 - 16 7  n < 30

16 - 20 3
20 - 30 1
Total n = 20

ING. WILLIAM LEON V.

MEDIDAS DE DISPERSIÓN ABSOLUTA


Ejemplo:

 2
  k  
  fi X i 
1 
2
1 k 2  i 1    230  
V(X )    fi X i  n    3200  20  
n  1 i 1  n   19    20  
   

   

V ( X ) = 29,21  29 años2
En promedio la edad de estas personas se aleja
con respecto a su promedio aritmético en
aproximadamente 29 años al cuadrado.

ING. WILLIAM LEON V.


30
MEDIDAS DE DISPERSIÓN ABSOLUTA
b) Si n  30 :

Usando frecuencias absolutas: Usando frecuencias relativas:

2
k 2  k 
 fi X i   fi X i 
 i 1  2
S2  i 1   
k  k 
n n S2  2
 hi X i    hi X i 
  i 1  i 1 
 

ING. WILLIAM LEON V.


31
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

Calcular e interpretar la varianza de la siguiente tabla.

Peso Nº de
Ii ingenieros
fi n = 40
50 - 60 6
60 - 70 8
 n > 30
70 - 80 10
80 - 90 9
90 -100 7
Total n = 40

ING. WILLIAM LEON V.


32
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

2
k 2  k 
 fi X i   fi X i  2
 i 1  236 400  3030 
S2  i 1         171,94
n n 40  40 
 
 

En promedio el peso de los ingenieros se aleja


con respecto al peso promedio en
aproximadamente 172 kilos al cuadrado.

ING. WILLIAM LEON V.


33
MEDIDAS DE DISPERSIÓN ABSOLUTA
Si una muestra de tamaño n se particiona en k
muestras de tamaño ni cada una con su
correspondiente promedio aritmético, x i y Si2 su
varianza
1 2 k

n1 n2 nk

x1 x2 xk
2 2
S1 S2 S k2

ING. WILLIAM LEON V.


34
MEDIDAS DE DISPERSIÓN ABSOLUTA
entonces la varianza para los k grupos juntos
se calcula mediante:
2
k  k 
 2 2
n i ( x i  Si ) 
  ni x i 

S2  i 1   i 1  donde
T n  n 
  k
 
 
n   ni
i 1

ING. WILLIAM LEON V.


35
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

 Se tienen tres grupos, de seis,


nueve y siete estudiantes
respectivamente. Si las notas
correspondientes a cada uno de
ellos son:

Grupo 1: 12 16 08 11 10 12
Grupo 2: 17 14 07 13 11 18 13 15 14
Grupo 3: 10 13 11 08 12 09 12

ING. WILLIAM LEON V.


36
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

 6 (11,5 2
 7,1)  9 (13,56 2  10,53 )  7 (10,712  3,24)
 12,09   8,89
2
S T2  i 1
22

S T = 2,98
En promedio las notas de los estudiantes de los tres grupos se alejan

con respecto al promedio total en aproximadamente 3 puntos.

ING. WILLIAM LEON V.


37
MEDIDAS DE DISPERSIÓN ABSOLUTA
Es la raíz cuadrada positiva de la
varianza y posee las mismas unidades
que la media aritmética, las cuales ya no
están elevadas al cuadrado como en la
varianza.

S  V ( X)
ING. WILLIAM LEON V.
38
MEDIDAS DE DISPERSIÓN ABSOLUTA
La desviación estándar o desviación típica
aparece para simplificar la interpretación de
la varianza.
Cuando calculamos la varianza, nos basamos
en datos elevados al cuadrado, por lo que, el
resultado obtenido debe interpretarse en
unidades al cuadrado;
por esta razón aparece la desviación estándar
como la raíz cuadrada de la variancia.

ING. WILLIAM LEON V.


39
MEDIDAS DE DISPERSIÓN ABSOLUTA
Interpretación de la Desviación
Estandar:
Es una medida de distancia promedio
de los valores observados a su
media. La distancia de cada valor a la
media se mide tomando el valor
absoluto de la diferencia entre ese
valor y la media, es decir, es la
distancia de cada dato respecto a su
promedio.

ING. WILLIAM LEON V.


40
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo :

 Si se tiene una producción de franelas


y sabemos que diariamente se
producen un promedio de 500
franelas, adicionalmente tenemos
también que la desviación es de 25
franelas, tendremos entonces una
mejor comprensión del proceso pues
este último número nos indica que
diariamente se producen entre 475 y
525 franelas

ING. WILLIAM LEON V.


41
MEDIDAS DE DISPERSIÓN ABSOLUTA
Distribuciones con igual promedio aritmético y
diferente desviación estándar

42
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:

1.- Si la desviación típica


del salario de los ingenieros
de sistemas es $1,000 y la
media aritmética es $3,000,
entonces los salarios de los
ingenieros fluctúan entre
$2,000 y $4,000 dólares.

43
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:

2.- Calcular la desviación


estándar de las notas obtenidas por
un grupo de alumnos del cuarto
ciclo de la Facultad de Ingeniería
Industrial de la UNMSM en la
primera evaluación de estadística.
12 07 14 11 16
18 09 14 10

44
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplos:

9 9 2
 n=9  X i  111  X i  1 467
i 1 i 1

Por lo tanto:

 2
1  111 
VX   1 467  9     12,25  SX  12,25  3,5 puntos
8   9  

45
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
 Nota:
 La varianza y la desviación estándar se
utilizan para comparar grupos cuya
variable está expresada en las mismas
unidades.

 Así, el grupo más homogéneo, más


uniforme o en el que la media aritmética
es más representativa será aquel en el
cual la varianza o la desviación estándar
es menor.

46
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

En varias semanas consecutivas,


los oficiales de policía, Martínez y
Castro levantaron las siguientes
infracciones por exceso de
velocidad:
Martínez : 31 38 42 32 39 26
Castro : 35 43 38 37 33 28 27

¿Cuál de los oficiales es más homogéneo con


respecto al número de infracciones?

47
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Ejemplo:

2 2
1  208   1  241  
S2  7 390  6     35,87 S2
C  8 489  7     31,95
M 6  7  
5  6   
 
Solución:
S2  S2
M
C

El oficial Castro es más homogéneo porque su


varianza es menor.

48
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
1. La desviación estándar será siempre un valor positivo o cero,
en el caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la
desviación estándar no varía.
3. Si todos los valores de la variable se multiplican por un
número la desviación estándar queda multiplicada por dicho
número.

49
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
4. Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones estándar se puede
calcular la desviación estándar total.
 Si todas las muestras tienen el mismo tamaño:

 Si las muestras tienen distinto tamaño:

50
ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
Tipificación. Valor Z

 La tipificación es el proceso de restar la media y dividir


entre su desviación típica a una variable X.
 De este modo se obtiene una nueva variable

 de media 0 y desviación estándar σ z = 1, que se


denomina variable tipificada.

51
ING. WILLIAM LEON V.
Tipificación. Valor Z

Esta nueva variable carece de unidades y permite


hacer comparables dos medidas que en un principio
no lo son, por aludir a conceptos diferentes.

 Ejemplo:
 Podemos preguntar si un elefante es
más grueso que una hormiga
determinada, cada uno en relación con
su población.

52
ING. WILLIAM LEON V.
Tipificación. Valor Z

También es aplicable al caso en que se quieran


comparar individuos semejantes de poblaciones
diferentes.
 Ejemplo: Comparar el nivel académico de dos estudiantes de
diferentes Universidades para la concesión de una beca de
estudios, en principio sería injusto concederla directamente al
que posea una nota media más elevada, ya que la dificultad
para conseguir una buena calificación puede ser mucho
mayor en un centro que en el otro, lo que limita las
posibilidades de uno de los estudiante y favorece al otro.

53
ING. WILLIAM LEON V.
Se quiere dar una beca a uno de dos estudiantes de
sistemas educativos diferentes. Se asignará al que
tenga mejor expediente académico.
 El estudiante A tiene una calificación de 8 en un sistema donde
la calificación de los alumnos se comporta como N(6,1).
 El estudiante B tiene una calificación de 80 en un sistema
donde la calificación de los alumnos se comporta como
N(70,10).
Solución
 No podemos comparar directamente 8 puntos de A frente a los
80 de B, pero como ambas poblaciones se comportan de modo
normal, podemos tipificar y observar las puntuaciones sobre
una distribución de referencia N(0,1)
Bioestadística. U. Málaga. 54
Tema 5: Modelos probabilísticos
xA   A 8  6
zA   2
A 1
xB   B 80  70
zB   1
B 10
Como ZA>ZB, podemos decir que el
porcentaje de compañeros del
mismo sistema de estudios que ha
superado en calificación el
estudiante A es mayor que el que ha
superado B.
Podríamos pensar en principio que
A es mejor candidato para la beca.

55
 La variancia y la desviación típica también
tienen sus limitaciones. Similar a la media
aritmética es vulnerable a la influencia de
casos extremos. Además, cuando las medias
aritméticas no son iguales o cuando las
unidades de medición son distintas, la
comparación de desviaciones típicas puede
no ser significativa.

ING. WILLIAM LEON V.


56
MEDIDAS DE DISPERSIÓN RELATIVA
Es la desviación estándar dividida
sobre la media aritmética
multiplicada por 100. El mismo nos
permite comparar desviaciones
típicas de variables con unidades de
medición distintas.
S
CV   100
x
El coeficiente de variación se
expresa en unidades independientes
de la naturaleza de la variable.

ING. WILLIAM LEON V.


57
MEDIDAS DE DISPERSIÓN RELATIVA
Interpretación del Coeficiente de
Variación:
El Coeficiente de Variación, mide la
variabilidad relativa a la Media.
Expresa la proporción de variabilidad
de una característica por cada unidad
de la Media.

ING. WILLIAM LEON V.


58
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo :

 Sabemos que la fábrica de textiles


produce 500 franelas diarias con
una desviación típica de más o
menos (±) 25 franelas, entonces, el
Coeficiente de Variación será
25/500 = 0,05, es decir, tenemos
una variación de 5% en la
producción diaria de franelas.

ING. WILLIAM LEON V.


59
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo :

ING. WILLIAM LEON V.


60
MEDIDAS DE DISPERSIÓN RELATIVA
 En la práctica, se acostumbra considerar que un
coeficiente de variación según la tabla.

Valor del coeficiente Interpretación del coeficiente


De variación (%) Variabilidad Estabilidad
Igual a cero Nula Muy alta
Mayor de 0 hasta 20 Baja Alta
Mayor de 20 hasta 60 Moderada Moderada
Mayor de 60hata 90 Alta Baja
Mayor de 90 Muy alta Nula

ING. WILLIAM LEON V.


61
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo:

 Se desea comparar los sueldos


de los trabajadores de dos
empresas A y B. Para tal efecto
se tienen los datos de la tabla
siguiente :

 ¿Se puede afirmar que los


sueldos de los trabajadores de la
empresa A son más uniformes?
¿Por qué?

ING. WILLIAM LEON V.


62
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo:

Empresa A Empresa B

Sueldos Nº Sueldos Nº
($) trabajadores ( S/.) trabajadores
380 10 600-650 7

410 9 650-700 9

450 12 700-750 14

480 8 750-800 6

500 7 800-850 4
ING. WILLIAM LEON V.
63
MEDIDAS DE DISPERSIÓN RELATIVA
Ejemplo:

x A  439,78 xB  713,75

S A  42,55 S
B
 59,67

42,55
CVA   100  9,68% CV  59,67  100  8,36%
439,78 A
713,75

 Por lo tanto, los sueldos de los trabajadores de la


empresa A no son más uniformes; sino los sueldos
de la empresa B porque presenta menor coeficiente
de variación.

ING. WILLIAM LEON V.


64
MEDIDAS DE DISPERSIÓN RELATIVA
MEDIDAS
DE
FORMA

Ing. William León Velásquez


ING. WILLIAM LEON V.
66
MEDIDAS DE FORMA
Una distribución es
asimétrica cuando sus
datos tienden a
agruparse hacia uno
de los extremos de la
distribución.
Cuando una curva es
asimétrica, tiene un
sesgo.

ING. WILLIAM LEON V.


67
MEDIDAS DE FORMA
El sesgo puede ser de dos tipos:
 Si los datos tienden a agruparse en las primeras
clases, se dice que el distribución tiene un sesgo
positivo o que es asimétrica positiva.
 Si los datos tienden a agruparse en las últimas
clases de la distribución, se dice que esta tiene
sesgo negativo o que es asimétrica negativa.

ING. WILLIAM LEON V.


68
MEDIDAS DE FORMA
Es una medida que se utiliza para evaluar el
sesgo de una distribución:
3 ( x  Me )
CA 
S

ING. WILLIAM LEON V.


69
MEDIDAS DE FORMA
Según es grado de asimetría una distribución
puede ser:

Simétrica Asimétrica positiva Asimétrica negativa


CA > 0 CA < 0
CA = 0

ING. WILLIAM LEON V.


70
MEDIDAS DE FORMA
Mide el grado de elevación o de agudeza de
una distribución comparada con la curva
normal.

ING. WILLIAM LEON V.


71
MEDIDAS DE FORMA
Según su grado de curtosis, una distribución puede
ser:

K=0 K > 0,263 K < 0,263

ING. WILLIAM LEON V.


72
MEDIDAS DE FORMA
Indica la deformación vertical de una
distribución de frecuencias.

Si K = 0,263  mesocúrtica.
P75  P25
K  Si K > 0,263  leptocúrtica.
2 ( P90  P10 )
Si K < 0,263  platicúrtica.

ING. WILLIAM LEON V.


73
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
74
MEDIDAS DE FORMA
ING. WILLIAM LEON V.
75
wjleonv@yahoo.com

Potrebbero piacerti anche