Sei sulla pagina 1di 39

Medidas Descriptivas de las Variables

Cuantitativas

PROFESOR: PROSPERO CELSO BENITES GRADOS


MEDIDAS DE TENDENCIA CENTRAL

• LA MEDIA
• MEDIANA
• MODA
• PERCENTILES
MEDIA DATOS SIN AGRUPAR

MEDIA DATOS DE LA POBLACION x i


 i 1
N

MEDIA DATOS DE LA MUESTRA n

x i
6, 4, 4, 1, 5, 3, 2, 6, 8, 5, 2. x i 1
n
PARA DATOS AGRUPADOS DE VARIABLE DISCRETA

Si los datos están ordenados con una tabla de


frecuencia tenemos:

variable fi DATOS AGRUPADOS


xi f1
k
: :
x f i i
: : x i 1
n
xk fk
Ejemplo: Calcule la media aritmética en la tabla siguiente:

Número de Número de
habitaciones Viviendas
1 3
2 4
3 7
4 10
5 2
Total 26
PARA DATOS AGRUPADOS POR INTERVALOS

m i fi
x i 1
n

• m1, m2, ……, mk son las marcas de clase.


• f1, f2, ……, fk son las frecuencias absolutas respectivas
Ejemplo: Calcule la media aritmética en la tabla siguiente:

INTERVALOS mi fi Fi
[15 – 19> 17 5 5
[19 – 23> 21 5 10
[23 – 27> 25 13 23
[27 – 31> 29 4 27
[31 – 35> 33 2 29
[35 – 39] 37 1 30
n = 30
LA MEDIANA

Definición: La mediana (Me) o valor mediano de una


serie de valores observados, es el número que separa
a la serie de datos ordenados (en forma creciente o
decreciente) en dos partes de igual número de datos.
La mediana es la medida promedio que depende del
número de orden de los datos.
CALCULO DE LA MEDIANA

PARA DATOS NO AGRUPADOS

Para realizar el cálculo de la mediana de n valores no agrupados


de una variable cuantitativa X se siguen los siguientes pasos:

1. Se ordenan los datos en forma creciente.


2. Luego, se ubica el valor central Me.
Si n es impar, la mediana es el dato ordenado del centro.
Pero si n es par, la mediana es la semisuma de los dos
valores ordenados centrales.
Ejemplo
Supongamos que tenemos las edades (en años) de 11
abogados antiguos que sufren de Hipertensión.

51, 52, 47, 30, 69, 29, 40, 86, 77, 36, 80.

Hallar la mediana de la edad de los abogados que


sufren de hipertensión.
PARA DATOS AGRUPADOS INTERVALOS

n 
2  F i 1 
Me  L I  A 
 f i 
 

Donde:

L I : Limite inferior del intervalo de la mediana.

A : Amplitud del intervalo de la mediana.


Fi 1 : Frecuencia acumulada anterior a la clase mediana.
fi : Frecuencia simple de la clase mediana.
Ejemplo: Calcule la mediana en la tabla siguiente:

INTERVALOS mi fi Fi
[15 – 19> 17 5 5
[19 – 23> 21 5 10
[23 – 27> 25 13 23
[27 – 31> 29 4 27
[31 – 35> 33 2 29
[35 – 39] 37 1 30
n = 30
LA MODA

Definición: La moda de una serie de datos es el


valor Mo que se define como el dato que ocurre
con mayor frecuencia.
La moda no siempre existe y si existe, no siempre
es única. La moda es el promedio menos
importante debido a su ambigüedad.
Ejemplo Se realizo una encuesta a 12 estudiantes del
doctorado de la UCV, sobre el número de hijos y se
obtuvo las siguientes respuestas:

Número Número de
de hijos estudiantes Hallar la moda.
1 1
2 3
3 5
4 3
Total 12
MODA PARA DATOS AGRUPADOS EN INTERVALOS

Se determina frecuencia (fi ) mas alta, y utilizar esa fila, es


donde ese intervalo contiene a la Mo. Este intervalo se
denomina intervalo modal Luego se aplica la formula:

d1
Mo = Li + ( )A
d1 +d2

Li = Limite inferior del intervalo modal


A = Valor de la amplitud de los intervalos
𝑑1 = 𝑓𝑖 - 𝑓𝑖−1
𝑑2 = 𝑓𝑖 - 𝑓𝑖+1
Ejemplo: Calcule la moda en la tabla siguiente:

INTERVALOS mi fi Fi
[15 – 19> 17 5 5
[19 – 23> 21 5 10
[23 – 27> 25 13 23
[27 – 31> 29 4 27
[31 – 35> 33 2 29
[35 – 39] 37 1 30
n = 30
PERCENTILES
Son medidas de posición que dividen el total de observaciones
en 100 partes iguales, la formula para calcular percentiles es:

 nk 
  Fi 1 
Pk  L I  A 100 
Donde:  fi 
k  1,2,...., 99.  
 
L I : es el limite inferior del intervalo de la mediana.
A : es la amplitud del intervalo de la mediana.
Fi 1 : es la frecuencia acumulada anterior a la clase mediana.
f i : es la frecuencia simple de la clase mediana.
Ejercicio
Supongamos que tenemos los puntajes de 50 alumnos en
una prueba de 100 preguntas. Determinar el P25, P50, P75 .

Número de
Puntajes
alumnos
[20 -30) 3
[30-40) 6
[40-50) 7
[50-60) 14
[60-70) 7
[70-80) 7
[80-90) 3
[90-100] 3
Total 50
MEDIDAS DE DISPERSIÓN
Indican si las puntuaciones son muy parecidas o muy distintas entre sí.

Las siguientes distribuciones tienen todas una media de 4. ¿Qué las diferencia?
• 7, 6, 3, 3, 1
• 3, 4, 4, 5, 4
• 4, 4, 4, 4, 4

Existen dos procedimientos:

1. Considerar el recorrido o amplitud de la escala en la que se distribuyen las


puntuaciones;
2. Describir la variación por medio de las diferencias que se producen entre
todas las puntuaciones y un índice de tendencia central.
¿En que se diferencian con las medidas de tendencia central?
Mientras las medidas de tendencia central nos indican dónde
se concentra un grupo de puntuaciones, las medidas de
dispersión refieren a la homogeneidad / heterogeneidad de
una distribución.
¿Cómo se relacionan con las medidas de tendencia central?
- Son complementarias.
- Para calcular las medidas de dispersión es necesario
conocer los valores de otras medidas. (media aritmetica)
- Ambos tipos de medidas son necesarias para la descripción
de una distribución.
MEDIDAS DE DISPERSIÓN
La medidas de dispersión o variabilidad son números reales
que miden el grado o nivel de separación de los datos con
respecto a un valor central, que generalmente es la media
aritmética.
Las principales medidas de dispersión son:
 El rango
 La varianza.
 La desviación estándar y
 El coeficiente de variación.
EL RANGO

El rango de variación o recorrido, denotado


por R es el número que resulta de la
diferencia del valor máximo menos el valor
mínimo de una serie de datos observados.
R = Valor máximo – Valor mínimo
Ejemplo:
De la siguiente serie de datos, hallar el rango:
6, 4, 4, 1, 5, 3, 2, 6, 8, 5, 2.
LA VARIANZA

Es una medida de dispersión que, en promedio, cuantifica el


nivel de dispersión o de variabilidad de los valores de una
variable cuantitativa con respecto a su media aritmética.
Denotación:
2
Varianza Muestral s

Varianza Poblacional 2

DESVIACIÓN ESTÁNDAR

Es la raíz cuadrada positiva de la varianza.

s s 2
  2
Varianza para datos no agrupados:
n

 (x
n

 (x  ) 2
i  x) 2
i

s 
2 i 1 2  i 1

n 1 N

Desviación Estándar datos no agrupados


n

 i
n

 ( x  x) i
2 ( x   ) 2

s i 1  i 1

n 1 N
Ejemplo:

Hallar la varianza y desviación estándar de los


siguientes datos muestrales:

2, 6, 8, 10, 3, 5, 4, 8.
Varianza para datos agrupados variable discreta
K

 i
K

 ( x  x)   2
i
2
fi ( x ) fi
s 
2 i 1  
2 i 1

n 1 N

Desviación Estándar para datos agrupados variable discreta


K

 (x  )
K

 ( x  x) 2 2
i fi i fi
s i 1
 i 1

n 1 N
Ejemplo:
De los siguientes datos, hallar la varianza y
desviación estándar.

Nº hijos por
fi
familia
0 1
1 4
2 7
3 6
4 2
Total 20
Varianza para datos agrupados por intervalos
K

 i
K

 (m  x)   2
i
2
fi ( m ) fi
s 
2 i 1  
2 i 1

n 1 N

Desviación Estándar para datos agrupados por intervalos


K

 i
K

 (m  x)  
2 2
i fi ( m ) fi
s i 1
 i 1
n 1 N
Ejemplo: Calcule la varianza y desviación estándar en
la tabla siguiente:

INTERVALOS mi fi Fi
[15 – 19> 17 5 5
[19 – 23> 21 5 10
[23 – 27> 25 13 23
[27 – 31> 29 4 27
[31 – 35> 33 2 29
[35 – 39] 37 1 30
n = 30
Coeficiente de Variación

Se denota por CV, y es una medida de dispersión relativa, que se


define como el cociente de la desviación estándar entre la media
aritmética. Esto es:

s
CV   100
x

El coeficiente o índice de variación se utiliza para comparar la


variabilidad de dos o más series de datos que tengan medias iguales
o diferentes o que tengan unidades de medida iguales o diferentes.
Ejemplo:
Un estudio sobre el monto de bonos pagados y los años de
servicio empleados, dio como resultado los siguientes datos
estadísticos: la media de los bonos pagados fue $200
(dólares), y la desviación estándar fue $40. La media del
numero de años de servicio fue 20 años, y la desviación
estándar 2 años. Compare las dispersiones relativas de las
dos distribuciones empleando el coeficiente de variación.
Solución:
Las distribuciones están en unidades diferentes (dólares y años de servicio).
Por lo tanto se convierten en coeficiente de variación.

Para los bonos Para los años de servicio


𝑆 𝑆
CV = (100) CV = (100)
𝑋 𝑋
𝑋 = 200 𝑋= 20
S = 40 S=2
40 2
CV = (100) = 20% CV = (100) = 10%
200 20

Al interpretar se puede ver que existe mayor dispersión relativa con


respecto a la media en la distribución de los bonos pagados en comparación
con la distribución de los años de servicio (porque 20% > 10%).
Ejemplo:
Se va ha comparar la variación en los ingresos anuales de varios ejecutivos con
la variación de los ingresos de trabajadores no calificados. En una muestra de
ejecutivos la media es $500000 y S = $50000: Para una muestra de empleados
no calificados la media es $32000 y S = $3200 uno se ve tentado a afirmar que
hay mayor dispersión en los ingresos anuales de los ejecutivos porque $50000
> $3200, sin embargo la medias son tan distantes que se necesitan convertir
los valores estadísticos a coeficiente de variación para poder efectuar una
comparación significativa de los variaciones en los ingresos anuales.

Para los ejecutivos Para los trabajadores no calificados


CV = S/X (100) CV = S/X (100)
CV = 50000/500000(100) = 10% CV = 3200/32000(100) = 10%

No existe diferencia en la dispersión relativa de los dos grupos


Ejemplo

Se ha evaluado a 3 obreros para saber su rapidez en la


fabricación de un artículo, sus resultados en segundos se
presentan en la siguiente tabla. Mediante el C.V. indicar
que obrero tiene mejor rendimiento

Obrero1 Obrero2 Obrero3


61.8 60.8 61.4
61.9 60.7 61.2
63.2 62.9 63.3
63.8 62.8 61.0
Ejercicio 1

Calcule las medidas de tendencia central y de dispersión

Numero de Número de
Hijos Familias
0 1
1 4
2 7
3 6
4 2
Total 20
Ejercicio 2
Supongamos que tenemos las edades de 50 presos del penal
Cambio Puente.

Número de
Puntajes
presos
[20 -30) 3 Encuentre todas las
[30-40) 6
[40-50) 7 medidas de tendencia
[50-60) 14 central y de dispersión
[60-70) 7
[70-80) 7
[80-90) 3
[90-100] 3
Total 50
Ejercicio 3

Consideremos el peso de 21 estudiantes de la escuela de


postgrado. Según la siguiente distribución de frecuencias:

Peso Número de
[Li-LS) estudiantes
50-55 4
Encuentre todas las
55-60 3 medidas de tendencia
60-65 2 central y de dispersión
65-70 4
70-75 6
75-80 2
TOTAL 21
Ejercicio 4

Consideremos el peso de 21 estudiantes de la escuela de


postgrado. Según la siguiente distribución de frecuencias:

Peso Número de
[Li-LS) estudiantes
Encuentre todas las
50-55 4
medidas de tendencia
55-60 3
60-65 2
central y de dispersión
65-70 4
70-75 6
75-80 2
TOTAL 21
Ejercicio 5

los siguientes datos muéstrales sobre el pago de servicio


por cliente en un estudio de abogados.

Pago de servicios
# de clientes
(S/.)
[260-340) 1
Encuentre todas las
[340-420) 2
medidas de tendencia
[420-500) 4 central y de dispersión
[500-580) 10
[580-660) 16
[660-740) 8
[740-820) 4

Potrebbero piacerti anche