Sei sulla pagina 1di 56

Tema

5
PROMEDIOS
Un motivo para hacer sospechar
que la Estadstica es ms un arte
que una ciencia, gira en torno a la
ambigedad con que se usa el
trmino promedio.
OBJETIVOS

Al finalizar la Tema 5, el participante ser capaz de:

1. Diferenciar los diversos tipos de medidas de


resumen que se pueden aplicar a un conjunto de
datos

2. Calcular e interpretar las principales medidas de


tendencia central
CONTENIDO
1. La estadstica de resumen
2. Propiedades de la sumatoria
3. Principales medidas de tendencia central
3.1 Medias
3.2 Mediana
3.3 Moda
3.4 Cuartiles
3.5 Percentiles
5.1 La estadstica de resumen
Despus de construir tablas y grficos, a partir
de una coleccin de datos, se requieren medidas
ms exactas.
La estadstica de resumen, proporciona medidas
para describir un conjunto de datos.
Existen tres tipos de medidas de resumen:
De tendencia central.
De dispersin.
De la forma de la distribucin.
(A) Las medidas de tendencia central
Se refieren al punto medio de una distribucin
Se conocen como medidas de posicin
Ejemplo: A partir del grfico siguiente, se observa que
la posicin central de la curva B est a la derecha de la
posicin central de las curvas A y C. Observese que la
posicin central de la curva A es la misma que la curva
C.
(B) Las medidas de dispersin
1.Se refieren a la extensin o amplitud de los datos
de una distribucin
2.Representan el grado de variabilidad de los datos.
Ejemplo: Observe que la curva A en el siguiente
grfico tiene una mayor dispersin que la curva
B, a pesar que la posicin central es la misma.
(C) Las medidas de la forma de la curva
Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a) Simetra b) Curtsis

Las curvas simtricas, tienen una forma tal que con


una lnea vertical que pase por el punto ms alto de
la curva, dividir el rea de esta en dos partes
iguales.
Las curvas sesgadas son aquellas cuyos valores
estn concentrados en el extremo inferior o superior
de la escala de medicin del eje horizontal. La
cola indica el tipo de sesgo.
Cuando medimos la curtsis nos referimos al grado de
agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).
5.2 Propiedades de la sumatoria
1ra Regla: La suma de los n trminos de una serie
constante, es igual a n veces la constante.
n

c
i 1
i nc

Ejemplo:
C = 10, n=3
3

c = 10 + 10 + 10 =
i 1
3 (10) = 30
2da Regla: La suma de los productos de una constante
por una variable, es igual a la constante multiplicada
por la suma de la variable.
n n

cx
i 1
i c x i
i 1

Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

cx
i 1
i
5(2) + 5(4) + 5(6) = 60
3ra Regla: La suma de los valores de una variable ms una
constante es igual a la suma de los valores de la variable
ms n veces esa constante.
n n
(x i c) x i nc
1
i 1
i

Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

(x i c) (5 + 2) + (3 + 2) + (2 + 2) = 16
i 1

= (5 + 3 + 2) + 3(2) = 16
5.3 Las medidas de tendencia central
1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la moda.
Aritmtica
Media Geomtrica
Medidas de Mediana Armnica
tendencia central Moda

3. Tambin es til conocer los percentiles (o fractiles).


POR QU SON IMPORTANTES LAS MEDIDAS
DE TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos
muestran una tendencia a agruparse alrededor de
un dato central.
Las medidas de tendencia central son puntos en
una distribucin, los valores medios o centrales
de sta y nos ayudan a ubicarla dentro de la
escala de medicin.
5.3.1 La Media
(A) La media aritmtica ( x )
a) Obtencin: Se obtiene sumando los valores
registrados y dividindolos entre el nmero
de datos.
Ejemplo:
La siguiente tabla muestra el nmero de
reclamos y quejas presentadas por pacientes en
el Servicio de Emergencias a lo largo de una
semana. Calcule e interprete la media.
Da/Semana Lun Mar Mier Jue Vier Sab
Reclamos/da 8 10 5 12 10 15
8 10 5 12 10 15 60
Media aritmtica =
6 6
x = 10 reclamos
b) Interpretacin: Si elige al azar un da de la
semana, se espera que los pacientes del servicio de
emergencia realicen 10 reclamos en ese da.
c) Simbologa:
Tamao Media aritmtica
x
Muestra n (equis barra)
Poblacin N (mu)
d) Clculos a partir de datos no agrupados, se
utilizan las siguientes formulas.
Para una muestra
n donde: x : media muestral
x
Xi
i 1 X : suma de todos los datos
i
n n
Para una poblacin : nmero de datos (muestra)
N
donde: : media poblacional
Xi X i : suma de todos los datos
i 1 N : nmero de datos (poblacin)
N
Se puede calcular la media aritmtica utilizando Excel.

Media
aritmetica
e) Clculo a partir de datos agrupados.
El clculo de la media aritmtica, cuando los datos
disponibles se encuentran en tablas de
distribucin de frecuencias, se realiza utilizando
n
la formula siguiente fi Xi
x i 1n
fi
i 1

donde: x :media muestral


fi
:frecuencia absoluta de la clase i
Xi :marca de la clase i
Ejemplo:
La distribucin de frecuencias siguiente, representa los
puntajes obtenidos en una evaluacin del desempeo,
aplicado al personal tcnico de un Centro de Salud. El
puntaje mximo en la prueba es 50. Calcule e interprete en
media. Desempeo Nmero de
(puntos) tcnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularn las marcas de clase ( Xi);
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase x
clase ( i) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60

x
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) x 1575
4 + 8 + 15 + 23 + 10 60
x 26.25
Interpretacin: Si se elige al azar a un trabajador tcnico de
este hospital, se espera que tenga un puntaje de 26,25 en su
evaluacin de desempeo.

f) La media aritmtica ponderada ( x p )


donde:
n

w X i i wi = factor de ponderacin
xp i 1
n

w
i 1
i X i = datos
Ejemplo: Una empresa comercializadora de Seguros
Mdicos dispone de 3 representantes para la zona de
Miraflores, cada uno de los cuales cobra diferente comisin
por pliza vendida, y realiza diferente nmero de contratos.
Calcule e interprete el valor medio de la comisin

N de polizas de Comisin
Vendedor Seguro Mdico por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
30(30) 25(40) 20(50) 2900
xp $38.67
30 25 20 75

Interpretacin:

Si se elige al azar un representante se espera que cobre


una comisin de $38.67 por pliza vendida.
g)Ventajas y desventajas de la media aritmtica
Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no estn
agrupados, su clculo es tedioso
Si los datos estn agrupados en clases con
extremos abiertos, no es posible calcular la
media.
xg (
(B) La media geomtrica )
Se utiliza para calcular tasas medias de variacin,
como la tasa media de crecimiento poblacional, la
tasa media de inflacin mensual, la tasa media de
mortalidad, entre otros.

a) Obtencin Se obtiene extrayendo la raz ensima


del producto de los n valores de una serie.

xg n X1 X2 X3 .........Xn
Ejemplo:
La siguiente tabla muestra la tasa de aumento en las quejas
durante los ltimos meses. Calcule e interprete la tasa media
mensual.
Meses Enero Febrero Marzo Abril Mayo
Aumento de
2.6% 5.4% 3.8% 0.5% 1.4%
quejas

La tasa 2,6% tambin se puede expresar como 0,026 , y


puesto que se refiere a un aumento a partir de una base
de 100%, el factor de variacin ser 1,026. Para los
otros datos se opera igual.
b) Clculos

Por lo tanto, la media geomtrica se calcula:


x g n x1, x 2, x3,......x
x g 5 (1.026) (1.054) (1.038) (1.005)(1.014)
x g 5 1.143903377
x g 1,0272540 ( Factorde crecim iento m edio)

Tasa media
= (x g 1) 100
de variacin
= (1,0272540 - 1) x 100 = 2,72%

c) Interpretacin

Si se selecciona al azar un mes entre enero y


mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.
xh (
(C) La media armnica )
Se utiliza para calcular el tiempo medio, velocidad
y aceleracin media, como por ejemplo, el tiempo
medio para realizar determinada ciruga.
a) Obtencin: se obtiene calculando el inverso de la
media aritmtica de los inversos de una serie.

1
xh n 1

i 1
X
i
n
Ejemplo:
Los siguientes datos registran el tiempo que utilizan cuatro
mdicos al realizar una cierta intervencin quirrgica.
Calcule e interprete el tiempo medio.
Mdico A B C D
Tiempo
45 38 52 40
(minutos)

Conocer el tiempo medio permite contar con una


herramienta til en la planeacin de los recursos,
como la Sala de Operaciones. Adems de poder
comparar nuestro desempeo con los estndares
de calidad internacionales.
4 4
xh 1 1 1 1

1976 2340 1710 2223

45 38 52 40 88920

4 88920
xh 43.117953 minutos
8249

xh 43 minutos 7 segundos

b) Interpretacin:

Si se selecciona al azar a uno de los cuatro


mdicos, se espera que realice este tipo de ciruga
en 43 minutos aproximadamente.
5.3.2 La Mediana
Es la medida que divide en dos subconjuntos
iguales a datos, de tal manera que 50% de los datos
es menor a la mediana y el otro 50% es mayor a la
mediana.

a) Obtencin: Se obtiene ordenando la serie de


datos (en forma ascendente o descendente) y
ubicando el dato central.
Ejemplo:
Los siguientes datos se refieren al nmero de pacientes
que llegaron a su cita, despus de la hora programada
durante los ltimos 11 das en el Servicio de Pediatra.
Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:


5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores 5 datos mayores
mediana
b) Interpretacin: Durante 5 das llegaron menos de 11
pacientes tarde a su cita y durante 5 das, ms de 11
pacientes llegaron tarde a su cita.

c) Reglas

1 Si la serie es impar, la mediana ocupa el lugar


central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24


2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18 23
mediana 20.5
2

3 Sea la serie par o impar, la mediana ocupa el lugar


n 1previamente
,de la serie ordenada.

2
d) Clculo a partir de datos agrupados.
n 1
2 F 1
Md Li c
f Md
donde:
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : nmero total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase
Ejemplo: La tabla siguiente muestra la experiencia laboral
(aos) del personal de seguridad que labora en un gran
hospital. Calcule e interprete la mediana.
Lugar de la mediana:
Experiencia Nmero de n 1 69 1
laboral trabajadores 35o
(aos) de seguridad 2 2
69 1 (16)
0-3 4
4-7 12
Clase Md 7,5 2 4
8 - 11 24 24
Mediana
12 - 15 16
16 - 19 10
7 ,5
35 16 4
20 - 23 3
69
24
Mediana = 10,5 aos
Interpretacin:

La mitad del personal de seguridad que


labora en este hospital tienen una experiencia
laboral igual o menor a 10 aos 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 aos y
6 meses.
e) Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana
como en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
5.3.3 La Moda
La moda es el valor que ms se repite dentro de un
conjunto de datos.
a) Obtencin: se obtiene organizando la serie de datos
y seleccionando el o los datos que ms se repiten.

Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38


b) Clculo a partir de datos agrupados
1
Mo L c

donde: i
1 2
Mo : moda
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
1
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturacin durante un mes, en una Clnica. Calcule e
interprete la moda.
Errores de
facturacin Das
0-3 6
6
1
Clase
Clase moda : (4 - 7)
4-7 12
Modal
6
8 - 11 8 4 Mo 3.5 4
12 - 15 3
2
64
16 - 19 1
Total 30 Mo = 5,9
Interpretacin: Durante un mes, el nmero ms frecuente de
errores de facturacin en esta clnica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos
como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
ms clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin
amodal).
En otros casos la distribucin tiene varias modas,
lo que dificulta su interpretacin.
5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos

a) Clculo: para datos agrupados.

100

Kn F 1
i
P L c
K i f
P
K

donde:
P : percentil
K
K : el percentil buscado
n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el percentil K
f
P : frecuencia absoluta de la clase donde se ubica
K
el percentil K
c : amplitud de clase
Ejemplo:
La tabla muestra la experiencia (en aos) de las
enfermeras de un gran centro hospitalario

Experiencia Trabajadores
(aos)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
Sobre qu edad se ubica el 25% de las enfermeras de
mayor experiencia?

75 % 25 %

P75
Menor Mayor
Experiencia Experiencia
K = 75

Kn 75(334)
Lugar del P75 250,5o (de los nmeros ordenados )
100 100

Para saber en cul clase se halla este dato, se


calcul la frecuencia acumulativa.
Experiencia N Trabajadores Frec. Acumulada
(aos) fi Fi
0-3 18 18
4-7 42 60 F=248
8 - 11 68 128
12 - 15 120 248 En esta clase
16 - 19 40 288 se localizan del
20 - 23 34 322 249 - 288
24 - 27 12 334
334

75(334) 248 1
100 P 15.65 aos
P 15 .5 4
75 40 75

Interpretacin: Para que una enfermera est
comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das.
Hoja de Comprobacin
1. El valor de cada observacin del conjunto de datos se toma en cuenta
cuando calculamos su mediana
2. Cuando la poblacin esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posicin, debido a
que siempre cae entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones estn dispersas

4. Una medida de la agudeza de una curva de distribucin es el sesgo

5. Con un conjunto de datos no agrupados, la moda se utiliza con mas


frecuencia como medida de tendencia central
6. Si organizamos las observaciones de un conjunto de datos en orden
descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una
media aproximada si suponemos que cada valor de una clase dada es igual a
su punto medio

8. El valor que ms se repite en un conjunto de datos se conoce como media


aritmtica

9.Para un arreglo de datos con 50 observaciones, la mediana ser el valor de la


observacin numero 25 del arreglo

10.La desviacin estndar se mide en las mismas unidades que las


observaciones del conjunto de datos

11.La varianza indica la distancia promedio de cualquier observacin del


conjunto de datos con respecto a la media
12. Si la curva de una cierta distribucin tiene el extremo mas largo
hacia la izquierda de la escala de medicin del eje horizontal, se
dice que la distribucin esta negativamente sesgada
13.Despus de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero de
observaciones

14.Una media calculada a partir de un conjunto de datos agrupados siempre da


una buena estimacin del valor real, aunque rara vez es exacto

15.Podemos calcular una media para cualquier conjunto de datos, si se nos da su


distribucin de frecuencias

16.La moda siempre se encuentra en el punto mas alto de una grfica de un


arreglo de datos

17. El numero de elementos de una poblacin se denota con n


18.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

19.La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como media geomtrica

20.La dispersin de un conjunto de datos da una cierta visin de la confiabilidad


de la medida de tendencia central

21.La desviacin estndar es igual a la raz cuadrada de la varianza

22. .La diferencia entre las observaciones mas alta y mas baja de un conjunto de
datos se conoce como el alcance cuartil

23. El alcance intercuartil esta basado solamente en dos valores tomados del
conjunto de datos
24.Un fractil es una posicin en una distribucin de frecuencias en la
que una determinada fraccin (o porcin) de los datos esta situada
en ella o por encima
25.La varianza, al igual que la desviacin estndar, toma en cuenta cada
una de las observaciones del conjunto de datos

26. .El coeficiente de variacin es una medida absoluta de la dispersin

27. La medida de dispersin que con mas frecuencia utilizan los


especialistas en estadstica es la desviacin estndar
28.Una de las ventajas de las medidas de dispersin es que cualquier
estadstica que mide variacin absoluta, tambin mide variacin relativa
29. Una desventajas de utilizar el alcance para medir la dispersin es que no
toma en cuenta la naturaleza de las variaciones entre la mayora de las
observaciones
30. Cada poblacin tiene una varianza que se simboliza con S2

31.De acuerdo con el teorema de Chebyshev, no mas de 11% de las


observaciones de una poblacin puede tener resultados estndar de la
poblacin mayores que 3 o menores que -3

32.El alcance intercuartil es un ejemplo especifico de un alcance interfractil

33.Es posible medir el alcance de una distribucin de extremo abierto

34.El alcance intercuartil mide el alcance promedio de la cuarta parte ms


baja de una distribucin.
Algunas personas
suean con
alcanzar grandes logros...
mientras que otros
permanecen despiertos
y los realizan!

Potrebbero piacerti anche