Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICA DESCRIPTIVA
E INFERENCIAL I
COLEG IO DE
BACHILLERES
Colaboradores
Asesora Pedaggica
Revisin de Contenido
Diseo Editorial
Leonel Bello Cuevas
Javier Daro Cruz Ortiz
NDICE
INTRODUCCIN
PROPSITO
CUESTIONAMIENTO GUA
7
9
11
12
12
1.1.1 Moda
13
1.1.2 La Mediana
16
1.1.3 La Media
19
22
25
27
1.1.7 Rango
27
28
1.1.9 La varianza
41
44
45
51
51
1.2.2 Momentos
53
56
1.2.4 Sesgo
57
RECAPITULACIN
61
ACTIVIDADES DE CONSOLIDACIN
62
AUTOEVALUACIN
63
BIBLIOGRAFA CONSULTADA
66
INTRODUCCIN
PROPSITO
CUESTIONAMIENTO GUA
Seguramente has escuchado en los medios de informacin, noticias como las siguientes:
-
El sueldo promedio de los trabajadores de una empresa est por arriba del salario
mnimo.
10
LE BOUTIQUE DE
MADAME LAGUSSI
Figura 1
El sexo femenino suele vestir muy a la moda y esto se refleja en las ventas del mes de
mayo en la cada de modas de Madame Lagussi.
M. Lagussi al hacer un balance obtuvo los siguientes resultados:
VENTAS DEL MES DE MAYO
Tipo de vestido
Suare
Corte de Princesa
Traje de Novia
Short
Maternidad
Bermudas
Minifaldas
10
Traje sastre
Vestido de cocktel
3
11
De acuerdo con esta informacin, Qu tipo de ropa crees que est de moda?
En toda actividad humana se presentan muchos problemas que se pueden analizar y
estudiar en forma sistemtica y lgica.
El estudio de estos problemas nos permiten tomar decisiones acertadas que nos
conducen a lograr metas importantes de progreso.
La informacin que se obtiene de un determinado problema en estudio como el dell
ejemplo anterior, se resume mediante adecuadas descripciones estadsticas que
llamamos:
CAPTULO 1
MEDIDAS DE TENDENCIA CENTRAL
1.1 MEDIDAS DESCRIPTIVAS, MEDIDAS DE TENDENCIA CENTRAL O
DE POSICIN
Las medidas descriptivas que estudiaremos en este fascculo son de dos tipos:
a) Medidas de Tendencia Central o de Posicin y
b) Medidas de Dispersin o de Variacin.
Medidas de Tendencia Central o de Posicin.
Las medidas de tendencia central describen las caractersticas bsicas de un conjunto
de datos. Son medidas representativas del conjunto y generalmente se resume mediante
un valor numrico que ndica la variacin entre stos.
Las medidas de tendencia central son:
a)
b)
c)
La Moda (Mo)
La Mediana (Me)
La Media aritmtica (X )
En este ejemplo, el tipo de ropa con mayor frecuencia de venta es la minifalda, porque la
frecuencia f = 10 es la mayor. En este caso denotamos Mo = minifalda.
Esta variable aleatoria describe una cualidad como en nuestro ejemplo (minifalda); pero
tambin describe una cantidad representada por un valor numrico, como ya veremos.
1.1.1 Moda
La Moda (Mo) de un conjunto de datos es el valor (o cualidad) de la
variable aleatoria que aparece con mayor frecuencia.
Ejemplos:
1. En la conferencia que se llev a cabo en el hotel Mara Isabel Sheraton para altos
ejecutivos, cuyo tema fue: El tratado de libre comercio; la asistencia fue la siguiente:
Da
No. de personas
20
15
16
16
18
16
25
Lunes
Martes
Mircoles
Jueves
Viernes
Sbado
Domingo
a)
b)
c)
d)
R.
a)
b)
c)
d)
13
Nm. de jugador
Recorrido en km.
Martes
Mircoles
Jueves
Viernes
Sbado
Domingo
150
200
180
200
275
200
300
a)
b)
R.
a) El da de moda en ventas fue el domingo porque la frecuencia en ventas es la mayor
de todas, Mo = domingo.
b) La moda en ventas es Mo = 200 porque es la cantidad que aparece con mayor
frecuencia.
Como ya qued definido, la variable aleatoria puede ser de cualidad o de cantidad. En
este ejemplo lo hacemos notar nuevamente: fijaremos la variable dependiendo del
inters que tengamos.
4. En un equipo de ftbol las estaturas del cuadro campen son:
Delanteros
Medios
Defensas
Portero
1.70
1.70
1.75
1.80
1.85
1.70
1.88 mts.
1.75
14
1.75 mts.
1.75 mts.
1.70 mts.
f.
1.70
1.75
1.80
1.85
1.88
De acuerdo a la definicin de moda vemos que esta variable aleatoria tiene dos modas
porque dos estaturas diferentes tienen la misma frecuencia y sta es la mayor. En estos
casos la variable se llama modal.
La variable aleatoria que tiene moda se llama unimodal.
La variable aleatoria que tiene dos modas se llama bimodal.
La variable aleatoria que tiene tres modas se llama trimodal, etc.
Por lo tanto en el ejemplo anterior la variable aleatoria es bimodal por tener dos modas.
ACTIVIDAD DE REGULACIN
Para cada uno de los ejercicios siguientes contesta las preguntas que se indican:
a)
b)
c)
d)
1.1.2 La Mediana
GRADUACIN DE LA GENERACIN 2002
DEL COLEGIO DE BACHILLERES
Fig. 2
16
Fi
2
5
7
6
3
1
1
25
A
6
B
19
C
11
D
10
E
11
F
13
G
12
H
9
I
16
J
11
K
16
L
6
M
8
Para determinar el valor de la mediana (Me) de un conjunto con (n) datos, si n es impar,
entonces aplicamos la frmula:
n+1
(1)
2
En el ejemplo de las donaciones, n = 13, sustituyendo en ( 1 ) obtenemos:
13 + 1
=7
2
17
El 7 indica el nmero de orden del elemento que representa la mediana que es Me = 11.
Si el nmero de datos ( n ) es un nmero par, entonces la mediana recae en los dos
valores centrales.
6. Para n = 50, sustituyendo en ( 1 )obtenemos:
50 + 1 51
=
= 25.5
2
2
Este valor nos indica que la mediana se obtiene por la semisuma de los elementos que
ocupan los lugares 25 (vigsimoquinto) y 26 (vigsimo sexto).
7. El nmero de transacciones en dlares, realizadas por el Banco Nacional de Mxico
durante los primeros das del mes de julio de 1993, fueron los siguientes: el 1er. da 9, el
2do. da 13 y los siguientes das 12, 8, 3, 7, 14, 16, 18 y 17 respectivamente.
Determina la mediana (Me) de la variable aleatoria:
Al ordenar los datos en sentido creciente obtenemos 3, 7, 8, 9, 12, 13, 14, 16, 17, 18.
Aplicando la frmula (1) para n= 10 obtenemos:
10 + 1 11
=
= 5. 5
2
2
El valor obtenido nos indica que la mediana se obtiene por la semisuma de los
elementos que ocupan los 5 y los 6 Lugares o sea los valores 12 y 13.
Me =
12 + 13 25
=
= 12.5
2
2
Me = 12.5
Este valor de la mediana nos indica que el valor central de los datos corresponde a 12.5
y como ya se dijo, si el nmero de datos es par, para determinar el valor de la mediana
se toma la semisuma de los dos valores centrales. Tambin esto ilustra que la mediana
no es necesariamente un elemento del conjunto en cuestin.
ACTIVIDAD DE REGULACIN
En cada uno de los problemas siguientes determina la moda y la mediana de cada
conjunto de datos. Analiza los resultados e indica tus observaciones.
18
1.1.3 La Media
LAS DIEZ PRIMERAS FINALISTAS DEL CONCURSO
MISS UNIVERSO
Fig 3
Las edades de las 10 primeras finalistas del Concurso de Belleza, son: 18, 19, 25, 19,
20, 21, 20, 22, 18 y 18 aos, respectivamente. Cul es la edad del promedio (X) de las
diez finalistas?
R.
Para poder determinar la edad promedio, hacemos una suma de las edades y el
resultado lo dividimos entre el nmero de finalistas.
X=
18 + 19 + 2 + 19 + 20 + 21 + 20 + 22 + 18 + 18
= 20
10
X = 20
19
Este resultado nos dice que la edad promedio de las 10 finalistas del concurso Miss
Universo es de 20 aos.
8. En la temporada pasada los equipos de ftbol que ms goles anotaron fueron los
siguientes: El Atlante 47, el Pachuca 50, el Amrica 45, el Guadalajara 39, el Cruz Azul
38, el Necaxa 29, el Universidad 39, la U. de G. 42, el Toluca 44, el Quertaro 43 y el
Puebla 46.
Cul fue el promedio de goleo de la temporada pasada?
Para determinar la media aritmtica (X ) o promedio de n datos, se suman y
el resultado se divide entre n.
De nuestro ejemplo obtenemos
X =
n = 11
47 + 50 + 45 + 39 + 38 + 29 + 39 + 42 + 44 + 43 + 46
= 42 goles
11
X 1 + X 2 + . . . . . . .X n
(2)
n
X=
i=1
(3)
Esta expresin indica que el numerador del segundo miembro existe una suma de la
variable X, el subndice ( i ) indica que el valor de X es la variable y la anotacin abajo y
arriba de indica que el subndice ( i ) toma valores desde i = 1 hasta i = n, es decir; la
suma se hace desde X = X 1 hasta X = X n.
X1 = 25
X2 = 24
X3 = 20
X4 = 30
X5 = 27
X6 = 35
X7 = 28
n=7
X =
25 + 24 + 20 + 30 + 27 + 35 + 28
= 27
7
X = 27
El promedio semanal de atencin de pacientes en la sala de
urgencias es de 27 pacientes.
ACTIVIDAD DE REGULACIN
En cada uno de los ejercicios siguientes, determina la Mo, Me y X , analiza tus
resultados, compralos y expresa tus observaciones.
1. En el departamento de control de calidad se tom una muestra al azar de 10 focos
para determinar el nmero de horas de vida de cada foco, obtenindose los
siguientes datos:
De
muestra
10
De horas
865
850
841
850
820
843
830
848
840
838
la
de
lunes
martes
mircoles
jueves
viernes
Sbado
240
225
215
208
295
230
21
Hasta este momento, hemos calculado las medidas de tendencia central (Mo = moda,
Me = mediana X = media) de datos no agrupados y esto se puede hacer debido a que
las muestras tomadas de la poblacin son pequeas. Si la muestra es grande entonces
es necesario agrupar los datos en tablas de frecuencias como ya lo estudiaste en el
fascculo anterior.
Ahora estudiaremos cmo determinar la moda, la mediana y la media para datos
agrupados.
Frecuencia de retardos
3
5
8
12
6
5
4
43
( 4 )
A = Intervalo de clase.
Lr = Lmite real inferior de la clase modal.
d1 = frecuencia de la clase modal menos la frecuencia de clase anterior a la modal.
d2 = frecuencia de la clase modal menos la frecuencia de la clase siguiente.
Recordars que la moda es el valor que se repite con mayor frecuencia. Para los datos
agrupados en clases, la moda es el valor que se encuentra en la clase de mayor
frecuencia y a esta clase se le llama clase modal.
22
d1
d2
A
X
0
LT = 9.5
Fig 4
23
X =
d1
A
d1 + d2
d1
X=A d +d
1
2
........ ..(a)
............ (b)
Sustituyendo ( a ) en ( b ) obtenemos:
Mo = Lr + A
d1
d 1 + d2
.................. (c)
Del ejemplo anterior podemos concluir que la moda de datos agrupados se puede
determinar de dos formas:
1. Aplicando la ecuacin ( 4 )
2. Clculo grfico.
Para el clculo grfico, una vez graficado el histograma, se trazan las diagonales
uniendo los puntos superior derecho de los rectngulos de la clase modal y la clase
anterior y los puntos superior izquierdo de la clase modal y la clase siguiente a sta. En
el punto donde se cortan las diagonales se traza una perpendicular al eje X. El punto
donde se cortan la perpendicular y el eje X es la moda de los datos agrupados.
24
ACTIVIDAD DE REGULACIN
En cada uno de los siguientes ejercicios, determina la moda (Mo) mediante la grfica y
comprueba el resultado, aplicando la frmula.
1. En un grupo de 60 alumnos se obtuvieron los siguientes resultados en su examen
final que contena 20 reactivos. Los datos reportados son aciertos.
15,12,18,13,20,14,16,14,18,19
8,15,9,12,17,19,14,13,12,20
17,13,15,18,20,12,15,19,10,0
9,12,20,10,12,13,12,18,14,11
20,11,10,9,13,18,15,17,19,12
11,19,17,20,8,15,18,14,17,19
2. Las llamadas telefnicas diarias que una empresa hizo a sus clientes durante los dos
primeros meses del ao fueron:
6,12,7,15,13,18,16,20,25,12,10,8
13,15,6,9,18,20,25,12,7,10,11,13
9,12,15,18,20,13,17,23,25,14,18,6
14,16,9,6,10,12,20,13,17,14,25,7
F
2
Me = L i + A
25
Frecuencia absoluta
53-57
58-62
63-67
68-72
73-77
78-82
83-87
total
2
7
10
12
9
6
4
50
Frecuencia
acumulada
2
9
19
31
40
46
50
A = 77 - 73 + A = 4+1 = 5
F = 19
f = 12
Ecuacin:
n
Me = Li + A ( 2 - F )
. . . . . . . . . . . ( 5)
f
Sustituyendo en la frmula obtenemos
Me = 68 + 5 ( 25 19 ) = 68 + 5 ( 6 ) =
12
12
Me = 68 + 2.5 = 70.5 Kg.
ACTIVIDAD DE REGULACIN
x n + x n1
2
M f + Mi f 2 + .....Mi fn
=
X= i1
n
M f
i i
i=1
M f
i i
X=
i=1
. . . . . . . . . . .
27
. (7)
12. Se desea saber la edad promedio de 50 ancianos de un asilo y para ello con la
informacin se elaboras la siguiente distribucin de frecuencias:
Clase aos
Mi
Fi
Mi fi
70-72
73-75
76-78
79-81
82-84
85-87
88-90
total
71
74
77
80
83
86
89
15
11
8
7
4
3
2
50
1065
814
616
560
332
258
178
=3823
M f
i i
X=
i=1
3823
= 76.46 aos es la edad promedio en el asilo de ancianos.
50
Existe otro mtodo para calcular la media de datos agrupados, lo llamaremos Mtodo
abreviado para el clculo de la media.
Este mtodo consiste en fijar un origen muy aproximado a la media ( X ) de los datos.
Este valor que sirve de origen se resta a cada uno de los valores individuales obtenidos
como diferencia, valores negativos y positivos cuya suma es cero; pero el producto de
cada diferencia por la frecuencia nos da valores cuya suma es diferente de cero, con
estas cantidades aplicamos la siguiente ecuacin:
n
X = X'+
X' f
i=1
. . . . . . . . . . . ( 8 )
fi
X fi
Calif.- origen
Xi X = X
05=5
15=4
25=3
35=2
45=1
(5)
55= 0
65= 1
14
14
75= 2
12
24
85= 2
21
95= 4
16
10
10 5 = 5
20
50
= 88
Calificacin
Total
X = 5
n = 50
i=1
X' f i = 88
X = X'+
X' f
i=1
=5+
88
= 5 + 1.76
50
14. Aplicando esta frmula calculemos la edad promedio de los 50 ancianos del
problema (12), y comparemos los resultados obtenidos con ambos mtodos.
29
Clase
aos
70 72
73 75
X = 77 76 78
79 81
82 84
85 87
88 90
Total
Mi
Fi
71
74
77
80
83
86
89
Mi X= X
15
11
8
7
4
3
2
50
71 77 = 6
74 77 = 3
77 77 = 0
80 77 = 3
83 77 = 6
86 77 = 9
89 77 = 12
X fi
90
33
0
21
24
27
24
= 27
X = 77 + - 27 = 77 0.54 = 76.46
50
X = 76.46 aos es la edad promedio en el asilo de ancianos.
Al comparar este valor con el calculado por el otro mtodo, podemos observar que el
valor es el mismo.
ACTIVIDAD DE REGULACIN
PROBLEMA.
Calcula la media ( X ) tomando como punto origen X = 80 y repite los clculos para
X = 8 compara tus resultados con el anterior y expresa tus conclusiones.
En el siguiente problema, aplica el mtodo abreviado para calcular la media.
1. Una zapatera pone en remate 200 pares de zapatos cuyos precios y cantidades de
existencia se indican en la siguiente tabla de frecuencias:
PRECIO EN
$
10 19
20 29
30 39
40 49
50 59
60 69
total
fi
19
46
69
35
22
9
200
30
X
i =1
. . . . . . . . . . . . . (9)
Mo
Me
Ventas de Andrs: Mo
Me
Ventas de Carlos:
Me
Mo
De acuerdo a tus clculos, la media de las ventas que obtuviste fue la misma para los
tres:
X = 15.8
Qu podras deducir de estos resultados?
Expresa brevemente tu deduccin:
Mo
17;
Me
17;
15.8
Ventas de Andrs: Mo
17;
Me
17;
15.8
Ventas de Carlos:
20;
Me
19;
15.8
Mo
32
Esta informacin podra hacernos pensar que todo est bien, sin embargo no lo es, por
lo que es necesario tomar alguna medida para mejorar las ventas.
Si observas los resultados anteriores, podrs notar que el valor de la media es el mismo
para los tres, por lo que no nos indica en donde las ventas andan mal.
Un clculo rpido y sencillo consiste en restar al valor mayor de los datos el valor menor,
este resultado nos indica el rango en que estn dispersos los datos.
Calcula el rango de dispersin de cada uno de los vendedores.
Los resultados que debiste obtener son:
Rango de ventas de Pedro 25 5 = 20
Rango de ventas de Andrs 17 5 = 12
Rango de ventas de Carlos 21 5 = 16
Las ventas de Andrs son muy consistentes porque el rango de dispersin es de 12.
Las ventas de Carlos tambin son consistentes aunque menor que las de Andrs; la
dispersin de los datos es 16.
Las ventas de Pedro registran el mayor rango de dispersin, por lo tanto nos indica que
sus ventas no son consistentes.
Con este anlisis debemos recomendar que se haga una investigacin de campo para
determinar las causas de la irregularidad de Pedro con el fin de dar una solucin para
mejorar.
La variabilidad y dispersin de los datos la proporcionan otras medidas que son:
1.
2.
3.
4.
El rango
La desviacin media
La desviacin estndar
La varianza
1.1.7 El Rango:
Una forma rpida de conocer la dispersin de los datos determinando el rango o
recorrido de la variable aleatoria.
El rango (R) es la diferencia entre el valor
mayor y el menor que toma la variable.
33
R = rango
R = Xn X1 . . . . . . . . . . . . . (10)
X1 = el menor valor
Xn = el mayor valor
En el ejemplo anterior obtuvimos los rangos de dispersin de las ventas aplicando la
ecuacin (10).
Para determinar el rango de datos agrupados Xn es el lmite superior del ltimo intervalo
de clase y X1 es el lmite inferior del primer intervalo de clase.
ACTIVIDAD DE REGULACIN
En cada uno de los ejercicios determina el rango, analzalo y da tus conclusiones.
1. El departamento de control de calidad tom una muestra de 10 flechas al azar, para
medir su dimetro y conocer si la tolerancia est dentro de las especificaciones. Se
obtuvieron los siguientes datos (y las unidades son cm.):
12, 12.05, 12.03, 11.95, 12.01, 12.04, 12, 11.98, 11.99 y 12.03
2. El departamento de control de calidad de una fbrica de bateras tom una muestra
aleatoria de 10 pilas con el fin de determinar su vida til. Se obtuvieron los siguientes
resultados:
6.2 hrs., 6.8 hrs., 6.0 hrs., 6.4 hrs., 5.9 hrs., 6.6 hrs.,
5.8 hrs., 6.3 hrs., 6.1 hrs., 6.2 hrs., 6.8 hrs.
El rango es muy til en el control de calidad porque en esa rea manejan diferencias
muy pequeas (tolerancias). Sin embargo, la media y el rango no permite conocer con
precisin cmo estn dispersos los datos, por lo tanto es necesario introducir otra
variable que permita conocer la dispersin y sta es la desviacin media que
introduciremos en la siguiente seccin.
di = Xi - X
................
( 11)
D=
(X
X) = 0 . . . . . . . . . . . .
(12)
i =1
Este valor D = 0 no nos ayuda en el clculo; para evitar que la suma sea igual a cero, se
toma el valor absoluto de cada desviacin y la ecuacin (12) se transforma en:
D=
i =1
i=1
(X i X) = di
. . . . . . . . . . . . . (13)
DM =
(X
X)
i =1
.. . . . . . . . . . . . (14)
DM =
(X
i =1
.. . . . . . . . . . . . (15)
DM = desviacin media
Xi = 1-esimo dato u observacin
= media poblacin
X = media muestral
N = nmero de observaciones de la poblacin
n = nmero de observaciones de la muestra
= signo de sumatoria
= signo del valor absoluto
35
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Xi X
Xi X
18 40 = -22
20 40 = -20
23 40 = -17
28 40 = -12
30 40 = -10
37 40 = - 3
39 40 = -1
40 40 = 0
42 40 = 2
43 40 = 3
46 40 = 6
55 40 = 15
57 40 = 17
58 40 = 18
64 40 = 24
22
20
17
12
10
3
1
0
2
3
6
15
17
18
24
= 170
X=
X=
i=1
(3)
600
= 40
15
DM =
(X
X)
i =1
170
= 11 .3 .. . . . . . . . . . . . (14)
15
DM = 11.3 minutos.
36
X DM
Esto significa que los datos se distribuyen en torno a la media en:
X 11.3 minutos ( Es una distancia promedio a la media).
Si los datos estn agrupados en una tabla de distribucin de frecuencias, entonces para
determinar la desviacin media DM es necesario multiplicar cada desviacin por su
frecuencia y de esto se obtienen otra ecuacin de la DM para datos agrupados, la cual
es:
n
f (X
1
DM =
X)
i =1
. . . . . . . . . . (16)
fi = frecuencia absoluta
17. La siguiente distribucin de frecuencias corresponde al nmero de aviones que
despegan diariamente en el aeropuerto capitalino tomando como muestra aleatoria los
primeros 20 das de un mes.
Xi
41
42
44
46
48
50
51
fi
1
2
4
6
4
2
1
20
fi Xi
41
84
176
Xi X
41 46 = -5
42 46 = -4
44 46 = -2
Xi X
5
4
2
fi Xi X
5
8
8
=0
X=
i=1
920
= 46
20
X = 46
37
Xi X
f (X
1
DM =
DM = 2
X)
i =1
42
= 2 .1
20
Este resultado nos indica que los datos estn distribuidos en 46 2 aviones a partir de la
media, que despegan diariamente.
Cuando los datos estn agrupados en clase, para obtener la diferencia de cada
observacin con la media, se toma la Mi, esto es:
Mi X . . . . . . .. . . . . . . . . . . . . . (17)
con esto obtenemos otra ecuacin para la desviacin media:
n
f (M
1
DM =
X)
i =1
. . . . . . . . . . . . . . . (18)
i =1
38
Intervalo de
clase
1.54 1.56
1.56 1.58
1.58 - 1.60
1.60 1.62
1.62 1.64
1.64 1.66
1.66 1.68
1.68 1.70
1.70 1.72
1.72 1.74
Total
Mi
fi
fi Mi
fi X
fi Mi X
1.55
1.57
1.59
1.61
1.63
1.65
1.67
1.69
1.71
1.73
5
6
8
20
25
16
9
7
3
1
100
7.75
9.42
12.72
32.20
40.75
0.35
0.30
0.24
0.20
0.25
162.96
= 1.62 metros
100
3.14
= 0.0314
100
Este resultado dice que las estaturas se distribuyen en promedio en 0.0314 mts., a uno y
otro lado de la media. Como ste es un valor muy pequeo, se interpreta que los datos
estn agrupados muy prximos a la media.
ACTIVIDAD DE REGULACIN
1. En una fbrica no se ha realizado debidamente el programa de mantenimiento por lo
que una mquina est fuera de operacin debido a las fallas que a menudo se
presentan. El tiempo de inactividad consecutivos en minutos durante un ao se registran
en la siguiente tabla.
Esta informacin incluye el tiempo inactividad de algunas mquinas cuya falla ocurre
ms de una vez al da.
39
32
51
33
42
73
26
36
82
65
45
a)
b)
c)
d)
e)
f)
g)
63
55
45
67
61
58
67
22
73
56
52
48
61
34
55
82
43
62
57
75
62
60
53
53
65
74
28
55
39
40
35
76
21
45
62
41
56
72
46
51
34
51
68
47
54
70
79
68
57
70
74
35
85
52
41
38
84
40
56
74
53
44
60
68
59
50
49
37
60
76
64
45
77
52
53
47
36
78
50
48
80
54
61
69
50
35
65
43
88
59
Xi X
para eliminar el signo y de esta forma tener siempre un valor positivo en la suma de las
desviaciones.
otra forma de eliminar el signo de las desviaciones es elevando al cuadrado de cada una
de stas, es decir;
(X
) = (X
2
X ) . . . . . . . . . .. (19)
2
S2 =
(X
X)
i=1
. . . . . . . . . . (20)
n 1
(X
i=1
X)
(X
=
. . . . . . . . . . . . (21)
1.1.9 La Varianza
Es una medida de dispersin, en cuyo clculo interviene el cuadrado de
las desviaciones de cada puntuacin. Para obtener su valor, calculamos la
sumatoria de los cuadrados de las desviaciones y el resultado lo dividimos
entre n1 o N.
Xi X
0-1.8=-1.8
0-1.8=-1.8
1-1.8=-0.8
1-1.8=-0.8
2-1.8=0.2
2-1.8=0.2
2-1.8=0.2
3-1.8=1.2
3-1.8=1.2
4-1.8=2.2
=0
Xi
0
0
1
1
2
2
2
3
3
4
18
S2 =
(X
X)
i=1
n 1
15.60 15.60
=
= 1.73
10 1
9
Xi X
-10.8
-7.8
-3.8
1.2
1.2
1.2
2.2
3.2
4.2
9.2
( Xi X )
116.64
60.84
14.44
1.44
1.44
1.44
4.84
10.24
17.64
84.64
X = 158 =15.8
10
Andrs
2
Xi
5
17
17
17
17
17
17
17
17
17
Xi X
-10.8
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
( Xi - X )
116.64
1.44
1.44
1.44
1.44
1.44
1.44
1.44
1.44
1.44
X = 158 =15.8
10
42
Carlos
2
Xi
5
6
10
18
19
19
20
20
20
21
Xi X
-10.8
-9.8
-5.8
2.2
3.2
3.2
4.2
4.2
4.2
5.2
( Xi X )2
116.64
96.04
33.64
4.84
10.24
10.24
17.64
17.64
17.64
27.04
X = 158 =15.8
10
S2 =
(X
X)
i=1
. . . . . . . . . . (20)
n 1
S 2A =
129.6
= 14.4
9
S p2 =
313.6 313.6
=
= 34.84
10 1
9
S C2 =
351.6
= 39.06 = 351.6 = 39.06
9
S 2A = 14
S P2 = 35
2
SC
= 39
43
f (X
i
S2 =
X)
i=1
. . . . . . . . . . . . . . (22)
n 1
21. Tomamos los datos del ejemplo de las jeringas ( 19 ), los agrupamos en una tabla
de frecuencias y obtenemos:
Xi
0
1
2
3
4
( Xi X )2
3.24
0.64
0.04
1.44
4.84
Xi X
-1.8
-1.8
0.2
1.2
2.2
fi
2
2
3
2
1
fi ( Xi X )2
6.48
1.28
0.12
2.88
4.84
f (X
i
S2 =
X)
i=1
n 1
15.6
15.6
=
= 1.73
10 1
9
S2 = 2 este valor significa que la varianza de las jeringas rotas es 2, toda vez que no
podemos hablar de fracciones de jeringa.
Compara los dos clculos del problema y explica tus conclusiones.
Si los datos estn agrupados en clases, entonces la puntuacin que se toma para
determinar la desviacin de cada uno con respecto a la media, es la marca de clase Mi,
obtenindose la siguiente ecuacin:
n
f (M
i
S2 =
X)
i=1
. . . . . . . . . . . . (23)
n 1
22. Tomemos los datos del ejercicio VIII referente a la falla de la mquina que
constantemente est fuera de servicio. En este ejercicio debiste haber seguido este
procedimiento de clculo:
a) Ordenamos los datos de menor a mayor
44
Con esta informacin tomamos los valores de la tabla y los sustituimos en la ecuacin
(22) para el clculo de S2.
Intervalo
de clase
20-29
30-39
40-49
50-59
60-69
70-79
80-89
Mi
fi
fi Mi
Mi X
( Mi X )2 fi ( Mi X )2
24.5
34.5
44.5
54.5
64.5
74.5
84.5
4
12
18
26
20
14
6
100
98.0
414
801
1417
1290
1043
507
5570
-31.2
-21.2
-11.2
-1.2
8.8
18.8
28.8
973.44
449.44
125.44
1.44
77.44
353.44
829.44
2810.08
3893.76
5393.28
2257.92
37.44
1548.80
4948.16
4976.64
23056
Clculo de la media
n
f M
i
X=
i=1
n
5570
= 55.7
100
i=1
n
f (X
i
S2 =
X)
i=1
n 1
23056 23056
=
= 232.88
100 1
99
S2 = 233
La varianza de los tiempos en que la mquina est fuera de servicio por falla es
de S2 = 233 min 2.
45
Como puedes notar en el resultado, los tiempos estn en unidades cuadradas por lo que
no nos da una idea precisa de los tiempos que la mquina est fuera de servicio toda
vez que las unidades de la varianza no coinciden con las unidades de los datos, por lo
que no podemos saber si la dispersin con respecto a la media es muy grande o
pequea.
Para poder determinar la dispersin de las puntuaciones con la misma unidad de la
variable aleatoria, se usa otra medida de dispersin que se llama desviacin estndar (S)
o ().
S es la desviacin estndar de la muestra y
es la desviacin estndar de la poblacin.
S= S
(X
X)
i=1
f (X
i
S= S
i=1
f (M
i=1
n 1
= 2 =
X)
(Mi )2
i=1
N1
n 1
S= S
X)
. . . . . . . . . . . . . . . . . . . (24)
n 1
23. Calcula la desviacin estndar del ejemplo anterior correspondiente a los tiempos
fuera de servicio de la mquina por descompostura.
R.Como ya calculamos la varianza basta con extraerle la raz cuadrada, obtenindose:
S2 = 233 min2.
S = S 2 = 233 = 15.26
S= 15.3
Esta informacin es ms comprensible y debemos entender que los tiempos de
descompostura de la mquina se distribuyen a X 15.3 min.
ACTIVIDAD DE REGULACIN
En cada uno de los siguientes problemas, calcula la varianza y la desviacin estndar.
Interpreta tus resultados y expresa tus deducciones.
1. La oficina de quejas de los microbuses del D.F. recibieron en una semana el
siguiente nmero de quejas: Lunes 16, martes 10, mircoles 8, jueves 12, viernes
15, sbado 18 y domingo 20.
2. El bufete jurdico de una empresa envi cartas de cobranza a los clientes morosos
del mes de Junio. El primer da del mes envi 64, el segundo da 62 y los siguientes
das 51, 58, 83, 54, 57, 51, 42, 54, 74, 62, 47, 59, 51, 67, 53, 45, 58, 78, 69, 51, 72,
69, 78, 45, 64, 67.
3. La siguiente tabla muestra la distribucin de frecuencias de las horas/hombre que
requiere una compaa de pintura para pintar 100 casas clasificadas por el grado de
deterioro.
Horas
0 19
20 39
40 59
60 79
80 99
100 119
120 139
140 159
160 179
180 199
No. casas
4
5
13
17
24
11
10
7
5
4
47
Existe una forma simplificada para calcular la desviacin estndar y para ello se aplican
las siguientes ecuaciones:
Para datos no agrupados
n
S=
i=1
S=
i=1
S=
i=1
X i2
n Xi
n
i=1
n 1
f i X i2
fi
f i Mi2
fi
i=1
i=1
. . . . . . . . . . . . . . . . . . . . (28)
f i X i
n
f i Mi
n
. . . . . . . . . . . . . . . . . . (29)
. . . . . . . . . . . . . . . . . (30)
e) Determinamos la media X .
f) Calculamos el producto fi Mi2
g) Calculamos el producto fi (X i X )
h) Calculamos Mi2
i)
f (M
i
X)
i=1
S = S2 =
. . . . . . . . . . . . . . . . . (26)
i=1
Frmula simplificada
n
S=
i=1
1
Clase
20-29
30-39
40-49
50-59
60-69
70-79
80-89
f i Mi2
fi
2
Mi
24.5
34.5
44.5
54.5
64.5
74.5
84.5
f i Mi
n
i=1
. . . . . . . . . . . . . . . . (30)
3
4
fi
fi Mi
3
73.5
4
138.0
5
222.5
10
544.0
12
774.0
5
447.0
2
169.0
42 2368
5
Mi X
-31.9
-21.9
-11.9
- 2.0
8.1
18.1
28.1
6
(Mi X)2
1017.61
479.61
141.6
4.0
65.61
327.61
789.61
7
fi (Mi X)2
3052.83
1918.44
708.05
40.0
787.32
1965.66
1579.22
10051.62
Clculo de la media
n
f M
X=
f
i
i=1
2368
= 56.4
42
X = 56.4
Clculo de la varianza
n
f (M
i
S = S2 =
X)
i=1
. . . . . . . . . . . . . . . . . (26)
i=1
49
8
Mi2
600.25
1190.25
1980.25
2959.36
4160.25
5550.25
7140.25
9
fi Mi2
1800.75
4761.00
9901.25
29593.60
49923.00
33301.50
14280.50
143561.6
10051.52
= 239.32 = 15.46
42
S=
f i Mi2
i =1
f
i=1
f i Mi
i=1
fi
i=1
. . . . . . . . . . . . . . . . (30)
143561 .6
2368
42
42
3418.13 (56.38) 2 =
239.32 = 15.46
50
ACTIVIDAD DE REGULACIN
Para familiarizarte con la ecuacin simplificada, repite los clculos del ejercicio (IX) y
compara tus resultados.
Las medidas de posicin y las medidas de variacin son descripciones estadsticas muy
importantes, porque nos describen cmo se estn agrupando o alejando los datos de
una distribucin con respecto a las medidas de tendencia central. Existen otras maneras
de describir los datos estadsticos en forma ms ilustrativa que un simple nmero que
describe todo un proceso y que finalmente su interpretacin se hace ms compleja. La
otra forma de analizar e interpretar los datos, es mediante su representacin grfica que
a continuacin estudiaremos.
Fig 1
Fig 2
Fig 3
1.2.2 Momentos
Momentos son los promedios de las series de potencias de las
desviaciones de la variable con respecto a la media.
M1 =
i=1
. . . . . . . . . . . . . . . . . . (31)
M2 =
( X
X)
i=1
2
i
= S 2 . . . . . . . . . . . . (32)
M3 =
( X
X)
i=1
3
i
. . . . . . . . . . . . . . . . (33)
M4 =
( X
X)
i=1
4
i
. . . . . . . . . . . . . . . . . (34)
5. Momento de orden m:
n
M5 =
( X
X)
i=1
X
n
5
i
. . . . . . . . . . . . . . . . . (35)
53
f ( X
i
Mm =
X)
i=1
. . . . . . . . . . . . . . . . (36)
M4
(M2 )2
3 . . . . . . . . . . . . . . . . . . . . . . . (37)
M4 = Cuarto momento
M2 = Varianza
En el siguiente problema calcula los momentos sucesivos hasta el de cuarto orden y
determina el apuntamiento (K).
23. Se tomaron al azar 20 alumnos para determinar su aptitud en la lectura; para ello se
les dio a leer un texto de 100 palabras, habindose obtenido los siguientes tiempos
de lectura en segundos: 70, 78, 60, 58, 80, 70, 75, 78, 60, 65, 70, 85, 78, 80, 75, 60,
55, 58, 78.
R.
Elaboramos la siguiente tabla:
1
Xi
55
58
60
65
70
75
78
80
85
2
fi
2
2
3
1
3
2
4
2
1
3
fi Xi
110
116
180
65
210
150
312
160
85
1388
4
5
6
2
Xi - X (Xi - X) fi (Xi - X)2
-14.4 207.36 414.72
-11.4 129.96 259.92
-9.4
88.36
265.08
-4.4
19.36
19.36
0.6
0.36
1.08
5.6
31.36
62.72
8.6
73.96
295.84
10.6 112.36 224.72
15.6 243.36 243.36
7
(Xi - X)3
2985.98
1481.54
830.58
85.18
0.22
175.61
636.06
1191.02
3796.42
1786.8
8
fi (Xi - X)3
5971.96
2963.08
2491.74
85.18
0.66
351.22
2544.24
2382.02
3796.42
20596.52
54
9
(Xi - X)4
42998.17
16889.60
7807.48
374.80
0.13
983.45
5470.08
12624.77
59224.09
10
fi (Xi - X)4
85996.34
33779.20
23422.46
374.80
0.39
1966.90
21880.32
25249.54
59224.09
251894.04
X=
Xi
i=1
1388
= 69.4
20
Mi = 69.4
M2 = 1786.8 = 89.34
20
M3 = 205960.52 = 1029.8
20
M4 = 551894 = 12594.7
20
M4
(M 2 )2
. (37)
M4 = Cuarto momento
M2 = Varianza
M4 = 12594.7
K=
12594.7
(89.34)2
M2 = 89.34
3 = 1.57 3
K = 1.4
=0
>0
La curva es lepticrtica
<0
La curva es platicrtica
En nuestro ejemplo donde K = -0.21 significa que K < 0 por lo tanto si graficamos la tabla
de frecuencia, obtendremos una grfica similar al de la figura 1 o sea una grfica
platicrtica.
55
ACTIVIDAD DE REGULACIN
Del siguiente problema calcula el valor de K e indica qu tipo de grfica tiene. Interpreta
el resultado y expresa tus conclusiones.
1. De una guardera infantil se toma una muestra de 36 nios para determinar su altura.
Los resultados obtenidos en centmetros son:
63, 64, 64, 65, 65, 66, 66, 66, 67, 67, 67, 67, 67, 68, 68, 68, 69, 69, 69, 69, 69, 70, 70,
70, 71, 72, 72, 72, 72, 73, 73, 74, 74, 76, 76, 77.
Estas grficas se caracterizan por la posicin que guardan las medidas de tendencia
central. Podemos generalizar su presentacin mediante las siguientes grficas:
f
X
Mo
X = Mo = Me
X Mo = 0
Me
Fig. 4
56
X Me Mo
Fig. 5
Mo Me X
Mo < Me < X
X Mo < 0
sesgo a la izquierda
Fig. 6
Analiza cada una de las grficas anteriores y contesta las siguientes preguntas:
a) Qu caractersticas tiene cada una? ______________________________________
1.2.4 Sesgo
Sesgo es la medida de la asimetra de la grfica y se calcula por el
cociente de la media menos la moda entre la desviacin estndar.
57
X Mo
. .
S
. (37)
SG = Sesgo de la grfica.
De acuerdo con esta ecuacin y analizando el numerador podemos definir el sesgo de la
grfica de un conjunto de datos de la siguiente forma:
X Mo
= 0 Implica que la curva est centrada con respecto a
S
las medidas de tendencia central (curva simtrica)
X Mo
> 0 Implica que la grfica est sesgada a la derecha.
S
X Mo
<0
S
Del siguiente problema calcula el apuntamiento (K) y el sesgo (SG), analiza tus
resultados e indica cmo es la grfica y cmo se distribuyen los datos del problema.
26. El departamento del Distrito Federal recibi varias quejas del pblico sobre la
contaminacin que produce la Planta de xido de sulfuro. El Departamento envi un
equipo de expertos para investigar el problema.
Para hacer el estudio de la contaminacin, los investigadores se establecieron dentro de
la Planta y tomaron una muestra diaria durante 40 das de los humos que sta despide.
Los resultados obtenidos de la emisin promedio de xido de sulfuro en kg. Por da, son
los que se indican a continuacin:
17, 15, 20, 29, 19, 18, 22, 25, 29, 9, 24, 20, 17, 16, 24,
14, 15, 23, 24, 26, 19, 23, 28, 19, 16, 22, 24, 17, 20, 13,
19, 10, 23, 18, 31, 13, 20, 17, 24, 14.
R.Secuencias de operaciones:
a) Ordenamos los datos en sentido creciente.
9, 10, 13, 13, 14,14, 15, 15, 16, 16, 17, 17, 17, 17, 18,
18, 19, 19, 19, 19, 20, 20, 20, 20, 22, 22, 23, 23, 23, 24,
24, 24, 24, 24, 25, 26, 27, 28, 29, 31.
58
3
Mi
11
16
21
26
31
4
Mi fi
44
192
273
234
62
5
Mi - X
-9.125
-4.125
0.875
5.875
10.875
6
(Mi - X)2
83.3
17.0
0.76
34.5
118.3
40
7
fi (Mi - X)2
333.2
204.0
9.95
310.5
236.6
8
(Mi - X)4
6938.9
289.0
0.58
1190.3
13994.9
1094.3
9
fi (Mi - X)4
27755.6
3468.0
7.6
10712.3
27989.8
69933.3
805
= 20.125
40
d) Calculamos los momentos de segundo y cuarto orden, para ello sustituimos los datos
de la tabla en las ecuaciones (33) y (35) obtenemos:
M2 =
1094.3
= 27.36
40
M4 =
69933.3
= 1748.3
40
e) Calculamos (K), para ello sustituimos los datos de la tabla en la ecuacin (36) y
obtenemos:
K=
1748.3
(27.36 )2
3 = 2.3 3 = 0.66
K = 0.7
Este resultado nos dice que k < 0, por lo tanto la grfica de la distribucin es de tipo
platicrtida.
f)
1. La Moda.
De la tabla obtenemos que la Moda Mo = 21 porque es el valor de mayor frecuencia.
2. Calculamos la desviacin estndar.
59
S=
27.34 = 5.23
S = 5.23
Para calcular el sesgo (SG) sustituimos estos valores en la ecuacin (37) y obtenemos:
SG =
20.125 21
= 0.167
5.23
SG = 0.2
Este resultado nos dice que SG < 0 lo cual implica que la grfica esta cargada a la
izquierda, por lo tanto los datos del problema estn dispersos hacia la izquierda de la
media.
ACTIVIDAD DE REGULACIN
Para el siguiente problema calcula el apuntamiento (K) y el sesgo (SG). Analiza tus
resultados e indica qu tipo de grfica tiene el problema y cmo estn dispersos los
datos.
1.
60
RECAPITULACIN
MEDIDAS DE
TENDENCIA CENTRAL
MODA
d1
Mo = Lr + A
d1 + d2
MEDIANA
Me =
MEDIA
Li + a N / 2F
f
POSITIVA
SG > 0
X=
SESGO
SG
X Mo
S
ASIMTRICA
i =1
DESVIACIN
MEDIA
DM =
NEGATIVA
SG < 0
SIMTRICA
SG = 0
SG =
RANGO
R = Xn Xi
fM
f
i =1
MOMENTO DE
2o. ORDEN
f (M
i
X)
i=1
i=1
DESVIACIN
ESTNDAR
f (M X)
i
PLATICURTICA
K<0
C
U
R
V
A
SIMTRICAS
APUNTAMIENTO
M4
K=
(M2)2
61
D
I
S
P
E
R
S
I
D
E N
LEPTOCURTICA
K>0
M
E
D
I
D
A
S
VARIANZA
S2 =
MOMENTO DE
4o. ORDEN
i =1
MOMENTO DE
3er. ORDEN
MESOCURTICA
K=0
M3
(M 2 )
i Mi X
S=
i =1
i =1
ACTIVIDADES DE CONSOLIDACIN
Con el fin de afirmar los conceptos que estudiaste en este fascculo, del siguiente
problema realiza lo que se indica:
1. Ordena los datos y
agrpalos en 9 clases.
2. Elabora la tabla de
frecuencias.
3. Determina la moda de
la muestra.
4. Calcula la mediana.
5. Calcula la media.
6. Traza el polgono de
frecuencia.
7. Determina el rango de
datos.
8. Calcula la desviacin
media.
9. Calcula el polgono de
frecuencias.
11. Calcula el 2 y 4
momentos.
62
AUTOEVALUACIN
2
fi
3
Mi
4
Mi fi
5
Mi - X
6
(Mi - X)2
7
(Mi - X)4
9
fi (Mi - X)2
3418801
8
fi (Mi - X)
86
10-19
14.5
29
-43
1849
20-29
24.5
123
-33
1096
1200361
165
5445
30-39
34.5
138
-23
529
279841
92
2116
40-49
20
44.5
890
-13
169
28561
260
3380
50-59
26
54.5
1417
81
78
234
60-69
19
64.5
1226
49
2401
133
931
70-79
12
74.5
894
17
289
83521
204
3468
80-89
84.5
760
27
729
531441
243
6561
90-99
94.5
283
37
1369
1874169
111
4107
Total
100
6088
7419169
1372
29940
5760
63
3698
3. Clculo de la moda:
4. Clculo de la mediana:
50 31
Me = 50 + 10
= 57.3
26
5. Calculo de la media:
X=
5760
= 57.6
100
34.5
44.5 54.5
64.5
74.5
84.5
94.5
1372
= 13.7
100
29940
= 299.4 u 2
100
29940
= 299.4
100
M4 =
7419169
= 74191.69
100
K=
74191.69
(299.4)2
64
3 = 2 .1
57.6 54.5
= 0 .2
17.4
65
BIBLIOGRAFA CONSULTADA
Estadstica
66