Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A lo largo de su existencia el ser humano ha llevado a cabo anlisis de una gran cantidad
de datos o informacin, referentes a los problemas o actividades de sus comunidades. Por
ejemplo, desde comienzos de la civilizacin se hacan representaciones grficas y otros
smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero
de personas, animales o cosas. Hacia el ao 3000 a. C., los babilonios usaban pequeas
tablillas de arcilla para recopilar datos sobre la produccin agrcola y los gneros
vendidos o cambiados mediante el trueque. Mucho antes de construir las pirmides, los
egipcios analizaban los datos de la poblacin y la renta del pas.
Otro ejemplo de recopilacin y anlisis de datos es el del imperio romano, cuyo
primer gobierno, al verse en la necesidad de mantener control sobre sus esclavos y riquezas,
recopil datos sobre la poblacin, superficie y renta de todos los territorios bajo su control.
Siguiendo con la historia de la recopilacin de datos, a mediados del primer
milenio, por el gran crecimiento de las poblaciones y para poder tener control sobre stas,
se comenzaron a efectuar censos poblacionales, como los de la Edad Media en Europa.
Por ejemplo, los reyes caloringios1 Pipino el Breve y Carlomagno ordenaron hacer estudios
minuciosos de las propiedades de la Iglesia en los aos 758 y 762, respectivamente.
Conforme pasaba el tiempo, la recopilacin y anlisis de datos comenzaban a tener
otro fin adems de los censos y conocimiento de diferentes propiedades. Por ejemplo, en
Inglaterra a principios del siglo xvi se realiz el registro de nacimientos y defunciones, con
el cual en 1662 apareci el primer estudio de datos poblacionales, titulado Observations on
the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,
realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para
la primera tabla de mortalidad. En el siglo xix, con la generalizacin del mtodo cientfico
para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores
aceptaron la necesidad de reducir la informacin a valores numricos para evitar la
ambigedad de las descripciones verbales.
1.1 Estadstica
Qu entendemos por estadstica? Como se explic, el ser humano tuvo la necesidad de crear una ciencia que redujera la
informacin a valores numricos para la mejor interpretacin de los fenmenos; se le
llam estadstica.
Definicin 1.1
La estadstica es una rama de las matemticas aplicadas que proporciona mtodos para reunir,
organizar, analizar e interpretar informacin, y usarla para obtener diversas conclusiones que
ayuden a tomar decisiones en la solucin de problemas y en el diseo de experimentos.
1
Carolingia tambin llamada Carlovingia, fue una dinasta de reyes francos que gobernaron un vasto terri-
torio de Europa Occidental desde el siglo vii hasta el siglo x d. C.; su nombre fue tomado de su ms renombrado
miembro, Carlomagno.
20 E stadstica y probabilidad
Cul es la funcin de la estadstica? Actualmente la estadstica es un mtodo efectivo para describir con precisin los valores
de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y una herramienta para
relacionar y analizar dichos datos. Por esta razn, la estadstica se divide en diferentes
ramas, entre las ms aplicadas y que analizaremos estn la estadstica descriptiva y la
inferencial.
La primera de ellas se aborda en la presente unidad y ser descrita ms adelante,
mientras que la segunda ser estudiada en las unidades 9 y 10. Por ahora se vern dos
conceptos fundamentales en el estudio de la estadstica.
Definicin 1.2
La poblacin es el conjunto que incluye el total de elementos o datos cuyo conocimiento es de
inters particular.
Definicin 1.3
La muestra es cualquier subconjunto de la poblacin.
Ejemplo 1 1. Si el conjunto de datos de inters est constituido por todos los promedios de un grupo
de estudiantes de licenciatura de una universidad, cada uno de los estudiantes ser
un individuo estadstico, mientras que el conjunto de todos estos estudiantes ser
la poblacin y una muestra podra ser el conjunto de todos los estudiantes del tercer
cuatrimestre de ingeniera.
2. Si el conjunto de datos de inters est constituido por todos los promedios de los grupos
de licenciatura, cada uno de los grupos ser un individuo estadstico, mientras que el
conjunto de todos estos grupos ser la poblacin y una muestra podra ser el conjunto
de todos los grupos del tercer cuatrimestre de ingeniera.
U nidad 1 E stadstica descriptiva 21
Definicin 1.4
El caracter de un elemento, individuo u objeto es cualquier caracterstica por medio de la cual se
puede clasificar y estudiar.
Ejemplo 2 1. Si los individuos son personas, el sexo, el estado civil, el nmero de hermanos o su
estatura son caracteres.
2. Si el individuo es una reaccin qumica, el tiempo de reaccin, la cantidad de producto
obtenido o si ste es cido o bsico, son caracteres que pueden analizarse.
Definicin 1.5
Una variable estadstica es discreta slo cuando permite valores aislados, como nmeros enteros.
Por ejemplo, la variable nmero de hermanos toma los valores 0, 1, 2, 3, 4 y 5. Este tipo
de variables se caracterizan por obtenerse mediante un proceso de conteo (ver semejanza
con las variables aleatorias discretas en la unidad 5).
Definicin 1.6
Una variable estadstica es continua cuando admite todos los valores de un intervalo.
de variables se caracteriza por obtenerse mediante mediciones (ver semejanzas con las
variables aleatorias continuas en la unidad 7).
Las variable cualitativas pueden ser nominales si se trata de categorias (sexo, raza,
etc.) y ordinales si implican orden (clase social, grado de preferencia).
Definicin 1.7
La estadstica descriptiva es la parte de la estadstica que organiza, resume y analiza la totalidad
de elementos de una poblacin o muestra.
Muestreo estratificado
Como se mencion, las muestras aleatorias se pueden obtener a partir de una tabla de
nmeros aleatorios. Se supone que se tiene una poblacin de mil individuos y se quiere
hacer un muestreo de diez de ellos. En este caso, primero se asigna un nmero del 000
al 999 a cada miembro de la poblacin y luego se elige de la tabla de nmeros aleatorios
un punto de arranque y se hace el recorrido hasta obtener el tamao de la muestra de
diez. Debido a que el tamao de la poblacin es mil, de los nmeros que aparecen en la
tabla se consideran slo sus tres ltimas cifras. Por ejemplo, sean los siguientes nmeros
aleatorios elegidos de una tabla.
Al elegir sus tres ltimas cifras se obtienen los nmeros que formarn la muestra:
061, 897, 108, 542, 975, 093, 135, 818, 499 y 605. Despus se procede a seleccionar de la
poblacin a los individuos que les corresponden estos nmeros.
Cmo se lleva a cabo un muestreo De forma similar que en el caso de las mil personas, primero se asigna un nmero
aleatorio de diez personas a cada elemento de la poblacin desde 000 hasta 649 y posteriormente se elige un bloque
con poblacin de 650 individuos?
de nmeros aleatorios donde las tres primeras cifras sean menores a 649.
24 E stadstica y probabilidad
1.5.1 La media
Cuando una persona tiene en sus manos un conjunto de datos para analizarlos,
generalmente calcula, en primera instancia, un promedio de stos. Por ejemplo, dicha
persona tiene las cantidades mensuales que ha ganado en los ltimos seis meses (10 800,
9 700, 11 100, 8 950, 9 750 y 10 500) y desea conocer el valor que representa su salario
promedio. En este caso, obtendr su ingreso promedio al sumar las cantidades y dividir
entre el nmero de meses que trabaj
Como el caso anterior, existe una infinidad de problemas o casos prcticos en los
que de un conjunto de datos se quiere conocer un valor central que refleje la influencia
que tiene cada uno de los datos en l. La medida central ms propicia para tales fines se
define a continuacin.
Definicin 1.8
Dado el conjunto finito de datos muestrales x , x ,..., x , la media muestral (promedio aritmtico)
1 2 n
o estadstico media del conjunto es el estadstico que representa el promedio de los datos
simbolizado por x (x barra), y se calcula
x1 + x2 + + x n 1 n
x= = xi
n n i = 1
U nidad 1 E stadstica descriptiva 25
Definicin 1.9
Dado el conjunto de datos poblacionales x , x ,. . ., x , se llama media poblacional o parmetro
1 2 N
media del conjunto al parmetro representado por (miu o mu), y se calcula
x1 + x2 + + x N 1 N
= = xi
N N i = 1
Ejemplo 3 Un fabricante de pistones toma una muestra aleatoria de 20 de stos, para medir su
dimetro interno promedio. Con la informacin que el fabricante obtuvo dada en
centmetros, se calcula su dimetro medio
10.1 10.1 9.8 9.7 10.3 9.9 10.0 9.9 10.2 10.1
9.9 9.9 10.1 10.3 9.8 9.7 9.9 10.0 10.0 9.8
1
x= [10.1 + 10.1 + 9.8 + 9.7 + 10.3 + 9.9 + 10 + 9.9 + 10.2 + 10.1 + 9.9 +
20
9.9 + 10.1 + 10.3 + 9.8 + 9.7 + 9.9 + 10 + 10 + 9.8] = 9.975
Ejemplo 4 Se quiere calcular el sueldo promedio de los trabajadores de una fbrica, eligiendo
aleatoriamente a diez de ellos, con las siguientes cantidades:
Dato x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400
1.5.2 La mediana
Por lo expuesto al final de la subseccin es necesario presentar otro tipo de medida central en
la que valores muy extremosos, con respecto al resto, no tengan una influencia tan marcada
como en la media. A dicha medida se le conoce, debido a su naturaleza, como mediana.
Definicin 1.10
La mediana de un conjunto de datos es el valor medio de los datos cuando stos se han ordenado
en forma no decreciente en cuanto a su magnitud.
26 E stadstica y probabilidad
Clculo de la mediana
Dado el conjunto de datos muestrales x1, x2,. . ., xn, la mediana muestral o estadstico mediana
del conjunto se representa por x (x tilde) y se obtiene ordenando primero en forma no
decreciente estos n datos, los que se renombrarn segn su posicin por medio de tildes
de la siguiente forma
x1 x 2 x n
Posteriormente se localiza el punto medio de los datos ordenados, con dos casos:
Dato x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400
x 5 + x 6 2 300 + 2 400
x = = = 2 350
2 2
En la mediana se puede observar que el valor $25 000, el cual sobresala con
respecto a todos los dems, a diferencia de la media, no influye en el resultado de la
mediana. Puesto que si en lugar de $25 000 se elige $5 000 o $100 000, el sueldo medio
de los diez trabajadores seguir siendo $2 350. Por lo cual se dice que la mediana es una
medida central insensible de los datos.
1.5.3 La moda
Definicin 1.11
La moda de un conjunto de datos es el valor que se presenta en su distribucin con mayor
frecuencia.
Cundo se considera 1. La moda puede no existir. Por ejemplo, se tienen las siguientes series de datos:
a un conjunto de datos amodal?
6, 7, 34, 4, 8
6, 3, 8, 9, 3, 8, 6 y 9
En esta serie estn los valores 6 y 9 como los de mayor frecuencia, ambos
se repiten cinco veces. Al conjunto de datos que tiene ms de una moda se le llama
multimodal; bimodal si son dos modas, y trimodal si son tres, etctera.
La media geomtrica de los datos x1, x2,. . ., xn se simboliza por MG y est definida como
la raz n-sima del producto de las n mediciones.
MG = n x1 x2 x n
5 8 9 9 8 10 9 5 10 5
6 5 10 10 8 9 7 9 5 9
MG = 20 5 8 9 9 8 10 9 5 10 5 6 5 10 10 8 9 7 9 5 9 = 7.5446868
Observacin De la definicin de media geomtrica se deduce que sta no se puede aplicar cuando
algn dato vale cero o la cantidad de datos es par y existe una cantidad impar negativa.
U nidad 1 E stadstica descriptiva 29
La media armnica de los datos x1, x2,. . ., xn se simboliza por MA y est definida como el
recproco de la media aritmtica de los recprocos.
1 1 n
MA = = =
1 n
1 11 1 1 1 1 1
n i = 1 x i
+ + +
n x1 x2 xn
+ + +
x1 x2 xn
Ejemplo 8 Si se viaja de una ciudad a otra recorriendo los primeros 100 km a 80 kmph, los siguientes
100 km a 100 kmph y finalmente otros 100 km a 120 kmph, se calcula la velocidad media
utilizando la media armnica y se compara con las medias aritmtica y geomtrica.
1
MA = = 97.2973
1 1 1 1
+ +
3 80 100 120
1 300
x = [80 + 100 + 120] = = 100
3 3
Ahora se compara con la distancia total real recorrida las distancias que recorrera
el automvil con cada una de las velocidades promedio calculadas
Para los casos en que cada dato tiene una importancia relativa en su distribucin la cual
se denomina peso, la media correspondiente ms apropiada se obtiene sumando los
productos de cada dato por su peso, llamando a dicha medida media ponderada.
Definicin 1.12
En un conjunto de datos x , x ,. . ., xn se llama pesos o ponderaciones respectivas de estos
1 2
datos a las cantidades w , w ,. . ., wn que cumplen
1 2
a) w i [0,1] , para todo valor de i
b) w1 + w2 + . . . + wn = 1
La media ponderada del conjunto de datos x1, x 2 ,. . ., xn, con pesos respectivos w1,
w2 ,. . ., wn, se simboliza por MP y se calcula con la siguiente frmula:
n
MP = wi x i
i = 1
Nota En el caso de poblaciones, los parmetros correspondientes se calculan con las mismas
formulas cambiando n por N.
Al analizar un conjunto de datos surge una duda: tener las medidas centrales es
suficiente para conocer su distribucin? Despus de estudiar la siguiente seccin esto
quedar claro.
Ejercicio 1
2. Calcula la media y mediana de los tiempos de llegada de seis aviones que aterrizan
en un aeropuerto. Los tiempos (en minutos) son
3.5 4.2 2.9 3.8 4.0 2.8
U nidad 1 E stadstica descriptiva 31
1.6.1 Rango
Es el primer valor que nos muestra cmo estn distribuidos (dispersos) los datos. El rango
de las observaciones est simbolizado por r para la muestra y R para la poblacin.
El rango es una medida de variacin de los datos que lo nico que muestra es el tamao
o longitud del intervalo en el que los datos se encuentran distribuidos y es:
Definicin 1.13
El rango es igual a el valor mayor menos el valor menor de los datos.
32 E stadstica y probabilidad
Por ejemplo, para los datos muestrales de los dos conjuntos de datos anteriores
Los elementos del segundo conjunto tienen una separacin mayor entre ellos, pero
el resultado no muestra el comportamiento de los datos con respecto a su media.
Otra medida de dispersin de los datos que est relacionada directamente con la media del
conjunto es la varianza.
Definicin 1.14
Se llama varianza de un conjunto de datos al promedio de los cuadrados de las desviaciones de
cada uno de los datos con respecto a su valor medio.
Si se tienen n datos muestrales, x1, x2,. . ., xn con valor medio igual a x , los cuadrados
de las desviaciones de cada uno de los datos con respecto a su valor medio sern ( x1 x )2,
( x2 x )2, etctera.
Al igual que en los valores medios, la varianza puede definirse con respecto a la
muestra o a la poblacin.
Respecto a la muestra
Definicin 1.15
La varianza muestral o estadstico varianza del conjunto de datos x , x ,. . ., x , se representa
2 1 2 n
por s , y se define como el valor medio de los cuadrados de las desviaciones de cada uno de los
datos con respecto a x , y se calcula
1 n
s2 = ( x i x )2
n i = 1
Sobre la definicin anterior podemos decir que denota la intencin de una medida
variacional de un conjunto de datos, slo que ms adelante (unidades 9 y 10) se ver que
es conveniente definir el estadstico varianza dividiendo entre n 1 en lugar de n. Para
distinguirlas, se les asignan nombres diferentes, los cuales se justificarn hasta la unidad
9, cuando se analice el tema Estimadores puntuales. Mientras tanto se define
1 n
La varianza sesgada como s2n =
n i = 1
( x i x )2
U nidad 1 E stadstica descriptiva 33
1 n
La varianza insesgada como s2n 1 = ( x i x )2
n 1 i = 1
Respecto a la poblacin
De forma similar para poblaciones finitas se define el parmetro varianza poblacional, el
cual est representado por 2.
Dado el conjunto de datos poblacionales x1, x2,. . ., xn, con valor medio , se define
la varianza poblacional
1 N
Varianza poblacional
*
2 = ( x i )2
N i = 1
La varianza se calcula con los cuadrados de las desviaciones y, por tanto, no est en
las mismas unidades que los datos. Por consiguiente, se introduce una nueva medida de
dispersin de la siguiente forma:
Definicin 1.16
Se llama desviacin estndar de un conjunto de datos a la raz cuadrada positiva de la varianza,
es decir
= 2 o s = s2
Ejemplo 10 Se calcula la varianza insesgada y la desviacin estndar de cada uno de los dos conjuntos
de la seccin 1.6:
Primer conjunto: 20, 12, 15, 16, 13 y 14. Anteriormente se encontr que x = 15.
1 n
s2n 1 = ( x i x )2 =
n 1 i = 1
1
= (20 15)2 + (12 15)2 + (15 15)2 + (16 15)2 + (13 15)2 + (14 15)2
6 1
1
= [25 + 9 + 0 + 1 + 4 + 1] = 8
5
*
En las unidades 5 y 7 se presenta una definicin ms general, la cual se puede aplicar tanto a poblaciones
finitas como infinitas.
34 E stadstica y probabilidad
1 n
s2n 1 = ( x i x )2 =
n 1 i = 1
1
= ( 5 15)2 + ( 0 15)2 + ( 50 15)2 + (117 15)2 + (8 15)2 + (10 15)2
6 1
1
= [100 + 225 + 1225 + 4 + 49 + 25] = 325.6
5
1 n 2
Varianza sesgada s2n = xi x 2
n i = 1
1 n 2 n 2
Varianza insesgada s2n 1 =
n 1 i = 1
xi
n 1
x
Ejemplo 11 Se calcula la varianza insesgada para los conjuntos de datos del ejemplo 10, empleando
las ltimas frmulas para la varianza, y se verifica que coincidan los resultados.
1 n 2 n 2 1 2 6
s2n 1 =
n 1 i = 1
xi
n 1
x =
6 1 20 + 122 + 152 + 162 + 132 + 142
6 1
(15)2
1 6
= [400 + 144 + 225 + 256 + 169 + 196 ] 225 = 278 270 = 8
5 5
1 n 2 n 1 6
s2n 1 = x i n 1 x 2 = 6 1 52 + 02 + 502 + 172 + 82 + 102 6 1 (15)2
n 1 i = 1
1 6
= [25 + 0 + 2500 + 289 + 64 + 100 ] 225 = 595.6 270 = 325.66
5 5
En los clculos anteriores se observa que en ambos casos coinciden los resultados
con los del ejemplo 10.
U nidad 1 E stadstica descriptiva 35
Ejercicio 2
0.95 1.01 0.97 0.95 1.0 0.97 0.95 1.01 0.95 0.98
Calcula la varianza.
Definicin 1.17
Dado un conjunto de datos, se llama intervalos de clase o clases de frecuencia o simplemente
clases a los intervalos que por parejas son ajenos o disjuntos y contienen todos los datos del
conjunto.
Nota Con respecto a los intervalos de clase, no es un requisito que sean de igual longitud, sin
embargo, aqu habr restriccin a clases de igual longitud.
36 E stadstica y probabilidad
Aqu se construirn los intervalos de clase de un conjunto de datos {x1, x2,. . ., xn}, de
acuerdo con los siguientes puntos:
Ejemplo 12 Dado un conjunto de datos donde el valor ms pequeo es 5 y el ms grande 75. Construye
diez intervalos de clase para dicho conjunto de datos.
El rango del conjunto es: r = 75 5 = 70. Como queremos tener diez intervalos de
clase dividimos el rango 70 entre diez y obtenemos siete. Este valor ser la longitud de
cada una de las clases de frecuencia. Por tanto, las diez clases son
[5,12), [12,19), [19,26), [26,33), [33,40), [40,47), [47,54), [54,61), [61,68), [68,75]
Recurdese que un intervalo de la forma [26,33) indica que se consideran todos los
valores que estn entre 26 y 33, incluyendo el 26 y excluyendo el 33.
Definicin 1.18
Se llama frecuencia relativa de una clase i al cociente de la cantidad de datos que se encuentran
en sta con respecto del total de datos en el conjunto y se simboliza por
fi
fr =
n
donde n representa la cantidad total de datos.
U nidad 1 E stadstica descriptiva 37
Ejemplo 13 Se consideran las calificaciones (con escala de cero a 100) de 80 estudiantes en la materia
fsica experimental, se distribuyen en siete clases de frecuencias y se calculan las frecuencias
relativas de las clases:
30 88 96 100 45 38 78 89 68 88
68 100 100 68 69 79 98 94 30 46
30 86 85 89 94 99 100 45 30 35
36 76 78 81 80 40 67 58 89 58
98 90 100 100 68 70 83 85 68 56
30 67 78 98 100 86 69 79 52 45
89 78 65 60 69 76 78 77 89 98
99 91 100 48 68 84 67 69 46 79
Finalmente, se calculan las frecuencias relativas por clase, dividiendo las frecuencias
entre la cantidad total de datos, en este caso 80, y se obtiene
Tabla 1.1
38 E stadstica y probabilidad
Definicin 1.19
Se llama frecuencia acumulada a la funcin que representa la suma de las frecuencias por clase,
y se simboliza por F .
i
Definicin 1.20
Se llama frecuencia relativa acumulada a la funcin que representa la suma de las frecuencias
relativas por clase y se simboliza por F .
r
xi x
F( x) = fi
i = 1
Debido a que en las frecuencias por clase no es de inters el valor de cada elemento
sino slo la cantidad de estos en la clase, se acostumbra realizar el conteo por medio de
las barras como antiguamente se llevaba a cabo; es decir, se pone una barra vertical por
elemento contado y cada vez que se llega a cuatro barras la quinta se coloca en diagonal.
Por ejemplo, para contar ocho elementos:
U nidad 1 E stadstica descriptiva 39
Con esta forma de conteo se puede construir, a partir de la tabla 1.1, una tabla
similar que contenga las frecuencias acumuladas
Tabla 1.2
Al igual que se realiz con un conjunto de datos del cual se obtuvieron sus medidas
centrales y de desviacin, stas se pueden obtener para las clases de frecuencia empleando
los puntos medios de las clases y sus frecuencias de clase.
Definicin 1.21
Sea k el nmero de clases, x el punto medio de la i-sima clase y f la frecuencia de la i-sima
i i
clase, entonces el valor de la media aritmtica se calcula con la frmula
k
fi x i
x=
i = 1 n
donde
Ejemplo 14 Con los datos del ejemplo 13, se calcula la mediana Md.
Solucin El intervalo de clase mediana es [70, 80), ya que F5 = 46 incluye a la mitad de las obser-
vaciones n/2 = 80/2 = 40; l = 80 70 = 10.
n
2 C 40 34 6
Md = L + l = 70 + 10 = 70 + 10 = 70 + 5 = 75
f 12 12
El valor promedio moda (Mo ), que se comparar con los valores numricos de la
media aritmtica x y la mediana Md, se calcula con la frmula:
donde
Ejemplo 15 Con los datos del ejemplo 13, se calcula el valor promedio moda (Mo ).
Solucin El intervalo de clase modal es [90, 100] ya que la mayor frecuencia est en F7 = 19 con
L = 90, l = 10, d1 = 19 15 = 4 y d2 = 19 0 = 19.
d1 4 4
Mo = L + l = 90 + 10 = 90 + 10 = 90 + 10(..1739) = 90 + 1.739
d +
1 2d 19 + 4 23
= 91.74 92
De forma similar a la media de clases de frecuencia se pueden definir las varianzas sesgada
e insesgada de las clases de frecuencia.
Definicin 1.22
Si f y x son la frecuencia y el punto medio de la i-sima clase, respectivamente, y n es la suma
i i
de las frecuencias, entonces la varianza sesgada s2 se calcula con la frmula
k
1
s2 = fi ( x i x )2
n i = 1
U nidad 1 E stadstica descriptiva 41
Definicin 1.23
La varianza insesgada s2 se calcula con la frmula
1 k
2
s = fi ( x i x )2
n 1 i = 1
La desviacin estndar por clases de frecuencia seguir siendo la raz cuadrada positiva
de la varianza correspondiente.
Nota La media y varianza por clases de frecuencia generalmente se emplean para observar la
distribucin de datos muestrales, pero en caso de querer definir estas medidas para datos
poblacionales se realiza de forma similar, sustituyendo la n por N, x por y s por , como
se hizo en las secciones 1.5 y 1.6.
Ejemplo 16 Se calcula la varianza sesgada de las clases de frecuencia con los datos del ejemplo 13.
Para realizar los clculos ms fcilmente se utilizar l
a tabla 1.2,
tan slo intro-
duciendo algunas columnas:
Tabla 1.3
1
s2 = ( 30 640 ) = 382.984 383
80
s = s2 = 383 19.57
42 E stadstica y probabilidad
Ejercicio 3
a) divide los valores en tres clases de frecuencia de igual longitud, calcula sus
frecuencias relativas e indica si el encargado tendr que reparar la mquina o no
b) calcula la cantidad de lquido promedio que despacha la mquina, empleando
las clases de frecuencia del inciso anterior
1.8 Grficas
Las grficas a las que se hace referencia en estadstica descriptiva deben mostrar la
distribucin de las frecuencias o frecuencias acumuladas del conjunto de datos, con lo
cual se podr entender e interpretar fcilmente su comportamiento.
Por tanto, es necesario introducir un nuevo mtodo grfico para la interpretacin
de datos, entre los grficos ms comunes estn
diagrama de barras
polgono de frecuencias
diagrama circular o de pastel
Definicin 1.24
Un histograma es un grfico de barras utilizado para representar la forma en que estn distribuidas
las frecuencias; permite identificar el centro y la variabilidad de los datos.
Ejemplo 17 Se construye un histograma para las clases de frecuencia y la frecuencia acumulada del
ejemplo 13.
44 E stadstica y probabilidad
Tabla 1.4
Se grafican los puntos medios de los intervalos (tercera columna) y se trazan los
rectngulos con sus bases iguales a la longitud de la clase y con las alturas correspon-
dientes a su frecuencia, como se muestra en las siguientes figuras:
a) b)
Nota Para las frecuencias relativas el histograma es el mismo, slo se divide cada frecuencia
entre el total de datos.
Los histogramas no slo nos ayudan a ubicar el centro y visualizar la variabilidad de los
datos, sino tambin la forma en que se distribuyen; por tanto, los podemos clasificar en
simtricos
sesgados hacia la izquierda o la derecha
multimodales
U nidad 1 E stadstica descriptiva 45
Histogramas simtricos
Histogramas sesgados
En una distribucin de datos Presentan una distribucin en la que alguna de las colas est ms alargada en comparacin
qu significa sesgo? Qu forma tienen
los histogramas sesgados?
con la otra. Se llaman sesgados a la derecha o positivamente sesgados si la cola derecha es la
que est ms alargada. Como lo muestra la figura 1.2b, se cumple Mo < Md < x. Se les
llama sesgados a la izquierda o negativamente cuando la cola izquierda es la ms alargada.
Como lo muestra la figura 1.2c, se cumple x < Md < Mo.
Histogramas multimodales
Tienen en su distribucin ms de un pico (ver figura 1.2d). En caso de dos picos bimodal,
en caso de tres, trimodal etctera.
Figura 1.2
Histogramas para las clases de frecuencia
a) simtrico; b) sesgado a la derecha;
c) sesgado a la izquierda,
y d) multimodal (bimodal).
a) b)
c) d)
Ejemplo 18 Retomando los datos del ejemplo 13 y comparando los valores promedio calculados x =
72, Md = 75, Mo = 92, el modelo asociado con las 80 calificaciones de fsica experimental
es sesgado a la izquierda.
46 E stadstica y probabilidad
Definicin 1.25
Un polgono de frecuencias es un grfico de lnea que representa las frecuencias de los datos,
uniendo por lneas los puntos medios de cada intervalo, donde x es el punto medio de clase i y f
i i
su frecuencia. Debido a su forma tambin se le suele llamar grfico poligonal.
Ejemplo 19 Se construye un polgono de frecuencias para las clases del ejemplo 13. Por medio de la
tabla 1.4, si se grafican los puntos obtenidos de la tercera y la cuarta columnas:
Figura 1.3 f
Polgono de frecuencias.
19
15
12
8
7
4
0
35 45 55 65 75 85 95
Definicin 1.26
A los polgonos de frecuencia que se elaboran con las frecuencias acumuladas o las frecuencias
relativas acumuladas se les llama ojivas.
Ejemplo 20 Se construye la ojiva para las frecuencias relativas acumuladas del ejemplo 13.
Figura 1.4 1
Ojiva de frecuencias relativas acumuladas.
0.7625
0.5750
0.4250
0.2375
0.1875
0.10
0
1 2 3 4 5 6 7
Definicin 1.28
Un diagrama circular es un grfico que divide en sectores un crculo, los cuales representan las
frecuencias relativas del conjunto de datos. Por su forma tambin se le suele llamar diagrama de pastel.
Ejemplo 21 Se construye un diagrama circular que represente la distribucin por clases de frecuencias
relativas para las estaturas (en centmetros) de la siguiente muestra de 50 personas.
48 E stadstica y probabilidad
Como son 50 datos y se van a distribuir en siete clases, primero se calcula el rango
del conjunto r = 186.4 158.4 = 28
Se quieren obtener siete clases, por tanto, se divide el rango 28 entre siete y el resultado
es cuatro. Este valor ser la longitud de cada una de las clases de frecuencia. Es decir
Tabla 1.5
Clase Intervalo Frecuencia Frecuencia
Conteo
i i fi relativa
Figura 1.5
a) diagrama circular o de pastel
del ejemplo 21 en su forma plana; 12
b) representacin tridimensional. 12
24%
24%
24% 24%
8
16% 9 16% 18%
18% 10% 4% 4%
5
10% 2 2
4% 4%
a) b)
anillos
superficies
cotizaciones
cilndricas
cnicas
piramidales