Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA I
AUTOR: Patricia Castillo Garzón
ÍNDICE
ÍNDICE
1. Organización de datos
1.1. Distribución de frecuencias para variable cualitativa
1.2. Representación gráfica para una variable cualitativa
1.2.1. Gráfico de barras
1.2.2. Gráfico circular
1.3. Distribución de frecuencias para variable cuantitativa discreta
1.3.1. Representación gráfica tabla discreta
1.4. Distribución de frecuencias para variable continua
Acceso rápido
1.4.1. Histogramas y polígonos de frecuencias
DESARROLLO
GLOSARIO REFERENCIAS
C, C, S, S, SE, S, S, SE, V, UL, S, UL, C, S, S, C, UL, V, UL, S, SE, C, S, S El resultado se aproxima a 41,67, mediante la siguiente norma: si el tercer decimal es igual
o superior a 5, se aproxima hacia arriba, es decir, el segundo decimal se aumenta en una
En donde se ha utilizado la siguiente codificación: centésima. Si el tercer decimal es inferior a 5, se aproxima hacia abajo, es decir, el
segundo decimal se disminuye en una centésima.
C Casado S Soltero UL Unión libre
Número de personas
8 (360) x(12,5)
Separado 12,5% 45
100
6
(360) x(8,33)
Viudo 8,33% 29,88
4 100
(360) x(16,67)
2 Unión Libre 16,67% 60,01
100
0
Fuente: elaboración propia
Casado Soltero Separado Viudo Union
Libre
Figura 1. Gráfico de barras Con un transportador se pueden ubicar los grados en la circunferencia para obtener el
Fuente: (elaboración propia) siguiente gráfico.
X ____________ 20,83
Viudo
8%
(360) x(20,83)
74,98
100 Casado Unión Libre
21% 17%
Siguiendo el mismo proceso, se calculan los grados para cada una de las modalidades de la
variable. La tabla queda de la siguiente forma:
Esta nomenclatura es de uso universal. Para los subíndices se pueden utilizar las letras i, j, Para la tercera columna (3), se ha ubicado la frecuencia relativa (hi), esta frecuencia se
o en algunas ocasiones k. obtiene dividiendo cada frecuencia absoluta (ni) sobre el número total de datos (n), de la
siguiente manera:
Xj = valor de la variable ni
hi
ni = frecuencia absoluta
n
hi = frecuencia relativa La cuarta columna (4) se presenta con la frecuencia absoluta acumulada N i teniendo en
cuenta que:
Ni = frecuencia absoluta acumulada
N1 = n1 la primera frecuencia absoluta coincide con la primera acumulada
Hi = frecuencia relativa acumulada
N2 = n1 + n2 = N1 + n2
Tabla de distribución de frecuencias: en esta tabla se presentan los distintos valores de la
variable en forma ordenada con las frecuencias absolutas y relativas correspondientes. N3 = n1 + n2+ n3 = N2 + n3
Se hace un estudio para determinar el número de empleados que tienen las empresas de .
una pequeña localidad en el centro de la ciudad.
.
En este caso la variable se representa como X = número de empleados por empresa,
.
medida en las empresas de una localidad.
N7= n1 + n2+ n3+n4 +n5 +n6 +n7 = N6+n7 = n
8 12 12 8 10 12 13 8 11 13
10 9 14 9 10 9 12 9 10 13
8 10 11 11 10 14 12 13 9 14
14 12 12 10 11 9 11 14 12 11 El valor de la última frecuencia acumulada coincide con el número total de datos n.
Los datos presentados reciben el nombre de datos sin agrupar o datos originales. La quinta columna (5) presenta las frecuencias relativas acumuladas Hj. Se construye de
forma similar a las frecuencias absolutas acumuladas:
..
9
Otra forma de encontrar las frecuencias relativas es con el cociente entre la frecuencia
8
absoluta acumulada y el número total de datos:
7
N
Hi i 6
n
5
La tabla de Distribución de frecuencias se presenta entonces de la siguiente manera:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Número de empleados por empresa.
Tabla 3. Número de empleados por empresa
Se van a tener en cuenta los siguientes pasos para la construcción de la tabla. Como el número de grupos debe ser un valor entero, se deja m = 5, porque es el entero
más cercano.
1. Determinar el rango o recorrido de los datos (R). Este valor se obtiene con la
diferencia entre el valor máximo y el mínimo de los datos. 3. Calcular la amplitud del grupo, a la que llamaremos C, con la siguiente fórmula:
En el ejemplo tenemos:
Rango
C
Xmáximo= 92 Xmínimo= 47 m
R = 45
Se inicia la primera columna con el valor mínimo de los datos (47), como Li (límite inferior)
y para el límite superior (Ls) del primer grupo se suma la amplitud C = 9.
m = 1 + 3,3 log n
Ls = Li + C Una vez establecidos los grupos o intervalos y el punto medio, se comienza a trabajar con
las frecuencias absolutas y las relativas tal como se hizo con la tabla discreta.
Primer grupo Li = 47 Ls = 47 + 9 = 56
Tabla 4. Distribución de frecuencias del peso de 20 alumnos
Segundo grupo Li = 56 Ls = 56 + 9 = 65
47 56
Xi
2 1.4.1. Histogramas y polígonos de frecuencia
De la misma forma se continúa trabajando cada punto medio hasta completar la columna. El gráfico lo situamos en el eje de coordenadas en un plano cartesiano. En el eje vertical se
representa la frecuencia, y en el eje horizontal se representan los intervalos de clase.
La tercera columna contiene la frecuencia absoluta, es decir el conteo de valores que
están en un intervalo dado. Para mejor comprensión, los datos del mismo color Las bases de los rectángulos son iguales, dado que los intervalos de clase tienen la misma
pertenecen a un grupo de la tabla. amplitud. La altura de cada rectángulo depende de la frecuencia de cada clase. Como se
trata de una variable cuantitativa continua, los rectángulos deben ir unidos. Al observar la
X1 =74 X5= 69 X9 = 47 X13=65 X17=76 gráfica se comparan las áreas de los rectángulos.
X2=67 X6= 61 X 10 =82 X14=88 X18=57 Realizamos el histograma para el ejemplo sobre el peso de los alumnos, con la distribución
de frecuencias de la tabla 4.
X3=92 X7= 71 X 11 = 82 X15=52 X19=72
NÚMERO DE ESTUDIANTES
7
6
5
4
3
2
1
0
51,5 60,5 69,5 78,5 87,5
PESO
Para este tipo de variable se puede elaborar un gráfico similar al histograma, con las
Polígono de frecuencia frecuencias absolutas acumuladas (Ni). Sobre el eje vertical construimos una escala de
valores que llega hasta 20, que es la frecuencia máxima, y sobre el eje horizontal
Para la variable continua, tomando como base el histograma de frecuencias, se localizan
marcamos los valores de los intervalos. Levantamos rectángulos en donde la altura
los puntos medios y se conectan con una línea recta.
corresponde a la frecuencia absoluta acumulada. Este gráfico se llama Histograma de
Para el ejemplo del peso de los alumnos se puede construir el polígono de frecuencias Frecuencias acumuladas.
sobre el histograma. Para ello se ubican los puntos medios y se unen con una línea recta
que parte desde el eje horizontal, uniendo los puntos medios de los demás intervalos. Histograma de frecuencias acumuladas
Figura 5. Histograma de Frecuencias Figura 7. Representación de datos mediante el histograma de frecuencias acumuladas
20
b) ¿Cuál es la variable de estudio?
estudiantes
15
c) ¿Qué tipo de variable es?
10
d) Construya la tabla de distribución de frecuencias
5
e) ¿Cuál es el número de familias que tiene como máximo 2 computadores?
0
47 56 65 74 83 94 f) ¿Cuántas familias tienen más de 1 computador, pero como máximo 3?
PESO
g) ¿Qué porcentaje de familias tiene más de 3 computadores?
Figura 8. Representación gráfica de la ojiva
Fuente: (elaboración propia)
Solución:
A continuación se presentan algunos ejemplos sobre el material visto. c) El tipo de variable es discreta, ya que el número de computadores sólo puede tomar
determinados valores enteros.
Ejemplo 1
Se desea determinar el número de computadores por familia en una pequeña ciudad. Para
ello se han encuestado a 50 familias respecto al número de computadores que poseen, y
se han obtenido los siguientes datos:
Solución:
e) El número de familias que tienen dos o menos computadores es 2+4+21 = 27
a) La población objeto de estudio son los empleados de una entidad financiera.
f) El número de familias que tienen más de un computador, pero tres como máximo, es
b) La variable que estamos estudiando es el tiempo.
21 + 15 = 36
c) El tipo de variable es continua.
g) El porcentaje de familias con más de 3 computadores es 0,12 + 0,04 = 0,16 =
d) El problema que plantea es que existen muchos valores diferentes; por lo tanto es
16%. bueno agrupar los datos en grupos o intervalos.
Ejemplo 2 Para la elaboración de la tabla, primero calculamos el rango de los datos
El gerente de una entidad financiera quiere determinar el tiempo (en minutos) que gastan R = máximo – X mínimo = 6.1 – 3.1 = 3
los empleados en la atención a los clientes. Los valores obtenidos son:
Aplicamos la fórmula para determinar el número de intervalos.
4,8 5,0 3,7 5,6 4,3 4,9 4,7 6,1 5,1 4,5 m = 1 + 3,3log(n)
m = 1 + 3,3log (30)
5,8 3,9 4,3 5,0 4,5 4,7 5,1 4,2 4,4 5,3
m=6
4,3 4,1 3,1 5,8 4,4 5,8 6,1 4,3 5,3 4,5
Por lo tanto se toman 6 intervalos o grupos.
Obtenemos la amplitud de grupo dividiendo el rango sobre el número de grupos, así: 3/6
3,9 5,4 4,0 4,7 3,2 4,5 4,7 4,2 6,0 3,9
= 0,5