Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
14 Estadística
14.1 Introducción
La palabra Estadística deriva de la palabra latina “status” que significa Estado. Al comienzo, las primeras
estadísticas se referían a cosas propias del Estado; de ahí proviene su nombre.
En la actualidad, la compleja y abundante información que se requiere transmitir, exige ser presentada ordena-
damente, de modo que sea posible usarla en la toma de decisiones. La importancia de la Estadística radica
precisamente en que facilita la obtención, ordenación y presentación de una gran cantidad de datos, en forma
simple y práctica.
La Estadística es la ciencia que estudia un conjunto de técnicas y procedimientos que permiten recoger
datos, presentarlos, ordenarlos y analizarlos, de manera que a partir de ellos se puedan inferir conclusiones.
En un sentido elemental, la palabra Estadística se usa para referirse a los datos mismos o a números que se
obtienen a partir de ellos. Así, hablamos de estadística de empleo, estadística de salarios, estadística de peso
promedio de estudiantes, etc.
La estadística tiene dos ramas diferentes: Estadística Descriptiva y Estadística Inferencial.
La Estadística Descriptiva es la que empleamos en la descripción y análisis de conjuntos de datos.
14.3 Variable
La variable estadística es una característica común que presentan todos los elementos de la población, que es
materia de estudio o investigación y que puede tomar valores diferentes; se representa por x, y, z.
Por su naturaleza las variables pueden ser cualitativas o cuantitativas.
Variables cualitativas
Son aquellas variables que expresan una cualidad o atributo de la población.
Pueden ser nominales u ordinales.
|TConsumidores moderados
Consumidores severos (alcohólicos)
|| Primaria
Secundaria
Variables cuantitativas
TSuperior
Son aquellas que se pueden “contar” o “medir”.
1
Estado S e x o
civil Total
Masculino Femenino
Soltero 31 54 85
Casado 69 76 145
Viudo 11 20 31
Divorciado 9 12 21
Total 120 162 282 Grado de S e x o
2 estudio Total
Masculino Femenino
Primero 24 16 40
Segundo 18 25 43
Tercero 27 13 40
Cuarto 25 19 44
Quinto 22 12 34
Total 116 85 201
II) Para organizar los datos que corresponden a variables cuantitativas se les agrupa en intervalos de clase, y
luego se procede al conteo de datos por intervalo (frecuencia del intervalo), obteniéndose así la tabla de
frecuencias, también denominada, “tabla de distribución de frecuencias”.
Ejemplos:
1 Edades de 120 personas adultas, clasificadas en 2 Peso en kg de 110 personas, clasificados en in-
intervalos. tervalos.
Intervalos Frecuencias Intervalos Frecuencias
18 − 28 34 40 − 50 12
28 − 38 21 50 − 60 20
38 − 48 40 60 − 70 35
48 − 58 18 70 − 80 39
58 − 68 7 80 − 90 4
Total 120 Total 110
Ordenación de datos
Generalmente, los datos correspondientes a una variable que representa una cantidad, aparecen en forma
desordenada. Ordenarlos significa colocarlos en orden creciente o decreciente.
Ejemplo:
Los datos 6, 7, 6, 5, 9, 8, 5, 5, 8, 9, 8 se pueden ordenar así: Un importante elemento estadístico relacionado
con un grupo de datos es su rango o recorrido.
Ordenación creciente 5 , 5, 5, 6, 6, 7, 8, 8, 8, 9, 9 El rango de un conjunto de datos es la diferencia
Ordenación decreciente 9 , 9, 8, 8, 8, 7, 6, 6, 5, 5, 5 entre el mayor y el menor de ellos.
Ejemplo:
Si la estatura del alumno más alto del 4o B es 1,76 m y del más bajo es 1,55 m, entonces el rango de estos
datos es: 1,76 m - 1,55 m = 0,21 m = 21 cm
83 82 87 64 63 75 83 62 67 83
Ejemplo: En una prueba tomada a
50 alumnos, se registraron los si- 68 85 66 61 83 76 83 67 78 76
guientes puntajes: 83 72 72 70 84 71 77 82 79 83
77 74 67 80 84 75 73 75 83 84
77 72 89 80 87 77 63 72 84 78
Para ordenarlos y agruparlos, establecemos los intervalos que se usarán para distribuirlos, determinando el
rango (R) de estos datos.
a) Dato mayor = 89; dato menor = 61; d) Los intervalos se forman así:
rango = 89 - 61 = 28 → R = 28 61 - (61 + 4 = 65) U
|| 61 − 65
65 - (65 + 4 = 69) 65 − 69
b) Para determinar el número de intervalos (m) se
escoge m = 7 intervalos por ser R = 28 múltiplo 69 - (69 + 4 = 73) || 69 − 73
de 7. 73 - (73 + 4 = 77) V
||
73 − 77
c) El tamaño o amplitud de cada uno de los inter- 77 - (77 + 4 = 81) 77 − 81
valos está dado por:
81 - (81 + 4 = 85) || 81 − 85
w=
R
→ w=
28
= 4 (También se llama 85 - (85 + 4 = 89) |W 85 − 89
m 7 ancho de clase: C)
Todo intervalo tiene un punto medio que recibe el Intervalos de Marca de Frecuencia
Conteo ƒi
nombre de marca de clase (xi). La marca de clase Puntajes L i ,L s clase xi
se obtiene calculando el promedio entre los límites 61− 65 63 IIII 5
inferior y superior de cada intervalo.
65 − 69 67 IIII 5
L +L Li = límite inferior 69 − 73 71 IIIII 6
Así: xi = i s
2 Ls = límite superior
73 − 77 75 IIIIII 7
61 + 65 77 − 81 79 IIIIIIII 9
Ejemplo: 61 − 65 à x1 = = 63
2 81− 85 83 IIIIIIIIIIII 14
65 + 69 [85 − 89] 87 IIII 4
61 − 69 à x2 = = 67
2
n = 50
Luego, elaboramos el cuadro siguiente:
Nota: El último intervalo se toma cerrado para incluir el
dato mayor.
Fm = Fm - 1 + f m
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
M
Hm = h1 + h2 + h3 + ... + hm-1 + hm = Hm-1 + hm
Interpretaciones:
f3 = 28 → 28 personas tienen estaturas de 1,73 m a 1,77 m
f6 = 5 → 5 personas tienen estaturas de 1,88 m a 1,93 m
h2 = 0,088 → 8,8 % del total tienen estaturas de 1,68 m a 1,72 m
F4 = 57 → 57 personas tienen estaturas de 1,63 m a 1,82 m
H5 = 0,938 → 93,8 % del total tienen estaturas de 1,63 m a 1,87 m
Taller 8 2
Ejercicio 1 Considerar los datos siguientes: Resolución:
7 12 14 8 9 15
10 8 11 12 8 8
14 13 10 8 9 12
Taller
7 10 8 12 13 11
14 15 12 9 7 9
i) Ordénalos en forma creciente
ii) Calcula el rango de los datos
iii) Calcula la frecuencia de los datos 8; 10 y 15
iv) De todos los datos, ¿cuál tiene más frecuencia?
Ejercicio 2 Las notas obtenidas por 50 alumnos en una prueba de matemática fueron las siguientes:
6 20 15 12 8 10 7 14 13 9
12 19 20 13 8 6 10 12 15 18
18 16 7 8 9 12 14 15 9 12
13 10 10 7 9 13 14 16 17 19
20 18 12 14 16 16 7 10 10 15
Construye la tabla de distribución de frecuencias considerando 7 intervalos iguales y responde.
i) ¿Cuál es la clase con menor frecuencia?
ii) ¿Cuántos alumnos obtuvieron 14 ó 15 de nota?
iii) ¿Cuántos alumnos obtuvieron de 6 a 13 de nota?
iv) ¿Qué porcentaje de alumnos obtuvieron de 18 a 20 de nota?
v) ¿Qué porcentaje de alumnos obtuvieron menos de 12 de nota?
vi) ¿Cuántos alumnos obtuvieron menos de 16 de nota?
vii) ¿Qué porcentaje de alumnos obtuvieron de 10 a 15 de nota?
[170-178] 4
[179-187] 7
[188-196] 12
[197-205] 16
[206-214] 35
[215-223] 37
[224-232] 11
[ 233-241] 8
61,- 65 63 5
65,- 69 67 5
Le corresponde el
69,- 73 71 6
siguiente histograma
73,- 77 75 7
77,- 81 79 9
81,- 85 83 14
[85,- 89] 87 4 xi
Polígono de frecuencias
Otra forma de representar una distribución de frecuen-
cias es a través del polígono de frecuencias, que es
aquella poligonal que se obtiene al unir los puntos co-
rrespondientes a los pares ordenados, originados por
cada marca de clase y su respectiva frecuencia, inclui-
dos los intervalos de frecuencia cero, uno en cada
extremo de la distribución.
Observación
Los vértices del polígono de frecuencias
corresponden a los puntos medios de los lados
superiores de los rectángulos del histograma.
xi
Ojiva
35
Puntajes Frecuencias
acumuladas (F i ) 30
Menor que 61 0
25
Menor que 65 5
Menor que 69 10 20
Menor que 73 16
Menor que 77 23 15
Menor que 81 32 10
Menor que 85 46
Menor que 89 50 5
0 61 65 69 73 77 81 85 89
puntajes
n
La media aritmética de n datos numéricos x1, x2, x3, ... xn que se
designa por x es el cociente obtenido al dividir la suma de todos los x + x + x3 + ... + xn i=1
∑ xi
x= 1 2 =
datos entre la frecuencia total n. n n
Ejemplo 1 Calcular la media aritmética de las Ejemplo 2 Un alumno obtuvo 08 y 12 como notas
edades de 42 alumnos, si sabemos que 1 alumno en dos pruebas escritas y 11 en el examen bimestral. Si
tiene 16 años,4 alumnos tienen 17 años, 35 alum- el examen bimestral tiene doble importancia que la prueba
nos tienen 18 años y los 2 alumnos restantes tienen escrita, ¿cuál es la nota promedio del bimestre?
19 años. Resolución:
xi fi Presentemos los datos en una tabla:
16 1 Notas Impor tancia o peso Nota × peso
17 4 08 1 08 × 1 = 08
18 35 12 1 12 × 1 = 12
19 2 11 2 11× 2 = 22
Total 4 Σnota × peso = 42
1⋅ 16 + 4 ⋅ 17 + 35 ⋅ 18 + 2 ⋅ 19
x=
1+ 4 + 35 + 2 Nota promedio Σ nota × peso 42
del bimestre
= = = 10,5
752 Σ pesos 4
x=
42 Si se considera el medio punto a favor del alumno, la nota
promedio del bimestre sería 11 (APROBADO).
x = 17,9 años Rpta.
La nota promedio normal, sin considerar la importancia o
08 + 12 + 11 31 )
peso, sería: = = 10,3 (DESAPROBADO)
3 3
b) Cada marca de clase se multiplica por su respectiva frecuencia absoluta, luego se suman los productos
obtenidos.
c) La media aritmética ( X ) se calcula dividiendo la suma de los productos obtenidos, entre la suma de
frecuencias absolutas, es decir:
k k
∑ Mi × f i ∑ Mi × f i
i= 1 i= 1
X = o X =
Σ fi n
60 − 70 35 1,73 - 1,78 28
1,78 - 1,83 17
70 − 80 39
1,83 - 1,88 18
80 − 90 4
1,88 - 1,93 5
Total 110
Total 80
10 + 12 + 15 + 16 + 18 71
X = = = 14,2
5 5
2 Es representativa del conjunto de datos, porque en su cálculo intervienen todos ellos, como se observa en
el ejemplo anterior.
3 Se utiliza en el cálculo de otros estadígrafos como, por ejemplo, las medidas de dispersión: desviación
media, desviación típica o estándar, el coeficiente de variación.
4 No es representativa cuando hay valores que se diferencian notablemente del resto.
L
M
110 O
− 32 P
Clase
mediana
1,73 - 1,78 28 fMe
à Me = 60 + M 2 1,78 - 1,83 17
35 P
× 10
M
N Q P 1,83 - 1,88 18
1,88 - 1,93 5
L23 O× 10
Me = 60 + M P Total 80
N35 Q Para calcular la mediana aplicamos la fórmula:
Me = 60 + 6,57 ∴ Me = 66,57 kg
L
n
M −b
O
Σ f gP
1
L
80
M O
− 12P
2 , +M2
Interpretación: El peso máximo del 50% de las
Me = L + M
i
M fMe
P
×C
P
à Me = 173
M 28 P
P× 0,05
personas es 66,57 kg que a su vez es el peso mínimo
N Q N Q
del 50% restante de personas, como se ve en la figura: L
M
28 O
Me = 66,57 kg
Me = 1,73 +
N28 P
Q× 0, 05
Me = 1,73 + 0,05
∴ Me = 1,78 m
La moda
La moda, designada por Mo, de un conjunto de datos es aquel que tiene la mayor frecuencia.
En otras palabras, es el valor que aparece más repetido. Dependiendo de los datos, es posible que la moda
no exista y también que pueda haber más de una.
Ejemplos: Resolución:
• La moda de los datos: Persona Edad La media aritmética o promedio es la
2; 3; 3; 3; 5; 8 es: Mo = 3 1 55 suma de todos los números del conjunto
2 52 dividido por el número de ellos.
• El conjunto de datos: 3 51
1061
1; 2; 2; 2; 2; 4; 5; 6; 6; 6; 6; 7 tiene
4 50 x= = 42,44 años
5 49 25
dos modas Mo = 2 y Mo = 6 6 48
7 47 La mediana de un conjunto ordenado de
• Entre los datos: 10; 13; 14; 15; 18; 20 8 45 números es el número que está en el cen-
no existe moda. 9 44 tro en la ordenación.
10 43 41 es la mediana
Ejemplo: Nataly elaboró una lista de las 11 42
edades de los padres de sus compañeros 12 42 La moda de un conjunto de números es
de clase. En la lista había 25 números. 13 41 el número, si lo hay, que aparece más
14 40 veces en el conjunto.
Determinar: 15 40 38 es la moda
La media aritmética, la mediana y la moda 16 39
17 39
de dichas edades. Atención
18
19
38
38
U
|V Si el total de datos, hubiera sido
42 38 40 45 42 20 38
50 36 35 51 38 21 38
|W par, la mediana sería entonces el
39 40 38 49 38 22 37 promedio de los dos “números
48 34 43 47 37 del medio”. La media aritmética,
23 36
52 55 44 39 41 24 35 la mediana y la moda se llaman
25 34 medidas de tendencia central.
Total 1061
F ∆ I× C
a) La clase modal es la que tiene mayor frecuen- d) Se aplica la fórmula: Mo = Li + G
H∆ + ∆ JK
1
1
2
cia. Se anota su límite inferior (Li) y su fre- donde: Mo : moda
cuencia f
Modi
. Li : límite inferior de la clase modal
b) Se calcula: ∆1 = fMo − fanterior ∆1 : fmodal - fanterior
c) Se calcula: ∆ 2 = fMo − fposterior ∆2 : fmodal - fposterior
C : ancho de la clase modal
Ejemplo 1 Calcular la moda de la siguiente dis- Para calcular la moda aplicamos la fórmula:
tribución de frecuencias:
F ∆ I× C
Peso en kg de 110 personas, clasificados en intervalos Mo = Li +G
H∆ + ∆ JK
1
1
2
Intervalos Frecuencias à
F 4 IJ× 10
Mo = 70 + G
H4 + 35 K
40 − 50 12
40
50 − 60 20 Mo = 70 + Mo = 71,025
39
60 − 70 35 Mo = 70 + 1,025 ∴ Mo = 71,03 kg
70 − 80 39 Interpretación: El peso que más se presenta
entre las 110 personas es 71,03 kg.
80 − 90 4
50 − 60 20 1,88 - 1,93 5
∆1=39 - 35=4
60 − 70 35
U
V Total 80
Wf modal
Clase 70 − 80 39 ¿Cuál es la estatura que más se presenta entre los 80
modal U
V∆ =39 - 4=35 postulantes?
80 − 90 4 W 2
Total 110
Intervalos Frecuencias
Resolución: 1,63 - 1,68 5
a) La mayor frecuencia es 28, por lo tanto la clase 1,68 - 1,73 7 U
V∆ =28 - 7=21
1
modal es 1,73 − 1,78 , entonces:
Li = 1,73 Clase 1,73 - 1,78 28 Wf
fMo = 28 mediana U
V
modal
1,78 - 1,83 17
W∆ =28 - 17=11
2
Mo = 1,73 + F
21 I
à G
H21+ 11J
K× 0,05 Interpretación:
La estatura que más se presenta entre los 80
F21I
Mo = 1,73 + G J× 0, 05 postulantes es 1,76 m.
H32K
Recomendaciones para el uso de la moda
Resolución:
Se nota que el dato que más se presenta es
La mayor frecuencia es 39 y corresponde a
90. No influye el dato muy pequeño (5) ni el ARIEL, esto significa que el detergente de ma-
dato muy grande (507). yor aceptación en el mercado es ARIEL, es el
∴ La moda es 90 más usado, el que más se repite en las res-
puestas de las 103 amas de casa encuestadas.
2 También, al igual que la mediana, es útil en ∴ La moda es ARIEL.
una distribución de frecuencias que tiene in-
tervalos de clase abiertos en los extremos. 4 No es representativa cuando no existe repeti-
ción importante de alguno de los datos.
3 Es útil también en variables nominales.
5 Cuando ningún valor se repite, el conjunto de
Ejemplo: datos no tiene moda.
La tabla siguiente presenta la aceptación en el
6 Si el conjunto de datos tiene varias modas se
mercado, de los detergentes señalados, en una dificulta su interpretación.
encuesta a 103 amas de casa.
Taller 8 3
Ejercicio 1 Con respecto a la siguiente tabla que muestra el sueldo mensual de un grupo de
trabajadores, elaborar un histograma y el polígono de frecuencias.
Taller
Ejercicio 2 Un alumno obtuvo las siguientes Ejercicio 3 El promedio de siete números en-
notas parciales en matemática: 16; 12; 10; 15 y teros consecutivos es “x”; si al menor le restamos
una quinta nota que no recuerda. Si su promedio 7, el nuevo promedio será.
fue 13,4; calcular la nota que falta.
Resolución:
Resolución:
Rpta. Rpta.
Rpta.
[1,56 – 1,6 0 28
[ 40 – 45 7
[1,60 – 1,6 4 22 [ 45 – 50 10
Total 80 [65 – 70 5
Total 53
Consumo de carne
N° de Familias
de res (en kg) N° de aciertos N° de alumnos
[0 – 1,5 8
10
[0 – 4 12
[1,5 – 2,0
[4 – 8 8
[2,0 – 2,5 6
[8 – 12 16
[2,5 – 3,0 9
[12 – 16 8
[3,0 – 3,5 4
40 Total 50
Total
Razonamiento y Demostración
1 . Una con una flecha cada concepto de la izquierda con su correspondiente término de la derecha.
Escriba dentro de las llaves los números de los elementos que forman parte del conjunto considerado.
Comunicación Matemática
13 11 15 17 16
12 16 12 11 14
15 13 17 11 13
12 16 11 15 16
16 tiene .
17 g) Si se suman todas las frecuencias relativas, se ob-
tiene .
4. El proceso para obtener el promedio de las edades de todos los alumnos es el siguiente: (LLene cada
recuadro con el valor correspondiente)
Edades Frecuencias
(en años) absolutas Edad · Frecuecnia
11
12
13
14
15
16
17
TOTAL B A
A
Edad promedio = = años.
B
Problemas de reforzamiento
Problema 1 La siguiente tabla muestra la distribución Problema 5 Calcular el porcentaje de personas que
del ingreso familiar que corresponde a 80 familias obtuvieron menos de 83 puntos, en relación a la tabla
Si: fi = frecuencia absoluta del ejercicio 3.
Fi = frecuencia absoluta acumulada A) 21 % B) 17 % C) 42 % D) 37 % E) 49 %
hi = frecuencia relativa
Problema 6 El siguiente histograma muestra las no-
determinar el número de familias que ganan menos de tas obtenidas por los alumnos de una sección en el
200 nuevos soles. curso de Biología.
N°
Intervalos de ingreso S/. fi Fi hi
160 - 170
170 - 180 48 60
180 - 190 0,125
190 - 200 0,175
0,075
200 - 210