Sei sulla pagina 1di 113

2

Matemática

Estadística

3
ÍNDICE

1. Población y muestra.............................................. 6
2. Estadística Descriptiva ......................................... 9
Ejercicios 2-1 ........................................................ 12
Hoja de respuestas 2-1 ........................................ 16
3. Amplitud de una variable................................... 21
4. Intervalos de clase............................................... 25
5. Gráficos. Histogramas, polígonos de
frecuencia, tortas, barras......................................... 30
6. Medidas de centralización ( de posición o de
tendencia central)..................................................... 39
7. Moda ..................................................................... 44
8. estadística. Ejercicios ......................................... 47
Hoja de respuestas ............................................... 50
9. Medidas de dispersión (o de desviación) ......... 53
10. Desviación Media.............................................. 56
11. Desviación estándar (s) .................................... 61
12. Varianza.............................................................. 64
13. Distribución normal - curva de Gauss.......... 69
Ejercicios 13-1...................................................... 75
Hoja de respuestas 13-1 ...................................... 78
14. Correlación......................................................... 80
14.1 ¿Cómo se calcula el coeficiente de
correlación lineal? ............................................... 92

4
14.2 Ejercicios ...................................................... 98
15. Media, Moda y Mediana................................. 103

5
1. POBLACIÓN Y MUESTRA

Para hacer el estudio de los caracteres que se


desea conocer se hacen observaciones. Si las ob-
servaciones se realizan sobre el total de un grupo,
a ese grupo se lo denomina población o universo y
cada observación se llama individuo.

Por ejemplo:
Si se efectúa un censo ganadero

población el conjunto de
animales

individuo cada animal

Si se efectúa un censo sobre viviendas


población el total de
viviendas

individuo cada vivienda

Si en una empresa se toman los salarios de


cada empleado

6
población el conjunto de
salarios

individuo cada salario

Muchas veces es muy difícil estudiar el


número total (N) de los individuos de una pobla-
ción debido al costo económico, el tiempo que
llevaría o por ser muy difícil de delimitar ese nú-
mero total.
Por ejemplo, si se desea saber la diferencia
de presión sanguínea entre hombres y mujeres,
sería imposible determinar la presión se todos los
hombres y de todas las mujeres. El problema se
resuelve recurriendo a las muestras.
Se llama muestra al conjunto de n indivi-
duos (n < N) elegidos al azar entre los N de una
población dada.
Si en el ejemplo anterior se toma la pre-
sión a 200 personas elegidas al azar:

Población Total de
personas existentes

Muestra Los 200


personas escogidas

Individuo Cada persona

7
Para que los estudios realizados sobre la
población sean válidos, la muestra debe ser repre-
sentativa de la población. Por ejemplo, si se quiere
estudiar la incidencia del mal de Chagas en la Pro-
vincia del Chaco, y se toma una muestra de pobla-
ción perteneciente sólo a la ciudad de Resistencia,
el estudio estadístico no es válido, ya que se está
estudiando sólo individuos de la zona metropoli-
tana, dejando de lado la zona rural. En este caso se
dice que la muestra no es representativa de la po-
blación.

EJERCICIOS

1. Se quiere realizar un estudio para determi-


nar la cantidad promedio de huevos que ponen los
pingüinos hembras en el período reproductivo en
Puerto Madryn. Determiná población y muestra
del estudio.

2. Se quiere determinar la audiencia de cierto


programa televisivo de televisión de aire. Deter-
miná muestra y población.

8
2. ESTADÍSTICA DESCRIPTIVA

Actualmente es difícil leer un informe de cual-


quier actividad humana con repercusión pública
que no esté acompañada por tablas ó gráficos
estadísticos: el periodista los utiliza para enrique-
cer su comentario escrito; el empresario, para ex-
plicar su cuenta de resultados; el publicista, para
transmitir un mensaje visualmente concreto; y
todos, para facilitar la comprensión de una infor-
mación generalmente densa y con datos de com-
plicada presentación.

Ante tal cúmulo de información y de datos,


muchas veces el lector termina leyendo solamente
el gráfico y la tabla adjunta. Por lo tanto, es im-
prescindible aprender a leer e interpretar este mo-
do de comunicación y también aprender a confec-
cionarlos para que los demás la entiendan con
claridad.

La definición matemática de la estadística


es:

9
Ciencia que utiliza conjuntos de datos
numéricos para obtener a partir de ellos
inferencias basadas en el cálculo de pro-
babilidades.

El lenguaje de la estadística
Vamos precisar algunos términos propios del
lenguaje estadístico:

Población: se denomina población al con-


junto de todos los elementos que cumplen una
determinada característica, que deseamos medir ó
estudiar.

Muestra: Se denomina muestra a cualquier


subconjunto de la población. El número de ele-
mentos de la muestra se llama tamaño de la mis-
ma. Cuando el tamaño de la muestra coincide con
la población, se llama censo.

Individuo (objeto): Se considera individuo a


cada uno de los elementos de la población.

10
Carácter estadístico: Cada una de las propie-
dades (aspectos) que pueden estudiarse en los
individuos de una población recibe el nombre de
carácter.
Un carácter puede ser cuantitativo si se puede
medir.
Un carácter es cualitativo si no se puede me-
dir, o sea se puede comparar.

Variables estadísticas: Una variable estadís-


tica se llama discreta cuando sólo se pueden tomar
determinados valores de ella. En cambio la varia-
ble se llama continua cuando puede tomar todos
los valores de un intervalo

Intervalos de clase: Se llama intervalos de


clase a cada uno de los intervalos en que pueden
agruparse los datos de una variable estadística

11
EJERCICIOS 2-1

EJERCICIO 1

Dados los siguientes datos de longitud de vari-


llas:
52, 80, 65, 82, 77, 60, 72, 83, 63
78, 84, 75, 53, 73, 70, 86, 55, 88
85, 59, 76, 86, 73, 89, 91, 76, 92
66, 93, 84, 62, 79, 90, 73, 58, 71

a- Agrupá los datos en clases y establecé la


frecuencia y frecuencia relativa
b- Calculá la media, mediana y moda
c- Graficá los datos en grafico de barras.

12
EJERCICIO 2

Se ha realizado en EE.UU. una estadística so-


bre la capacidad matemática de los alumnos de 14
años los resultados son los siguientes:

Resultados 30-32 33-35 36-38 39-41 42-44 45-47 48-50


F (EE.UU.) 5 5 10 15 40 15 10

a- Halla los puntos medios de cada intervalo de


clase.
b- Graficá los polígonos de frecuencias.
c- Calculá la desviación estándar y la varianza

EJERCICIO 3

La siguiente tabla muestra los pesos en Kg. de


luchadores de Sumo
KG. 140-144 145-149 150-154 155-159 160-164 165-169
Frecuencia 5 7 10 16 8 4
Frecuencia
relativa

13
a- Completá la tabla dada
b- Calculá la moda, media y mediana
c- Graficá

EJERCICIO 4

Del campeonato local de fútbol se han elegido


partidos, en la tabla se muestran el número de
goles:
Números de goles 1 2 3
Números de 8 8 x
partidos

a- Si la media de goles es de 2,04; hallá x


b- Si la moda de goles es 3, determiná el me-
nor valor que puede tener x.
c- Si la mediana es de 2 goles, hallá el mayor
valor positivo de x.

14
EJERCICIO 5

En una encuesta, se pregunta a 50 personas


sobre el número se libros que se leen al año. Los
resultados se muestran en la tabla:
Nº de 0 1 2 3 4 5 6 7 8
libros
Frecuencia 5 5 6 9 11 7 4 2 1
Frecuencia
relativa

a- Completá la tabla
b- Calculá la media de los libros leídos por per-
sona
c- Calculá la varianza y desvío estándar.
d- Realizá el grafico de tortas o circular.

15
HOJA DE RESPUESTAS 2-1

EJERCICIO 1

a-
Longitud de Marca o Frecuencia Frecuencia Marca de
las varillas intervalo Relativa clase x
(en m) de clase frecuencia
50-59 54,5 4 0,111 218
60-69 64,5 6 0,166 387
70-79 74,5 12 0,333 894
80-89 84,5 10 0,277 845
90-99 94,5 4 0,111 378
Total 36 0,998 2722

b-
La media aritmética es 75,6 m
La mediana se encuentra en el intervalo 70-79;
es exactamente 76 m
La moda es la longitud de varillas de 70-79

16
c-

Gráfico de barras de longitud de


varillas

15

10

0
50-59 60- 69 70- 79 80-89 90-99

EJERCICIO 2

a-
Resultados 30-32 33-35 36-38 39-41 42-44 45-47 48-50
F (EE.UU.) 5 5 10 15 40 15 10
Punto medio 31 34 35 40 43 46 49

b-
Poligono de frecuencia (Capacidad de alumnos
de matemática)

45
40
35
30
25
20
15
10
5
0
30-32 33-35 36-38 39-41 42-44 45-47 48-50

17
c- La varianza es 13,3 m y el desvío estándar
es 3,6 m

EJERCICIO 3

a-
KG. 140-144 145-149 150-154 155-159 160-164 165-169
Frecuencia 5 7 10 16 8 4
Frecuencia 0,1 0,14 0,2 0,32 0,16 0,08
relativa

b-
La moda es el intervalo 155-159
La media aritmética es 154,7 Kg.
La mediana es 155,75 Kg.
c-

Gráfico de barras (Pesos de


luchadores de Sumo)

20

15

10

0
140-144 145-149 150-154 155-159 160-164 165-169

18
EJERCICIO 4

a- X=9
b- El valor menor valor que puede tomar x es
9
c- El mayor valor positivo de x es 15

EJERCICIO 5

a-
Nº de 0 1 2 3 4 5 6 7 8
libros
Frecuencia 5 5 6 9 11 7 4 2 1
Frecuencia 0,1 0,1 0,12 0,18 0,22 0,14 0,08 0,04 0,02
relativa

b- La media es 3,38
c- La varianza es 1,26 y el desvío estándar es
1,12

19
d-

Gráfico de tortas (Nº de libros leídos) 1


2
3
4
5
6
7
8
9

20
3. AMPLITUD DE UNA VARIABLE

Amplitud:
Es la diferencia entre el valor máximo y
mínimo que puede tomar la variable
Amplitud = xmáx - xmin

● Cuando la variable es continua

EJEMPLO 1

El cuadro muestra la cantidad de hijos que tie-


nen ciertas mujeres.

21
Nº de hijos fi
xi
0 2
1 5
2 7
3 4
4 1
5 1

Amplitud = xmáx - xmin


=5–0
A=5

● Cuando la variable es continua

EJEMPLO 2

El siguiente cuadro muestra las temperaturas


registradas durante dos primaveras, en un obser-
vatorio.

22
Temperaturas fi

15º 12

16,5º 5

17,2º 8

17,5º 7

18,2º 1

Amplitud = xmáx - xmin


Amplitud = 18,2º - 15º
Amplitud = 3,2º
● Cuando la variable viene dada en in-
tervalos

EJEMPLO 3:

En la tabla se muestran los salarios en pesos,


de los empleados de la compañía “S&S”

23
Salarios ($) Frecuencias

50 – 69,99 5

70 – 89,99 12

90 – 109,99 10

110 – 129,99 15

130 – 149,99 18

150 – 169,99 31

170 – 189,99 35

Amplitud = xmáx - xmin


Amplitud = $189,99 - $50
Amplitud = $139, 99.-

24
4. INTERVALOS DE CLASE

Si tenemos un gran número de datos de una


variable continua (cuando puede tomar cualquier
valor real), es conveniente agruparlos en intervalos
consecutivos, de manera que cada dato pertenezca
a un solo intervalo.

EJEMPLO 1

Los siguientes datos corresponden a las alturas


(en cm) de un grupo de 24 alumnos de cuarto
grado:

125 130 132 140 128 132


128 132 139 133 142 130
138 133 142 136 145 124
126 147 138 134 128 132

25
Primer paso:
● Calculamos la amplitud
A = xmax - xmin
A= 147 –124
A= 23

Segundo paso:
● Determinamos el número de intervalos
Como la muestra tiene 24 individuos, se de-
terminarán 6 intervalos de amplitud 4 ya que
23
≅4
6

Tercer paso:
● Determinamos los intervalos.
El primer intervalo se toma a partir del valor
mínimo. Para evitar que los extremos del intervalo
coincidan con un valor de la variable se los define
restando media unidad del último decimal.

El primer intervalo se toma a partir del

26
124 – 0,5=123, 5

Valor mínimo Limite inferior de la clase

El segundo intervalo se toma a partir de

123,5 + 4 = 127,5

Amplitud del intervalo (Calculado en


el paso 2)

Intervalo de clase Frecuencia


123,5-127,5 3
127,5-131,5 5
131,5-135,5 7
135,5-139,5 4
139,5-143,5 3
143,5-147,5 2

Cantidad de alumnos que


tienen una altura pertene-
ciente al intervalo de cada
clase

27
EJEMPLO 2

El puntaje de la evaluación de matemática de


32 estudiantes se registran en la siguiente tabla:
68 84 75 82 96 78 89 61
79 62 67 97 73 79 88 73
61 65 75 87 66 78 82 75
65 80 73 57 86 67 73 81

Primer paso:
● Calculamos la amplitud.
A = xmax - xmin
A = 97 – 57
A = 40

Segundo paso:
● Determinamos el número de intervalos
40
= 8 . Formamos 5 intervalos de ampli-
5
tud 8.

28
Tercer paso:
● Determinamos los intervalos.

El primer intervalo se toma a partir del 57 – 0,5=


56,5
El segundo intervalo se toma a partir 56,5 + 8 =
64,5

Intervalos de clase Frecuencias

56,5 – 64,5 4

64,5 – 72,5 6

72,5 – 79,5 11

79,5 –87,5 7

87,5 – 95,5 2

95,5 - 103,5 2

29
5. GRÁFICOS. HISTOGRAMAS, PO-
LÍGONOS DE FRECUENCIA, TOR-
TAS, BARRAS

HISTOGRAMAS

Un histograma consiste en una serie


de rectángulos que tienen:
-Sus bases sobre un eje horizontal (eje
x) con centros en los puntos medios de los
intervalos de clase y la longitud a igual al
tamaño de los intervalos de clase.
-Superficies proporcionales a las fre-
cuencias de clase.

EJEMPLO:

La siguiente tabla muestra la altura de ciertos


árboles (en metros) y su frecuencia. Graficá en un
histograma.

30
Altura Cantidad de árboles
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100

Determinamos los puntos medios de los in-


tervalos de clase.

Limite superior + limite inferior


= punto medio
2

Altura Cantidad de Punto medio Tamaño de los


árboles intervalos
60-62 5 61 62- 60= 2
63-65 18 64 65-63= 2
66-68 42 67 68-66= 2
69-71 27 70 71-69= 2
72-74 8 73 74-72= 2
Total 100

31
POLÍGONOS DE FRECUENCIAS

Polígono de frecuencias:
Es un gráfico de línea trazado sobre los pun-
tos medios. Se obtiene uniendo los puntos me-
dios de los lados opuestos a las bases de los rec-
tángulos en el histograma; incluyendo el anterior
al primero y el posterior al segundo.

32
EJEMPLO:

La tabla muestra el tiempo (medido en horas)


que tardan en fundirse 50 lámparas halógenas de
larga duración.
A continuación encontrarás el polígono de
frecuencia correspondiente.

Tiempo (en horas) Lámparas Puntos medios de los


intervalos
500 -1750 2 1125
1750 - 3000 7 2375
3000 - 4250 9 3625
4250 - 5500 12 4875
5500 - 6750 7 6125
6750 - 8000 6 7375
8000 - 9250 5 8625
9250 - 10500 2 9875

33
GRAFICO DE TORTA

Gráfico de torta: Los ángulos deben ser


proporcionales a las respectivas frecuencias, por
αº f .absoluta
lo tanto: =
360º total
A la cantidad total de la muestra le corres-
ponden los 360º del círculo.

EJEMPLO:

En la siguiente tabla se muestra la superficie


de distintas zonas del mundo en millones de millas
cuadradas.

34
Zonas Superficies
11,7

África
Asia 10,4

Europa 1,9

Norteamérica 9,4

Oceanía 3,3

Sudamérica 6,9

Centroamérica 7,9

El total de la superficie es 51,5 millones, en-


tonces le corresponden los 360º del círculo.
Para calcular el ángulo que le corresponde a
cada sector haremos regla de tres simple:
51,5 millones 360º
11, 7 millones x = 81º 47´
(África)

51,7 millones 360º


10,4 millones x = 72º 25´
(Asia)

35
51,7 millones 360º
1,9 millones x = 13º 13´
(Europa)

51, 7 millones 360º


9,4 millones x = 65º 27´
(Norteamérica)

51,7 millones 360º


3,3 millones x = 22º 58´
(Sudamérica)

51, 7 millones 360º


6,9 millones x = 48º 2´
(Centroamérica)

36
GRAFICO DE BARRAS

Gráfico de barras: Las anchuras de las barras


son todas iguales, puede elegirse cualquier tamaño
adecuado con tal de que las barras no se super-
pongan.

EJEMPLO:

En la tabla se muestran las velocidades orbita-


les de los planetas del sistema solar. A continua-
ción encontrarás el gráfico de barras correspon-
diente.

Planeta Velocidades (milla /seg)


29,7
Mercurio
Venus 21,8

Tierra 18,5

Marte 15,0

Júpiter 8,1

Saturno 6,0

Urano 4,2

Neptuno 3,4

Plutón 3,0

37
Gráfico de barras

38
6. MEDIDAS DE CENTRALIZA-
CIÓN ( DE POSICIÓN O DE TEN-
DENCIA CENTRAL)

Son una serie de valores que tratan de re-


presentar o resumir una distribución de fre-
cuencias dada. Además, se utilizan para compa-
rar distintas distribuciones de frecuencias.
Estas medidas son:
● la media aritmética (o promedio)
● la mediana
● la moda (o modo)

Mediana: de una serie de datos ordenados (en


forma creciente o decreciente) es el valor que tie-
ne tantas observaciones anteriores como posterio-
res a él.

● La variable no viene dada en intervalos

39
EJEMPLO 1

Se tira un dado 50 veces. Cada número y la


frecuencia con que han aparecido está indicado en
la tabla. Calculá la mediana.

Número del dado Frecuencia Frecuencia acumu-


lada
1 11 11

2 9 20

3 5 25

4 10 35

5 12 47

6 3 50

Total 50

La mediana corresponde a la observación cuya


n
frecuencia acumulada contenga a .
2
n 50
Como = = 25 la frecuencia acumulada 25
2 2
contiene a 25.

40
Como la frecuencia acumulada es 25 le co-
rresponde el número de dado 3. Entonces la me-
diana es 3.

● Cuando la variable está dada en forma


de intervalos

EJEMPLO 2

La tabla muestra una distribución de frecuen-


cias de los salarios en pesos de 65 empleados de
la Compañía P & R.

Salarios (en pesos) Nº Frecuencia acumulada


de empleados
50 – 59,99 8 8

60 – 69,99 10 18

70 – 79,99 16 34

80 – 89,99 14 48

90 – 99,99 10 58

100 – 109,99 5 63

110 – 119, 99 2 65

Total 65

41
n 65
Como = = 32,5 .
2 2
Como 32,5 está contenido en la frecuencia
acumulada 34, la mediana está en el intervalo 70 –
79,99.

Para obtener exactamente el valor utilizaremos


 n 
 − F1 
la siguiente fórmula: M = L1 +  2 .c
 f mediana 
 
 
donde L1= límite inferior del intervalo que
contiene a la mediana
n = número total de datos.
F1= Frecuencia acumulada anterior al interva-
lo que contiene a la mediana.
C = tamaño del intervalo que contiene a la
mediana.

42
Reemplazando en la fórmula:
 n   65 
 − F1   − 18 
M = L1 +  2 .c = 70 +  2 .9,99 ⇒ M = $79,06
 f mediana   16 
   
   

Gráficamente
En un histograma

Sueldos de em pleados

20 l 50 – 59,99
15 60 – 69,99
em pleados 10 70 – 79,99
5 80 – 89,99

0 90 – 99,99
1 100 – 109,99
sueldos 110 – 119, 99
m

La mediana es la abscisa correspondiente a la


recta lm que divide al histograma en dos partes de
igual área.

43
7. MODA

MEDIDAS DE CENTRALIZACIÓN (DE


POSICIÓN O DE TENDENCIA CENTRAL)

Son una serie de valores que tratan de repre-


sentar o resumir una distribución de frecuencias
dada.

Además, se utilizan para comparar distintas


distribuciones de frecuencias.

Estas medidas son:


• la media aritmética (o promedio)
• la mediana
• la moda (o modo)

44
Moda
El dato que se repite más veces, es decir, el de
mayor frecuencia, es la moda. Tiene la ventaja de
que es una medida que también es válida para
datos no numéricos. Es muy común y se utiliza
cotidianamente para describir la tendencia en el
vestuario de cada año.

La moda es el valor de la variable al


que le corresponde la mayor frecuencia.

Ejemplo
En la siguiente tabla, x i = 2 tiene la mayor
frecuencia, f i = 7.

xi fi
0 2
1 5
2 7 La moda es 2

3 4

45
4 1
5 1
Σ 20

Cuando en el conjunto de observaciones hay


una sola moda, se dice que la distribución es
unimodal.

Si hay dos variables con la misma frecuencia


máxima la distribución se llama bimodal.

Ejemplos

1. En la serie 5, 8, 5, 9, 6 la moda es 5 (f =2)


La distribución es unimodal

2. En la serie 3, 6, 9, 4, 4, 8, 9, 4, 9, las modas


son 4 y 9 (f = 3)
La distribución es bimodal.

46
8. ESTADÍSTICA. EJERCICIOS

EJERCICIO 1

En un curso de estadística de 15 alumnos


se registraron las siguientes notas:
2, 4, 8, 7, 9, 6, 6, 6, 5, 7, 8, 9, 6, 4, 2.
Ordená los datos y hallá:

a- La media aritmética.
b- La mediana.
c- La moda.
d- El rango.

EJERCICIO 2

En la primera semana del mes de enero se


registraron, en la ciudad de Buenos Aires, las
siguientes temperaturas:
25, 28, 27, 33, 31, 28, 29.
Ordená los datos y hallá:

a- La media aritmética.
b- La mediana.

47
c- La moda.
d- El rango

EJERCICIO 3

En el curso de estadística del problema 1)


se tomaron las alturas de los alumnos y los
datos fueron los siguientes:
1,79; 1,69; 1,72; 1,63; 1,67; 1,59; 1,69; 1,68;
1,78; 1,72; 1,65; 1,61; 1,70; 1,57; 1,72.
Ordená los datos y hallá:

a- La media aritmética.
b- La mediana.
c- La moda.
d- El rango.

EJERCICIO 4

El dueño de un negocio, con el fin de im-


plementar un nuevo plan de márketing, estu-
dia la cantidad de clientes que ingresan al
local, en el término de una semana, y los da-
tos fueron:
52, 20, 34, 83, 15, 21, 38, 42, 29, 18
Ordená los datos y hallá

48
a- La media aritmética.
b- La mediana.
c- La moda.

EJERCICIO 5

En la guardia de un hospital se tomaron


las medias aritméticas mensuales de los in-
gresos a la guardia, en el año 2000. Los regis-
tros fueron los siguientes:
2400, 2056, 3245, 2890, 2113, 3560, 2456,
3654, 2432, 2012, 1967, 1056.
Hallá:

a- La media aritmética.
b- La mediana.
c- El rango.

49
HOJA DE RESPUESTAS

EJERCICIO 1

Los elementos ordenados quedan: 2, 2, 4, 4, 5,


6, 6, 6, 6, 7, 7, 8, 8, 9, 9
a- X = 5.933
b- Mediana = 6
c- Moda = 6
d- Rango = 7

EJERCICIO 2

Los elementos ordenados quedan: 25, 27, 28,


28, 29, 31, 33
a- X = 28, 71
b- Mediana = 28
c- Moda = 28
d- Rango = 8

50
EJERCICIO 3

Los elementos ordenados quedan: 1,57; 1,59;


1,61; 1,63; 1,65; 1,67, 1,68; 1,69; 1,69; 1,70; 1,72;
1,72; 1,72; 1,78; 1,81

a- X = 1,682
b- Mediana = 1,68
c- Moda = 1,72
d- Rango = 0,24

EJERCICIO 4

Los elementos ordenados quedan: 15, 18, 20,


21, 29, 34, 38, 42, 52, 83

a- 35,2
b- 29
c- 83

51
EJERCICIO 5

Los elementos ordenados son: 1056, 1967,


2012, 2056, 2113, 2400, 2432, 2456, 2890, 3245,
3560, 3654
a- X = 2486,75
b- Mediana = 2416
c- Rango = 2598

52
9. MEDIDAS DE DISPERSIÓN (O
DE DESVIACIÓN)

Las medidas de centralización (la moda, la


media y la mediana) tratan de representar o resu-
mir una distribución de frecuencias dada en un
solo valor.

Las medidas de dispersión tienen como


objetivo estudiar lo “concentrada” que está la
distribución en torno a la media.

Podría suceder que dos distribuciones de fre-


cuencias sean muy diferentes pero tener la misma
media.

Me
53
Me

Las medidas de dispersión completan el análi-


sis numérico de un conjunto de datos. Determi-
nan la mayor o menor variación de los datos, y
dan una idea de su dispersión respecto a las medi-
das de centralización.
Las más importantes son:
● la desviación media

Desviación media =
∑ x−x
n

● la desviación estándar o desvío típico

∑ (x )
2
i −x fi
s=
n

54
● la varianza

∑ (x )
2
2 i −x fi
s =
n

55
10. DESVIACIÓN MEDIA

Hemos estudiado varias medidas de centrali-


zación, por lo que podemos hablar de desviación
con respecto a cualquiera de ellas, sin embargo, la
más utilizada es con respecto a la media. La media
es la medida de tendencia central más útil y exacta.

Recordá que:

La media aritmética o promedio es el cociente


que se obtiene dividiendo la suma de los valores de
la variable por el número de observaciones.

Desviación

Es la diferencia que se observa entre el valor


de la variable y la media aritmética. La denotare-
mos por di .

56
La desviación no es una medida, son muchas
medidas, pues cada valor de la variable lleva aso-
ciada su correspondiente desviación, por lo que
precisaremos una medida que resuma dicha in-
formación. Si sumamos las desviaciones con res-
pecto de la media podríamos obtener una estima-
ción de la cantidad característica de desviación con
respecto a la media. Entonces,dividiendo por n
(número de observaciones), tendríamos una me-
dida análoga a la medid aritmética, excepto que
representaría la dispersión promedio de las califi-
caciones con respecto a la media.
Pero, teniendo en cuenta las características
de la media, encontramos una seria dificultad: la
suma de las desviaciones de todos los valores ob-
tenidos con respecto a la media, debe valer cero.
Así, si definimos la desviación media como esta
suma dividida por n, la desviación media tendría
que ser cero.

57
Recordá que:

La media es el punto en una distribución

( )
de medidas respecto del cual la suma de las
desviaciones es igual a cero: Σ x − x = 0

Este inconveniente se soluciona sumando to-


das las desviaciones sin considerar el signo y dividien-
do por n, es decir tomamos los valores absolutos
de las desviaciones.

Desviación media

Es la media de los valores absolutos de las


desviaciones, y la denotaremos por dm.
La fórmula que utilizaremos en una serie sim-
ple es:

Σx−x
dm =
n

58
Referencias:

Σ: sumatoria

x : media aritmética

n: número de observaciones

Si x1 , x 2 ,...x k se presentan con frecuencias, la


fórmula que utilizaremos para datos agrupados en
forma de distribución de frecuencias es:

dm =
Σ f x−x( )
n

Ejemplo
● Hallá la desviación media de los nú-
meros 2, 3, 6, 8, 11.

59
2 + 3 + 6 + 8 + 11
Media aritmética = x = =6
5

Desviación media =
2 − 6 + 3 − 6 + 6 − 6 + 8 − 6 + 11 − 6
dm =
5
−4 + −3 + 0 + 2 + 5
dm =
5
4+3+0+ 2+5
dm =
5
dm = 2,8

60
11. DESVIACIÓN ESTÁNDAR (S)

La desviación estándar es la raíz


cuadrada de la varianza.

La fórmula que nos permite hallarla es:

s=
(
Σ xi − x )
2

n
Para datos presentados en forma de distribu-
ción de frecuencia, la fórmula de la desviación
estándar es:

s=
( )
2
Σ xi − x . f
n

Recordá que:

Llamamos varianza a la media de los


cuadrados de los desvíos (s2)

61
Observación:
Dos distribuciones de datos pueden tener la mis-
ma media y ser muy diferentes.

Ejemplo

● Tené en cuenta la siguiente tabla y


hallá la desviación estándar

x x−x (x − x )2

9 4 16
8 3 9
7 2 4
7 2 4
7 2 4
5 0 0
5 0 0
5 0 0
5 0 0
4 -1 1
4 -1 1
3 -2 4
3 -2 4
2 -3 9
1 -4 16

62
● Con estos datos recopilamos la siguiente
información:
Σ x = 75 (
Σ x−x =0 )
(
Σ x−x )2
= 72 n = 15 x=5

● Como sabemos, la desviación estándar se


calcula con la siguiente fórmula:

s=
(
Σ xi − x )
2

● Entonces sólo resta reemplazar los datos


obtenidos en la fórmula y hallar la desvia-
ción:
72
s=
15
= 4,80
= 2 ,19
● De esta manera podemos concluir que la
desviación estándar es igual a 2,19.

63
12. VARIANZA

Para evitar los valores negativos de los desvíos


suelen tomarse los cuadrados de los desvíos.

Llamamos varianza a la media de los cua-


drados de los desvíos, y la denotaremos
por s2

Cálculo de la Varianza en una serie simple

En símbolos, la varianza queda expresada co-


mo la suma de los cuadrados de los desvíos divi-
dida por el número de observaciones.

s =
2 (
Σ xi − x )2

64
Cálculo de la Varianza en una serie de fre-
cuencias

Para calcular la varianza se suman los produc-


tos de los cuadrados de los desvíos por la frecuen-
cia, y se divide la suma por el número de observa-
ciones.

s =
2 (
Σ xi − x . f )
2

Cálculo de la Varianza en una distribución


en intervalos de clase

Se suman los productos de los desvíos de cada


intervalo por la frecuencia del intervalo y se divide
la suma por el número de observaciones.

s =
2 (
Σ xm − x . f i) 2

65
En todos los casos: xi: es el i-ésimo dato
: es la media aritmética para datos no agru-
pados
n: es el número de datos

Σ: sumatoria

Este dato estadístico tiene el inconveniente de


ser poco significativo, pues se mide en el cuadrado
de la unidad de la variable, por ejemplo, si la va-
riable viene dada en cm la varianza vendrá dada en
cm2.

Pero al elevar al cuadrado las diferencias de los


datos respecto de la media, hace que los valores
más alejados de la media tengan mayor contribu-
ción. Como consecuencia, distingue mejor que la
amplitud la variabilidad de dos conjuntos de datos.

66
EJEMPLO 1

● Calculá la varianza para el siguiente


conjunto de datos

5 9 12 7 15 3

SOLUCIÓN

● Aplicamos la definición (primera fórmula).

● Primero hay que calcular la media

= (5+9+12+7+15+3)/6 = 51/6 = 8.5

● Ahora procedemos al cálculo de la varian-


za:
S2= [(5-8.5)2+(9-8.5)2+(12-8.5)2+(7-8.5)2+(15-
8.5)2+(3-8.5)2]/6 = 99.5/6 = 16.58

67
● Llegando entonces a que la varianza para
este conjunto de datos es 16.58.

68
13. DISTRIBUCIÓN NORMAL -
CURVA DE GAUSS

El matemático Karl Friedrich Gauss, (1777-


1855) estudiando los errores que se producen al
medir reiteradas veces una misma magnitud, pro-
bó que éstos se distribuyen según una ecuación
exponencial cuya grafica es:

Media

La distribución normal es simétrica y el valor máximo de la


función corresponde a la media.

69
Este gráfico se denomina campana de Gauss
(debido a su forma acampanada) o distribución
normal. La distribución de muchas variables pa-
rece seguir la curva normal. Por ejemplo, caracte-
res de individuos (personas, animales, plantas) de
una misma especie (altura, peso). También hay
variables discretas que tienen una distribución
parecida, como el número de caras al lanzar un
cierto número de monedas.

Hay una gran cantidad de variables aleatorias


continuas que se presentan en las situaciones más
variadas y que, a pesar de ello, son de un mismo
tipo. Todas ellas tienen en común la forma de su
función de densidad. Para estas variables aleato-
rias, si la media es µ y la desviación típica es σ la
función densidad es:

2
1  x−µ 
−  
1 2 σ 
f ( x) = e
σ 2π
70
La gráfica de estas funciones tiene forma de
campana con un eje de simetría. Las funciones de
este tipo están completamente determinadas por
su media µ, y su desviación típica, σ.

● La media µ indica la posición de la cam-


pana (parámetro de centralización)

● La desviación típica σ será el parámetro de


dispersión. Cuanto menor sea, mayor can-
tidad de masa de probabilidad habrá con-
centrada alrededor de la media y cuanto
mayor sea ``más aplastado" será.

Su gran importancia se debe al hecho de que el


área debajo de cualquier campana de Gauss entre
los valores x1 = µ + k1σ y x 2 = µ + k 2σ es la
misma que el área bajo la N (0;1) entre
z1 = k1 ∧ z 2 = k 2

71
EJEMPLO

Un estudiante consigue un 72 % de aproba-


ción en Historia y lo mismo en Inglés. La media
para todos los alumnos es 65 %. La desviación
estándar es del 3% para Inglés y 15% para Histo-
ria.

72
En inglés

Los mejores resultados

72 puntos
µ=65

En Historia

Los mejores resultados

72 puntos
µ=65

73
En Inglés, muy pocos superaron el 72 %, por
lo tanto, se trata de un resultado muy bueno.

En Historia, el 72 % lo superaron muchos. La


media no es muy válida puesto que la dispersión
de los resultados fue muy grande, como nos indica
la desviación típica.

Luego, ese 72 % no es muy bueno.

74
EJERCICIOS 13-1

EJERCICIO 1

Dada la variable aleatoria Z de distribu-


ción normal N(0,1)

! Calculá las siguientes probabilidades


a- P(Z ≤ -1,3)
b- P(Z ≥ 1)
c- P(-0,5 ≤ Z ≤ 1,47)

EJERCICIO 2

! En una variable aleatoria X con distribu-


ción normal N(8,4) calculá P(3 ≤ X ≤ 10)

EJERCICIO 3

Las notas de Historia de una clase se distribu-


yen según una distribución normal N(6,4;1,5) y el

75
profesor quiere poner sobresaliente a un 15% de
la clase
! ¿A partir de qué nota debe poner sobresa-
liente?

EJERCICIO 4

Las alturas de los empleados de una empresa


de transportes se toman redondeando al centíme-
tro más próximo. Se sabe que están distribuidos
normalmente con la función N(172,5). Se toma
una muestra de 1000 empleados al azar.

! Calculá cuántos miden :


a- No más de 180 cm.
b- 175 cm o más.
c- Entre 160 y 184 cm

76
EJERCICIO 5

El coeficiente intelectual (C.I.)de los alumnos


de la universidad de Berdaguer sigue una distribu-
ción normal N(115,12).

! Calculá la probabilidad de que un alumno


tenga un C.I. superior a 138.

77
HOJA DE RESPUESTAS 13-1

EJERCICIO 1

a- 0,0968
b- 0,1587
c- 0,6207

EJERCICIO 2

0,5859

EJERCICIO 3
z − 6,4
P(Z ≤ z)=0,85 ⇒ z ' = ⇒ z = 7,96,
por lo tanto la nota debe ser 8.1,5

EJERCICIO 4

a- 955
b- 308

78
c- 988

EJERCICIO 5

0,0281

79
14. CORRELACIÓN

DOS TIPOS DE RELACIONES

A menudo, un investigador o nosotros mis-


mos, nos vemos en la necesidad de saber si existe
alguna relación entre dos variables que necesita-
mos medir. Por ejemplo:

# Cantidad de kilowatts consumidos y su costo.


# Posición de un cuerpo lanzado hacia arriba y su ve-
locidad.
# Cantidad de cierta población de bacterias en un de-
terminado momento.
# Altura de las personas y su peso.
# Altura de los padres y la de sus hijos
# Calificación de un curso en física y en matemática.

Entre estas situaciones hay algunas entre las


que podemos establecer una relación que llama-
remos funcional.

80
Para que exista este tipo de relación debe
haber una función que, conocida una de las varia-
bles, me permite calcular aproximadamente la
otra, esto se cumple en los tres primeros ejemplos,
cuando exista dicha relación diremos que las va-
riables están correlacionadas o que hay correla-
ción entre ellas.

En cambio no existe una función que nos


permita conocer la nota de física de un alumno
conociendo la de matemática; o la altura de los
hijos conociendo la de sus padres.

Llamaremos a la relación existente entre estas


variables relación estadística

DIAGRAMAS DE DISPERSIÓN

Para estudiar la relación entre dos variables, se


comienza por obtener un conjunto de datos.

81
Formamos con ellos pares ordenados (x , y ), la
primera coordenada corresponde a una variable y
la segunda a la otra, por ejemplo, las x correspon-
derán a las alturas de los padres y las y a las de sus
hijos; o las x a la nota de matemática y la y a la de
física; etc.

Tendremos entonces un conjunto de datos


(x 1 , y 1 ), (x 2 , y 2 ),..., (x n , y n ). que podemos re-
presentar en un par de ejes, formando lo que se
conoce como diagrama de dispersión, en este
caso se dice que los datos forman una nube de
puntos.

82
EJEMPLOS

1.

Relación entre población y vivienda por


provincia (censo 1991)

1.200.000
1.000.000
800.000
600.000
400.000
200.000
0

En este ejemplo, cada punto representa una provincia, los


valores de X indican la población y los de Y la cantidad
de viviendas. Vemos que los puntos se alinean por lo que
decimos que existe una correlación lineal. Además a
mayores valores de una variable corresponden mayores
de la otra, por lo que decimos que la correlación es dire-
cta. Por otra parte, como esta alineación es muy marcada
decimos que se trata de una correlación fuerte.

83
2.

Puntos obtenidos y partidos perdidos.


Torneo de fútbol local

10

0
0 10 20 30 40
Punt o s

Para este ejemplo, cada punto representa un equipo de


fútbol de primera división. Acá también notamos una
correlación lineal, aunque más débil que en el ejemplo
anterior. Como a mayores valores de x (puntos) corres-
ponden menores de y (perdidos) decimos que la correla-
ción es inversa.

84
3.

Relación entre población y superficie de


una provincia(censo 1991)

300.000

250.000

200.000

150.000

100.000

50.000

En este caso también cada punto representa una pro-


vincia argentina, pero acá no es clara la relación que
existe entre las variables. Decimos que no hay corre-
lación.

85
COVARIANZA Y COEFICIENTE DE CORRELA-
CIÓN

Para estudiar con más detalle la correlación


definiremos los siguientes parámetros estadísticos:

Desvío típico

∑x i
2

2
σx = i =1
−x
n

∑y i
2

2
σy = i =1
−y
n
Donde xi e yi son cada uno de los datos de ca-

da variable y x e y son las medias de dichos da-

tos. Al punto ( x , y ) se lo conoce como centro


medio o centro de gravedad de la muestra.

86
Covarianza

∑ (x i − x )( y i − y)
σ xy = i =1

n
Notemos, a partir de la fórmula, que si la ma-
yoría de los valores de x e y son, para cada par de
datos, superiores los dos o inferiores los dos a las
respectivas medias, esto implica que:

1. El signo de la covarianza será positivo.


2. La mayoría de los valores pequeños de x
se corresponden con valores pequeños de
y, cosa que también ocurre con los mayo-
res.

Esto nos dice que si la correlación es directa la


covarianza será positiva. De forma análoga se
puede ver que a una correlación inversa se corres-
ponde una covarianza negativa.
Sin embargo, la covarianza es un indicador
que se ve afectado por la escala considerada para

87
cada variable, o por algún dato demasiado alejado
del centro de gravedad. Para corregir estas defi-
ciencias se define el coeficiente de correlación
lineal.

COEFICIENTE DE CORRELACIÓN LINEAL

σ xy
ρ=
σ xσ y

Observaciones:

# ρ está siempre entre –1 y 1, es decir:


-1≤ ρ ≤1
# Si ρ es próximo a –1 se trata de una corre-
lación inversa, más fuerte cuanto más
próximo a –1 sea su valor.
# Si ρ es próximo a 1 se trata de una corre-
lación directa, más fuerte cuanto más
próximo a 1 sea su valor.

88
# Si ρ es muy próximo a cero no hay corre-
lación lineal entre los datos.

CORRELACIÓN NO LINEAL

El coeficiente ρ nos indica si hay o no corre-


lación lineal entre las variables y que tan fuerte es.
Sin embargo, las variables pueden estar
fuertemente correlacionadas pero dicha
correlación no ser lineal; un ρ próximo a cero
indica que no hay (o es muy débil) la correlación
lineal, pero nada nos dice de otro tipo de
correlación.

89
El siguiente gráfico muestra la relación entre la in-
versión en publicidad de una empresa y sus ventas.
Se observa que la publicidad hace aumentar las ven-
tas, pero no indefinidamente ni de forma lineal.
Las variables están fuertemente relacionadas pero la
nube no se ajusta a una recta: se trata de un caso de
correlación no lineal.

RECTA DE REGRESIÓN

Si la nube de puntos del diagrama de disper-


sión adopta una forma muy definida (como es el
caso del ejemplo 1 o del gráfico anterior) los pun-
tos se pueden aproximar mediante alguna curva
conocida que ajuste lo mejor posible los puntos de
la nube. Dicha curva se conoce como línea de
regresión y poder determinarla nos ofrece la po-
sibilidad de estimar los valores de una variable
conocidos los de la otra.
Si entre las variables existe una fuerte correla-
ción lineal, una recta se ajusta satisfactoriamente a

90
los puntos de la muestra. Esta recta se conoce
como recta de regresión y su ecuación es :
σ xy
y−y= (x − x)
σx

91
14.1 ¿CÓMO SE CALCULA EL CO-
EFICIENTE DE CORRELACIÓN
LINEAL?

Recordá que:

• Es un valor que está siempre entre 1 y


–1.
• El coeficiente de correlación, r no varía
con los cambios de escala y mide efi-
cazmente el grado de correlación entre
dos variables.

σx y
r=
σx . σ y
• Si r es 1 (o próximo a 1), la depen-
dencia es funcional (o casi funcional):
los puntos están alineados (o casi ali-
neados).

92
Cálculo de r

Ejemplo
En un experimento sobre la distancia de fre-
nado de un auto dependiendo de su velocidad, se
obtuvieron los siguientes datos:

Velocidad 70 50 45 120 85 65
(km/h)
Distancia 32 18 19 43 35 34
(m)

$ Representá los valores en un diagrama o


nube de puntos y calculá el coeficiente de
regresión entre la velocidad y la distancia.

Solución
1º Paso: Antes, debemos calcular previamente
x, y, σ x , σ y , σ xy

n n

∑ (xi − x )( yi − y ) = ∑ xi yi − x .y
1 1
σx y =
n i =1
n i =1

93
∑x
1 2
σx = i − x2
n

∑y
1 2
σy = i − y2
n
Si llamamos x a la velocidad e y a la distan-
cia. Entonces, obtenemos que:
x = 72 ,5
y = 30 ,16
2º Paso: Reemplazando en las fórmulas los
datos y los promedios, calculamos
$ Desviación típica de x:

∑x
1 2
σx = i − x2
n

σ x = 24 ,95
$ Desviación típica de y:

∑y
1 2
σy = i − y2
n
σ y = 8,93

$ La covarianza es:

94
n n

∑ (xi − x )( yi − y ) = ∑ xi yi − x .y
1 1
σx y =
n i =1
n i =1

σ xy = 201,91

3º Paso: El coeficiente de correlación en este


cada caso es:
σxy
r=
σ x.σ y
201,91
r=
24,95 ⋅ 8,93
201,91
r=
222,8
r = 0,91

Representamos los datos en un diagrama de


nubes. Este gráfico obtiene este nombre pues
cuando existe una gran cantidad de datos, los
mismos se agrupan formando una “nube” de pun-
tos.
Esta nube toma una forma que, a veces, la
puede caracterizar relacionándola con una función

95
determinada, generando así el criterio intuitivo de
correlación con una recta, parábola, exponencial,
etc.
Estas correlaciones son confirmadas o no por
el cálculo de los coeficientes en cada caso.

50
45
40
35
30
25
20
15
10
5
0
0 20 40 60 80 100 120 140

Rectas de regresión
Cuando existe correlación entre dos variables
–cuanto más fuerte mejor- es útil trazar la recta
que “mejor se ajuste” a los puntos de la nube.
Esta recta llamada recta de regresión de y sobre x,
tiene la siguiente ecuación:

96
σx y
y− y = (x − x )
σ 2x

Para el ejemplo anterior, la recta de regresión


lineal viene dada por la siguiente ecuación:

202,91
y − 30,16 = (x − 72,5)
(24,95)2
y − 30,16 = 0,32(x − 72,5)
y = 0,32 x − 23,2 + 30,16
y = 0,32 x + 6,96

Gráfico de la recta de regresión lineal.

50
45
40
35
30
25
20
15
10
5
0
0 20 40 60 80 100 120 140

97
14.2 EJERCICIOS

EJERCICIO 1

Las notas de los alumnos de 5º año en Mate-


mática y Física se muestran en la tabla:

Matemática 2 2 4 4 4 5 6 6 7 8 9 9

Física 2 4 3 4 6 7 5 6 8 7 7 10

a- Calculá el coeficiente de correlación

b- Graficá la nube de datos.

c- Determiná y graficá la ecuación de la recta


de regresión lineal

98
EJERCICIO 2

En el Parque Nacional Nahuel Huapi se tala-


ron ejemplares de robles para determinar su edad
(contando el número de anillos del tronco), y se ha
medido su diámetro. Los datos que se obtuvieron
son:

Diámetro 10 15 16 21 30 25 30 35
(cm)

Edad 4 8 12 18 22 26 30 32
(años)

a- Hallá el coeficiente de correlación.

b- Graficá la nube de datos.

c- Hallá la recta de regresión.

d- Determiná la edad correspondiente a 18 y


40 cm de diámetro.

99
EJERCICIO 3

En la tabla se muestran los datos de la longi-


tud corporal y el peso de un bebé durante las pri-
meras 24 semanas de vida.

Longitud 50 52 55 58 61 62 65
(cm)
Peso (Kg.) 3,3 3,9 4,5 5,2 5,6 6,2 6,7

a- Representá la nube de puntos.


b- Calculá el coeficiente de correlación lineal.
c- Explicá el significado obtenido en el coefi-
ciente.
d- Hallá la recta de regresión lineal.

EJERCICIO 4

En el colegio de Mariana los alumnos han me-


dido sus alturas y se han pesado para realizar un

100
trabajo de Ciencias Naturales. En la tabla, se en-
cuentran los datos:

Peso 42 43 47 50 55 60 65 70
(Kg.)
Altura 140 155 158 145 150 155 162 160
(cm)

a- Representá la nube de puntos.


b- Determiná el coeficiente de correlación
c- Hallá y graficá la recta de regresión lineal.

EJERCICIO 5

El astrónomo Kepler investigó los movimien-


tos de los planetas y descubrió tres leyes que lle-
van su nombre. En el siglo XVII, obtuvo datos
para los planetas conocidos en la época que se
volcaron a este cuadro:

101
Planeta Distancia (106 Período (años)
Km.)
Mercurio 58 0,24

Venus 108 0,62

Tierra 150 1

Marte 228 1,88

Júpiter 778 11,86

Saturno 1429 29,42

a- Elaborá una tabla de con dos columnas:


En la primera (x) escribí los cuadrados de
los períodos; y en la segunda, (y) los cubos
de las distancias.

b- Calculá el coeficiente de correlación entre


los valores obtenidos en el punto a.

102
15. MEDIA, MODA Y MEDIANA

La Estadística se ocupa de tomar datos reales,


analizarlos y presentarlos organizadamente para
poder explicar ciertas cuestiones de la realidad.
Entre los resultados que se obtienen de un estudio
estadístico existen tres valores que dan informa-
ción específica y que suelen ser muy utilizados:
Media, Moda y Mediana

Media aritmética o promedio

Cuando queremos saber la nota que figurará


en el boletín luego de un trimestre calculamos el
promedio de las notas que hemos calificado du-
rante ese período

La media aritmética, o promedio de una se-


rie de datos, se obtiene dividiendo la suma de los
valores por la cantidad que de ellos hay.

103
EJEMPLO

Un comerciante obtuvo las siguientes ventas: lunes, $


750; martes, $ 600; miércoles, $ 720; jueves, $ 680;
viernes, $ 840, y sábado $ 910. ¿Cuál fue la media de las
ventas en la semana?

Media =

750 + 600 + 720 + 680 + 840 + 910 = 4500 = 750


6 6

Media = $ 750 diarios

! La media puede no coincidir con ninguno


de los valores registrados.

Moda

Al dato que más veces se repite en una serie de


mediciones, es decir, el de mayor frecuencia se lo
denomina moda. Tiene la ventaja de ser una me-
dida que vale también para datos no numéricos.

104
Por ejemplo, si evaluamos estadísticamente los
colores de los autos que salen de una concesiona-
ria podremos ver cual de ellos tiene mas frecuen-
cia de venta, lo que establecerá lo que denomina-
mos moda.

EJEMPLO

El profesor de Matemática tomó en 7º B la


misma evaluación que en 7º A.

Las notas de 7º A fueron éstas:


2;2;2;3;3;3;3;5;7;7;8;8;8;8;8;8;9;9;10;10;10 y 10.

Las notas de 7º B fueron éstas:


5;5;5;5;5;6;6;6;6;6;6;7;7;7;7;7;7;7;8;8;8 y 9.

¿Cuál es la moda en cada uno de los cursos?

Realicemos las tablas correspondientes a cada


curso:

105
A
Notas Frecuencia
2 3
3 4
5 1
7 2
8 6
9 2
10 4
Total 22

Moda A = 6

Notas Frecuencia
5 5
6 6
7 7
8 3
9 1
total 22

Moda B = 7

106
• La moda siempre es uno de los valores
registrados.
• Cuando en el conjunto de observaciones
hay una sola moda, se dice que la distribu-
ción es unimodal.
• Si hay dos valores con la misma frecuencia
máxima la distribución se llama bimodal
• La moda no necesariamente coincide con
la media aritmética.

MEDIANA

En un estudio estadístico siempre se obtiene


una lista de datos o resultados.
En una lista con un número impar de datos, la
mediana es el valor central, cuando el número de
casos resulta par, la mediana se determina divi-
diendo a la mitad la suma de los dos datos centra-
les.

107
Dicho de otra manera, es el valor donde por
encima de él se encuentra el 50% del total y por
debajo el otro 50%.

Ejemplo

De acuerdo con los sueldos que ganan mensualmente


los 26 trabajadores de un taller, calcular la mediana.
Ya que se trata de 26 trabajadores, se divide
entre 2. La mediana se localiza contando entonces
13 frecuencias.
.
Sueldos Frecuencias
$ 7.000 1
$ 6.750 2
$ 6.250 6
$ 5.000 8
$ 4.000 4
$ 3.500 3
$ 2.000 2
Total 26

Mediana = $ 5 000

108
HOJA DE RESPUESTAS

EJERCICIO 1

a- El coeficiente de correlación es r = 0, 84

b- La ecuación de la recta es y = 0, 78 x +1,


46

Su representación gráfica es:

12

10

0
0 1 2 3 4 5 6 7 8 9 10

109
EJERCICIO 2

a- El coeficiente de correlación es r = 0, 957


b- La ecuación de la recta de regresión lineal
es y = 1, 13 x – 6,77
c- La edad correspondiente al roble de 18 cm
de diámetro es 13 años aprox. La edad del
roble de 40 cm de diámetro es 38 años
aprox.

EJERCICIO 3

a- La representación de la nube de puntos es:

8
7
6
5
peso

4
3
2
1
0
0 10 20 30 40 50 60 70
longitud

110
b- r = 0, 995
c- Como r > 0 la nube es ascendente y la co-
rrelación positiva. Por lo tanto es los pun-
tos están alineados o casi alineados.
d- La ecuación de la recta es y = 0, 22 x – 7,
772
e- Grafica de la ecuación lineal:

8
7
6
5
peso

4
3
2
1
0
0 10 20 30 40 50 60 70
longitud

EJERCICIO 4

a- El coeficiente de correlación es r = 0, 639

111
b- La recta de regresión lineal es y = 0, 47 x
– 127, 7. Su grafica es:

165

160

155

altura
150

145

140

135
0 10 20 30 40 50 60 70 80
peso

EJERCICIO 5

a- La tabla es la siguiente:

Cuadrados de los Periodo Cubos de las distancias


0,3844 195112
0,3844 1259712
1 3375000
3,5344 11852352

112
140,6596 470910952
865,5364 2918076589

b- El coeficiente de correlación es r = 0, 99

113

Potrebbero piacerti anche