Sei sulla pagina 1di 14

Facultad de Ciencias de la Educación SEMANA 8-9

Programa de Licenciatura en Matemáticas 3 7 6 4


f1   0,15; f 2   0,35; f 3   0,3; f 4   0,2
20 20 20 20

TABLAS DE FRECUENCIAS Y PRESENTACIÓN f1  f 2  f 3  f 4  0,15  0,35  0,3  0,2  1


GRAFICA EN DISTINTOS FORMATOS.
Tabla 1. Nivel de estudio

Distribución de frecuencias: es la tabla que presenta CATEGORÍAS NI FI F%

las categorías de una variable y sus respectivas 1 3 0,15 15

frecuencias. 2 7 0,35 35

3 6 0,3 30
Nos indica cómo se distribuye la frecuencia total entre
4 4 0,2 20
las categorías
N=20 1 100
Ejemplo 1 variable cualitativa.
En la tabla 1 se muestra que categoría de nivel de
Se ha clasificado a 20 individuos según su nivel de estudio más frecuente es la de estudios primarios y
estudios que puede tomar valores: la menos frecuente la de sin estudios.

La moda es estudios primarios.

1 sin estudios Nota: Las variables cualitativas por su naturaleza,


2
Nivel de Estudios=  primarios carecen de media o promedio y mediana.

3 medios
4 sup eriores Descripción de Variables Cuantitativas:
Distribución de frecuencias y Representación
y se han obtenido los siguientes datos: gráfica

{1;4;3;3;3;2;2;4;2;2;1;4;2;3;2;3;4;2;3} La naturaleza numérica de las variables


cuantitativas permite un tratamiento estadístico más
N=20; k=4
elaborado que con las variables cualitativas.
Frecuencias absolutas:

N1=3; N2=7; N3=6; N4=4


● Con las variables cuantitativas pueden
N  n1  n2  n3  n4  3  7  6  4  20 realizarse operaciones matemáticas, lo que permite
una descripción más precisa y completa.
Frecuencias relativas:

1
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas

Frecuencias relativas:

● En este tema estudiaremos la distribución de 11 13 20


frecuencias y su representación gráfica (como hemos f1   0,11; f 2   0,13; f 3   0,2
100 100 100
hecho para las variables cualitativas) y en los
siguientes temas veremos otras formas de describir 25 14 10
una variable cuantitativa.
f4   0,25; f 5   0,14; f 6   0,1
100 100 100
Variables Cuantitativas Discretas
4 2 1
f7   0,04; f8   0,02; f 9   0,01
100 100 100
● La distribución de frecuencias para las Distribución de frecuencias:
variables discretas es semejante a lo que hemos visto
Categorías ni fi
para el caso de las variables cualitativas, ya que las
categorías en que se agrupan los datos vienen dadas 0 11 0,11
de forma natural por los valores que toma la
variable. 1 13 0,13

Ejemplo 1: 2 20 0,2

Cien familias se han clasificado según el número 3 25 0,25

de hijos, resultando los siguientes datos: 4 14 0,14

Nº de 5 10 0,1
0 1 2 3 4 5 6 7 8
Hijos
6 4 0,04
Nº de
11 13 20 25 14 10 4 2 1 7 2 0,02
familias

N=100; k=9 8 1 0,01

Frecuencias absolutas: N=100 1

n1=11; n2=13; n3=20; n4=25; n5=14; n6=10; n7=4; La categoría más numerosa es la de familias con 3

n8=2; n9=1 hijos y la

2
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas menos
frecuente es la de familias con 8 hijos

3
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas

Diagrama de barras ● Para construir la distribución de frecuencias


acumulada hay que sumar a la frecuencia de cada
Frecuencias relativas fi
clase (absoluta o relativa) la de las clases anteriores.
0.30
●Los valores de la distribución de frecuencias
0.25 acumulada no decrecen.
0.20
●La información sobre los datos que proporcionan
0.15 la distribución de frecuencias y la distribución de
0.10 frecuencias acumulada es equivalente. Cada una
puede obtenerse a partir de la otra.
0.05

0.00 Ejemplo: Nº de hijos


0 1 2 3 4 5 6 7 8
Frecuencia Frecuencia
Frecuencia s absolutas Frecuencia s relativas
Frecuencias absolutas ni Categoría s absolutas acumulada s relativas acumulada
s s s
ni fi
30
Ni Fi

25 0 11 11 0,11 0,11

20 1 13 24 0,13 0,24

15 2 20 44 0,2 0,44

10 3 25 69 0,25 0,69

5 4 14 83 0,14 0,83

0 5 10 93 0,1 0,93
0 1 2 3 4 5 6 7 8
6 4 97 0,04 0,97

En general, las clases vienen ordenadas de forma 7 2 99 0,02 0,99


natural de menor a mayor por lo que tiene sentido
8 1 100 0,01 1
definir la distribución de frecuencias acumulada.

4
Facultad de Ciencias de la Educación SEMANA 8-9
N=100 1
Programa de Licenciatura en Matemáticas 1.0

0.8

0.6

0.4

0.2
● El último valor de la distribución de frecuencias
0.0
absolutas acumuladas coincide con N. 0 1 2 3 4 5 6 7 8

● El último valor de la distribución de frecuencias Ejercicio 3.2 de Peña y Romo


relativas acumuladas es 1 (salvo error de redondeo).
Los siguientes datos corresponden al número de
bibliotecarios en las bibliotecas públicas de las
● La distribución de frecuencias acumulada nos diferentes provincias españolas:
permite conocer la proporción (o el número) de
observaciones por debajo de cierto valor, entre dos 4 7 5 2 4 5 6 4 7 3 7 4 3 4 4 3 4 3 2 4 4 1 10 2 5 3 2 2

valores o por encima de una cantidad. 5 3 3 8 12 3 2 2 5 4 1 5 8 6 6 1 3 15 16 6 7 12

Ejemplo: Nº de hijos a. Hallar la distribución de frecuencias relativas y


representarla mediante un diagrama de barras
¿Qué proporción de familias tiene menos de 2 hijos?
0,24 b. Obtener y representar la distribución de
frecuencias relativas acumuladas
¿Cuántas familias tienen menos de 4 hijos? 69
c. ¿Qué proporción de provincias tiene más de 7
¿Qué proporción de familias tiene más de 6 hijos? bibliotecarios?

0,03=1-0,97=0,01+0,02 Frecuencias Frecuencias


Frecuencias
absolutas relativas
Frecuencias relativas
Bibliotecarios acumuladas acumuladas
¿Qué proporción de familias tiene más de 3 hijos absolutas ni
fi
Ni Fi
pero menos de 7? 0,28=0,14+0,1+0,04=0,97-0,69
1 3 3 0,06 0,06
Representación gráfica de la distribución de
2 7 10 0,14 0,2
frecuencias acumulada
3 9 19 0,18 0,38

Frecuencias relativas Fi 4 10 29 0,2 0,58

5 6 35 0,12 0,7

6 4 39 0,08 0,78

5
Facultad de Ciencias de la Educación SEMANA 8-9
7 4
Programa 43
de Licenciatura 0,08
en Matemáticas 0,86
1.0
8 2 45 0,04 0,9

10 1 46 0,02 0,92 0.8

12 2 48 0,04 0,96

0.6
15 1 49 0,02 0,98

16 1 50 0,02 1
0.4

0.2

0.0
1 2 3 4 5 6 7 8 10 12 15 16

Frecuencias relativas: fi
la proporción de provincias con más de 7
0.25 bibliotecarios es de 0,14

0.20 0,14=1-0,86=0,04+0,02+0,04+0,02+0,02

La mayoría de las provincias (62%) tiene 4


0.15
bibliotecarios o más: 0,62=1-0,38=
0.10
=0,2+0,12+0,08+0,08+0,04+0,02+0,04+0,02+0,0

0.05
2

4 es la clase más frecuente con una frecuencia


0.00
1 2 3 4 5 6 7 8 10 12 15 16 relativa de 0,2

Más de la mitad de las provincias españolas


Frecuencias relativas acumuladas: Fi
(F4=0,58) tiene menos de 5 bibliotecarios

La proporción de provincias españolas que tienen


entre 5 y 7 bibliotecarios es de 0,28

0,28=0,12+0,08+0,08=0,86-0,58

Variables Continuas

6
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas El análisis de
la distribución de frecuencias de las variables
cuantitativas continuas es más complejo que el de las
variables cualitativas o discretas.

●Las categorías o clases no vienen dadas de forma


natural, sino que deben elegirse.

●Tendremos que dividir el recorrido (o conjunto de


posibles valores de la variable) en intervalos que no
se solapen.

●El punto central de cada intervalo se llama marca


de clase (ci).

●El resto de los elementos y conceptos de la


distribución de frecuencias de una variable continua
es equivalente a lo visto en las cualitativas y
discretas.

7
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas Gasto Total (GTINE o G)

Ejemplo: Frecuencias Frecuencias


Gasto Frecuencias Frecuencias relativas
absolutas
absolutas relativas acumuladas
La variable GTINE representa el gasto total. Los (en miles de acumuladas

ptas.) ni fi Fi
datos correspondientes a 75 hogares son: Ni

81.861 105.628 110.690 134.246 226.177 273.870 0<G≤100 10 10 0,13 0,13

100<G≤200 22 32 0,29 0,42


142.376 309.964 101.431 276.273 662.803
200<G≤300 17 49 0,23 0,65
493.728 308.787 254.420 172.928 142.678
300<G≤400 8 57 0,11 0,76
510.223 158.829 278.854 168.620 176.204
400<G≤500 10 67 0,13 0,89
179.108 113.074 876.161 64.425 112.352 255.465
500<G≤600 3 70 0,04 0,93

321.307 434.375 707.444 90.460 89.498 466.862 600<G≤700 2 72 0,03 0,96

87.112 309.829 247.425 427.812 195.740 257.638 700<G≤800 2 74 0,03 0,99

176.656 285.935 450.571 56.292 306.488 156.772 800<G≤900 1 75 0,01 1

531.099 475.760 316.500 279.586 48.586 96.670 N=75 1

256.548 514.330 161.595 228.368 638.366 La proporción de familias que gasta 200.000 pesetas
o menos es de 0,42.
442.162 65.060 160.580 197.390 152.077 228.808
La proporción de familias que gasta más de 600.000
76.920 255.196 241.986 417.103 752.436 352.708
pesetas es 0,07=1-0,93=0,03+0,03+0,01.
259.472 225.388 174.341 308.705 455.125
La proporción de familias que gasta más de 100.000
122.696 479.791
pero no más de 300.000 es 0,52=0,29+0,23=0,65-
0,13
Tomando intervalos o clases iguales y de tamaño
100.000 pesetas, vamos a calcular la distribución de Representación gráfica de la distribución de
frecuencias. frecuencias

Por ejemplo, el primer intervalo será: El Histograma


0<GTINE≤100.000 y la marca de clase c1=50.000.
● El histograma es un gráfico que representa las
El número de intervalos o clases será k=9. frecuencias mediante áreas. Sobre cada clase (o
rango de valores) se dibuja un rectángulo cuya área

8
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas ● ¿Cómo elegimos los intervalos (o el número de
clases)?
representa la frecuencia (absoluta o relativa) de esa
clase. Empezar con pocas clases y ver (en el histograma) si con
más clases tenemos más información (ver Figura 3.6 de
● Cuando las clases (o intervalos) en que dividimos
Peña y Romo de la variable NOTAS)
los datos son de distinta longitud el eje vertical no
Si tenemos N observaciones elegir el número de clases
tiene sentido. Como la frecuencia es el área de cada
rectángulo, si dibujamos rectángulos con distinta igual al entero más próximo a N En el ejemplo de
base su mayor o menor altura no nos da información. GTINE como N=75 entonces

(Ver Ejemplo de GTINE en Peña y Romo) N  75  8,6  9


● Cuando las clases (o intervalos) son de la misma El polígono de frecuencias

longitud, las frecuencias son proporcionales a las


●El polígono de frecuencias es una representación
alturas de los rectángulos. La altura nos informa gráfica de las frecuencias equivalente al histograma.
sobre la densidad o concentración de datos en ese
●Se obtiene a partir del histograma uniendo los centros
intervalo:
de la base superior de sus rectángulos.
donde los rectángulos son más altos hay más datos
Ejemplo: GTINE
de la variable

Histograma de GTINE
donde los rectángulos son más bajos los datos de la
Frecuencias relativas (%)

30

variable son más escasos 25


20
15
Ejemplo: GTINE (distribución frecuencias) 10
5
0
Histograma de GTINE 0 0,2 0,4 0,6 0,8 1
Frecuencias relativas (%)

(X 1,E6)
30 GTINE
25
20
15
Polígono de frecuencias de GTINE
Frecuencias relativas (%)

10
30
5
25
0
0 0,2 0,4 0,6 0,8 1 20
(X 1,E6)
GTINE 15

10

Los rectángulos se dibujan contiguos (a diferencia 5

0
0 0,2 0,4 0,6 0,8 1
del diagrama de barras o de Pareto) para transmitir GTINE
(X 1,E6)

la idea de variable continua.

9
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas 2.La suma de las desviaciones al cuadrado de los
valores de la variable respecto a una constante k
MEDIDAS DE TENDENCIA CENTRAL
cualquiera, se hace mínima cuando esa constante es
Nos dan un centro de la distribución de frecuencias, la media. Es decir:
es un valor que se puede tomar como representativo
 x  x n i   x 
2 2
de todos los datos. Hay diferentes caminos para i i  k ni
i i ,
definir el "centro" de las observaciones en un
para cualquier constante k.
conjunto de datos. Por orden de importancia, son:
MEDIANA (Me):es el valor que separa por la mitad
MEDIA ARITMÉTICA: (o simplemente media). es el
las observaciones ordenadas de menor a mayor, de
promedio aritmético de las observaciones, es decir,
tal forma que el 50% de estas son menores que la
el cociente entre la suma de todos los datos y el
mediana y el otro 50% son mayores. Si el número de
número de ellos (Teniendo en cuenta que si un valor
datos es impar la mediana será el valor central, si es
se repite hay que considerar estas repeticiones)
par tomaremos como mediana la media aritmética

xn i i
de los dos valores centrales.
x i

n Distinguiremos entre distribuciones no agrupadas y


distribuciones agrupadas:
Si los datos están agrupados utilizamos las marcas
de clase, es decir ci en vez de xi. DISTRIBUCIONES NO AGRUPADAS:

Es la medida de centralización más importante.  Calculamos n/2.

Ejemplo 1:  Se busca en la tabla Ni-1<n/2 < Ni (es decir aquel


valor cuya frecuencia acumulada más se acerca a
0 * 2  1 * 4...6 * 1
x =2.52 n/2 por arriba).
50

PROPIEDADES -Si n/2<Ni la mediana es aquel valor de la variable


cuya frecuencia cumulada es Ni es decir: Me=xi
1. La suma de las diferencias de los valores de la
tal que n/2 <Ni
variable y la media es cero.

 x
i
i  xn i  0 -Si n/2=Ni la mediana será la media aritmética de
aquellos valores cuya frecuencia acumulada es Ni y
Ni+1 respectivamente, es decir: Me=(xi+xi+1)/2

10
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas tal que Ejemplo 2:
Ni=n/2
n=40
Ejemplo 1:
n/2=20
n=50
N2=11<20<25=N3
n/2=25
el intervalo mediano es el intervalo [Li-1,
N2 =6<25<27=N3 Li)=[4.25,4.75) con lo que

como 25< N3=27 entonces Me=x3=2


 40 
DISTRIBUCIONES AGRUPADAS   11 0.5
 2 
Me  4.25   4.57
 Se calcula n/2. 14

 Se busca en la tabla el intervalo, [Li-1, Li), que


cumple Ni-1<n/2<Ni (a este intervalo lo llamamos Cuando encontramos dos modas decimos que es una
intervalo mediano). distribución bimodal, tres, multimodal, etc.

 A continuación, para encontrar la mediana, Ejemplo1 M0=2


aplicaremos la siguiente fórmula:
DISTRIBUCIONES AGRUPADAS
n 
  Ni1  a i
2 
Me  L i1  Es importante distinguir aquí también entre
ni
intervalos de igual amplitud, o distribuciones de
El razonamiento es el siguiente: La frecuencia frecuencias donde los intervalos no tengan la misma
acumulada hasta el intervalo anterior al mediano es Ni-1; amplitud.
para llegar a la mitad de los datos, es decir, n/2
necesitamos tomar n/2 - Ni-1 del intervalo mediano, el cual A continuación, para encontrar la moda aplicamos

tiene ni datos repartidos en una amplitud ai ; como a cada la siguiente fórmula:


dato le corresponde una longitud ai / ni , a los n/2 - Ni-1
n i 1
datos les corresponderá Mo  L i1  ai
n i1  n i1

 n 
  Ni  1  a i
 2 
ni

11
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas 10.5 11.2 9.9 15.0 11.4 12.7 16.5 10.1 12.7 11.4

11.6 6.2 7.9 8.3 10.9 8.1 3.8 10.5 11.7 8.4
MEDIDAS DE DISPERSIÓN ABSOLUTAS
12.5 11.2 9.1 10.4 9.1 13.4 12.3 5.9 11.4 8.8
Por orden de importancia tenemos:
7.4 8.6 13.6 14.7 11.5 11.5 10.9 9.8 12.9 9.9
2
VARIANZA ( s ) es el promedio del cuadrado de las
distancias entre cada observación y la media
aritmética del conjunto de observaciones Construye una tabla de frecuencias que recoja
adecuadamente esta información, y haz también
  xi  x n i
2

alguna representación gráfica.


s2  i

n
3) Investigados los precios por habitación de 50
Si los datos están agrupados utilizamos las marcas hoteles de una ciudad se han obtenido los siguientes
de clase, es decir Ci en vez de Xi. resultados

En el caso extremo en que todas las observaciones 700 300 500 400 500 700 400 750 800 500

fueran iguales, la media coincidiría con ese valor


500 750 300 700 1000 1500 500 750 1200 800
común y la varianza sería cero. En general, cuanto
400 500 300 500 1000 300 400 500 700 500
más dispersas sean las observaciones, mayores
serán las diferencias dentro de los cuadrados y por 300 400 700 400 700 500 400 700 1000 750

tanto mayor será el valor de s2. 700 800 750 700 750 800 700 700 1200 800

2
DESVIACIÓN 𝑆 = √𝑆 2 Determínese:

EJERCICIOS DE APLICACIÓN a) La distribución de frecuencias de los precios.

Muchas de las personas que invierten en bolsa lo 1. Sin agrupar.


hacen para conseguir beneficios rápidos, por ello el
2. Agrupados en 5 intervalos de igual amplitud.
tiempo en que mantienen las acciones es
relativamente breve. Preguntada una muestra de 40 b) Porcentaje de hoteles con un precio superior a
inversores habituales sobre el tiempo en meses que 750.
han mantenido sus últimas inversiones se recogieron
c) Cuántos hoteles tienen un precio mayor o igual
los siguientes datos
que 500 pero menor o igual a 1000.

d) Representar gráficamente dichas distribuciones.

12
Facultad de Ciencias de la Educación SEMANA 8-9
Programa de Licenciatura en Matemáticas

4) El gobierno desea saber si el número medio de Se pide:


hijos por familia ha descendido respecto a la década
a) Construir la tabla de frecuencias
anterior. Para ello ha encuestado a 50 familias
respecto al número de hijos y ha obtenido los b) Si sabemos que los bebes que pesan menos de 3
siguientes datos: kilos nacen prematuramente ¿Qué porcentaje de
niños prematuros han nacido entre estos 40?
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4

c) Normalmente los niños que pesan más de 3 kilos y


3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
medio no necesitan estar en la incubadora ¿Puedes
a. Construye la tabla de frecuencias a partir de estos decirme que porcentaje de niños están en esta
datos. situación?

b. ¿Cuántas familias tienen exactamente tres hijos? d) Representa gráficamente la información recogida

c. ¿Qué porcentaje de familias tienen exactamente 3 6) Completar la siguiente tabla:


hijos?
Xi Mc ni fi Ni Fi
d. ¿Qué porcentaje de las familias de la muestra
[0,10) 2 0,05 2 0,05
tienen más de dos hijos? ¿Y menos de 3?
[10,20) 0,15
e. Construye el grafico que consideres más adecuado
con las frecuencias no acumuladas [20,30) 0,4

f. Construye el gráfico que consideres más adecuado [30,40) 15 0,775


con las frecuencias acumuladas.
[40,50) 1
5) En un hospital se desea hacer un estudio sobre los
a. Halle las medidas de tendencia central.
pesos de los recién nacidos. Para ello, se recogen los
b. Halle las medidas de dispersión
datos de 40 bebes y se tiene:
7) Antes de las últimas elecciones generales, una
3.2 3.7 4.2 4.6 3.7 3.0 2.9 3.1 3.0 4.5
encuesta realizada sobre la intención de voto de
4.1 3.8 3.9 3.6 3.2 3.5 3.0 2.5 2.7 2.8 colectivo de 45 personas, dio los siguientes

3.0 4.0 4.5 3.5 3.5 3.6 2.9 3.2 4.2 4.3 resultados

4.1 4.6 4.2 4.5 4.3 3.2 3.7 2.9 3.1 3.5

13
Facultad de Ciencias de la Educación SEMANA 8-9
PP PSOEPrograma
IU de PP PSOE
Licenciatura UV
en Matemáticas PP UV PSOE gráficamente la información recogida mediante un
diagrama de sectores.
IU PP IU PP UV PP PP PSOE UV

10) Construye la tabla de frecuencias relacionada


PSOE PP PSOE UV PP UV UV PSOE PP
con el siguiente gráfico, donde se resumen datos

IU PP PSOE IU PP IU UV UV PP
recogidos sobre 50 personas

PSOE UV PP PSOE PP IU PP IU PP 0,6


0,5
0,4
Se pide: 0,3
0,2
0,1
Confeccionar una tabla de frecuencias que recoja 0
0–1 1–2 2–3 3–4
esta información y elabora dos tipos de gráficos
distintos a partir de ella. ¿Qué porcentaje de
votantes espera tener cada formación política? 11) los siguientes datos representan el ancho en
milímetro de una marca de tornillos. construya una
8) Construye la tabla de frecuencias a partir del
distribución de frecuencias.
siguiente gráfico de frecuencias acumuladas,
sabiendo que tenemos una variable discreta 181 159 160 159 158 165 161 163 165 163
178 160 158 165 155 158 155 157 157 164
183 155 163 164 156 160 155 160 158 159
35
163 162 162 156 158 161 162 156 155 161
30
180 160 155 160 157 164 156 155 165 155
25
20
15
a. Realizar graficos. Circular y el Histograma
10 b. Mencione que tipo de variable es.
5
0
c. Halle las medidas de tendencia central
2 3 4 5 6 7 8
d. Halle las medidas de dispersión

9) En una finca de apartamentos en Benicasim, se


reúne la comunidad de vecinos para ver si contratan
una persona que les lleve la contabilidad. El
resultado de la votación es el siguiente: 25 vecinos a
favor de la contratación, 15 vecinos en contra y 5
vecinos se abstienen. Construye la tabla de
frecuencias para estos datos y representa

14

Potrebbero piacerti anche