Sei sulla pagina 1di 12

Distribución

de frecuencias

Herramientas
Matemáticas III
Estadística I

1
Distribución de intervalos de
clase
Números de intervalos

Amplitud de cada intervalo

Hay oportunidades en que un ordenamiento de datos no resulta útil. Por


ejemplo, en una lista de todos los valores, por ser una forma incómoda de
mostrar gran cantidad de datos.
Para estas situaciones, necesitamos resumir la información sin que pierda su
calidad al momento de utilizarla en su interpretación y en la evaluación de
decisiones.

Una alternativa a la hora de resumir datos es a partir de una tabla de


frecuencias o de distribución de frecuencias.

Una tabla de distribución de frecuencias se utiliza para ubicar datos


distribuidos en clases, es decir, en agrupamientos de valores que describen
una característica particular de dichos datos.

Para poder construir una distribución de intervalos de clase, se debe tener


en cuenta:

a) El número de intervalos: La determinación del número de intervalos (k)


está relacionada con la cantidad de datos que tenemos (n). Algunos
técnicos definen:

En cambio, otros se inclinan por la expresión del método Sturges:

k = 1 + 3,332 log n

2
Pero, en un plano aún más general, se puede definir el valor de k teniendo
en cuenta que:

6 ≤ 𝑘 ≤ 15

Es decir, el número de intervalos debe estar comprendido entre 6 y 15.


Menos de 6 intervalos da lugar a una distribución con información
insuficiente y frecuencias muy altas, y más de 15 intervalos generan una
distribución que resulta complicado operar.

b) A la amplitud de intervalo ∆𝑥 la podremos calcular con:

𝑥𝑁 − 𝑥𝑖
∆𝑥 = .
𝑘

c) No puede existir un intervalo con frecuencia cero; si esa situación se


presentara, sería necesario modificar la cantidad de intervalos o la amplitud
de cada intervalo.
d) Al fijar los extremos de los intervalos, debe atenderse a la posibilidad de
que uno de ellos pueda ser cerrado y el otro abierto.
e) Es necesario que todos los intervalos tengan el mismo tamaño y, cuando
esto no sea posible, los intervalos de diferente amplitud deben ubicarse en
los extremos.
f) Hay que tratar de evitar que las observaciones coincidan con los extremos
de cada intervalo, así desaparece la duda en cuanto a la pertenencia de una
observación a un intervalo o a su adyacente.

Tipos de intervalos finitos:

Son aquellos intervalos de números que se relacionan con segmentos de


recta.

Intervalo abierto: Se trata de un intervalo cuyos extremos no participan del


conjunto que está describiendo.
En el ejemplo a continuación, se representan todos los números reales
inferiores a b y superiores a a pero no incluyen ni a a ni a b.
En este tipo de intervalo, se representan a través de los valores extremos
separándose por un punto y coma y entre paréntesis.
Ejemplo: (a; b).

Figura 1: Intervalo abierto

Fuente: Elaboración propia

3
Intervalo cerrado: Al contrario del intervalo abierto, sus extremos si forman
parte del conjunto solución al que representa. Este intervalo involucra, entre
de sus extremos a y b, todos los números reales que sean iguales o mayores
que a y los que sean iguales o menores que b. Estos valores se colocan entre
corchetes y separados por un punto y coma.
En nuestro ejemplo: [a; b].

Figura 2: Intervalo cerrado

Fuente: Elaboración propia

Intervalo semiabierto a la izquierda: Se llama también intervalo


semicerrado a la derecha. Esto ocurre cuando su lado izquierdo se encuentra
abierto, es decir que no incluye al punto a y su lado derecho se encuentra
cerrado, por lo que si incluye al punto b.
Se representa con un paréntesis a la izquierda, los extremos separados con
punto y coma, y con un corchete a la derecha. Ejemplo: (a;b].

Figura 3: Intervalo semiabierto por la izquierda

Fuente: Elaboración propia

En cambio, los intervalos semiabiertos por la derecha incluyen a los


números reales menores que b y a los iguales o mayores que a por lo que se
encuentran cerrados a la izquierda.
Estos intervalos se escriben con un corchete a la izquierda, los extremos
separados por punto y coma y un paréntesis a la derecha.
Ejemplo: [a; b).

Figura 4: Intervalo semiabierto por la derecha

Fuente: Elaboración propia.

4
Tipos de intervalos infinitos:
Los valores en este tipo de intervalos son encerrados por paréntesis y
separados por punto y coma.

Ejemplo: (–ꝏ; +ꝏ)

Figura 5: Intervalo infinito

–ꝏ +ꝏ
Fuente: Elaboración propia.

Intervalo infinito abierto a la izquierda:

Ejemplo: (a; +ꝏ).

Figura 6: Intervalo infinito abierto a la izquierda

+ꝏ

Fuente: Elaboración propia.

Intervalo infinito cerrado a la izquierda:

Ejemplo: [a, +ꝏ).

Figura 7: Intervalo infinito cerrado a la izquierda

+ꝏ
Fuente: Elaboración propia.

Intervalo infinito abierto a la derecha:

Ejemplo: (–ꝏ; b).

Figura 8: Intervalo infinito abierto a la derecha

–ꝏ
Fuente: Elaboración propia.

5
Intervalo infinito cerrado a la derecha:

Ejemplo: (–ꝏ; b].

Figura 9: Intervalo infinito cerrado a la derecha

–ꝏ
Fuente: Elaboración propia.

Determinación de la media

Para poder determinar la media aritmética de una distribución de


frecuencias, consideramos que todos los valores pertenecientes a cada
intervalo están uniformemente distribuidos por dicho intervalo. De esta
manera, la suma de todos ellos estará dada por el producto entre la marca
de clase y la frecuencia de ese intervalo.

∑(𝑥𝑚𝑖 . 𝑓𝑖 )
𝜇= .
𝑁

Determinación de la mediana para datos agrupados

La mediana estará ubicada en el intervalo cuya frecuencia acumulada


contenga la observación X(n/2); es, por lo tanto, conveniente determinar, en
la tabla de frecuencias, las columnas que contengan las frecuencias
acumuladas y desacumuladas. De acuerdo con la tabla, la mediana deberá
ubicarse en el intervalo al que denominaremos intervalo medial. Para su
determinación en una distribución de intervalos de clase, contamos con dos
métodos.

a) Método gráfico: Trazaremos los diagramas correspondientes con la


frecuencia acumulada y desacumuladas. Combinemos, en un mismo
diagrama, las representaciones gráficas de un ejemplo cualquiera.

6
Figura 10 Frecuencias acumuladas y desacumuladas

Me

Fuente: Elaboración propia.

Como ambas frecuencias se representan en el eje vertical a la misma escala,


en el punto intersección ambas son iguales y su suma es:

fa + fds = N.

Debe verificarse que el valor de esas frecuencias, en ese punto, es igual a


N/2. Como la mediana es el valor que ocupa el punto medio, la abscisa
correspondiente con el punto de intersección tendrá su valor. Por lo tanto,
las coordenadas del punto intersección serán (Me, N/2).

b) Método analítico: analizaremos el intervalo medial.

Figura 11: Frecuencia Acumulada en el intervalo medial

Fuente: Elaboración propia

Esa variación de frecuencia acumulada de fas - fai es justamente la


frecuencia correspondiente con el intervalo medial (fm = 6). Consideramos
que el total de observaciones es 21, por lo que la mediana se encontrará en
el intervalo que incluye a N/2 = 10,5. Esos triángulos que se ven en el gráfico
son semejantes y, por lo tanto, sus lados homólogos son proporcionales.
Por tal razón, tendremos:

7
𝑓𝑚 ∆𝑥
= .
𝑁 (𝑀𝑒 − 𝐿𝑖 )
( 2 − 𝑓𝑎𝑖 )

Despejando Me, tendremos:

𝑁
∆𝑥 ( 2 − 𝑓𝑎𝑖 )
𝑀𝑒 = 𝐿𝑖 + .
𝑓𝑚

Determinación de la moda para datos agrupados

Se define como intervalo modal al intervalo de mayor frecuencia; para la


determinación de la moda, consideremos, en el histograma de frecuencia, el
intervalo modal y los intervalos adyacentes.
Si definimos a d1 = (frecuencia del intervalo modal) - (frecuencia del
intervalo que le antecede) y d2 = (frecuencia del intervalo modal) - (menos
la frecuencia del intervalo que le sucede), como Li se define al inicio del
intervalo modal, el valor de la moda de una distribución de intervalos de
clase está dada por la expresión:

𝑑1
𝑀𝑜 = 𝐿𝑖 + ∆𝑥. .
(𝑑1 + 𝑑2 )

Figura 12: Intervalo Modal

Fuente: Elaboración propia

d1

Histograma de frecuencias

8
Es un gráfico de barras para datos numéricos agrupados, en el que la
frecuencia o el porcentaje de cada grupo está representado por una barra
individual. No hay separación entre las barras adyacentes, por lo que
tenemos un diagrama de barras sin discontinuidades. La variable (por
ejemplo, las calificaciones) que nos interesa se coloca a lo largo del eje de
las abscisas. El eje (Y) vertical representa la frecuencia o el porcentaje de los
valores de cada intervalo de clase. El intervalo entre dos clases sucesivas se
denomina “amplitud de intervalo”; en este caso, es la unidad y se la expresa
como Δx = 1.

Figura 13: Histograma de frecuencias

∆x

Fuente: Elaboración propia

La superficie de cada una de las barras está dada por el producto entre la
base Δx por la altura, que está determinada por la frecuencia.
Si a ∆x lo asimilamos con la unidad, entonces cada barra tendrá una
superficie igual a su frecuencia, y el área total del diagrama será la suma de
todas las frecuencias e igual a N. ΣSi = Σfi = N.

Histograma de frecuencias relativas:


Este histograma se diferencia del histograma de frecuencias absolutas, en
que en el eje de las ordenadas, se ubican las frecuencias relativas de los
datos de cada una de las clases.

Este histograma tiene una gráfica similar al de un histograma de frecuencias


absolutas del mismo agrupamiento de datos.

Se debe a que el tamaño relativo de cada bastón es la frecuencia absoluta


de esa clase dividida por el número total de observaciones.

9
Habiendo recordado esto último, la diferencia entre el histograma de
frecuencias relativas y absolutas es la escala del eje de las ordenadas.

Muy ventajoso es poder mostrar los datos en función de frecuencias


relativas debido a que los valores absolutos pueden alterarse
individualmente, las frecuencias relativas permanecen relativamente
estable.

Este hecho nos ayudará comparar datos de muestras con diferentes


tamaños muestrales.

Figura 14: Histogramas de frecuencias absolutas y relativas

Fuente: Levin y Rubin, 2004, p. 30.

En los diagramas que anteceden, se puede observar, en un ejemplo


cualquiera, las formas similares de ambos diagramas y el cambio de escala
citado.

10
Frecuencias acumuladas

Recuerda que la frecuencia acumulada (fa) indica el número de valores que


son menores o iguales que el valor dado. Su representación gráfica es similar
a la estudiada en el punto 2.3, pero, en cuanto a datos agrupados en el eje
de las abscisas, se ubican las marcas de cada clase (la marca clase de una
distribución de datos agrupados en intervalos corresponde con la media
aritmética de los extremos de cada uno de dichos intervalos).

Frecuencias acumuladas y desacumuladas para datos


agrupados

Hacemos las mismas consideraciones que en el punto anterior, lo hemos


explicado en el punto 2.3 considerando que, en los datos agrupados,
trabajamos con la marca de la clase.

11
Bibliografía de referencias
Levin, R. I., y Rubin, D. S. (2004). Estadística para administración y economía
(7.a ed.). México: Pearson Educación.

12

Potrebbero piacerti anche