Sei sulla pagina 1di 18

2.

1 Necesidad de organizar los datos



Para poder realizar un anlisis lgico de los datos obtenidos en una
investigacin y contenidos en una serie de instrumentos, es necesario
ordenarlos en forma lgica, es decir, clasificarlos en base a determinados
criterios. En ese sentido, y recordando el paso 4 de la Seccin 1.10.4 del
Unidad I, es necesario efectuar:

1) La Revisin: Consiste en constatar y hacer recuento todos los
instrumentos contentivos de los datos con el objeto de detectar los
espacios en blanco u omisiones, y observar aquellas respuestas
absurdas, errneas o ilgicas, corrigindolas cuando sea posible.
2) El Agrupamiento: Luego de ejecutarse el paso anterior, corresponde
seleccionar, expresar (resumidamente) y agrupar en una hoja los datos tal
como aparecen descritos en el respectivo instrumento a ser asociado a
dicha hoja.
3) La Clasificacin: Se determina cada variable evaluada en los
instrumentos, y de todas las hojas antes usadas para registrar los datos
se escogen, de entre estos ltimos, los que estn asociados a la variable
en cuestin.

As obtenemos una mejor percepcin visual, conceptual y sectorizada
del volumen de informacin a ser expuesta en forma manejable para su
procesamiento estadstico con las tcnicas a ser estudiadas en la presente
Gua Didctica.

2.2 Qu se entiende por Observacin, Clase y Frecuencia?

Una Observacin (o Unidad Estadstica) es un dato asumido por una
variable cuando esta es cualitativa, o es una repeticin de un dato propio de
una poblacin o muestra cuando la variable es cuantitativa.

En el primer caso, la cantidad N de observaciones es igual a la
cantidad n de datos (N =n) pues cada observacin es un dato en s misma.
En el segundo caso, cada dato est asociado a una serie de observaciones
que lo repiten; el nmero N de observaciones de todos los datos es mayor o
igual al nmero n de datos obtenidos (N n). Si cada observacin aparece
repetida una sola vez, entonces la cantidad de datos resulta igual a la
cantidad de observaciones (N =n), es decir, cada dato est asociado a una
sola observacin.

Necesariamente deben aplicarse tcnicas de conteo con el fin de
identificar y cuantificar las observaciones de manera cuidadosa para evitar
errores. La ms sencilla es escoger una observacin de una serie dada y en
una hoja se le colocan al lado tantas rayitas como repeticiones se encuentren
en la serie, en la cual se van tachando a medida que se van encontrando.
Este procedimiento se ejecuta para todas las observaciones previa aplicacin
de algn criterio que permita ordenarlas.

Una Clase es un grupo determinado de datos u observaciones
estudiados, los cuales se pueden ubicar en k grupos, pudindose colocar
estos en orden de magnitud de ser as posible (de acuerdo a la escala o nivel
de medicin a usarse), y se distribuyen de forma que un mismo dato u
observacin no tenga ubicacin simultnea en clases diferentes. Es decir,
cada dato u observacin se asocia a una y slo una de las k clases dadas.

Se entiende por Frecuencia a la cantidad o porcentaje de
observaciones asociadas a un dato o a una clase. Si la variable es
cualitativa, cada observacin es un dato y cada categora asumida por la
variable viene siendo una clase, cuya frecuencia en todo caso viene dada por
la cantidad o porcentaje de datos que caen en esa categora. Si la variable
es cuantitativa, un dato es un valor numrico repetido por las observaciones,
y la cantidad de estas es la frecuencia del dato, y la frecuencia de una clase
es la suma de las frecuencias de los datos que la conforman.

2.3 Distribuciones de Datos y Frecuencias

Una Distribucin de Datos en un conjunto de datos obtenidos de una
serie de observaciones, y dispuestos de manera separada y consecutiva, ya
sea en forma unitaria o grupal conforme a las categoras o valores de una
variable, y ordenados segn la escala o nivel de medicin empleada al
efecto.

Una Distribucin de Frecuencias es un agrupamiento de datos en
grupos mutuamente excluyentes, dando el nmero o porcentaje de
observaciones a cada grupo. O sea, no hay Distribucin de Frecuencias sin
Distribucin de Datos, y aquella tendr su respectiva denominacin de
acuerdo al tipo de frecuencia a definirse en la Seccin 2.5. Por ejemplo, se
puede hablar de una Distribucin de Frecuencias Relativas.

2.4 Tipos de Distribuciones de Datos y Frecuencias

2.4.1 Distribucin de Datos Simples o no Agrupados

As se le denomina cuando a los datos no se les han aplicado algn
tratamiento de agrupacin, es decir, cada uno de los n datos es tomado de
manera unitaria y por separado. Cuando a estos datos les asociamos sus
respectivas frecuencias, estamos ante una Distribucin de Frecuencias para
Datos Simples o no Agrupados. Por otra parte, toda serie de N
observaciones se puede representar como una distribucin de n datos
simples y viceversa, por lo que uno es equivalente al otro, y de uno se
construye el otro.

2.4.2 Distribucin de Datos Agrupados

A partir de una Distribucin de Datos Simples o no Agrupados
previamente elaborada, los datos se agrupan en k clases o grupos con el fin
de sintetizar, condensar, resumir o hacer ms fcilmente manejable la
informacin. Cuando a estas clases les asociamos sus respectivas
frecuencias, estamos ante una Distribucin de Frecuencias para Datos
Agrupados.

2.5 Tipos de Frecuencia

2.5.1 Frecuencia Absoluta (f o F)

Es la cantidad f de veces que se repite cada uno de los n datos dentro
de una coleccin de estos, o el nmero de observaciones F asociadas a cada
una de las k clases. A veces a la Frecuencia Absoluta se le denomina
Frecuencia Absoluta Simple.

La suma de n o k frecuencias (para datos simples o agrupados,
respectivamente) da el nmero N de todas las observaciones. Luego
tenemos las correspondientes expresiones que simbolizan lo antes dicho:

Datos Simples Datos Agrupados

=
=
n
1 j
j
f N

=
=
k
1 j
j
F N

2.5.2 Frecuencia Absoluta Acumulada (fa o Fa)

Es la suma de las frecuencias absolutas comprendidas hasta un
determinado dato (fa) o hasta cierta clase (Fa).


Datos Simples Datos Agrupados
fa
j
=f
1
+f
2
++f
j
, j = 1,, n Fa
j
=F
1
+F
2
++F
j
, j = 1,, k

2.5.3 Frecuencia Relativa (h o H)

Se define como el porcentaje que resulta de dividir cada frecuencia
absoluta sobre la sumatoria de todas las frecuencias absolutas de n datos o
k clases, y luego multiplicar ese cociente por 100%, obtenindose h o H
respectivamente. A veces a la Frecuencia Relativa se le denomina
Frecuencia Relativa Simple.

Datos Simples Datos Agrupados
n 1,2,..., j 100%,
N
f
h
j
j
= = k 1,2,..., j 100%,
N
F
H
j
j
= =

2.5.4 Frecuencia Relativa Acumulada (ha o Ha)

Es la suma de las frecuencias relativas comprendidas hasta un
determinado dato (ha) o una cierta clase (Ha).

Datos Simples Datos Agrupados
ha
j
=h
1
+h
2
++h
j
, j = 1,, n Ha
j
=H
1
+H
2
++H
j
, j = 1,, k



Construccin de Distribuciones de Frecuencias para Datos Simples y
Agrupados

Si la variable X es cualitativa, hallaremos las frecuencias absolutas y
relativas de cada una de las k modalidades de la variable. Aqu cada clase
se expresa como una modalidad representada de acuerdo a la Escala de
Medicin Nominal u Ordinal de la variable. Si la escala no es ordinal, no
tiene sentido calcular las frecuencias absolutas acumuladas y las frecuencias
relativas acumuladas.
Modalidad
de Clase
F H Fa Ha
c
1

c
2

c
3

.
.
.
c
k

F
1

F
2

F
3

.
.
.
F
k

H
1

H
2

H
3

.
.
.
H
k
=100%
Fa
1

Fa
2

Fa
3

.
.
.
Fa
k
Ha
1

Ha
2

Ha
3

.
.
.
Ha
k
=100%
N N

Ejemplo: Un estudio hecho en un conjunto de 25 varones con objeto
de determinar su grupo sanguneo ha conducido a los siguientes resultados:

A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B

La variable que indica el tipo sanguneo es cualitativa, y no hay
jerarqua entre los atributos o modalidades. Luego obtenemos la siguiente
Distribucin de Frecuencias.

Tipo de
sangre
F H
A
B
O
AB
11
7
6
1
44%
28%
24%
4%
N = 25 100%

Si la variable X es cuantitativa (discreta o continua), hallaremos las
frecuencias de cada uno de los valores o datos de la variable si son pocos, y
se har de manera similar a como se expuso anteriormente.

Ejemplo: Observemos la siguiente tabla en la que se expresan las
calificaciones obtenidas en un ejercicio evaluado en escala de 1 a 10 puntos.
Tenemos una distribucin de frecuencias asociadas a una variable
cuantitativa.

Calificaciones f h fa ha
1
2
3
4
5
6
7
8
9
10
1
2
1
2
3
4
3
1
2
1
5%
10%
5%
10%
15%
20%
15%
5%
10%
5%
1
3
4
6
9
13
16
17
19
20
5%
15%
20%
30%
45%
65%
80%
85%
95%
100%
N = 20 100%

2.7) Pasos necesarios en la construccin de una Distribucin de
Frecuencias para Datos Agrupados

En caso de asumir la variable cuantitativa X una cantidad
relativamente numerosa de valores, los agrupamos en clases y hallamos sus
frecuencias. Aqu la clase se representa por un nmero, y a esta se halla
asociado un intervalo de la recta real llamado Intervalo de Clase, y una
Marca de Clase Xm o valor que representa ese intervalo, tal como veremos a
continuacin.

N de
Clase
Intervalo
de Clase
Xm F Fa H Ha
1
2
3
.
.
.
k
[Li
1
, Ls
1
]
[Li
2
, Ls
2
]
[Li
3
, Ls
3
]
.
.
.
[Li
k
, Ls
k
]
Xm
1

Xm
2

Xm
3

.
.
.
Xm
k
F
1

F
2

F
3

.
.
.
F
K

Fa
1

Fa
2

Fa
3

.
.
.
Fa
K
=N
H
1

H
2

H
3

.
.
.
H
K

Ha
1

Ha
2

Ha
3

.
.
.
Ha
K
=100%
N 100%

Ejemplo: Una cooperativa de produccin fundada hace algunos aos
se dedic a vender productos agrcolas que produca. Como consecuencia
del paro petrolero y de escasez de alimentos enlatados en las comunidades
a las que serva la cooperativa, se propuso negociar productos enlatados a
fin de aumentar la oferta de productos y de esta manera ampliar sus servicios
a la comunidad. Dada la gran variedad de productos as como de sus
precios, la cooperativa necesita desarrollar una investigacin estadstica de
productos y precios que ofrecan a fin de encontrar las variaciones en los
precios y las tendencias de preferencia de la comunidad.

A continuacin presentamos una serie de datos de los precios de los
nuevos productos ofrecidos por la cooperativa.

1.560 1.870 1.890 2.330 3.030 1.990
1.630 3.240 2.330 2.550 2.010 3.030
1.220 1.630 2.010 1.150 3.020 1.893
3.550 3.030 2.750 2.330 2.110 1.630
1.630 3.240 1.893 2.111 1.630 2.010
2.735 2.330 3.240 2.567 2.789 1.234

1) Definimos la variable X, determinamos el nmero N de
observaciones, y se ordena la serie de datos de menor a mayor (por
filas o columnas)

Sea X la variable que indica el precio de cada producto enlatado
vendido por la cooperativa. Vemos que X es cuantitativa y discreta. Hay N =
36 observaciones que ordenaremos por columnas en forma creciente. Para
hacer esto, de cada una de las m columnas (filas) de la agrupacin anterior
se selecciona la menor de las observaciones, y de all se escoge la menor de
las m cantidades as obtenidas por columna. Luego, en una nueva columna
(fila) a escribirse en otra agrupacin posterior, se expresan las repeticiones
de ese valor a la vez que se tachan en la agrupacin anterior, y en sta se
aplica el procedimiento de nuevo sin tomar en cuenta los valores ya
tachados.


1.150 1.630 1.893 2.111 2.567 3.030
1.220 1.630 1.990 2.330 2.735 3.030
1.234 1.630 2.010 2.330 2.750 3.240
1.560 1.870 2.010 2.330 2.789 3.240
1.630 1.890 2.010 2.330 3.020 3.240
1.630 1.893 2.110 2.550 3.030 3.550

Interpretacin: Al observar los precios ordenados podemos decir que
hay 18 productos con precios por debajo de Bs. 2.111 y el resto un precio
mayor.
La cantidad de observaciones realizadas es de 36 precios
correspondientes a 36 productos enlatados diferentes.

2) Determinamos la cantidad de datos n y la correspondiente
Distribucin de Frecuencias para Datos Simples.

Dada la variable X, las observaciones se denotan con el smbolo x
i
,
donde j asumir el valor de la posicin de cada observacin, j = 1, 2, 3,..., N.

x
1
= 1.150 x
7
= 1.630 x
13
= 1.893 x
19
= 2.111 x
25
= 2.567 x
31
= 3.030
x
2
= 1.220 x
8
= 1.630 x
14
= 1.990 x
20
= 2.330 x
26
= 2.735 x
32
= 3.030
x
3
= 1.234 x
9
= 1.630 x
15
= 2.010 x
21
= 2.330 x
27
= 2.750 x
33
= 3.240
x
4
= 1.560 x
10
= 1.870 x
16
= 2.010 x
22
= 2.330 x
28
= 2.789 x
34
= 3.240
x
5
= 1.630 x
11
= 1.890 x
17
= 2.010 x
23
= 2.330 x
29
= 3.020 x
35
= 3.240
x
6
= 1.630 x
12
= 1.893 x
18
= 2.110 x
24
= 2.550 x
30
= 3.030 x
36
= 3.550

De aqu obtenemos la siguiente tabla, donde el nmero de datos es n
= 22. Esa tabla es un ejemplo de una Distribucin de Frecuencias Absolutas
para Datos Simples, donde a cada dato X
j
se le asocia su correspondiente
frecuencia absoluta f
j
, j = 1,, n. No sera posible obtener la tabla que
veremos a continuacin sin la tabla anterior donde las observaciones estn
ordenadas en forma creciente. Ambas tablas son equivalentes, pues de una
se puede extraer la otra.

X f X f X f X f
X
1
= 1.150 1 X
7
= 1.890 1 X
13
= 2.330 4 X
19
= 3.020 1
X
2
= 1.220 1 X
8
= 1.893 2 X
14
= 2.550 1 X
20
= 3.030 3
X
3
= 1.234 1 X
9
= 1.990 1 X
15
= 2.567 1 X
21
= 3.240 3
X
4
= 1.560 1 X
10
= 2.010 3 X
16
= 2.735 1 X
22
= 3.550 1
X
5
= 1.630 5 X
11
= 2.110 1 X
17
= 2.750 1
X
6
= 1.870 1 X
12
= 2.111 1 X
18
= 2.789 1

Dada la variable X, en la Distribucin de Frecuencias Absolutas para
Datos Simples cada uno de estos es tomado aisladamente del resto al
representarlo con el smbolo X
j
, donde j asumir el valor de la posicin de
cada dato y X =X
j
(j = 1, 2,..., n).

En el presente caso, el dato X
5
= 1.630 est asociado a las
observaciones x
5
, x
6
, x
7,
x
8
y x
9
, las cuales asumen cada una el valor 1.630,
que se repite con una frecuencia f
5
= 5.

Interpretacin: Hay 5 productos enlatados que tienen un precio de
Bs. 1.630.

3) Calculamos la Amplitud, Rango o Recorrido de la distribucin de
datos considerada

Para esto primero determinamos el valor mayor X
ms grande
y el valor
menor X
ms pequeo
de la Distribucin de Datos Simples. Como en esta
distribucin los datos estn ordenados del menor al mayor valor, tenemos
que X
ms grande
=X
n
y X
ms pequeo
=X
1
. Luego calculamos la Amplitud, Rango
o Recorrido mediante la siguiente formula: A = X
ms grande
X
ms pequeo
=X
n

X
1
.

X
ms pequeo
= Bs. 1.150, X
ms grande
= Bs. 3.350

A = 3.350 1.150; A = 2.200

Interpretacin: La variacin de precios entre el mayor y el menor es
de Bs.2.200.

4) Calculo el nmero k de clases

Necesitamos determinar la cantidad de clases o grupos en que
debemos separar a los distintos datos de la distribucin. La idea es hacer
ms fcil el manejo de la informacin vinculada a numerosas observaciones
o datos.

Existen muchas maneras de definir la cantidad de clases a considerar.
Un procedimiento til para este fin es la Regla de 2 a la k. Tomamos el
menor valor entero para k de tal manera que 2
k
sea mayor o igual a N
(numero de observaciones consideradas).

El valor encontrado para k ser el nmero de clases para la
agrupacin. Se recomienda que el nmero de clases este entre 5 y 25 (5 k
25).

Ahora usamos esta regla para hallar el nmero de clases del ejercicio
considerado.

Asumimos (por tanteo) un valor de k = 5. Entonces 2
5
= 32, y como 32
es menor que N = 36, el valor de k = 5 no es til. Ahora asumimos el valor
de k = 6, calculamos 2
6
= 64, y como ahora 64 es mayor que N = 36,
entonces en este caso se usarn 6 clases. Siempre el valor de 2
k
tiene que
ser mayor o igual que N (o sea, N 2
k
).

Interpretacin: Los datos los agruparemos en 6 clases o grupos para
poder obtener la mayor informacin posible de la distribucin considerada.
Tratar esa cantidad de clases es un trabajo ms prctico que usar 22 datos o
36 observaciones.

5) Clculo de la distancia entre los lmites consecutivos de los
Intervalos de Clase (D
C
) y su correspondiente longitud (Ic)

Un Intervalo de Clase se define como aquel sector de la recta real que
contiene una clase o conjunto de datos que se encuentra ubicado entre dos
extremos o lmites establecidos. El tamao de cada intervalo debe ser el
mismo para todas las clases, y el valor de esa distancia debe ser un nmero
entero, no decimal. La sucesin de estos intervalos deben abarcar por lo
menos la distancia desde el menor valor X
ms pequeo
hasta el valor mayor
X
ms grande
, aunque pueden abarcar una distancia mayor.

Con respecto a la clase j = 1,, k, el intervalo de clase que la
contiene posee como extremos un lmite inferior Li
j
y un lmite superior Ls
j
.
Aqu cada intervalo se tomar cerrado en sus extremos, y estar separado
de los intervalos adyacentes a una distancia de una unidad de longitud para
cada uno. Por ejemplo, para las clases 1 y 2 los respectivos intervalos [Li
1
,
Ls
1
] y [Li
2
, Ls
2
] estarn separados de esa manera pues se debe cumplir que
Li
2
Ls
1
= 1.

Por razones de orden prctico, a veces cada intervalo [Li
j
, Ls
j
] se
representa como Li
j
Ls
j
tal como aparece en algunos libros de Estadstica.
En tal caso no se est representando una resta ni un intervalo que no sea
cerrado en sus extremos.

Hay casos en que los intervalos de clase se pueden tomar abiertos o
semiabiertos en sus lmites. En la presente Gua Didctica no estudiaremos
los procedimientos para obtenerlos, pudindose consultar en otros textos de
Estadstica.

Sea D
C
la distancia existen entre los lmites inferiores o superiores
consecutivos para dos intervalos de clases. Siguiendo el ejemplo dado, D
C
=
Li
2
Li
1
=Ls
2
Ls
1
. Para hallar esa distancia podemos utilizar la siguiente
formula:

( )
k
1 X X
k
1 A
c D
mspequeo msgrande
+
=
+
=

Si el resultado dado por esta frmula da un nmero decimal, este se
redondea por exceso y se escoge como el valor buscado para D
C
. Se
selecciona as para garantizar que los intervalos de clase puedan contener a
todos los datos.

Sea Ic la longitud que tiene cualquier intervalo de clase [Li
j
, Ls
j
], por lo
que Ic =Ls
j
Li
j
, j = 1,, k, pues todos los intervalos tienen igual tamao.
Es fcil deducir que Ic =Dc 1.

En base a los clculos anteriores, tenemos que

X
ms pequeo
= 1.150, X
ms grande
= 3.350, A = 2.200, k = 6

Aplicamos la formula:

366,83
6
1 2.220
=
+
= Dc

A este resultado lo aproximamos al entero inmediatamente superior,
por lo cual tenemos que Dc = 367 e Ic = 366.

Interpretacin: Determinamos que el precio menor de la distribucin
es Bs. 1.150 y el mayor Bs. 3.350. La diferencia entre los valores extremos
consecutivos de cada clase es Bs. 367.

6) Determinamos los Intervalos de Clases

6.1) Clculo de los lmites inferiores Li

Tomamos Li
1
=X
ms pequeo
= 1.150 como lmite inferior de la clase j =
1. Para calcular el lmite inferior Li
2
de la clase j = 2, sumamos al Li
1
el valor
D
C
y tendremos Li
2
=Li
1
+D
C
= 1.150 + 367 = 1.517. Entonces Li
2
= 1.517, y
as sucesivamente hasta completar los 6 lmites inferiores de los
correspondientes intervalos de clases.

6.2) Clculo de los lmites superiores Ls

Para calcular el limite superior Ls
1
de la clase 1, a Li
2
le restamos la
unidad, y as Ls
1
=Li
2
1 = 1.517 1 = 1.516, Ls
1
= 1.516. Luego, para
calcular Ls
2
le sumamos D
C
a Ls
1
y tendremos Ls
2
=Ls
1
+D
C
= 1.516 + 367
= 1.883. Entonces Ls
2
= 1.883, y as sucesivamente hasta completar los 6
lmites superiores de los correspondientes intervalos de clases.

6.3) Tabulacin de los Intervalos de Clase

Ahora determinamos los intervalos de clases que usaremos. A la
clase j le corresponde el intervalo [Li
j
, Ls
j
], j = 1,, k. Expondremos esta
informacin por medio de una tabla. Recordemos que su tamao o longitud
es Ic =Ls
j
Li
j
=Dc 1, el cual es igual para todos los intervalos de clase.


N de
Clase
Intervalo
de Clase
1 [1.150, 1.516]
2 [1.517, 1.883]
3 [1.884, 2.250]
4 [2.251, 2.617]
5 [2.618, 2.984]
6 [2.985, 3.353]

Interpretacin: La clase o grupo 2 consta de todos los precios
registrados de enlatados mayores o iguales a Bs. 1.517 y menores o iguales
a Bs. 1.883, y la variacin entre estos dos lmites o extremos es de Bs. 366.

7) Calculamos la Marca de Clase

La Marca de Clase es el punto medio del respectivo intervalo de clase
al cual pertenece. Se calcula a partir de la semisuma de sus lmites.

2
Ls Li
Xm
j j
j
+
= , j = 1,, k

Calculamos el valor medio Xm
1
de la clase j = 1.

1.333
2
1.516 1.150
=
+
=
+
=
2
Ls Li
Xm
1 1
1
; Xm
1
= 1.333

De igual manera determinamos el resto de las marcas de clase.
Luego, a la tabla anterior le anexamos una columna contentiva de dichas
cantidades, asocindolas a sus correspondientes clases.

N de
Clase
Intervalo
de Clase
Xm
1 [1.150, 1.516] 1.333
2 [1.517, 1.883] 1.770
3 [1.884, 2.250] 2.065
4 [2.251, 2.617] 2.434
5 [2.618, 2.984] 2.801
6 [2.985, 3.353] 3.164

Interpretacin: El primer grupo de precios est definido entre Bs.
1.150 y Bs. 1.516, y el precio promedio de estos valores extremos es de Bs.
1.333.

8) Calculamos la Frecuencia Absoluta de cada clase

De la distribucin de frecuencias para datos simples, la frecuencia
absoluta F
j
de la clase j = 1,, k es la suma de las frecuencias de los datos
pertenecientes a esa clase.

Para el caso de la clase j = 2, el respectivo intervalo de clase es
[1.517, 1.883], y los datos X
4
= 1.560, X
5
= 1.630 y X
6
= 1.870 conforman la
clase 2. Luego tenemos que F
2
=f
4
+f
5
+f
6
= 7. Es decir, en el intervalo
[1.517, 1.883] hay 7 observaciones.

Las frecuencias as obtenidas las anexamos a la tabla en una columna
adjunta a la de las marcas de clase.

N de
Clase
Intervalo
de Clase
Xm F
1 [1.150, 1.516] 1.333 3
2 [1.517, 1.883] 1.770 7
3 [1.884, 2.250] 2.065 9
4 [2.251, 2.617] 2.434 6
5 [2.618, 2.984] 2.801 3
6 [2.985, 3.353] 3.164 8
N =36

Interpretacin: Los precios de 7 productos enlatados son mayores o
iguales a Bs. 1.517 y menores o iguales a 1.883.

9) Calcularemos la Frecuencia Absoluta Acumulada (Fa)

Para la clase j = 1,, k, tenemos que Fa
j
es la cantidad de
observaciones contenidas entre el correspondiente intervalo de clase ms las
de los anteriores siguiendo el orden, es decir, Fa
j
=F
1
+F
2
++ F
j
.

Las frecuencias absolutas acumuladas aqu obtenidas se ubican en la
tabla anterior por orden de clase en una columna anexa a la de la frecuencia
absoluta.

Para la clase j = 3 tenemos que Fa
3
= F
1
+ F
2
+ F
3
= 3 + 7 + 9 =19.

N de
Clase
Intervalo
de Clase
Xm F Fa
1 [1.150, 1.516] 1.333 3 3
2 [1.517, 1.883] 1.770 7 10
3 [1.884, 2.250] 2.065 9 19
4 [2.251, 2.617] 2.434 6 25
5 [2.618, 2.984] 2.801 3 28
6 [2.985, 3.353] 3.164 8 36
N =36

Interpretacin: Los precios de 19 productos enlatados son menores o
iguales a Bs. 2.250.

En algunos textos la Frecuencia Absoluta Acumulada Fa
j
aqu referida
para la clase j viene siendo la Frecuencia Absoluta Acumulada hacia Arriba

j
Fa , mientras que la Frecuencia Absoluta Acumulada hacia Abajo es

j
Fa =
F
j
+ F
j+1
++ F
k-1
+ F
k
.

N de
Clase
Intervalo
de Clase
Xm F

Fa

Fa
1 [1.150, 1.516] 1.333 3 3 36
2 [1.517, 1.883] 1.770 7 10 33
3 [1.884, 2.250] 2.065 9 19 26
4 [2.251, 2.617] 2.434 6 25 17
5 [2.618, 2.984] 2.801 3 28 11
6 [2.985, 3.353] 3.164 8 36 8
N = 36

Para la clase j = 3 tenemos que

3
Fa = F
3
+ F
4
+ F
5
+ F
6
= 9 + 6 + 3 +
8 = 26.

Interpretacin: Los precios de 26 productos enlatados son mayores o
iguales a Bs. 1.884.

10) Calculamos la Frecuencia Relativa (H)

Aplicando la frmula respectiva para la clase j = 2, tenemos que
=
N
F
H
2
2
100% =
36
7
100% = 19,44%

De igual manera se calcula la
frecuencia relativa de cada una de las clases restantes.

N de
Clase
Intervalo
de Clase
Xm F Fa H
1 [1.150, 1.516] 1.333 3 3 8,33%
2 [1.517, 1.883] 1.770 7 10 19,44%
3 [1.884, 2.250] 2.065 9 19 25,00%
4 [2.251, 2.617] 2.434 6 25 16,67%
5 [2.618, 2.984] 2.801 3 28 8,33%
6 [2.985, 3.353] 3.164 8 36 22,22%
N = 36 99,99%

Interpretacin: El 19,44% de los productos enlatados tienen precios
mayores o iguales a Bs. 1.517 y menores o iguales a Bs. 1.883.

11) Calculamos la Frecuencia Relativa Acumulada (Ha)

Para la clase j = 1,, k, tenemos que Ha
j
es el porcentaje de
observaciones contenidas en el correspondiente intervalo de clase ms los
porcentajes de observaciones de las anteriores clases siguindolas en orden
creciente, es decir, Ha
j
= H
1
+ H
2
++H
j
. De aqu se deduce que
necesariamente la frecuencia relativa acumulada de la clase j =k tiene que
ser Ha
k
= 100%, aunque a veces por errores de clculo a nivel de
centsimas, o incluso de milsimas, puede que ese valor de la ltima clase
se ubique en el entorno de 99,99 %.

Para la clase j = 3 tenemos que Ha
3
= H
1
+ H
2
+ H
3
= 8,33% + 19,44%
+ 25,0 % = 52,78%. De igual manera calculamos las restantes frecuencias y
las anexamos.

N de
Clase
Intervalo
de Clase
Xm F Fa H Ha
1 [1.150, 1.516] 1.333 3 3 8,33% 8,33%
2 [1.517, 1.883] 1.770 7 10 19,44% 27,78%
3 [1.884, 2.250] 2.065 9 19 25,00% 52,78%
4 [2.251, 2.617] 2.434 6 25 16,67% 69,44%
5 [2.618, 2.984] 2.801 3 28 8,33% 77,78%
6 [2.985, 3.353] 3.164 8 36 22,22% 99,99%
N =36 99,99%

La ltima tabla as obtenida es la Distribucin de Frecuencias para
Datos Agrupados del problema tratado hasta ahora.

As como nos hemos referido a la Frecuencia Absoluta Acumulada
hacia Arriba (

Fa) y hacia Abajo (

Fa), en forma anloga se puede definir
Frecuencia Relativa Acumulada hacia Arriba (

Ha) y hacia Abajo (

Ha).

Interpretacin:
La frecuencia absoluta F
4
= 6 de la cuarta clase, significa que 6
productos enlatados tienen precios que oscilan entre Bs. 2.252 y Bs. 2.619.
La frecuencia relativa H
3
= 25,00% de la tercera clase, significa que el
25% de los productos referidos tienen precios que oscilan entre Bs. 1.884 y
Bs. 2.251.
La frecuencia acumulada Ha
4
= 25 de la cuarta clase, significa que 25
productos tienen precios que oscilan entre Bs. 1.150 y Bs. 2.619.
La frecuencia relativa acumulada Ha
5
= 77,78% de la quinta clase,
significa que el 77,78% de los productos tienen precios que oscilan entre Bs.
1.150 y Bs. 2.987.

Del ejemplo anterior contesten las siguientes preguntas:
Cuntos productos enlatados tienen precios entre Bs.2.252 y Bs.
2.986?
Cuntos productos enlatados tienen precios entre Bs.1.150 y Bs.
2.251?
Cul es el precio promedio del 25% de los productos enlatados?
En qu precios oscilan por lo menos 28 productos enlatados?

Nota 1: Al tener una Distribucin de Frecuencias para Datos Simples o
no Agrupados, para cada uno de estos se calcula la frecuencia absoluta,
relativa, acumulada (hacia arriba y hacia abajo), y relativa acumulada (hacia
arriba y hacia abajo. Como los datos se toman unitariamente y no agrupados
en clases, no hay intervalos de clase.

Ejemplo: Las edades de los 20 integrantes de una seccin de
estudiantes de la UBV se obtuvieron luego de aplicrseles una encuesta.

34 40 30 37 26 18 37 18 26 26
23 37 26 23 34 37 21 37 37 23

A esta serie de observaciones se le aplica los pasos 1 y 2 de la
Seccin 2.7 para construir una tabla donde aparezcan ordenados en forma
creciente los datos con sus respectivas frecuencias absolutas.

X 18 21 23 26 30 34 37 40
f 2 1 3 4 1 2 6 1

Posteriormente, se ejecutan los pasos 8, 9, 10 y 11 de la seccin
antes mencionada.

X f

fa

fa
h

ha

ha
18 2 2 20 10% 10% 100%
21 1 3 18 5% 15% 90%
23 3 6 17 15% 30% 85%
26 4 10 14 20% 50% 70%
30 1 11 10 5% 55% 50%
34 2 13 9 10% 65% 45%
37 6 19 7 30% 95% 35%
40 1 20 1 5% 100% 5%
N =20 100%

Nota 2: La Distribucin de Frecuencias para Datos Simples expresa
informacin muy detallada y abundante acerca de los datos. La Distribucin
de Frecuencias para Datos Agrupados expresa informacin muy resumida y
austera acerca de estos, por lo que se pierde informacin y la segunda
distribucin mencionada es una aproximacin de la primera. Manejarlos de
cualquiera de las dos maneras es ms prctico y explcito en su contenido
que tenerlos desordenados y dispersos.

Nota 3: Todos los pasos de la Seccin 2.7 se han aplicado para una
variable cuantitativa, pero algunos se pueden usar y adaptar para cualquier
variable cualitativa. En ese caso no se podran calcular el rango ni nada
referido propiamente a intervalos de clase, y si tal variable hace uso de una
Escala de Medicin Ordinal tiene sentido determinar las frecuencias
absolutas acumuladas y frecuencias relativas acumuladas para cada
categora que asuma la variable en cuestin.

Nota 4: Dependiendo de las particularidades del problema a estudiar y
de la variable usada para una distribucin de frecuencias para datos
agrupados, los intervalos asociados a las clases j = 1 y j = k (o sea, el primer
y el ltimo intervalo) pueden no tener definidos el lmite inferior Li
1
y el lmite
superior Ls
k
, respectivamente. En este caso hablamos de una Distribucin
Abierta.

Ejemplo: En una Unidad de Barrio Adentro fueron atendidas 200
personas en un da de consulta, y se distribuyeron en 6 grupos por edades.

Edades
(aos)
Nmero de
asistentes
Menos de 29 16
30-39 25
40-49 51
50-59 80
60-69 20
Ms de 70 8

Potrebbero piacerti anche