Sei sulla pagina 1di 39

Estadística General

Organización y presentación
de los datos

Ing. Claudio Cerrón Landeo


• Cuando se tiene información acerca de cierta
característica de una determinada cantidad de
datos, se procederá a organizar y presentar
estos de modo que facilite el análisis.
• Un primer paso es determinar si la variable es
Cualitativa o si es Cuantitativa.
• Luego de esto se construye la tabla de
distribución de frecuencias, la cual tendrá
ciertas características según sea el tipo de
variable.
• También veremos algunas pautas para la
representación de estos datos mediante gráficos
Organización y Presentación de datos

Variables Cualitativas
Tabla de distribución de frecuencias

• En esta caso la Tabla de distribución de


frecuencias
tabla de
distribución de Variable fi hi
frecuencias C1 f1 h1
tendrá una C2 f2 h2
columna para las ... ... ...
posibles Ck f k hk
categorías de la
variable y otra
En este caso definimos las siguientes frecuencias:
Ci : Representa las categorías o niveles de la
variable en estudio.
fi : Es llamada frecuencia absoluta simple, y
representa el número de datos que tienen la
Caraterística Ci
Se obtienen mediante un conteo directo de
los datos.
Siempre se debe cumplir que
hi : frecuencia relativa simple. Representa el
porcentaje de datos que tienen la
carácterística Ci
Se calculan de la siguiente forma:
fi
hi 
n
Donde n es el tamaño de muestra, es decir es el
número de datos.
Si multiplicamos hi por 100, la tendremos
expresada en porcentaje.
Presentación Gráfica

Para representar gráficamente la distribución


de frecuencias de una variable cualitativa se
utilizan las barras y los sectores circulares.
• Nota
Si trabajamos con variables nominales las
categorías pueden ser colocadas en cualquier
orden. En el caso de las variables ordinales, las
categorías deberán ser colocadas en determinado
orden.
Ejemplo:

En una planta embotelladora se registraron 54


accidentes en el último trimestre. El gerente de
producción está interesado en determinar que parte del
cuerpo resultó lesionada o afectada.
Al tomar la información se determinó que las partes del
cuerpo lesionadas o más afectadas fueron: dedos (D),
ojos (O), brazo (B), y piernas (P); los datos registrados
se muestran en la tabla adjunta.
Se pide organizar los datos en una tabla de distribución
de frecuencias
Cuadro 1
Parte del cuerpo lesionada al producirse el
accidente

D D B P B B
D D D P D O
D P D O D P
O B B O B D
D B B D O B
P B P D D P
D P D D P B
D D D B O P
B P B O D D
En este caso, el cuadro de distribución de frecuencias
tendrá la siguiente forma:

Número de Frecuencia
Parte Lesionada Accidentes Relativa
(fi ) (hi )

BRAZOS 14 0.259
DEDOS 22 0.407
OJO 7 0.130
PIERNA 11 0.204
Total 54 1
También se puede presentar la tabla de distribución
de frecuencias con las frecuecuencias relativas hi en
términos porcentuales

Porcentaje
Número de de
Parte Lesionada Accidentes accidentes
(fi) (hi%)

BRAZOS 14 25.9%
DEDOS 22 40.7%
OJO 7 13.0%
PIERNA 11 20.4%
Total n = 54 100%
Representación gráfica:
Gráfico de Barras

Accidentes ocurridos en la planta


Según parte lesionada
25

20

15
Count

10

0
Brazo Dedos Ojos Pierna
Parte Lesionada
Representación gráfica:
Gráfico Circular

Accidentes ocurridos en la planta


Según parte lesionada
C ategory
Pierna
Brazo
11, 20.4%
Dedo
Ojo
Pierna

Ojo
7, 13.0%
Brazo
14, 25.9%

Dedo
22, 40.7%
Organización y Presentación de datos

Variables Cuantitativas
Discretas
Tabla de distribución de frecuencias

Tabla de distribución de
Si tenemos una variable frecuencias
cuantitativa discreta, cuyos
posibles valores son pocos, Variable fi hi Fi Hi
entonces la tabla de
distribución de frecuencias X1 f1 h1 F1 H1
tendrá la forma mostrada.
En la primera columna se X2 f2 h2 F2 H2
colocan todos los posibles
valores que puede tomar la
variable, y en las otras dos
..... ... ... ... ...
columnas se presentan la
frecuencias Xk fk hk Fk Hk
Para construir una tabla de distribución de frecuencia en
este caso, consideraremos las siguientes pautas:

• Primero se determina todos los posibles valores que puede


tomar la variable, a los que llamaremos X1, X2, ...... Xk
• En esta tabla tenemos lo siguiente:
Xi : Cada uno de los posibles valores que
puede tomar la variable.
fi : Frecuencia absoluta simple del valor Xi
hi : Frecuencia relativa simple del valor de Xi
fi
hi 
n

Fi : frecuencia absoluta acumulada, hasta el valor Xi


Ejemplo:

Los siguientes datos corresponden al número de


trabajadores ausentes, por día, en los últimos 20
días laborales. Elabore una tabla de distribución
de frecuencias para estos datos:

2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
El cuadro de distribución de frecuencias en
este caso será:

Número de Número Frecuencia


Ausencias de Días Relativa Fi Hi
Xi fi hi

0 1 0.05 1 0.05
1 4 0.20 5 0.25
2 7 0.35 12 0.60
3 6 0.30 18 0.90
4 2 0.10 20 1
Total 20 1
La tabla de distribución de frecuencia se puede presentar
considerando las frecuencias relativas en términos
porcentuales

Número de Número Porcentaje


Ausentes de Días de Días Fi Hi %
Xi fi hi %

0 1 5 1 5
1 4 20 5 25
2 7 35 12 60
3 6 30 18 90
4 2 10 20 100
Total 20 100%
Organización y Presentación de datos

Variables Cuantitativas
Continuas
Tabla de distribución de
Frecuencias

• En este caso la tabla de distribución de


frecuencias tendrá seis columnas, en cada una
de las cuales tendremos:
 Intervalos de Clase: [Linf , Lsup>
 Marcas de Clase: Xi
 Frecuencias Absolutas simples: fi
 Frecuencias Relativas simples: hi
 Frecuencia Absolutas acumuladas: Fi
 Frecuencias Relativas acumuladas: Hi
• La tabla de distribución de frecuencias tendrá la
siguiente estructura:

Intervalos Xi fi hi Fi Hi
de Clase
[ > X1 f1 h1 F1 H1
[ > X2 F2 h2 F2 H2
..... .... .... .... .... ....

[ > Xk fk hk Fk Hk
Algunas relaciones importantes entre los componentes
de esta tabla de distribución de frecuencias

 La marca de clase Xi es el punto medio del


intervalo de clase respectivo.
 k es el número de intervalos de clase y n es el
número de datos.
 Tendremos que: h i %  fi (100)
n

 Siempre se debe cumplir que:


k k


i 1
fi  n 
i 1
h i  1 00

 Ademas: Fk = n y Hk = 100

Procedimiento para construir una tabla de
distribución de frecuencias:

• Paso 1:
Determinar el rango o amplitud de las datos,
este valor se denota por la letra R, y se
calcula de la siguiente manera:
R = XMAX - XMIN
• Paso 2:
Determinar el número de intervalos de clase, al
que denotaremos por k, y se calcula utilizando
la regla de Sturges
k = 1 + 3.3 log(n)
En este caso se utiliza el redondeo matemático
usual
• Paso 3:
Hallar la amplitud de clase, la denotaremos por C, tambien
la suelen llamar TIC
C = R / k
El resultados se redondea al valor inmediato superior,
teniendo en cuenta el número de decimales que se está
utilizando.
• Paso 4:
i) En base a los resultados anteriores determinar los límites
de los intervalos de clase
ii) Proceder al conteo de los datos que dará como resultado
las frecuencias absolutas simples fi , a partir de estas se
calcular el resto de las frecuencias hi , Fi y Hi
Para graficar este procedimiento veamos el
siguiente ejercicio:

Ejemplo:
Se ha observado el nivel de ventas de un
determinado artículo (en cientos de unidades por
semana). Se tomó una muestra de 65 centros
comerciales de la ciudad de Lima, y los
resultados que se encontraron fueron los
siguientes:
9 9.5 10 10 10 10.5 10.6
10.9 11 11 11 11 11.3 11.7
11.8 12 12 12 12 12 12
12 12 12.1 12.2 12.3 12.5 12.6
12.6 13 13 13 13 13 13
13 13 13.2 13.2 13.4 13.5 13.5
13.5 13.6 13.6 13.7 14 14 14
14 14 14.2 14.2 14.2 14.3 14.3

14.3 14.5 14.5 14.6 15 15 15


15.3 15.3
Procedimiento:

• Paso 1:
Calculamos el rango o recorrido:
R = XMAX – XMIN = 15.3 - 9.0 = 6.3
• Paso 2:
Determinamos el número de intervalos de clase
k = 1 + 3.3 log (n) = 1 + 3.3 log (65) = 6.98 = 7
• Paso 3:
Calculamos la amplitud de clase:

R 6.3 por lo tanto


C   0.9 C  0.9
k 7
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 >
[ 9.9, 10.8 >
[ 10.8, 11.7 >
[ 11.7, 12.6 >
[ 12.6, 13.5 >
[ 13.5, 14.4 >
[ 14.4, 15.3>
Marca de Clase ( Xi )

• La marca de clase es el punto medio de cada


intervalo y se calcula sumando los límites de
cada intervalo y dividiendolos entres dos, por
ejempo:
9  9.9
X1   9.45
2
9.9  10.8
X2   10.35
2
10.8  11.7
X3   11.25
2
…………
Así sucesivamente, luego de esto tendremos:
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 > 9.45
[ 9.9, 10.8 > 10.35
[ 10.8, 11.7 > 11.25
[ 11.7, 12.6 > 12.15
[ 12.6, 13.5 > 13.05
[ 13.5, 14.4 > 13.95
[ 14.4, 15.3 > 14.85

 
Frecuencia absoluta simple ( fi )

 La frecuencia absoluta simple se halla mediante


un conteo de los datos, lo que se tiene que
determinar es cuantos datos, de los observado,
pertenecen a cada uno de los intervalos de clase.
 Así, por ejemplo tenemos que:
en el intervalo [9, 9.9> se encuentren 2 datos,
en el intervalo [9.9, 10.8> se encuentren 5
datos en en el intervalo [10.8, 11.7> se
encuentren 6 datos.
 De este modo se hallan resto de las frecuencias.
 Note que la suma de estas frecuencias debe de
ser igual al número de datos n
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 > 9.45 2
[ 9.9, 10.8 > 10.35 5
[ 10.8, 11.7 > 11.25 6
[ 11.7, 12.6 > 12.15 14
[ 12.6, 13.5 > 13.05 13
[ 13.5, 14.4 > 13.95 17
[ 14.4, 15.3 > 14.85 8

  65
Frecuencia relativa simple ( hi )

 La frecuencia relativa simple nos indica que porcentaje de


datos se encuentran en cada uno de los respectivos
intevaloes de clase; se calculan de la siguiente manera:
fi y expresado en porcentaje h  fi (100)
hi  i
n n
 En nuestro ejemplo tendremos:
2 o 2
h1   0.031 h1  (100)  3.1
65 65
5 5
h2   0.077 o h2  (100)  7.7
65
………………….. 65
 Note que la suma de estas frecuencias debe de ser igual
a 1 o al 100%, dependiendo de cómo fue expresado.
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 > 9.45 2 3.1
[ 9.9, 10.8 > 10.35 5 7.7
[ 10.8, 11.7 > 11.25 6 9.2
[ 11.7, 12.6 > 12.15 14 21.5
[ 12.6, 13.5 > 13.05 13 20.0
[ 13.5, 14.4 > 13.95 17 26.2
[ 14.4, 15.3 ] 14.85 8 12.3
7 7

   f i  65
i 1
h
i 1
i  1 00
• Frecuencia absoluta acumulada ( Fi )
Esta frecuencias se calculan sumando las frecuencias
absolutas simples, así:
F1= f1 = 2
F2= f1 + f2 = 2 + 5= 7
F3= f1 + f2 + f3 = 2 + 5 + 6 = 13
............
• Frecuencia relativa acumulada ( Hi )
Estas frecuencias se calcular sumando las frecuencia
relativas simples, así:
H1 = h1 = 3.1
H2 = h1 + h2 = 3.1 + 7.7 =10.8
H3 = h1 + h2 + h3 = 3.1 + 7.7 + 9.2 = 20
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 > 9.45 2 3.1 2

[ 9.9, 10.8 > 10.35 5 7.7 7

[ 10.8, 11.7 > 11.25 6 9.2 13

[ 11.7, 12.6 > 12.15 14 21.5 27

[ 12.6, 13.5 > 13.05 13 20.0 40

[ 13.5, 14.4 > 13.95 17 26.2 57

[ 14.4, 15.3 ] 14.85 8 12.3 65


7 7

   f i  65  h
i 1
i  1 00
i 1
Nivel de Ventas Xi fi hi Fi Hi
[ 9, 9.9 > 9.45 2 3.1 2 3.1
[ 9.9, 10.8 > 10.35 5 7.7 7 10.8
[ 10.8, 11.7 > 11.25 6 9.2 13 20.0
[ 11.7, 12.6 > 12.15 14 21.5 27 41.5
[ 12.6, 13.5 > 13.05 13 20.0 40 61.5
[ 13.5, 14.4 > 13.95 17 26.2 57 87.7
[ 14.4, 15.3 ] 14.85 8 12.3 65 100
7 7

   f i  65 h i  1 00
i 1 i 1
Algunas frecuencias y su interpretación:

 f3 = 6 :En seis centros comerciales se observaron


ventas entre 10.8 y 11.7 cientos de unidades.
 h4 = 21.5 : En el 21.5% de los centros comerciales
se observaron ventas entre 11.7 y 12.6
cientos de unidades.
 F3 = 13 : Es 13 centros comerciales se observaron
ventas menores a 11.7 cientos de unidades
 H4 = 41.5: El 41.5% de centros comerciales tienen
ventas que son menores a 12.6 cientos
de unidades.0

Potrebbero piacerti anche