Sei sulla pagina 1di 24

3.

ObjetivosdeAprendizaje

1. Ordenaryagruparlosdatosoinformacinestadsticaengruposdefcilmanejo
einterpretacin.
2. Presentarlainformacinestadsticaenformagrficaparasudescripcinvisual.
3. Analizareinterpretarlainformacinpresentadaencuadrosygrficos

4.Lectura

1.4.3 Organizacin de datos

Cuando se observan las variables bajo estudio, se genera un conjunto de resultados


denominados datos originales. Estos datos son difciles de manejar e interpretar y no
permiten detectar, en primera instancia, hechos importantes acerca del comportamiento
de la variable.

Un primer paso para manejar e interpretar los datos consiste en agrupar la informacin,
clasificando los datos segn los diferentes valores que pueda presentar la caracterstica,
valores que constituirn las diferentes categoras o clases de la clasificacin.

Existen mtodos para resumir los datos medidos u observados. Estos mtodos dependen
del tipo de variable que se est analizando y de la escala de medida.

Distribuciones de frecuencias

La distribucin de frecuencias es un mtodo para organizar y resumir datos. Bajo


este mtodo los datos que componen una serie, se clasifican y ordenan,
indicndose el nmero de veces en que se repite cada valor.
1.4.3.1 Distribucin de frecuencias para variable cualitativa.

Cuando se trata de variables cualitativas donde las categoras estn determinadas, lo


nico que hay que hacer es contabilizar el nmero de casos pertenecientes a cada
categora y normalizar en relacin al nmero total de casos, calculando una proporcin, un
porcentaje o una razn. Por ejemplo se pregunta a un grupo de personas sobre su estado
civil y se obtienen los siguientes resultados:

C, C, S, S, SE, S, S, SE, V, UL, S, UL, C, S, S, C, UL, V, UL, S, SE, C, S, S

En donde se ha utilizado la siguiente codificacin:

C Casado S Soltero

SE Separado V Viudo

UL Unin libre

En este caso la variable estado civil es cualitativa con escala de medida nominal.

La tabla se elabora con tres columnas:

La primera columna (1) con la clasificacin de la variable


La segunda columna (2) con el nmero de veces que ocurre cada clasificacin
(frecuencia)
La tercera columna (3) con el porcentaje para cada clasificacin.

TABLA 1 DISTRIBUCION DE PERSONAS POR ESTADO CIVIL


Nmerode
ESTADOCIVIL Personas Porcentajedepersonas

(1) (2) (3)

Casado 5 5/24*100=20,83%

Soltero 10 10/24*100=41,67%

Separado 3 3/24*100=12,5%

Viudo 2 2/24*100=8,33%

UninLibre 4 4/24*100=16,67%

Total 24 100%

Para calcular el porcentaje de personas casadas, se toma nmero de personas casadas


(5) y se divide sobre el total de personas (24) y el resultado se multiplica por 100. Note
que cuando se hace esta operacin el resultado es:

El valor se deja con solo 2 decimales y queda 20,83

Tenga en cuenta que si el porcentaje es:


Solteros:

El resultado se aproxima a 41,67 teniendo en cuenta que si el tercer decimal es igual o


superior a 5, se aumenta el segundo decimal en una centsima.

1.4.3.2. Representacin Grfica para una variable cualitativa

1.4.3.2.1 Grfico de Barras

El grfico se realiza en el primer cuadrante del eje de coordenadas. En el eje horizontal se


colocan las categoras de la variable y sobre el eje vertical se coloca la frecuencia para
cada categora. Con cada grupo se forma un rectngulo en donde la base es la categora y
la altura es el nmero de elementos de cada categora. Para la tabla anterior el grfico de
barras es:

1.4.3.2.2 Grfico circular

Un grfico circular se hace con porcentajes. La idea es asociar los 360 de la


circunferencia con el 100% y establecer los grados correspondientes, a travs de una
regla de tres simple, de la siguiente manera:

En el ejemplo del estado civil encontramos que el 20,83% de las personas son casadas
entonces decimos:

360 --------------------------- 100%

X____________20,83

Siguiendo el mismo proceso, se calculan los grados para cada uno de las modalidades de
la variable, la tabla queda de la siguiente forma:

Porcentajede
personas
ESTADOCIVIL Grados


Casado 20,83%

Soltero 41,67%


Separado 12,5%


Viudo 8,33%

UninLibre 16,67%

Con un transportador se pueden ubicar los grados en la circunferencia para obtener el


siguiente grfico.

ESTADO
CIVIL

Solter
o41
%
Separad
o 13
%

Viud
o8
%
Casad Unin
o21 17
Libre
% %

Si se hace una interpretacin de la tabla de frecuencias o de los grficos, se puede decir


que la mayora de las personas son solteras (41,67%), en seguida estn los casados
(20,83%) y en unin libre (16,67%).

1.4.3.3 Distribucin de frecuencias para variable cuantitativa discreta

Cuando se trata de variables cuantitativas, el resumen de los datos consiste en organizar


tablas que sintetizan los datos originales y se denominan tablas de distribuciones de
frecuencia.

NOMENCLATURA

Esta nomenclatura es de uso Universal. Para los subndices, se pueden utilizar las
letras i, j o en algunas ocasiones k.

X j = valor de la variable

ni = Frecuencia absoluta

hi = Frecuencia relativa

Ni = Frecuencia absoluta acumulada

Hi = Frecuencia relativa acumulada

Tabla nde= frecuencias: es una tabla


Nmero de observaciones que Tamao
o de datos. presenta
de en forma ordenada los
la muestra
distintos valores de una variable y sus correspondientes frecuencias.

Por ejemplo: Se considera la variable X: nmero de empleados por empresa,


medida en las empresas de una localidad.
8 12 12 8 10 12 13 8 11 13
10 9 14 9 10 9 12 9 10 13
8 10 11 11 10 14 12 13 9 14
14 12 12 10 11 9 11 14 12 11

Los datos anteriores reciben el nombre de datos sin agrupar o datos


originales.
De acuerdo a la notacin anterior, para estos datos n= 40, es decir se pregunt a
40 empresas sobre el nmero de empleados.
Esta informacin se va a organizar en una tabla con cinco columnas:
La primera (1) con los valores de la variable (Xi), nmero de empleados por
empresa, que varan de 8 a 14, ordenados en forma ascendente.
En la segunda columna (2) se ha colocado la frecuencia absoluta (ni),
correspondiente a la cantidad de veces que se repite cada valor de la variable.
La tercera columna (3) con la frecuencia relativa (hi), se obtiene dividiendo cada
frecuencia absoluta sobre el nmero total de datos.

La cuarta columna (4) es la frecuencia absoluta acumulada Ni en donde:


N1 = n1
N2 = n1 + n2
N3 = n1 + n2+ n3
N4= n1 + n2+ n3+n4
.
.
.
Y as sucesivamente hasta completar el ltimo valor.

La quinta columna (5) con las frecuencias relativas acumuladas Hj.

H1 = h1

H2 = h1 + h2

H3 = h1 + h2 +h3

Y as sucesivamente hasta completar el ltimo valor.

La tabla de Distribucin de frecuencias:


TABLA 2 NMERO DE EMPLEADOS POR EMPRESA

Nmerode Proporcinde Nmero Proporcin


empleadospor empresas acumuladode acumuladade
Nmerode
empresa empresas empresas
empresas (3)
(1) (4) (5)
(2)

Xj nj hj N j H j
8 4 0,10 4 0,10

9 6 0,15 10 0,25

10 7 0,175 17 0,425

11 6 0,15 23 0,575

12 8 0,20 31 0,775

13 4 0,10 35 0,875

14 5 0,125 40 1

Total n=40 1

1.4.3.3.2 Representacin grfica:

Aunque las tablas sean ya el resultado de una concentracin de datos, pueden ser,
sin embargo, demasiado amplias y complejas, de modo que pierdan una buena
parte de lo que debera ser su cualidad primordial, la claridad.
Entonces, se puede recurrir a la presentacin grfica, para la mejor comprensin y
anlisis de los datos. En las variables discretas se hace la representacin mediante
diagramas de frecuencias. Para ello, en el eje horizontal, se colocan los distintos
valores que presenta la variable. Si la representacin se refiere a las frecuencias
absolutas o relativas acumuladas, se denomina Diagrama de frecuencias
acumuladas. Se colocan los valores de la variable en el eje horizontal y la
frecuencia en el eje vertical.
El grfico, para los datos de la tabla del ejemplo anterior, queda as:

Frecuencia

4
01234567891011121314
3
Nmerodeempleadosporempresa.
2

1.4.3.4.
Distribucin de frecuencias para variable

cuantitativa contnua.

Para este tipo de variable se agrega la siguiente notacin:


R = Rango ni = Frecuencia absoluta

X mx = Mximo valor de la variable hi = Frecuencia relativa

Xmn = Mnimo valor de la variable

X j = Punto medio o marca de clase Ni = Frecuencia absoluta acumulada

C = Amplitud del intervalo Hi = Frecuencia relativa acumulada

m = Nmero de clases n = Nmero de observaciones o de

Li = Limite inferior datos. Tamao de muestra.


Se toma como ejemplo una muestra de 20 alumnos, determinando su peso en
kilos. Para facilitar
Ls = Limite superior el trabajo se redondean las cifras.

X1 =74 X5= 69 X9 = 47 X13=65 X17=76

X2=67 X6= 61 X 10 =82 X14=88 X18=57

X3=92 X7= 71 X 11 = 82 X15=52 X19=72

X4=70 X8= 79 X12 = 55 X16=58 X20=66

Los pasos para la construccin de la tabla son:


1. Determinar el valor mximo y el mnimo.

En el ejemplo tenemos:

Xmaximo= 92 Xmnimo= 47

La diferencia entre el valor mximo y el mnimo se denomina recorrido o rango (R)

R = 94 47

R = 45

El rango ser entonces de 45.


2. Determinar el nmero de intervalos o grupos m, en los que se van a clasificar los


datos:

El valor de m, o sea, el nmero de intervalos se puede obtener mediante la


siguiente frmula:

m = 1 + 3,3 log n

En donde n es el nmero de datos.

Se recomienda que el nmero de intervalos, hasta donde sea posible, no sea


menor de 5 ni mayor de 16.

Reemplazando en la frmula se tiene:

m = 1 + 3,3 log 20

m = 5,29

Como el nmero de grupos debe ser un valor entero, se deja en m = 5 porque es


el entero ms cercano.

1. Se calcula la amplitud del grupo, a la que llamaremos C, con la siguiente frmula:


La amplitud del intervalo es de 9.

Se puede comenzar a construir la tabla de frecuencias en forma similar a la tabla


discreta, pero se agrega una columna adicional para la variable presentada en intervalos.

La primera columna de la tabla se inicia con el valor mnimo de los datos (47) como Li
Para el lmite superior (Ls) del primer grupo se suma la amplitud C = 9.

Para el segundo grupo el lmite inferior es el mismo valor del lmite superior del grupo
anterior y para el lmite superior se suma la amplitud de 9. Este proceso se sigue en toda
la tabla.

Ls = Li + C

Primer grupo Li = 47 Ls = 47 + 9 = 56

Segundo grupo Li = 56 Ls = 56 + 9 = 65

Tercer grupo Li = 65 Ls = 65 + 9 = 74

Cuarto grupo Li = 74 Ls = 74 + 9 = 83

Quinto grupo Li = 83 Ls = 83 + 9 = 92

La segunda columna contiene el punto medio o marca de clase y se obtiene como:

El primer valor queda


Xi = 51,5

De la misma forma se continua trabajando cada punto medio hasta completar la


columna.

La tercera columna contiene la frecuencia absoluta, es decir el conteo de valores que


estn en un intervalo dado. Para mejor comprensin, los datos del mismo color
pertenecen a un grupo de la tabla.

X1 =74 X5= 69 X9 = 47 X13=65 X17=76

X2=67 X6= 61 X 10 =82 X14=88 X18=57

X3=92 X7= 71 X 11 = 82 X15=52 X19=72

X4=70 X8= 79 X12 = 55 X16=58 X20=66

Observe que el lmite superior de un grupo es el mismo lmite inferior del siguiente, por lo
tanto en el conteo de los datos, el valor observado se contar en un solo grupo. El criterio
utilizado en esta tabla es que se incluye como lmite superior.

Estas frecuencias encontradas son la base de una tabla de frecuencias.

La tabla de frecuencias quedar de la siguiente forma:


Tabla 3 Distribucin de frecuencias del peso de 20 alumnos

Peso(kilos) Peso Nmerode Proporcinde Nmero Proporcin


medio estudiantes estudiantes acumuladode acumuladade
estudiantes estudiantes

LiLs Xj nj hj N j H j

4756 51,5 3 3/20=0,15 3 0,15

5665 60,5 4 4/20=0,20 7 0,35

6574 69,5 7 7/20=0,35 14 0,70

7483 78,5 4 4/20=0,20 18 0,90

8392 87,5 2 2/20=0,10 20 1

n=20 1

1.4.3.4.1 Histogramas y polgonos de frecuencia

El diagrama de barras de una distribucin de frecuencias recibe el nombre de


Histograma. Es una grfica que nos permite presentar los datos de forma que se pueda
visualizar su comportamiento. El grfico lo situamos en el eje de coordenadas en un plano
cartesiano, en el eje Y se mide la frecuencia y en el eje X se miden los intervalos de clase.

Las bases de los rectngulos son iguales, dado que los intervalos de clase tienen la
misma amplitud. La altura de cada rectngulo depende de la frecuencia de cada clase.
Como se trata de una variable cuantitativa continua los rectngulos deben ir unidos. Al
observar la grfica se comparan las reas de los rectngulos.

Realizamos el histograma para el ejemplo sobre el peso de los alumnos, con la


distribucin de frecuencias de la tabla 3.

POLGONO DE FRECUENCIA

Otra manera de describir la distribucin de la informacin obtenida, es por medio del


polgono de frecuencias.

Estos grficos tienen la forma de una serie de lneas rectas conectadas entre s y que
unen puntos medios de intervalos a lo largo del eje horizontal.

Para el caso del peso de los alumnos, se puede construir el polgono de frecuencias sobre
el histograma. Para ello se ubican los puntos medios y se unen con una lnea recta que
parte desde el eje horizontal, uniendo los puntos medios de los dems intervalos.

Para este tipo de variable se puede elaborar un grfico similar al histograma, con las
frecuencias absolutas acumuladas (Ni). Sobre el eje vertical construimos una escala de
valores que llega hasta 20, frecuencia mxima, y sobre el eje horizontal marcamos los
valores de los intervalos. Levantamos rectngulos en donde la altura corresponde a la
frecuencia absoluta acumulada. Este grfico se llama:

Histograma de Frecuencias acumuladas

Ahora elaboramos el grafico similar al polgono de frecuencias, pero en esta ocasin no


ubicamos los puntos medios sino el lmite superior de cada intervalo. Estos puntos se
unen con una lnea que no es exactamente una lnea recta. El grfico queda de la
siguiente forma y es conocido como OJIVA

Aqu concluimos la organizacin de datos con dos tcnicas estadsticas, las tablas de
frecuencias y los grficos estadsticos. Recuerde que el tipo de tabla o el
grfico dependen del tipo de variable que se tenga.

A continuacin se presentan los siguientes ejemplos sobre el material visto.

Ejemplo1

Se desea averiguar si el nmero medio de hijos por familia, en una pequea ciudad, ha
descendido respecto de la dcada anterior. Para ello se han encuestado 50 familias
respecto al nmero de hijos y se han obtenido los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4

3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Resuelva:

a) Cul es la poblacin objeto de estudio? Cul es la muestra?


b) Qu variable estamos estudiando?

c) Qu tipo de variable es?

d) Construya la tabla de frecuencias

e) Cul es el nmero de familias que tiene como mximo 2 hijos?

f) Cuntas familias tienen ms de 1 hijo, pero como mximo 3?

g) Qu porcentaje de familias tiene ms de 3 hijos?

Solucin:

a) La poblacin objeto de estudio es el conjunto de familias de una ciudad


determinada. La muestra son las 50 familias seleccionadas.

b) La variable que estamos estudiando es el nmero de hijos por familia

c) El tipo de variable es discreta, ya que el nmero de hijos solo puede tomar


determinados valores enteros (es imposible tener medio o un cuarto de hijo).

d) Para construir la tabla de frecuencias tenemos que ver cuntas familias tienen un
determinado nmero de hijos. Podemos ver que el nmero de hijos, toma los
valores existentes entre 0 hijos, los que menos y 6 hijos, los que ms y
tendremos:

Nmerode Nmerode Nmero Proporcinde Proporcin


hijos familias Acumuladode familias acumulada
familias defamilias

Xi ni Ni hi Hi

0 2 2 0.04 0.04

1 4 6 0.08 0.12

2 21 27 0.42 0.54

3 15 42 0.30 0.84

4 6 48 0.12 0.96

5 1 49 0.02 0.98

6 1 50 0.024 1

n=50 1

e) El nmero de familias que tienen dos o menos hijos es: 2+4+21 = 27

f) El nmero de familias que tienen ms de un hijo pero tres como mximo es:

21 + 15 = 36

g) Por ltimo el porcentaje de familias que tiene ms de tres hijos, son aquellos que
tienen 4, 5 y 6 es decir 6+1+1= 8

El porcentaje ser el tanto por uno multiplicado por cien es decir, la frecuencia relativa
de dichos valores multiplicado por 100: (0.12+0.02+0.02)* 100 = 0,16 + 100 = 16 %

Ejemplo 2

Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de sus
habitaciones, el gerente investiga los precios por habitacin de 40 hoteles de la misma
categora de esa ciudad. Los datos obtenidos en miles de unidades monetarias fueron

3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5

5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8

3,1 4,3 4,1 5,8 4,4 5,8 6,1 4,3 5,3 4,5

4,0 5,4 3,9 4,7 3,2 4,5 4,7 4,2 4,5 4,8

Resuelva:

a) Cul es la poblacin objeto de estudio?

b) Qu variable estamos estudiando?

c) Qu tipo de variable es?

d) Qu problema plantea la construccin de la tabla de frecuencias?

e) Cunto hoteles tienen un precio entre 3,6 y 5,1?

f) Cunto hoteles tienen un precio superior a 4,6?

g) Qu porcentaje de hoteles cuestan como mucho 4,6?

SOLUCIN:

a) La poblacin objeto de estudio son los hoteles de una ciudad.

b) La variable que estamos estudiando es el precio.

c) El tipo de variable es continua.

d) El problema que plantea es que existen muchos valores diferentes por lo tanto
es bueno agrupar los datos en grupos o intervalos

La manera de hacerlo sera la siguiente: primero, calculamos el rango de los datos

R = X Mximo X mnimo= 6.1 3.1 = 3

Cuando no se dice nada, el nmero de intervalos se obtiene calculando la siguiente


frmula.

m = 1 + 3,3log(n)

m = 1 + 3,3log(30)

m=6

Por lo tanto se toman 6 intervalos.

Como el rango es 3 si se divide entre el nmero de intervalos, se tiene la


amplitud de cada uno de ellos, as: 3/6 = 0,5
PRECIO NMERO PROPORCIN
PRECIO NMERODE PROPORCINDE
ACUMULADODE ACUMULADADE
MEDIO HABITACIONES HABITACIONES
HABITACIONES HABITACIONES

LiLs xi ni Ni hi Hi

3,13,6 3,35 2 2 0.05 0.05

3,64,1 3,85 6 8 0.15 0.2

4,14,6 4,35 12 20 0.30 0.5

4,65,1 4,85 11 31 0.25 0.75

5,15,6 5,35 4 35 0.1 0.85

5,66,1 5,85 5 40 0.15 1

n=40

e) 29

f) 20

g) 0,05+0,15+0,30=0,5 0,5*100 = 50%

1. 5 BIBLIOGRAFIA
(1) Martnez B. C., Estadstica y Muestreo. 11 ed., ECOE, 2002.
(2) Lind D.A., Marchall W.G, Wathen S.A. Estadstica para Administracin y Economa,
Decimotercera edicin .Mc Graw Hill 2008.
(3) Lincoln L.CH.,Estadstica para las Ciencias Administativas, tercera edicin. Mc. Graw
Hill 1993.
(4) Webster A. L., Estadstica aplicada a los negocios y la economa. Tercera edicin. Mc.
Graw Hill,2000

Potrebbero piacerti anche