Sei sulla pagina 1di 81

Estadística Laboral - RRLL

Unidad 2

Distribuciones Univariadas:
Tablas y Gráficos
Estadística Laboral - RRLL

Conceptos a tener en cuenta

 VARIABLE: propiedad, atributo o característica de una


unidad de análisis, susceptible de adoptar diferentes
valores o categorías
 Los valores o categorías que adopta una variable
constituyen un SISTEMA DE CATEGORIAS.
MUTUAMENTE EXCLUYENTES y el sistema debe ser
EXHAUSTIVO para la población en estudio
 MATRIZ DE DATOS: contiene en sus filas a cada una
de las unidades, en sus columnas a las variables que
caracterizan a esas unidades
 DATO: valor que toma una variable en una unidad de
análisis
Matriz de Datos

Ingresos del Número de miembros que


hogar trabajan
Hogar 1 $2000 2
Hogar 2 $70000 4
Hogar 3 $ 4500 0
….
Uso de Tablas y Gráficos
 Los usamos para facilitar la lectura de la
matriz de datos, para eso, la reducimos.
 En la clase de hoy, trabajaremos con UNA sola
VARIABLE.
 Más adelante aprenderemos a trabajar con
dos variables al mismo tiempo.
 Existen métodos de análisis multivariados
(múltiples variables) pero no los veremos en el
curso
Distribuciones Univariadas

 Elegimos la VARIABLE a estudiar.


 Realizamos la distribución de
frecuencias, que en nuestro caso será
una DISTRIBUCION UNIVARIADA DE
FRECUENCIAS
 La presentamos en una TABLA
 Podemos establecer además un
recorrido o rango de la variable
Precisiones conceptuales

 DISTRIBUCION DE FRECUENCIAS: es
una forma de organizar y resumir un conjunto de
datos agrupados en categorías, en las cuales se
muestra el número de observaciones que contiene
cada categoría

 DISTRIBUCION UNIVARIADA DE
FRECUENCIAS: sirve para resumir la
información de una sola variable
Precisiones conceptuales
 TABLA es una presentación ordenada
de los distintos valores de una variable
en base a los datos originales. Una
forma de presentar la distribución
univariada de frecuencias
 RECORRIDO o RANGO de la variable
es la distancia entre el valor más alto y el
más bajo
Datos
 Cuando el tamaño de la población o
muestra y el recorrido de la variable son
pequeños, no hay que hacer nada
especial, simplemente anotarlas de
manera ordenada en filas o columnas.

 Cuando el tamaño de la población y/o


muestra es grande, usamos tablas
Tablas tipo II: Tablas de
distribución de frecuencias simples

 Cuando el tamaño de la
población y/o muestra es grande
y el recorrido de la variable es
pequeño, hay valores de la
variable que se repiten
Tablas tipo II: Tablas de
distribución de frecuencias simples
Número de integrantes del hogar

2 1 2 2 1 2 4 2 1 1

2 3 2 1 1 1 3 4 2 2

2 2 1 2 1 1 1 3 2 2

3 2 3 1 2 4 2 1 4 1

1 3 4 3 2 2 2 1 3 3

Guía de Clase Pág.4


Tablas tipo II: Tablas de
distribución de frecuencias simples
Distribución de frecuencias simples de
integrantes del hogar

Integrantes Número de
del hogar hogares
1 16
2 20
3 9
4 5
Total 50
Tablas tipo II: Tablas de
distribución de frecuencias simples
 FRECUENCIA SIMPLE ABSOLUTA
veces que se repite el mismo valor
(categoría) de la variable.

 Variables como SEXO o ESTADO CIVIL


que normalmente toman pocos valores lo
usual es resumirlas en tablas de
frecuencias simples
Tablas tipo II: Tablas de
distribución de frecuencias simples
Integrantes Número Retomando este
del hogar de ejemplo, identifique
Frecuencia/s Simple/s
hogares Absoluta/s
1 16 Frecuencias
Categorías Simples
o valores
2 20 Absolutas
de la para cada
variable 3 9 valor de la
4 5 variable

Total 50 Ayuda: veces que se


repite el mismo valor
(categoría) de la
variable
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases

Cuando el tamaño de la población y/o


muestra y el recorrido de la variable
son grandes,
será necesario agrupar en
intervalos los valores de la
variable.
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 Ejemplo en Guía de Clases. Pág. 5
Tomamos un grupo de 30 alumnos les preguntamos el dinero que en ese
momento llevan encima, nos encontramos con los siguientes datos:

450 115 250 300 17 0


5 18 200 675 50 37
78 159 230 500 120 100
18 125 31 42 56 110
25 268 60 15 20 985
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases

¿Cuál es el recorrido de la variable?

 la variable tiene un recorrido muy


grande
 recorrido: 985-0= 985
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 si queremos hacer una tabla con estos datos
tendremos que tomar clases que agrupen los
valores.
 A estas clases le debemos definir un
«recorrido». Para decidir el recorrido de las
clases, necesitaremos decidir ….
 ¿cuántas clases queremos?.
 se suele trabajar con no más de 10 o 12 clases
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Modalidades de construcción de Clases
 limites superior e inferior “reales” de la distribución de
datos 0 – 99; el segundo 100 a 199; el tercero 200 a
299, y así sucesivamente..
 toman los denominados límites “teóricos” 0 a 100; el
segundo de 100 a 200, el tercero, de 200 a 300 y, así
sucesivamente
 si bien la primer clase se define como (0 a 100) no
incluye el 100; esta cifra esta incluida en la segunda
clase
 Veremos ejemplos…
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases

 ¿cuántas clases queremos?.

 Tomaremos 10 clases.
 Veremos cómo construimos la tabla
definiendo qué límites superior e inferior
tomamos
Li= límite inferior
Ls: Límite Superior
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 Ejemplo de tabla construida en base a
límites reales:
 Dividimos el recorrido entre 10 (985/10)= 98,5.
Por mayor comodidad tomamos 99
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s =99)
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Clases Frecuencia simple
absoluta (fi)
fi=
0 - 99 15 frecuencias
absolutas
100 - 199 6
simples
200 - 299 4
Exhaustivo 300 - 399 1

y 400 - 499 1 Veces que se


mutuamente 500 - 599 1 repite el
excluyente mismo valor
600 - 699 1 (categoría)
700 - 799 0 de la variable
800 - 899 0
900 - 999 1
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Ejemplo de tabla construida en base a
límites teóricos:
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s
=100).
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
LIMITES TEÓRICOS

 Se toman sumando al límite superior y restando al


límite inferior “0,5” unidades.
( Li – 0,5) (Ls + 0,5). Esto significa que el primer
intervalo tiene un recorrido de -0,5 a 99,5; el segundo
de 99,5 a 199,5.
 Es decir, el límite inferior es 0.5 unidades menor que el
límite inferior, y el límite superior es 0.5 unidades
mayor que el límite superior indicado.

 Pero NO se toman decimales, sino cifras


redondeadas
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s
=100).
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
[ Li-1 , Li ) fi
Hasta 99 [ 0 – 100 ) 15
Incluye 100 [ 100 - 200) 6
[ 200 - 300) 4
¿Si un alumno [ 300 – 400) 1
tiene 100 pesos, [ 400 - 500) 1
en qué clase lo
voy a incluir? [ 500 - 600) 1
[ 600 - 700) 1
[ 700 - 800) 0
[ 800 - 900) 0
[ 900 - 1000) 1
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases

AMPLITUD DE CLASE
Diferencia entre dos límites sucesivos
inferiores teóricos de las clases
100-0= 100
200-100= 100
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Agrupar la información en intervalos permite «resumir»
la información contenida en una matriz de datos pero
también implica una «pérdida de información» . Tomar
pocas clases implica que la "pérdida de información" sea
mayor.
Para solucionar este problema es decir, que no dispongamos
de los valores originales para reconstruir la verdadera
distribución de los datos – se suele asumir el supuesto que
todos los valores de la clase «tienden» a coincidir con
el «valor medio» de la misma, también llamada
MARCA DE CLASE (Xc)
Es un valor medio que se calcula sumando
los límites inferior y superior TEORICOS y
dividiendo el resultado entre dos.
MARCA DE CLASE (Xc)

 Se calcula sumando los límites


inferior y superior TEORICOS y
dividiendo el resultado entre dos.
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
CLASES MARCA DE CLASE FRECUENCIA AMPLITUD
[ Li-1 , Li ) Xc ABSOLUTA Ai
fi

[ 0 – 100 ) 50 15 100
[ 100 - 200) 150 6 100
[ 200 - 300) 250 4 100
[ 300 – 400) 350 1 100
[ 400 - 500) 450 1 100
[ 500 - 600) 550 1 100
[ 600 - 700) 650 1 100
[ 700 - 800) 750 0 100
[ 800 - 900) 850 0 100
[ 900 - 1000) 950 1 100
30
Tipos de frecuencia

 Absolutas – Relativas -
relativas porcentuales
 simples / acumuladas
Tipos de frecuencia

 Se llama frecuencia absoluta (simple) (fi) de


un valor de la variable al número de veces
que se presenta dicho valor. La
representaremos por fi. En el ejemplo anterior
el valor «tener en el bolsillo entre 900 y 1000
pesos» obtuvo en la medición una frecuencia
absoluta de 1. La suma de todas las
frecuencias absolutas es igual al total de la
población.
Frecuencia absoluta (fi)
CLASES MARCA DE FRECUENCIA AMPLITUD
[ Li-1 , Li ) CLASE ABSOLUTA Ai
Xc fi

[ 0 – 100 ) 50 15 100
[ 100 - 200) 150 6 100
[ 200 - 300) 250 4 100
[ 300 – 400) 350 1 100
[ 400 - 500) 450 1 100
[ 500 - 600) 550 1 100
[ 600 - 700) 650 1 100
[ 700 - 800) 750 0 100
[ 800 - 900) 850 0 100
[ 900 - 1000) 950 1 100
30
Frecuencia relativa simple
(fr)
 Se llama frecuencia relativa (simple) (fr) de
un valor a la frecuencia absoluta dividida
por el número total de individuos que
conforman la población o muestra (N). Es por
tanto, una proporción. La representaremos por
fr . En el ejemplo anterior la frecuencia relativa
de esta clase o intervalo [ 900 - 1000) es 1/30
= 0,033. La suma de todas las frecuencias
relativas es igual a la unidad (1).
Frecuencia relativa simple
[ Li-1 , Li ) fi fr

[ 0 – 100 ) 15 0,50
[ 100 - 200) 6 0,20
[ 200 - 300) 4 0,13
[ 300 – 400) 1 0,03 Valor de la
frecuencia absoluta=
[ 400 - 500) 1 0,03 1

[ 500 - 600) 1 0,03 dividido el número


total de individuos
[ 600 - 700) 1 0,03 que conforman la
población o
[ 700 - 800) 0 0,00 muestra= 30
[ 800 - 900) 0 0,00 1/30= 0,033
[ 900 - 1000) 1 0,03
N 30 1,00
Frecuencia absoluta
acumulada
 Se llama frecuencia absoluta acumulada (Fi)
al número de veces que se presenta un valor y
todos los anteriores a él.
 En el caso del ejemplo anterior el intervalo [ 0 – 100 ) acumula
15 casos; el intervalo [ 100 - 200) acumula 21 casos (6 que
corresponden a este intervalo + 15 casos que se le agregan por
corresponder al intervalo anterior.
 Las frecuencias absolutas acumuladas
llegan a acumular N en el último valor o
clase considerada.
Frecuencia absoluta acumulada
[ Li-1 , Li ) fi fr Fi

[ 0 – 100 ) 15 0,5 15
15 + 6
0
[ 100 - 200) 6 0,2 21 = 21
0
21 + 4
[ 200 - 300) 4 0,1 25
3 = 25
[ 300 – 400) 1 0,0 26
3
[ 400 - 500) 1 0,0 27
3
[ 500 - 600) 1 0,0 28
3
[ 600 - 700) 1 0,0 29
3
Frecuencia relativa
acumulada (Fr)
 Se llama frecuencia relativa acumulada (Fr)
a la frecuencia absoluta acumulada
dividida por el número total de
observaciones. La representaremos por
FR Las frecuencias relativas acumuladas
llegan a acumular 1 en el último valor o clase
considerada
Frecuencia relativa
acumulada (Fr)
[ Li-1 , Li ) fi Fr Fi Fr
[ 0 – 100 ) 15 0,50 15 0,5 15/30= 0,5
[ 100 - 200) 6 0,20 21 0,70 21/30= 0,7
[ 200 - 300) 4 0,13 25 0,83 25/30= 0,83
[ 300 – 400) 1 0,03 26 0,87
[ 400 - 500) 1 0,03 27 0,90
[ 500 - 600) 1 0,03 28 0,93
[ 600 - 700) 1 0,03 29 0,97
[ 700 - 800) 0 0,00 29 0,97
[ 800 - 900) 0 0,00 29 0,97
30/30=1
[ 900 - 1000) 1 0,03 30 1,00
N
30 1,00
Frecuencia porcentual (%)

 Se llama frecuencia porcentual (%) al tanto


por ciento de las veces que se ha obtenido un
determinado resultado. Se obtiene
multiplicando por 100 la frecuencia
relativa y se representa por n%.
 Se puede calcular la frecuencia porcentual
tanto para frecuencias simples como para
frecuencias acumuladas. (% acumulado)
Frecuencia porcentual (%)
[ Li-1 , Li ) fi fr % Fi Fr
[ 0 – 100 ) 15 0,50 50 15 0,5 0,5 x 100= 50
[ 100 - 6 0,20 20 21 0,70
200) fr %
[ 200 - 4 0,13 13 25 0,83
300) 0,20 x 100= 20
[ 300 – 1 0,03 3 26 0,87
400) 0,13 x 100= 13
[ 400 - 1 0,03 3 27 0,90
500)
[ 500 - 1 0,03 3 28 0,93
600)
[ 600 - 1 0,03 3 29 0,97
700)
[ 700 - 0 0,00 0 29 0,97
800)
Frecuencia porcentual (%)
acumulados
Fr
[ Li-1 , Li ) fi fr % Fi Fr %
acumulado
0,5 x 100= 50
[ 0 – 100 ) 15 0,50 50 15 0,5 50
[ 100 - 200) 6 0,20 20 21 0,70 70 0,70 x 100= 70
[ 200 - 300) 4 0,13 13 25 0,83 83
[ 300 – 400) 1 0,03 3 26 0,87 87
[ 400 - 500) 1 0,03 3 27 0,90 90
[ 500 - 600) 1 0,03 3 28 0,93 93
[ 600 - 700) 1 0,03 3 29 0,97 97
[ 700 - 800) 0 0,00 0 29 0,97 97
[ 800 - 900) 0 0,00 0 29 0,97 97
[ 900 - 1000) 1 0,03 3 30 1,00 100
30 1,00 100
Una tabla de distribución de frecuencias es una forma de presentar los datos sobre una
característica de la población en estudio; por tanto debe contener la información necesaria
para que el lector pueda analizarla.

Esto implica que debe tener explícitamente:

Título, en el cual se describe qué variable se está presentando, qué tipo de tabla es
(frecuencia simple, acumulada, porcentual, etc.) y cuál es la población que se está
caracterizando (Por ejemplo: “Trabajadores ocupados de Montevideo, año 2007”;
“Personal administrativo de la empresa XXX, año 2006”)

Fuente de donde proviene la información: cuál es el origen de la matriz de datos


que se está resumiendo. (Por ejemplo: “Encuesta Continua de Hogares, INE”;
“Encuesta a la empresa XXX, realizada por el autor del informe”)

Las columnas deben estar encabezadas por el tipo de frecuencia que contienen.
Ejemplo I
Variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos
que contiene 200 datos
Xi fi
0 = bachillerato, 50
1 = licenciatura sin 160
título;
2 = licenciatura con 100
título
3 = postgrado 90
400
Ejemplo I

 Considere el ejemplo de la variable


Escolaridad con valores 0, 1, 2 ó 3 en
una base de datos que contiene 200
datos
 0 = bachillerato,
 1 = licenciatura sin título
 2 = licenciatura con título
 3 = postgrado
Ejemplo II
Xi fi Variable Estado Civil
con valores 0, 1, 2 ó
0 = viudo, 10 3 en una base de
datos que contiene
1 = casado 150 200 datos

2 =soltero 250 0 = viudo


1 = casado
3 = divorciado 90
2 = soltero
500 3 = divorciado
Ejemplo I y II

Trabajo en grupos:

 ¿Cuál es la información relevante?


 ¿por qué?
 ¿Corresponde acumular? ¿Por qué?
Ejemplo I - Solución
Xi fi fr f% Fi Fr F%

0 = bachillerato, 50 0,13 13 50 0,13 13

1 = licenciatura sin 160 0,4 40 210 0,53 53


título;
2 = licenciatura con 100 0,25 25 310 0,78 78
título
3 = postgrado 90 0,22 22 400 1,00 100

400 1 100
Ejemplo II - Solución
Xi fi fr f%

0 = viudo, 10 0,02 2

1 = casado 150 0,3 30

2 =soltero 250 0,5 50

3 = divorciado 90 0,18 18

500 1 100
Ejemplo III
Salario por Número Calcule las distribuciones
hora de obreros de frecuencias que
(variable) (frecuencias) corresponda.

de 4 a 8 pesos 3 ¿Podemos calcular la


de 8 a 12 pesos 12 marca de clase?:

de 12 a 16 pesos 40 -¿Qué información nos


aporta?
de 16 a 32 pesos 47
- ¿Por qué la podemos
de 32 a 36 pesos 32
calcular?
de 36 a 40 pesos 13
- Calcule la marca de
de 40 a 44 pesos 9 clase si corresponde
de 44 a 48 pesos 4
Total 160
Ejemplo III - Solución

Salario por hora

(variable) fi fr f% Fi Fr F% Xc
[0 a 20 pesos ) 10 0,05 5 10 0,05 5 10

[20 a 40 pesos ) 20 0, 10 10 30 0,15 15 30

[40 a 60 pesos ) 40 0,20 20 70 0,35 35 50

[60 a 80 pesos ) 50 0,25 25 120 0,60 60 70

[80 a 100 pesos ) 35 0,18 18 155 0,78 78 90

[100 a 120 pesos ) 30 0,15 15 185 0,93 93 110

[120 a 140 pesos ) 10 0,05 5 195 0,98 98 130

140 a 160 pesos ) 5 0,02 2 200 1 100 150

Total 200 1 100


Ejemplo I
En esta variable la información que es relevante es la que se refiere a:

1. Los valores distintos que se presentan en la matriz de datos originales


(columna 1)
2. El orden de estos valores
3. La frecuencia con que cada uno de esos valores se presenta en la
matriz de datos originales .
4. Los distintos valores acumulados a medida que crece el valor de la
variable. En esta variable tiene sentido la idea de «acumular» pues los
valores guardan un «orden» que da un criterio de acumulación.

 Así, el resumen eficiente para este tipo de variables es una tabla de


frecuencias simple que brinde información tanto a partir de las
frecuencias absolutas, relativas y porcentuales, simples como
acumuladas. Seleccionamos una tabla de frecuencias simple
porque la población es grande (200) y su recorrido
pequeño (no es necesario agrupar los valores en
clases)
Ejemplo II
 En esta variable la información que es relevante es la que se refiere
a:
 1. Los valores distintos que se presentan en la matriz de datos
originales (columna 1)
 2. La frecuencia con que cada uno de esos valores se presenta en la
matriz de datos originales .
No interesa:
 el orden en que se presentan los datos y, por tanto, tampoco los
distintos valores acumulados a medida que crece el valor de la
variable
 Así, el resumen eficiente para este tipo de variables es una tabla de
frecuencias que brinde información a partir de las frecuencias
absolutas, relativas y porcentuales simples. No calculamos
frecuencias acumuladas porque no tiene sentido juntar valores ya
que entre ellos no existe un criterio de orden o jerarquía
que permita agruparlos.
Ejercicios del Módulo II
EJERCICIO Nº 1
Propone representaciones tabulares (lo más completas posibles) y gráficas
(puede ser de más de un tipo) para los siguientes casos:

 Distribución de frecuencias de la variable Departamento de residencia de


una población compuesta por 10 personas, en Uruguay, 2007.

 Distribución de frecuencias de la Edad de las personas desempleadas en


la ciudad de Montevideo en 2007. Toma en cuenta que la situación de
empleo se le pregunta sólo a las personas de 14 años y más.

 Esa misma población se ha desagregado según el sexo. ¿Qué


representación gráfica propondrías para visualizar la estructura por edad
y sexo de los desempleados?

 Distribución del Número de accidentes laborales en el último año que


han tenido 50 empresas del ramo de la construcción en el país. Se
conoce para cada empresa el número de accidentes.
Ejercicios del Módulo II
EJERCICIO Nº 2
Reconstruye las Tablas de distribuciones de frecuencias
simples absolutas, relativas y porcentuales y, cuando sea
pertinente también las acumuladas correspondientes a partir
de la información proporcionada por las siguientes gráficas,
provenientes de un estudio a una población compuesta por
200 personas: Estado civil de la población en estudio (%)

5
10 25
Soltera/o
En pareja
Divorciada/o
Viuda/o

60

Fuente: Datos ficticios


Ejercicios del Módulo II
EJERCICIO Nº 2
Reconstruye las Tablas de distribuciones de frecuencias simples absolutas,
relativas y porcentuales y, cuando sea pertinente también las
acumuladas correspondientes a partir de la información proporcionada
por las siguientes gráficas, provenientes de un estudio a una población
compuesta por 200 personas:
Nivel educativo de la población en estudio
(Frecuencias simples absolutas)

120
100
100

80 70 Sin instrucción
Primaria
60
Secundaria
40 Terciaria
20
20 10

Fuente: Datos ficticios


Distribuciones Univariadas
 Resumen
Variables de Tipo II: Variables de Tipo III:
Estadísticas que constan de muchas Estadísticas que constan de muchas
observaciones, pero la variable toma observaciones y la variable toma
pocos valores distintos. muchos valores distintos.
Salario por hora Número de obreros
Personas Activas Número de Familias
(variable) (frecuencias)
(variable) (frecuencias) de 4 a 8 pesos 3
1 16 de 8 a 12 pesos 12
de 12 a 16 pesos 40
2 20
de 16 a 32 pesos 47
3 9
de 32 a 36 pesos 32
4 5 de 36 a 40 pesos 13
Total 50 de 40 a 44 pesos 9
de 44 a 48 pesos 4
Total 160
Distribuciones Univariadas
Usamos:
Tablas tipo II: Tablas de distribución de frecuencias
simples.
Cuando el tamaño de la población y/o muestra es grande y
el recorrido de la variable es pequeño, hay valores de la
variable que se repiten
Tablas tipo III: tablas de frecuencias con datos
agrupados en clases
Cuando el tamaño de la población y/o muestra y el
recorrido de la variable son grandes, será necesario
agrupar en intervalos los valores de la variable.
Distribuciones Univariadas
 RECORRIDO o RANGO de la variable es la
distancia entre el valor más alto y el más bajo

 Las clases tienen una LIMITE INFERIOR, un


LIMITE SUPERIOR, y una AMPLITUD

 AMPLITUD DE CLASE: Diferencia entre dos


límites sucesivos inferiores teóricos de las
clases
 MARCA DE CLASE (Xc). Es un valor medio
que se calcula sumando los límites inferior y
superior TEORICOS y dividiendo el resultado
entre dos.
Distribuciones Univariadas

Nomenclatura
Li- – Ls Intervalo de clase (con límite inferior de clase y límite
superior de clase. Se trata de límites teóricos y no
reales.

Ai Amplitud del intervalo: diferencia entre Li y Ls TEORICOS

Xc Marca de clase: Punto medio del intervalo de clase. Es el


punto más representativo de los valores incluidos en el
intervalo. Se obtiene promediando los dos límites
teóricos del intervalo (Li +Ls)/2
Repaso

Niveles de medición de las variables


 Nominales
 Ordinales (crit.jerarquización, ordenación)
 De Intervalo (orden,distancia)
 De razón (orden, distancia, proporción)
GRÁFICOS
Una forma de presentación…

 Los gráficos son considerados el


método de presentación de la
información más simple para el lector
porque puede captar el panorama
general o la tendencia de los datos
de una sola mirada
Ventajas

 Es mucho más fácil de comprender que


una tabla o un texto.

 La sencillez de líneas, una atractiva


manera de presentación, hacen de los
gráficos una de las herramientas más
poderosas para transmitir ideas en forma
rápida y simple al lector.
Desventaja

Su desventaja más notoria es la pérdida de


precisión y exactitud, si se lo compara con
una tabla.
Distribución de la variable tipo de ocupación

Tipo de Ocupación %
Asalariado privado 57
Asalariado público 16
Miembro de cooperativa de
producción 1
Patrón 5

Cuenta propia sin local o inversión 7

Cuenta propia con local o inversión 12

Miembro del hogar no remunerado 3 Asalariado privado

Total 100 Asalariado público


Miembro de cooperativa de producción
Patrón
Cuenta propia sin local o inversión
Cuenta propia con local o inversión
Miembro del hogar no remunerado
TIPOS DE GRÁFICOS
Gráficos para variables cualitativas

• Diagramas de barras:

Representamos en el eje de ordenadas las


categorías y en abscisas las frecuencias
absolutas o bien, las frecuencias relativas.

Para comparar usar frecuencias relativas!


Diagramas de barras (ej. Estado Civil)
Diagramas de barras (ej. Estado Civil)

Compara dos poblaciones


Diagramas de sectores (o de torta)

41%
46%
54%
59%

Hasta 35 años Más de 35 años Masculino Femenino

Se divide un círculo en tantas porciones como


categorías existan, de modo que a cada
categoría le corresponde un arco de círculo
proporcional a su frecuencia absoluta o relativa
Pictogramas
Expresan con dibujos
alusivos al tema de
estudio las frecuencias de
las categorías de la
variable. Estos gráficos se
hacen representando a
diferentes escalas un
mismo dibujo.

Las áreas son


proporcionales a las
frecuencias. Se usa en
medios de comunicación
por su facilidad
Gráficos para variables cuantitativas
Distinción entre Variables Discretas y
variables Continuas
•Una variable discreta es la variable tal que
entre 2 cualesquiera valores observables
(potencialmente), hay por lo menos un valor
no observable (potencialmente).
•Una variable continua tiene la propiedad de
que entre 2 cualesquiera valores
observables (potencialmente), hay otro valor
observable (potencialmente).
Distinción entre Variables Discretas y
variables Continuas
- Una variable discreta es sencillamente una variable para la que se dan de
modo inherente separaciones entre valores observables sucesivos. Dicho con
más rigor, se define una variable discreta como la variable tal que entre 2
cualesquiera valores observables (potencialmente), hay por lo menos un valor
no observable (potencialmente). Por ejemplo, un recuento del número de
familias que habitan en una vivienda es una variable discreta. Mientras que
cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5.
- Una variable continua tiene la propiedad de que entre 2 cualesquiera valores
observables (potencialmente), hay otro valor observable (potencialmente). Una
variable continua toma valores a lo largo de un continuo, esto es, en todo un
intervalo de valores. Longitudes y pesos son ejemplos de variables continuas.
La estatura de una persona, pude ser 1,70 mts. ó 1,75 mts., pero en potencia al
menos podría tomar cualquier valor intermedio como 1,73 mts. por ejemplo.
- Un atributo esencial de una variable continua es que, a diferencia de lo que
ocurre con una variable discreta, nunca se la puede medir exactamente. Con
una variable continua debe haber inevitablemente un error de meda.
- Un importante principio sobre variables continuas es que siempre se registran
en forma discreta, quedando la magnitud de la distancia entre valores
registrables adyacentes determinada por la precisión de la medición.
Variables discretas:

Cuando representamos una variable discreta,


usamos el diagrama de barras si
pretendemos hacer una gráfica diferencial. Las
barras deben ser estrechas para representar el
que los valores que toma la variable son
discretos. El diagrama acumulado (o integral)
tiene, por la naturaleza de la variable, forma de
escalera.
Variables
discretas:

xi fi fr Fi Fr
0 1 1/8 1 1/8
1 3 3/8 4 4/8
2 3 3/8 7 7/8
3 1 1/8 8 8/8
n=8 1
Variables continuas:

• Histograma: Se construye a partir de la


tabla estadística, representando sobre
cada intervalo un rectángulo que tiene a
este segmento como base. El criterio
para calcular la altura de cada
rectángulo es el de mantener la
proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo
y el área de los mismos.
Variables continuas:

•Polígono de
Frecuencias

Se construye
Polígono de Frecuencias e Histograma
……….
Li-1 - Li Xc fi Fi
.
Supuesto
0 -- 2 1 2 2
Xc –
2 -- 4 3 1 3 frecuenci
4 -- 6 5 4 7 a cero
6 -- 8 7 3 10
8 - 10 9 2 12
12

Polígono de Frecuencias
Acumulado
Se obtiene como la poligonal
definida en abscisas a partir
de los extremos de los
intervalos en los que se ha
organizado la tabla de la
variable, y en ordenadas por
alturas que son proporcionales
a las frecuencias acumuladas
Nota:

El histograma representa las frecuencias de los intervalos


mediante áreas y no mediante alturas. Sin embargo nos es
mucho más fácil hacer representaciones gráficas teniendo en
cuenta estas últimas. Si todos los intervalos tienen la misma
amplitud no es necesario diferenciar entre los conceptos de
área y altura,
Tipo especial de Histograma: Pirámide de población
Resumen

Tabla: Principales diagramas según el tipo de variable


Tipo de variable Diagrama

Variable Cualitativa Barras, sectores, pictogramas


Variable Cuantitativa

Variable Discreta Diferencial (barras)


Acumulativo (en escalera)
Variable Continua Diferencial (histograma, polígono de
frecuencias, pirámides de
población)
Acumulativo (Ojiva o polígono de
frecuencias acumuladas)

Potrebbero piacerti anche