Sei sulla pagina 1di 4

Regresión Lineal Múltiple

Daniel Andres Delgado Ordoñez - 16229601


Christian Camilo Cadena Lemos - 16306532

I. INTRODUCCI ÓN A. Gráfica 1. Salario VS Sexo (Hombres y Mu-


jeres)
El siguiente Informe contiene la información Ingreso

mas relevante de los datos contenidos en la base


40

de datos proporcionada por el docente, con el fin

hombre
de mejorar el tratamiento y comprensión de los 20

mismos hemos realizado un análisis descriptivo 0

utilizando el paquete estadı́stico R-Studio, donde 40

a continuación traeremos los hallazgos que para

mujer
20

el grupo han sido mas importantes tanto para el 0

Análisis exploratorio de los datos como para el 0 10 20 30 40

Modelo de Regresión Lineal Múltiple. como observamos en la gráfica anterior muestra


Debemos mencionar que un punto relevante un comportamiento favorable de los salarios del
de estos datos pueden ser las desigualdades que sexo masculino ”Hombres” con respecto al salario
se presentan en los salarios de los hombres con del sexo femenino ”Mujeres”, en las mujeres solo
respecto a las mujeres, como lo menciona ”El hay un solo dato que alcanza un salario de 40, lo
Institute for Women’s Policy Research, con sede que por el contrario en los hombres hay muchos
en Washington en un estudio realizado entre 2001 datos que se aproximan a ese valor.
y 2015 en los Estados Unidos, donde concluyen
B. Gráfica 2. Salario VS Zona (Sur Y No-Sur
que los ingresos salariales de las mujeres son un
Salario según la zona
51% menores que el de los hombres”; lo que nos 60

pode a pensar que los que la brecha salarial es muy


amplia y esta en aumento. 40

no−sur
II. A N ÁLISIS E XPLORATORIO DE DATOS 20

La Base de datos con la que se va a trabajar se


llama Datos Salarios, este archivo proporciona 535 0

60

datos por variable, tiene 11 variables entre ellas


siete variables son categóricas ( empleo, sector,
asociado, sexo, estado civil, raza, zona) y las otras 40

cuatro son numéricas (estudios, experiencia, edad,


sur

id). 20

A continuación presentaremos gráficas rele-


vantes que nos brindan una mejor interpretación de
0

las variables categóricas y numéricas, y la relación 0 10 20 30 40

de estas con la variable Salarios:

1
Daniel Andres Delgado O, 1622960, Escuela de Estadistica En la anterior gráfica se puede observar según
2
Christian Camilo Cadena L, 1630653, Escuela de Estadistica el comportamiento de los datos que en la zona sur
se presenta una mayor tendencia a salarios mas En la gráfica 4 podemos observar que los valores
altos, por el contrario en la zona no-sur tenemos del salario tienen una tendencia a incrementar
un comportamiento a presentar salarios medio- en los rangos medios de años de experiencia,
bajo lo que nos indica que según el lugar de esto puede indicar que dicho comportamiento
donde fue tomada esta muestra podes afirmar que se puede presentar porque en esos rangos de
se presentan una desigualdad económica en dicha años de experiencia se encuentran personas
zona, ya que la zona sur tiene un salario mayor con estudios mas avanzados como maestrı́as o
por persona. doctorados que les permiten tener mejores salarios.

C. Gráfica 3. Salario VS Sexo y Empleo


E. Gráfica 5. Salario VS Edad

En esta gráfica se ratifica un poco mas lo que


nos muestra la gráfica 1, donde hemos dicho
que el sexo masculino tiene salarios mucho
mas altos al sexo Femenino, pero es con esta
gráfica podemos generalizar que los hombres En la gráfica 5 podemos observar que los val-
sin importar el sector al que pertenezcan (Clero, ores de los salarios tienden a ser un poco mas
Administrativo, Profesional, Servicios, Ventas u altos que en las edades menores y mayores esto
Otro-empleo) sus respectivos salarios son mucho puede deberse a que en esos rangos de edades
mayor a las mujeres. las personas (Hombre y Mujeres) ya cuenten con
algunos estudios de posgrados y pueden tener
alguna jerarquı́a en la empresa que laboran, lo cual
D. Gráfica 4. Salario VS Años de experiencia les hace devengar un poco mas.

F. Tabla 1. Empleo Vs Sexo

como se observa en la tabla 1 llaman varias


cosas la atención, una de ellas es que tanto
hombres como mujeres tiene la misma cantidad
de profesionales, en el sector administrativo si presentarse porque hay valores mas extremos.
hay una diferencia marcada entre los dos sexos al
igual que en otro tipo de empleo.

G. Tabla 2. Salario VS Sexo-Estado Civil-Estudios I. Tabla 4. Sindicato y Empleo

Podemos observar que que el salario medio


y los años de estudios medios son mayores en
los hombres casados con respecto a las mujeres
casadas, pero este comportamiento no indica que
sean mejores ya que si observamos la desviación Ahora observemos la tabla No. 4, en esta
estándar con respecto a dichas variables en los tabla lo que se muestra es la distribución del
hombres casados es mayor, lo que puede indicar salario dependiendo de si el individuo estaba
que los valores están un poco mas dispersos en asociado o no a algún grupo sindical. Casos
relación al salario medio y los años de estudios particulares se muestra en el tipo de empleo
medios. administrativo, donde los que ganan mas son
aquellos individuos que no están asociados a un
Por otra se presenta una situación totalmente sindicato. Por otra parte, las edades medias de
contraria en las mujeres solteras ya que su salario los individuos que están asociados son mayores
medio es prácticamente igual al de los hombres a comparación con la de los individuos no
pero los años de estudios son superiores al de los asociados, es un fenómeno donde se podrı́a
hombres, pero su desviación estándar en el salario intuir, que aquellas personas que tienen mas años
medio es mayor a la de los hombres, lo que nos laborando ven la necesidad de afiliarse a algún
puede indicar que los datos están mas dispersos grupo sindical para poder proteger sus derechos
en relación a dicha variable. como trabajador.

H. Tabla 3. Salario VS Zona (sur y No-sur)


III. R EGRESI ÓN L INEAL M ÚLTIPLE

Para esta parte de regresión lineal múltiple


hemos utilizado el paquete estadı́stico R-Studio
Observemos que la tabla anterior nos da una para el tratamiento y visualización de la respectiva
información un poco mas completa que la gráfica base de datos suministrada por el docente.
dos, ya que en dicha gráfica hemos dicho que A continuación se muestra el modelo completo
los salarios son mas altos en la zona sur, pero usando el Salario como variable de respuesta y las
analizando esta tabla nos damos cuenta que no variables empleo, zona, sector, asociado, estudios,
solo el salario medio es mas alto en la zona sur, experiencia, raza, estado civil, edad y sexo como
sino que también su desviación. predictoras, debemos aclara que la variable id no
se tuvo en cuenta ya que dicha variable solo es
Lo anterior nos hace pensar que dichos valores una codificación o registro de las personas en la
están mas dispersos que en la zona norte y que muestra.
dicho valor del salario medio en la zona sur puede
A. Modelo Completo como podemos observar este método nos arroja
un modelo totalmente nuevo con solo 6 variables
predictoras que son empleo, asociado, estudios,
experiencia, sexo y zona lo que nos puede indicar
que en el modelos completo habı́an variables
que no estaban o no explicaban mucho sobre la
variable de respuesta.

IV. C ONCLUSI ÓN


La realización de un análisis exploratorio de
datos previa, nos da un panorama mas amplio de
como se comportan los datos que vamos a trabajar,
que información sera mas relevante para explicar
el estudio y que métodos estadı́sticos se podrı́an
aplicar para un resultado óptimo y certero del
estudio. Luego, al hacer el modelo de regresión, se
La tabla del modelo completo nos arroja varios
pueden observar las diferentes correlaciones que
resultado importantes para saber si dicho modelo
hay entre las variables y que variables son mas
es significativo o no, entre estos esta R2 que
significativas que otras, esto es útil para realizar
nos indica que el modelos con sus 10 variables
predicciones del estudio y ası́ tomar las medidas
predictores solo es capaz de explicar el 32% de
pertinentes para contra-restar o mejorar dichos
la variabilidad observada en la variable Salarios,
fenómenos sociales.
el valor-p del modelo completo es significativo
por lo que podemos afirmar que al menos una de R EFERENCES
las variables predictoras esta relacionada con la Análisis exploratorio de datos en R. Felipe Jose Bravo Marquez.
variable Salarios. 13 de Noviembre del 2013.

Análisis exploratorio de datos con R. Palomino Morales


por ultimo podemos ver que hay variables que Edwin. 26 de febrero del 2018- Blog Rpubs
no aportan al modelo completo o son redundantes
para esto vamos a utilizar un método que nos Análisis exploratorio de datos con R. Camila Salazar-
Blog Rpubs.
permita ver cual es el mejor modelo ajustado y
descartar variables que no aporten nada. Libro en Pdf Análisis exploratorio de datos y visualización con
R. Francisco Charte Ojeda. Versión 20 de agosto del 2014.
B. Selección de predictores empleando stepwise
Modelo de regresión Lineal Múltiple. Rene Diaz Florez.
selection (hybrid/doble) Blog Rpubs.
Este método nos arroja como mejor modelo Análisis de regresión lineal múltiple en R. Diego Calvo.
de regresión lineal múltiple ajustado el siguiente: 21 de septiembre de 2016- blog personal.

Introducción a la Regresión Lineal Múltiple. Joaquı́n Amat


Rodrigo. Julio 2016. blog Rpubs.

Brecha salarial, peor de lo que creı́amos: Mujeres en EEUU


ganan la mitad que los hombres-29 de Noviembre de 2018,
nstitute for Women’s Policy Research, con sede en Washington.

INFORME SOBRE LA BRECHA SALARIAL,Articulo


Actualidad Internacional Sociolaboral no 166 Pdf.

Potrebbero piacerti anche