Sei sulla pagina 1di 30

FACULTAD DE CIENCIAS

ECONÓMICAS Y EMPRESARIALES

GRADO EN ADMINISTRACIÓN Y
DIRECCIÓN DE EMPRESAS
TRABAJO DE FIN DE GRADO

TÍTULO: Análisis de regresión múltiple con información cualitativa:


Diferencias salariales por razón de sexo

AUTORA: Miriam Garcimartín Marcos


TUTORA: Margarita Sánchez García

CURSO ACADÉMICO: 2016 - 2017


CONVOCATORIA: Junio
Índice de contenidos
1. Introducción, objetivos y literatura previa ..................................................................... 5

2. Obtención de los datos................................................................................................... 7

2.1. Base de datos ........................................................................................................ 7

2.2. Variables utilizadas ............................................................................................... 7

3. Metodología ................................................................................................................. 10

4. Primera regresión: diferencias salariales por razón de sexo ....................................... 12

4.1. Interpretación de los coeficientes del modelo ................................................... 15

Segunda regresión: diferencias salariales por razones de sexo y región ..................... 17

5.1. Interpretación de los coeficientes del modelo ................................................... 18

6. Resultados empíricos ................................................................................................... 19

7. Conclusiones ................................................................................................................. 25

8. Referencias bibliográficas ............................................................................................. 27

9. Anexo: Medias y desviaciones de las variables incluidas en la ecuación salarial ........ 28

Palabras clave
Brecha salarial, igualdad de género, discriminación, regresión lineal y estimación por
MCO.

Página2
Índice de figuras
Figura 1 - Contraste de normalidad de los residuos.......................................................... 13
Figura 2 - Valores atípicos.................................................................................................. 14
Figura 3 - Influencia de los valores atípicos....................................................................... 14
Figura 4 - Gráfico salario medio por nivel de estudios ...................................................... 20
Figura 5 - Gráfico salario medio por años de experiencia ................................................. 20
Figura 6 - Gráfico salario medio por edad ......................................................................... 21
Figura 7 - Gráfico salario medio por nivel de estudios en la región sur ............................ 22
Figura 8 - Gráfico salario medio por nivel de estudios en la Comunidad de Madrid ........ 22
Figura 9 - Gráfico salario medio por años de experiencia en la región sur ....................... 23
Figura 10 - Gráfico salario medio por años de experiencia en la Comunidad de Madrid . 23
Figura 11 - Gráfico salario medio por edad en la región sur ............................................. 24
Figura 12 - Gráfico salario medio por edad en la Comunidad de Madrid ......................... 24

Índice de tablas
Tabla 1 - Estimación por mínimos cuadrados ordinarios: Modelo 1 ................................ 12
Tabla 2 - Estimación del Modelo 1 con corrección de heterocedasticidad ...................... 15
Tabla 3 - Estimación del Modelo 2 con corrección de heterocedasticidad ...................... 17
Tabla 4 - Medias y desviaciones de las variables del Modelo 1 ........................................ 28
Tabla 5 - Medias y desviaciones de las variables del Modelo 2 ........................................ 29

Página3
Resumen
El presente estudio trata de examinar la existencia de desigualdad salarial por razones de sexo
en el mercado de trabajo español a partir de los microdatos emparejados empresa-trabajador
de las olas 2010 y 2014 de la Encuesta de Estructura Salarial (EES).

Se trata de determinar de manera objetiva a través de un análisis empírico si las diferencias


entre los salarios que perciben los hombres y los que perciben las mujeres están justificadas por
factores de capital humano o en caso contrario existe discriminación salarial hacia las mujeres.

El análisis consiste en la estimación de los parámetros considerados en la ecuación salarial a


través de métodos econométricos de regresión por mínimos cuadrados ordinarios (MCO) que
permitan determinar la existencia y, en cuyo caso, el nivel de desigualdad salarial entre
individuos de distinto sexo manteniendo los mismos niveles de educación, experiencia laboral y
edad (ceteris paribus).

Un segundo nivel de análisis, como extensión al anterior, se basa en contrastar la presencia


discriminación salarial entre hombres y mujeres en las dos regiones con mayor y menor renta
per cápita del territorio español.

Abstract
This study attemps to examine the gender pay equity in the Spanish labour market based on
microdata matched company/employee in the years 2010 and 2014 of the Wage Structure
Survey (WSS).

An empirical analysis seeks to objectively determine whether the gender pay gap is justified by
human capital factors or whether there is wage discrimination against women.

Using econometric methods of regression by ordinary least squares (OLS) an estimation of some
of the parameters considered in the wage equation is made keeping constant the levels of
education, work experience and age (ceteris paribus). Consequently, it is possible to determine
the existence and level of wage inequality between persons of different gender.

There is also an extension of the previous analysis comparing wage equity according to the
Spanish territory to which they belong. For this purpose, the two regions with the highest and
lowest per capita income in Spain have been used.

Página4
1. Introducción, objetivos y literatura previa
La brecha salarial entre hombres y mujeres existe a pesar de que las mujeres
obtienen mejores resultados académicos que los hombres en la escuela y la universidad.
Por término medio, en 20121, el 83% de las mujeres jóvenes de la UE cursaban al menos
estudios de secundaria, frente al 77,6% de los hombres. Además, las mujeres
representan el 60% de los graduados universitarios de la UE.

Las diferencias salariales entre hombres y mujeres es una realidad del mercado de
trabajo español que nadie pone en duda. Muchos estudios han confirmado que el salario
medio de los hombres es superior, en media, al que perciben las mujeres, y se han
ocupado de medir el alcance de la diferencia entre ambos.

A lo largo de la historia de la literatura económica numerosos estudios han tratado


de demostrar empíricamente la existencia de discriminación salarial que, definida por
Sara de la Rica, “es la parte de la brecha salarial que no viene explicada por diferencias
en los puestos de trabajo o en las características productivas entre dos grupos de
trabajadores”. Entre los diferentes métodos aplicados destacan el método de regresión
con variables ficticias por mínimos cuadrados ordinarios (MCO) que minimiza la suma
de residuos al cuadrado (aplicado en este trabajo), el método de descomposición salarial
de Oaxaca-Blinder que consiste en descomponer la diferencia entre las medias de los
logaritmos de los salarios de hombres y mujeres, el método de regresión cuantílica, el
método propuesto por Fields (2003), el método de Yun (2006) o el método de Machado
y Mata.

Uno de los estudios tradicionalmente aplicado para justificar las diferencias


salariales entre hombres y mujeres es la Teoría del Capital Humano propuesta por
Schultz (1961). Se fundamenta en que los salarios están ligados a la productividad y ésta
está directamente relacionada con la especialización (experiencia) y formación (nivel de
estudios). Basándose en esta teoría, las diferencias salariales observadas entre
individuos vendrían explicadas por las diferencias de factores de capital humano. La
evidencia empírica, en cambio, indica claramente que, si bien los factores de capital

1
Datos extraídos de la publicación de la Comisión Europea del año 2014 citada en la bibliografía.

Página5
humano son relevantes para explicar las posibles diferencias entre salarios de hombres
y mujeres, no son suficientes y se podría afirmar que existe discriminación.

La hipótesis del trabajo es analizar si los factores de capital humano son o no


indicadores determinantes para justificar las diferencias salariales observadas entre
hombres y mujeres, así como cuantificar la diferencia salarial existente entre ambos
sexos a igualdad de circunstancias, es decir, mismo nivel de estudios terminados, igual
número de años de experiencia e igual edad y por tanto determinar si existe
discriminación salarial por razones de sexo.

Un segundo análisis pretende contrastar la discriminación salarial entre hombres


y mujeres (en adelante modelo 2) y las posibles diferencias entre las regiones españolas
con mayor y menor renta per cápita según datos de la Contabilidad Regional del INE
2016.

Página6
2. Obtención de los datos
2.1. Base de datos

La Encuesta Anual de Estructura Salarial (en adelante EES) es publicada por el INE
con periodicidad cuatrienal de forma armonizada junto con todos los Estados miembros
de la Unión Europea y tiene por objeto analizar la estructura y distribución de los
salarios. Recoge datos de los salarios de forma individual en forma de cualidades o
atributos específicos de cada trabajador y así como variables específicas de cada
empresa y sector.

El ámbito poblacional de la EES está formado por todos los trabajadores por
cuenta ajena incluidos en la Seguridad Social. Se excluyen los trabajadores del sector
público adscritos al Régimen de Clases Pasivas del Estado.

Los microdatos utilizados en este estudio provienen de las olas 2010 - 2014 de la
EES correspondientes a la última encuesta cuatrienal publicada.

La mayoría de los datos de la encuesta se refieren al mes de octubre del año de


referencia (2014). La elección de dicho mes se realiza sobre la base de que sea un mes
representativo del conjunto del año al considerarse “normal” en todos los países de la
UE, en el sentido de que está poco afectado por variaciones estacionales o por pagos de
vencimiento superior al mes, como las pagas de Navidad.

La totalidad de la muestra de la EES alcanza 209.436 individuos, de los cuales


172.517 están empleados a jornada completa y de ellos 172.467 han estado de alta en
la Seguridad Social durante todo el mes de octubre del año de referencia de la encuesta
(2014).

2.2. Variables utilizadas

Los datos necesarios para el análisis son el salario bruto por hora, el sexo, la edad
de los individuos, los años de antigüedad, el nivel de estudios completados y la región a
nivel NUTS12 de la muestra restringida a los empleados que trabajan a tiempo completo

2
Nomenclatura de las unidades territoriales estadísticas establecida por Eurostat.

Página7
y que han estado de alta en la Seguridad Social durante todo el mes de octubre del año
de referencia de la encuesta.

La determinación del uso del salario bruto por hora en todo el análisis en lugar
de hacerlo sobre salarios mensuales o anuales, reside en el hecho de realizar una
comparativa homogénea ajustando los salarios por el tiempo efectivamente trabajado.
Se pretende evitar que, sobre todo en el caso de las mujeres, los salarios se vean
desvirtuados por las reducciones de jornadas, pues cerca del 70% de los empleos con
jornada a tiempo parcial corresponden a mujeres.

A la hora de determinar el salario bruto por hora ha sido necesario realizar algunos
cálculos previos siendo de la siguiente manera:

Salario bruto mensual del mes de octubre


Salario bruto por hora =
Horas trabajadas mensuales

Donde:

 Ganancia salario bruto mensual del mes de octubre3

= Salario base
+ Complementos salariales
+ Parte proporcional de las pagas extraordinarias

 Horas trabajadas mensuales = se asume la jornada máxima que establece el


Estatuto de los Trabajadores (artículo 12.5 del Estatuto de los Trabajadores.
Cuarenta horas semanales de trabajo efectivo de promedio en cómputo anual,
siendo la jornada máxima promedio mensual de 166 horas).

Ambos modelos tienen como variable endógena el logaritmo neperiano del salario
bruto por hora “logWAGE”. Se toma el logaritmo como estrategia de transformación
matemática tendente a reducir la dispersión original de la serie, y con ello se evita la
aparición de heterocedasticidad.

3
Con el fin de simplificar el modelo no se están considerando los pagos por horas extraordinarias así como
las horas extra realizadas en el mes.

Página8
Las variables exógenas se pueden clasificar en dos categorías:

- Variables relacionadas con el capital humano del trabajador

El nivel de estudios recoge estudios de primaria, estudios de secundaria, estudios de


formación profesional de grado superior, diplomados universitarios y licenciados o superior.
Están representados por la variable “ESTU” que toma los valores: 1=Menos que
primaria, 2=Educación primaria, 3=Primera etapa de educación secundaria, 4=Segunda
etapa de educación secundaria, 5=Enseñanzas de formación profesional de grado
superior y similares, 6=Diplomados universitarios y similares y 7=Licenciados y similares,
y doctores universitarios.

La experiencia laboral, representada por la variable “ANOANTI”, recoge los años


de antigüedad del individuo. También se incluye en el modelo su representación al
cuadrado “ANOANTI^2”, que permite determinar el decrecimiento de la función, o dicho
de otro modo, permite explicar que a medida que aumenten los años de experiencia,
habrá un punto en el cual los ingresos comiencen a disminuir.

- Variables relacionadas con las características propias del trabajador

La variable “SEXO” permite identificar si el individuo es hombre o mujer.

La edad representa los años cumplidos del individuo. Esta variable “EDAD” está
agrupada en intervalos de años y toma los valores: 1=menos 19 años, 2=de 20 a 29, 3=de
30 a 39, 4=de 40 a 49, 5=de 50 a 59 y 6=más de 59 años. Del mismo modo que en los
años de experiencia laboral se incluye la variable “EDAD^2” para determinar el
decrecimiento de la función.

Otra variable relacionada con las características del trabajador es la variable


“REGION”, que se incorpora en la ecuación del modelo 2 [2]. Esta variable determina si
el individuo pertenece a la Comunidad de Madrid o a la región sur. Las regiones se
establecen en función de los códigos de nomenclatura de las unidades territoriales
estadísticas de nivel uno, siendo ES3 Comunidad de Madrid y la región sur ES6 que
comprende las comunidades de Andalucía, Región de Murcia, Ciudad Autónoma de
Ceuta y Ciudad Autónoma de Melilla.

Página9
3. Metodología
La técnica empleada se fundamenta en el Teorema de Gauss-Márkov a partir del
cual se determina la estimación por mínimos cuadrados ordinarios (MCO) de los
parámetros poblacionales en un modelo de regresión lineal.

El método aplicado en este trabajo consiste en estimar una ecuación de salarios


conjunta para hombres y mujeres [1], basada en la teoría del capital humano,
empleando una variable dicotómica o binaria “SEXO”, también llamada ficticia o
dummy, que recoja el sexo del individuo.

log WAGEi = β0 + β1 ESTUi + β2 SEXOi + β3 EDADi + β4 EDAD2 i + β5 ANOANTIi + β6 ANOANTI2 i + 𝑢i [1]

Si se define el individuo como mujer entonces la variable ficticia toma el valor 1


para las mujeres y 0 para los hombres. Se supone que el salario que percibe un
trabajador es un reflejo de su productividad y depende de características personales, de
capital humano, del puesto de trabajo que desempeña y de la empresa donde trabaja.

El coeficiente que acompaña a la variable sexo, β̂2 , es la diferencia entre el salario


por hora de una mujer y un hombre, ceteris paribus el resto de variables (y con el mismo
término de error).

Para realizar la estimación de la ecuación [1] se plantea como hipótesis nula la no


existencia de diferencias salariales y como hipótesis alternativa la existencia de
diferencias salariales:

H0: β2 = 0
H1: β2 ≠ 0

Por tanto si el coeficiente estimado de la variable dicotómica, β̂2 , es distinto de


cero, entonces se rechaza la hipótesis nula y se acepta la hipótesis alternativa por lo que
se podría afirmar que existen diferencias entre los salarios percibidos por los hombres y
los salarios percibidos por las mujeres, si además el valor estimado del coeficiente es
menor que cero, β2<0, se puede decir hay evidencias de que existe discriminación
salarial en contra de las mujeres. Por tanto, para el mismo nivel de los demás factores
observados, las mujeres ganan menos en promedio que los hombres.

Página10
El modelo 2, se considera una extensión al descrito anteriormente, pero se
restringe la muestra a la población de las comunidades seleccionadas e incorpora una
nueva variable ficticia que permita identificar los individuos de las dos regiones elegidas.
Así, la variable “REGION”, toma el valor 1 para los individuos que trabajan en la
Comunidad de Madrid y toma el valor 0 para los individuos que trabajan en cada una de
las comunidades que forman la región sur (especificadas en el apartado 2).

En esta segunda regresión se estima de nuevo una ecuación [2] de salarios


conjunta para hombres y mujeres y para los individuos de ambas regiones.

log WAGEM = α0 + α1 ESTUi + α2 SEXOi + α3 EDADi + α4 EDAD2 i + α5 ANOANTIi + α6 ANOANTI2 i + α7 REGIONi +εi [2]

Si el coeficiente estimado de la variable “REGION”, 𝛼̂7 , resulta significativo


podremos afirmar que la región es un factor influyente en la determinación de salarios
entre hombres y mujeres.

En el tratamiento previo de los datos se ha utilizado la herramienta Microsoft


Excel, a través de la cual se han importado los microdatos de la EES e incorporado al
programa econométrico Gretl para el análisis y estimación por MCO de las regresiones
planteadas.

Página11
4. Primera regresión: diferencias salariales por razón de sexo
Los resultados de las estimaciones de la ecuación [1] se muestran en la tabla 1.

Modelo 1: MCO, usando las observaciones 1-172467


Variable dependiente: logWAGE

Coeficiente Desv. Típica Estadístico t valor p


const 1.23581 0.0115626 106.8800 <0.0001 ***
ESTU 0.133927 0.000541174 247.4744 <0.0001 ***
SEXO −0.211508 0.0019368 −109.2049 <0.0001 ***
EDAD 0.244729 0.00624297 39.2007 <0.0001 ***
EDAD2 −0.0245322 0.00080459 −30.4904 <0.0001 ***
ANOANTI 0.0199354 0.000291651 68.3538 <0.0001 ***
ANOANTI2 −0.000187305 8.39558e-06 −22.3100 <0.0001 ***

Media de la vble. dep. 2.472742 D.T. de la vble. dep. 0.484302


Suma de cuad. residuos 25370.10 D.T. de la regresión 0.383545
R-cuadrado 0.372828 R-cuadrado corregido 0.372806
F(6, 172460) 17086.70 Valor p (de F) 0.000000
Log-verosimilitud −79441.95 Criterio de Akaike 158897.9
Criterio de Schwarz 158968.3 Crit. de Hannan-Quinn 158918.8
Tabla 1- Estimación por mínimos cuadrados ordinarios: Modelo 1

A la vista de los resultados de la Tabla 1 se observa que todas las variables


explicativas del modelo son significativas individualmente, a cualquier nivel de
significación, incluso al 1%. Por tanto, se puede afirmar que el nivel de estudios, el sexo,
la edad y los años de experiencia son factores que influyen en la composición salarial.

De manera conjunta, se observa que el p-valor correspondiente al estadístico F de


contraste de significación global es cero, por lo que se rechaza la hipótesis nula de que
los coeficientes del modelo sean iguales a cero excepto el término independiente, o
dicho de otro modo se puede afirmar que el nivel de estudios, el sexo, la edad y los años
de experiencia son factores que de forma conjunta intervienen en la determinación del
salario del individuo.

Con el resultado del coeficiente de determinación R2 se puede afirmar que las


variaciones en el salario son explicadas en un 37,28% por las variaciones en la edad, el
nivel de estudios, la antigüedad y el sexo del individuo.

A fin de comprobar si el modelo cumple los supuestos de normalidad de los


residuos, homocedasticidad y no colinealidad se realizan una serie de test.

Página12
Respecto al primer supuesto se aplica contraste de normalidad de residuos, tal y
como ilustra en la Figura 1 se observa que, bajo la hipótesis nula de que los residuos
siguen una distribución normal, se rechaza dicha hipótesis a cualquier nivel de
significación dado que el valor obtenido (J-B: 𝜒22 = 13.498,6) para el estadístico es
2
mayor que el valor crítico tabulado (𝜒2,0,05 = 5,99).

1.2
Estadístico para el contraste de normalidad: uhat1
N(5.4277e-014,0.38355)
Chi-cuadrado(2) = 13498.572 [0.0000]

0.8
Densidad

0.6

0.4

0.2

0
-3 -2 -1 0 1 2 3 4
uhat1

Figura 1- Contraste de normalidad de los residuos

En modelos de regresión lineal múltiple con tamaños de muestras elevadas, como


es el caso en el que nos encontramos, puede ser habitual que los residuos no sigan una
distribución normal. Esto es debido, en ocasiones, a la influencia de valores atípicos que
distorsionan los resultados (Figura 2). Dado que este escenario de normalidad de
residuos es uno de los supuestos básicos del modelo de regresión lineal clásico y por
tanto de obligado cumplimiento para considerar que el modelo está bien construido, se
procede a comprobar la existencia de outliers o valores atípicos que puedan interferir
en los resultados estimados (Figura 3).

Página13
Figura 2- Valores atípicos

Figura 3- Influencia de los valores atípicos

Una vez detectados los valores atípicos se reemplaza en ellos el valor del salario
por el valor promedio y se vuelve a construir el modelo que arroja unos resultados
similares a los anteriores coeficientes y sus desviaciones típicas mientras que las
desviaciones en los coeficientes de asimetría y curtosis han disminuido y por tanto se ha
corregido la situación de no normalidad de residuos.

El segundo test consiste en comprobar que el modelo es homocedástico. Se aplica


contraste de White bajo la hipótesis nula de que no presenta heterocedasticidad. Los
resultados devuelven un estadístico de contraste (LM) TR2 = 4.840,91 y p-valor = 0, por
lo que se rechaza la hipótesis nula y existen evidencias de heterocedasticidad a cualquier
nivel de significación. Para solventar este problema se realiza de nuevo la estimación del
modelo con corrección de heterocedasticidad (Tabla 2) que aplica coeficientes robustos.

Página14
Modelo 1: con corrección de heterocedasticidad, usando las observaciones 1-172467
Variable dependiente: logWAGE

Coeficiente Desv. Típica Estadístico t valor p


const 1.3232 0.0108732 121.6938 <0.0001 ***
ESTU 0.12669 0.000547557 231.3727 <0.0001 ***
SEXO −0.209478 0.00184044 −113.8195 <0.0001 ***
EDAD 0.225575 0.00592984 38.0406 <0.0001 ***
EDAD2 −0.0234698 0.000771782 −30.4098 <0.0001 ***
ANOANTI 0.0191404 0.000279969 68.3662 <0.0001 ***
ANOANTI2 −0.000159477 8.15064e-06 −19.5662 <0.0001 ***

Estadísticos basados en los datos ponderados:


Suma de cuad. residuos 685161.7 D.T. de la regresión 1.993207
R-cuadrado 0.357750 R-cuadrado corregido 0.357728
F(6, 172460) 16010.80 Valor p (de F) 0.000000
Log-verosimilitud −363674.8 Criterio de Akaike 727363.6
Criterio de Schwarz 727434.0 Crit. de Hannan-Quinn 727384.4

Estadísticos basados en los datos originales:


Media de la vble. dep. 2.472615 D.T. de la vble. dep. 0.483624
Suma de cuad. residuos 25311.84 D.T. de la regresión 0.383105
Tabla 2- Estimación del Modelo 1 con corrección de heterocedasticidad

El tercer test aplicado, consiste en examinar la inexistencia de colinealidad, es


decir, averiguar si las variables explicativas del modelo son linealmente independientes
entre sí. Para ello se utiliza el criterio de factores de inflación de varianza (VIF).
1
VIF(j) = (1−R2
(j) )

El resultado es que todos los valores VIF son inferiores a 10, y por tanto
linealmente independientes entre sí, salvo los regresores que aparecen elevados al
cuadrado, que lógicamente depende linealmente de sus predecesores.

4.1. Interpretación de los coeficientes del modelo

Una vez corregidos los inconvenientes detectados en el modelo podemos determinar que la
ecuación salarial para las mujeres [3], empleando dos decimales, es la siguiente:

log WAGEM = 1,32 + 0,13ESTUi − 0,21SEXOi + 0,23EDADi − 0,02EDAD2 i + 0,02ANOANTIi − 0,01ANOANTI2 i + ui [3]

̂2, tiene signo


Dado que el coeficiente estimado que acompaña a la variable SEXO, 𝛽
negativo se puede afirmar que la variable SEXO para las mujeres afecta negativamente
al salario, pero la pregunta es ¿cuál es la diferencia?

Página15
Al estar representada la variable dependiente de forma logarítmica, la
interpretación de los coeficientes del modelo la determina el resultado estimado x 100
y expresada en tanto por ciento, de tal modo que ante un aumento de una unidad en
cualquiera de las variables del modelo el salario varía en 𝛽̂𝑖 × 100%.

Según este planteamiento, al aumentar la variable SEXO en una unidad el salario


disminuiría en un 21%. Dado que la variable SEXO es una variable binaria y sólo toma el
valor cero o uno, en el hipotético caso de que un hombre pasase a ser mujer percibiría
un salario un 21% inferior al que percibiría si fuera hombre, por tanto el salario para las
mujeres es un 21% inferior al de los hombres.

El resto de los coeficientes4 tienen signo positivo por lo que una mujer percibiría
un mayor salario en los siguientes supuestos:

- Caso de aumentar un nivel de estudios terminados percibiría un 13% más de


salario.
- Caso de cumplir un año más de experiencia percibiría un 2% más de salario.
- Caso de aumentar la edad y pasar al siguiente intervalo (la variable edad está
agrupada en intervalos de diez años) percibiría un 23% más de salario.

4
Nótese que el valor estimado de los coeficientes que acompañan a las variables al cuadrado tienen signo
negativo debido al decrecimiento de la función.

Página16
Segunda regresión: diferencias salariales por razones de
sexo y región
Ahora la muestra se reduce al subconjunto de individuos que pertenecen a las
regiones especificadas en el apartado 2.

Se estima la ecuación [2] por MCO y se realizan los test necesarios para determinar
que el modelo cumple los supuestos de normalidad de los residuos, homocedasticidad
y no colinealidad. Al ser este modelo 2 una extensión del modelo 1 se dan las mismas
particularidades. El procedimiento aplicado para subsanar la no normalidad de los
residuos y la presencia de heterocedasticidad es el mismo.

La regresión estimada con corrección de heterocedasticidad (Tabla 3) determina


que las variables del modelo son significativas a prácticamente cualquier nivel de
significación.

Modelo 2: con corrección de heterocedasticidad, usando las observaciones 1-50632


Variable dependiente: logWAGE

Coeficiente Desv. Típica Estadístico t valor p


const 1.16263 0.0208077 55.8750 <0.0001 ***
ESTU 0.133937 0.00100951 132.6746 <0.0001 ***
SEXO −0.206541 0.00353398 −58.4443 <0.0001 ***
EDAD 0.266812 0.0114884 23.2244 <0.0001 ***
EDAD2 −0.0274571 0.00151398 −18.1357 <0.0001 ***
ANOANTI 0.0230841 0.000547448 42.1668 <0.0001 ***
ANOANTI2 −0.000267393 1.61949e-05 −16.5110 <0.0001 ***
NUTS1 0.0615868 0.00349153 17.6389 <0.0001 ***

Estadísticos basados en los datos ponderados:


Suma de cuad. residuos 198922.7 D.T. de la regresión 1.982275
R-cuadrado 0.383943 R-cuadrado corregido 0.383857
F(7, 50624) 4507.167 Valor p (de F) 0.000000
Log-verosimilitud −106484.4 Criterio de Akaike 212984.8
Criterio de Schwarz 213055.5 Crit. de Hannan-Quinn 213006.9

Estadísticos basados en los datos originales:


Media de la vble. dep. 2.512126 D.T. de la vble. dep. 0.518431
Suma de cuad. residuos 8260.755 D.T. de la regresión 0.403954
Tabla 3- Estimación del Modelo 2 con corrección de heterocedasticidad

El p-valor correspondiente al estadístico de contraste de significación global es


cero, con lo que se puede afirmar que el nivel de estudios, el sexo, la edad, los años de
experiencia y la región donde trabaja el individuo son factores que de forma conjunta
intervienen en la determinación del salario del individuo.

Página17
Las variaciones en el salario son explicadas en un 38,39% por las variaciones en las
variables del modelo (R2 = 0,383943). Este coeficiente de determinación es algo más
elevado en esta regresión que en la anterior, así si comparamos ambos modelos se
puede afirmar que está mejor construido el modelo 2. Otra justificación que determina
que el modelo 2 es más representativo la dan los criterios de Akaike y Schawarz 5 al
arrojar valores muy inferiores a los del modelo 1.

5.1. Interpretación de los coeficientes del modelo

La representación de la ecuación salarial, en virtud del modelo 2, para las mujeres


de la Comunidad de Madrid [4], empleando dos decimales, es la siguiente:

log WAGEM = 1,16 + 0,13ESTUi − 0,21SEXOi + 0,27EDADi − 0,03EDAD2 i + 0,02ANOANTIi + 0ANOANTI2 i [4]
+ 0,06REGIONi +εi

Y sus interpretaciones se enumeran a continuación:

- El salario percibido por las mujeres es un 21% inferior de media al de los


hombres que trabajan en la Comunidad de Madrid.
- Las mujeres que trabajan en la Comunidad de Madrid ganan de media un 6%
más que las mujeres que trabajan en alguna de las comunidades que
componen la región sur de este estudio.
- En caso de aumentar un nivel los estudios terminados una mujer que trabaja
en la Comunidad de Madrid percibiría un 13% más de salario.
- En caso de aumentar un año la experiencia laboral una mujer que trabaja en
la Comunidad de Madrid percibiría un 2% más de salario.
- En caso de aumentar la edad al siguiente tramo (intervalos de 10 años) una
mujer que trabaja en la Comunidad de Madrid percibiría un 27% más de
salario.

5
Los criterios de Akaike y Schawarz son utilizados para comparar modelos con la misma variable
endógena.

Página18
6. Resultados empíricos
Se ha seleccionado una muestra de dos individuos con las mismas características,
uno de ellos hombre y la otra mujer con el fin de establecer una comparativa que
determine a priori si existen diferencias salariales entre ambos. A la hora de seleccionar
las muestras se tratado de hacerlo de la forma más objetiva posible escogido los datos
con mayor representatividad de nivel de estudios, experiencia y edad. Una vez
determinados se selecciona el valor de la variable endógena que más se aproxime a su
media muestral en cada uno de los dos grupos (hombres y mujeres).

En función de estas premisas el perfil del individuo sería de entre 30 y 39 años de


edad, con una experiencia de entre 6 y 15 años y con un nivel de estudios terminados
de segunda etapa de educación secundaria.

Corolario:

- Si el sujeto es hombre percibe un salario de 12,71 euros brutos hora que


extrapolando6 al año completo serían 23.200 euros.
- Si el sujeto es mujer percibe un salario de 9,55 euros brutos hora que
anualizados serían 17.438 euros, casi una cuarta parte menos que el hombre.

Ahora se trata de descender a una comparativa por cada uno de los niveles de
análisis expresados gráficamente.

6Calculado en función de 1.826 horas de jornada máxima en cómputo anual establecidas en el Estatuto
de los Trabajadores.

Página19
Modelo 1

En el salario medio por nivel de estudios (Figura 4) no sólo se aprecian diferencias


si no que la brecha es mayor en el colectivo de individuos con la titulación más alta. La
tendencia logarítmica también indica un mayor distanciamiento entre el salario de
ambos sexos. Se constata que una mayor educación de las mujeres no es capaz de
reducir la brecha salarial.

Salario medio por nivel de estudios


25
salario bruto hora en euros

20
15 R² = 0,709

10 -22,3% -24,4%
-23,1% -23,7%
-21,4% -17,4%
5 -20,6%
0
Menos que Educación Primera etapa Segunda Enseñanzas Diplomados Licenciados y
primaria primaria de educación etapa de de formación universitarios similares, y
primaria educación profesional doctores
secundaria universitarios

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 4- Gráfico salario medio por nivel de estudios

En el caso de la experiencia laboral (Figura 5) la curva de salarios de ambos sexos


sigue una tendencia más o menos lineal y creciente a medida que aumentan los años de
experiencia, aunque si bien es cierto la brecha aumenta sobre todo en las mujeres que
se sitúan en los tramos de entre 26 y 35 años y de entre 36 y 45 años de experiencia.

Salario medio por experiencia


25
salario bruto hora en euros

20 R² = 0,8553

15 -14,3%
-17,5% -22,2%
-15,6%
10 -16,1%
-10,4%
5

0
Hasta 5 años Entre 6 y 15 Entre 16 y 25 Entre 26 y 35 Entre 36 y 45 Más de 45 años
años años años años
Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 5- Gráfico salario medio por años de experiencia

Página20
El salario medio por edad (Figura 6), aunque no es un factor de capital humano
está totalmente ligado a los años de experiencia que sí es un indicador de capital
humano. La brecha tiende a disminuir en los colectivos de menor edad, hasta 39 años,
pero aumenta y tiende a divergir de la curva salarial de los hombres en edades de 40
años en adelante.

Salario medio por edad


20
salario bruto hora en euros

15 R² = 0,9645

-13,8% -19,5% -25,3%


10 -10,5%
-7,1%
5 -15,3%

0
Menos de 19 De 20 a 29 años De 30 a 39 años De 40 a 49 años De 50 a 59 años Más de 59 años
años
Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 6- Gráfico salario medio por edad

Página21
Modelo 2

Al hacer una comparativa del salario medio por nivel de estudios entre la región
sur y la Comunidad de Madrid (Figuras 7 y 8) se observa que la brecha salarial entre
hombres y mujeres de las comunidades de la región sur es menor que la brecha salarial
en la Comunidades Madrid, es decir los salarios de los trabajadores de la región sur están
mejor distribuidos entre hombres y mujeres.

Salario medio por nivel de estudios en la región sur


25
salario bruto hora en euros

20
R² = 0,7372
15
10 -19,2% -24,0%
-23,1% -23,7%
5 -20,0% -16,6%
-19,2%
0
Menos que Educación Primera etapa Segunda Enseñanzas Diplomados Licenciados y
primaria primaria de educación etapa de de formación universitarios similares, y
primaria educación profesional doctores
secundaria universitarios

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 7- Gráfico salario medio por nivel de estudios en la región sur

Salario medio por nivel de estudios en la Comunidad de


Madrid
salario bruto hora en euros

30
25 R² = 0,762
20
15
10 -25,4% -28,2%
5 -22,2% -18,2%
-22,4% -17,3%
0 -24,4%
Menos que Educación Primera etapa Segunda Enseñanzas Diplomados Licenciados y
primaria primaria de educación etapa de de formación universitarios similares, y
primaria educación profesional doctores
secundaria universitarios

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 8- Gráfico salario medio por nivel de estudios en la Comunidad de Madrid

Página22
Nuevamente, la brecha salarial por sexos y por años de experiencia (Figuras 9 y
10) es inferior en las comunidades que componen la región sur. La curva salarial de las
mujeres de la Figura 10 presenta unos datos atípicos para mujeres con más de 45 años
de experiencia.

Salario medio por años de experiencia en la región sur


20
salario bruto hora en euros

15
R² = 0,8602
-16,7% -22,5%
-11,6%
10 -13,9%
-9,5%
5

0
Hasta 5 años Entre 6 y 15 Entre 16 y 25 Entre 26 y 35 Entre 36 y 45 Más de 45 años
años años años años

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 9- Gráfico salario medio por años de experiencia en la región sur

Salario medio por años de experiencia en la Comunidad de


Madrid
salario bruto hora en euros

25
20
R² = 0,004
15
-22,3% -20,8% -19,4% -28,5%
10 -16,7%
5 -60,0%

0
Hasta 5 años Entre 6 y 15 Entre 16 y 25 Entre 26 y 35 Entre 36 y 45 Más de 45 años
años años años años

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 10- Gráfico salario medio por años de experiencia en la Comunidad de Madrid

Página23
En cuanto al salario medio por edad (Figuras 11 y 12) es destacable que en ambas
regiones el salario de las mujeres tiende a divergir del salario de los hombres a medida
que avanzan de edad.

Salario medio por edad en la región sur


20
salario bruto hora en euros

15 R² = 0,9384

10 -17,3% -22,1%
-10,6%
-8,4%
5 -1,8% -9,4%

0
Menos de 19 De 20 a 29 años De 30 a 39 años De 40 a 49 años De 50 a 59 años Más de 59 años
años

Hombres Mujeres Logarítmica (Mujeres) FUENTE: elaboración propia

Figura 11- Gráfico salario medio por edad en la región sur

Salario medio por edad en la Comunidad de Madrid


25
salario bruto hora en euros

20
R² = 0,9163
15
-18,6% -27,9% -31,5%
10 -14,2%
-9,2%
5
-60,0%
0
Menos de 19 De 20 a 29 años De 30 a 39 años De 40 a 49 años De 50 a 59 años Más de 59 años
años

Hombres Mujeres Logarítmica (Mujeres)


FUENTE: elaboración propia

Figura 12- Gráfico salario medio por edad en la Comunidad de Madrid

Página24
7. Conclusiones
El objetivo principal de este trabajo es determinar si los factores de capital
humano son o no indicadores determinantes para justificar las diferencias salariales
observadas entre hombres y mujeres en el mercado de trabajo español. El método
utilizado ha sido la estimación de una regresión lineal múltiple con variables cualitativas
a través del modelo econométrico de mínimos cuadrados ordinarios. Recurriendo a los
datos de la Encuesta de Estructura salarial (2010-2014), se determina que el salario de
las mujeres es un 21% inferior al de los hombres a igualdad de factores propios de capital
humano (nivel de estudios y experiencia laboral) y de características propias del
trabajador (edad y ámbito geográfico del puesto de trabajo).

Los resultados indican el siguiente corolario:

La brecha salarial no es atribuible a características observadas propias de factores


de capital humano y por tanto no son el principal determinante para justificar tales
diferencias.

Una brecha salarial inexplicada por causas objetivas pone de manifiesto el hecho
de la existencia de discriminación salarial entre hombres y mujeres. Entran en juego
otros factores como papel el socio cultural y estereotipos tradicionales.

Aunque si bien es cierto, muchos autores justifican las diferencias salariales entre
hombres y mujeres por causas de segregación ocupacional, es decir el hecho de que
existan ocupaciones “feminizadas” o “masculinizadas” y de que tiendan a estar mejor
remuneradas las segundas. Sería interesante realizar un análisis de las diferencias
salariales entre hombres y mujeres desagregando por ocupaciones.

Otro propósito de este trabajo es evidenciar si la comunidad autónoma en la que


se ubica el puesto de trabajo del individuo es causa observable para determinar los
salarios y se ha podido constatar, al menos en las dos regiones analizadas, que existen
tales diferencias, siendo de media un 6% mayor el salario percibido por las mujeres
empleadas en la Comunidad de Madrid que el percibido por las mujeres empleadas en
cada una de las comunidades que componen la región sur. Estas diferencias geográficas
podrían estar justificadas por causas relacionadas con la actividad económica que

Página25
desarrolle la empresa y que tengan un mayor peso en un sector determinado,
distinguiendo así entre regiones más industrializadas, regiones que desarrollen
principalmente actividades encaminadas al sector servicios o en las que predomine el
sector agrario.

Para concluir, cabe destacar que, a pesar de la existencia de brecha salarial entre
hombres y mujeres, es reseñable que combatirla es uno de los objetivos prioritarios de
la Unión Europea, tal y como recoge la publicación de la Comisión Europea del año 2014
sobre «Cómo combatir la brecha salarial entre hombres y mujeres en la Unión Europea».

Página26
8. Referencias bibliográficas
JEFFREY M. WOOLDRIDGE (2010): «Introducción a la econometría: Un enfoque
moderno, 4ª. Ed.»

DE LA RICA Y UGIDOS (1995): «¿Son las diferencias en capital humano


determinantes de las diferencias salariales observadas entre hombres y mujeres?»,
Universidad del País Vasco

INSTITUTO DE LA MUJER (2007): «Diferencia y discriminación salarial por razón de


sexo», Ministerio de Trabajo y asuntos sociales

SIMÓN H. (2009): «La desigualdad salarial en España: Una perspectiva


internacional y temporal», Universidad de Alicante - IEB

MARIA LUISA MOLTO: «Estudio empírico de la discriminación de la mujer en el


mercado de trabajo académico», Universidad de Valencia

ALÁEZ Y ULLIBARRI (1999): «Discriminación salarial por sexo en la Comunidad


Autónoma Vasca: un análisis del sector privado y sus diferencias con España»,
Ekonomiaz, Revista Vasca de Economía

J.M. ARRANZ Y C. GARCÍA-SERRANO (2012): «Diferencias salariales, características


del puesto de trabajo y cualificación: un análisis para el período 2005-2010», Universidad
de Alcalá

L. ESCOT MANGAS, J.A. FERNÁNDEZ CORNEJO, A. HERRÁEZ GONZÁLEZ, M.


INFESTAS MADERUELO Y T. MARTÍNEZ DUBLA (2014): «Discriminación salarial de género
en el mercado laboral español: Un análisis comparativo por CC.AA.»

OFICINA DE PUBLICACIONES DE LA UNIÓN EUROPEA (2014): «Cómo combatir la


brecha salarial entre hombres y mujeres en la Unión Europea», Comisión Europea

Página27
9. Anexo: Medias y desviaciones de las variables incluidas en
la ecuación salarial
Modelo 1

VARIABLE HOMBRES MUJERES


Media Desv. Típica Media Desv. Típica
(*) 26.267,2 20.053,0 22.240,8 13.252,5
Salario Bruto anual
Salario Bruto por hora 14,4 11,0 12,2 7,3
Nivel de estudios terminados
Menos que primaria 9,9 4,2 7,9 3,1
Educación primaria 10,6 7,8 8,4 3,2
Primera etapa de educación primaria 11,1 5,3 9,2 4,1
Segunda etapa de educación secundaria 13,6 8,8 10,4 5,1
Enseñanzas de formación profesional 14,3 6,7 10,9 4,6
Diplomados universitarios 17,7 10,6 13,7 6,5
Licenciados y similares, y doctores universitarios 22,1 18,0 16,7 9,8
Edad (tramos)
Menos de 19 años 8,1 7,3 6,8 1,6
De 20 a 29 años 9,9 8,1 9,2 4,0
De 30 a 39 años 12,9 9,5 11,5 6,0
De 40 a 49 años 15,1 10,0 13,0 8,0
De 50 a 59 años 16,6 13,4 13,4 8,6
Más de 59 años 17,7 14,1 13,2 7,4
Años de experiencia laboral
Hasta 5 años 11,7 10,5 10,5 6,1
Entre 6 y 15 años 14,4 9,9 12,0 7,1
Entre 16 y 25 años 17,4 11,8 14,7 8,9
Entre 26 y 35 años 19,3 11,8 15,9 7,6
Entre 36 y 45 años 19,4 12,3 15,1 6,3
Más de 45 años 22,4 18,2 19,2 9,5

FUENTE: elaboración propia a partir de los datos Tabla 4- Medias y desviaciones de las variables del Modelo 1
de la EES

(*) Calculado a partir del salario bruto diario extrapolado al año en función de las horas anuales de trabajo
efectivo en cómputo mensual establecidas en el artículo 12.5 del Estatuto de los Trabajadores y fijadas en
1.826 horas.

Página28
Modelo 2 Región Sur Comunidad de Madrid
VARIABLE HOMBRES MUJERES HOMBRES MUJERES
Media Desv. Típica Media Desv. Típica Media Desv. Típica Media Desv. Típica
(*) 24.450,9 15.368,4 21.185,4 13.508,9 31.518,9 33.572,1 25.099,0 16.692,9
Salario Bruto anual
Salario Bruto por hora 13,4 8,4 11,6 7,4 17,3 18,4 13,7 9,1
Nivel de estudios terminados
Menos que primaria 9,8 3,4 7,9 2,0 9,5 4,9 7,2 3,7
Educación primaria 10,2 4,0 8,1 2,9 11,2 20,1 8,7 4,5
Primera etapa de educación primaria 10,8 4,7 9,0 3,5 11,5 6,0 9,5 4,1
Segunda etapa de educación secundaria 13,5 6,7 10,3 4,9 14,0 12,0 10,9 6,4
Enseñanzas de formación profesional 13,9 6,1 10,6 4,2 14,3 7,0 11,7 5,4
Diplomados universitarios 16,8 9,9 13,6 8,0 19,2 13,2 14,3 7,2
Licenciados y similares, y doctores universitarios 20,2 14,3 15,3 10,7 25,5 25,8 18,3 11,5
Edad (tramos)
Menos de 19 años 7,9 3,8 7,7 0,2 9,7 12,0 3,9 0,0
De 20 a 29 años 9,4 4,0 8,5 3,4 10,6 15,2 9,7 4,1
De 30 a 39 años 11,9 6,0 10,9 5,3 15,1 17,3 12,9 7,5
De 40 a 49 años 13,9 8,2 12,5 7,4 18,7 15,3 15,3 10,5
De 50 a 59 años 15,7 10,8 12,9 10,9 20,9 23,8 15,1 10,8
Más de 59 años 17,0 12,3 13,3 8,2 21,0 18,1 14,4 8,1
Años de experiencia laboral
Hasta 5 años 10,7 6,8 9,7 5,0 14,5 19,2 12,1 8,3
Entre 6 y 15 años 13,3 7,0 11,5 6,1 17,7 17,8 13,8 9,4
Entre 16 y 25 años 17,0 11,2 15,0 13,1 21,1 18,6 16,7 9,7
Entre 26 y 35 años 18,6 9,4 15,5 6,1 21,7 14,8 17,5 9,8
Entre 36 y 45 años 18,9 10,0 14,6 5,5 21,4 14,0 15,3 6,6
Más de 45 años 18,0 11,7 n.a. n.a. 23,4 10,7 9,4 0,0
FUENTE: elaboración propia a partir de los datos de la EES Tabla 5- Medias y desviaciones de las variables del Modelo 2

Página29
“Tengo un sueño, un solo sueño,
seguir soñando. Soñar con la libertad,
soñar con la justicia, soñar con la
igualdad y ojalá ya no tuviera necesidad
de soñarlas”
Martin Luther King, Jr., 1963

Página30

Potrebbero piacerti anche