Sei sulla pagina 1di 17

UNA APROXIMACIÓN A LA CESANTÍA EN CHILE

¿Cuáles propiedades son relevantes?

Sebastián Ignacio Maturana Silva


Juan Pablo Miranda Arismendi
ÍNDICE

I. Introducción
(i) Fuente de la Muestra

II. Desarrollo
1. Análisis descriptivo
a. Para cada variable.
b. De a pares.
c. Procesamiento del modelo.
d. Gráficos.
2. Inferencia estadística
a. Estimación paramétrica. Estimación de proporciones de interés.
b. Test de hipótesis.
III. Conclusiones
IV. Anexos
INTRODUCCIÓN

La cesantía es fundamentalmente un problema económico, del cual podemos distinguir


enfoques micro y macroeconómicos.
A nivel micro, de las decisiones individuales y de las empresas, es indudable que sus efectos
negativos en las finanzas personales, puede decantar definitiva en niveles de una peor calidad
de vida, e incluso de niveles de pobreza, con todas las implicancias sociales que esto acarrea. A
nivel macroeconómico, esto también es cierto, pero también hay que considerar que ciertos
niveles de cesantía siempre existirán (tasas natural de desempleo), puesto que responden a
los constreñimientos intrínsecos de la estructura económica y social de un país en un instante
determinado.
De este modo, partiendo de la base de la teoría del capital humano, es que recogemos las
variables. Así, la muestra ha sido clasificada en virtud del nivel de estudios, y hemos consultado
sobre: la edad (x2), la cantidad de veces que ha estado cesante (x3), la edad a la que lo estuvo
por primera vez (x4), el número de entrevistas a las cuales se ha presentado en búsqueda de
trabajo (x5), el ingreso mensual presente (x6), y el número de personas que residen en su
hogar (x7). A nuestro juicio, es posible que estas variables, presenten relaciones
importantes que pueden ayudar a focalizar las políticas públicas a modo de favorecer y
hacerles más efectivas en ciertos aspectos.
Cabe una digresión. La base original de datos que nos fue proporcionada incluía consultas
específicas sobre la aplicación del seguro de cesantía del Estado Chileno; pero esto nos
dificultaba el trabajo todavía más y para nuestro objetivo, resultaban etéreas, por tanto fueron
omitidas del análisis.
Ahora bien, en efecto nos centraremos en el análisis del individuo, abordando un número
determinado de casos que constituyen la muestra. Las características de ésta, en cuanto a su
precisión y aleatoriedad, entre otros elementos para proceder al análisis, se efectuarán a
través de una metodología que estará compuesta de un análisis descriptivo y luego, inferencial.
Por último, conviene hacer un alcance. El objetivo planteado sin duda es ambicioso, por las
dificultades de extra e interpolación que a nivel práctico se suscitan. En este sentido, este
análisis es estático y obvia muchas influencias. Por ello, es que dentro de todas las limitaciones,
queremos al menos determinar, cuáles son más relevantes qué otras, … ¿?
Reconocidas estas imposibilidades, somos tercos: preferimos un poco menos de
incertidumbre; un ensayo equivocado, siempre será fructífero.

(i) Fuente de la Muestra:

La muestra en que hemos basado el siguiente informe fue entregada por el profesor
Carlos Araujo, por lo cual es una muestra copiada. Desconocemos si es una muestra de la
Realidad Nacional.
DESARROLLO
I. ANÁLISIS DESCRIPTIVO
PARTICIÓN (X2) (X3) (X4) (X5) (X6) (X7)

Edad a la que N° entrevistas Nº de personas


# Veces Ingreso mensual
Nivel de Estudios Edad fue cesante de trabajo en que viven en el
Cesante (miles $)
por 1a. vez total hogar

Básica Completa 64 5 55 9 200 2


Media Completa 50 2 45 3 800 5
Media Completa 22 0 0 0 200 4
Media Completa 24 1 23 2 200 4
Media Completa 70 1 25 1 250 3
Media Completa 25 1 22 3 400 7
Media Completa 55 5 37 12 350 5
Técnica Completa 30 1 30 1 750 4
Técnica Incompleta 27 4 25,5 7 120 6
Técnica Incompleta 24 2 22 3 350 5
Técnica Incompleta 22 0 0 0 400 4
Técnica Incompleta 22 2 20 3 300 3
Universitaria Completa 40 2 28 3 800 3
Universitaria Completa 48 2 33 6 1.200 5
Universitaria completa 25 0 0 0 200 4
Universitaria Completa 30 2 26 5 700 3
Universitaria Completa 44 0 0 0 1.500 5
Universitaria Completa 25 2 24,5 3 700 2
Universitaria Completa 26 1 25 3 500 4
Universitaria Completa 25 3 23 5 400 5
Universitaria Completa 24 0 0 0 1.000 5
Universitaria Completa 24 0 0 0 370 4
Universitaria Completa 46 1 30 5 800 3
Universitaria Completa 58 0 0 0 900 4
Universitaria Completa 32 0 0 0 1.350 4
Universitaria Completa 27 0 0 0 500 1
Universitaria Completa 52 0 0 0 650 4
Universitaria Completa 27 1 26 28 750 4
Universitaria Completa 26 1 24 15 600 3
Universitaria Completa 57 2 45,5 40 800 4
Universitaria Completa 60 1 50 35 15.000 6
Universitaria Completa 25 1 25 40 400 3
Universitaria Completa 45 1 40 1 780 4
Universitaria Completa 24 1 24 8 1.000 4
Universitaria Completa 26 1 26 24 600 5
Universitaria Completa 28 2 25 5 500 4
Universitaria Completa 29 2 27 7 600 3
Universitaria Completa 30 2 27 10 800 4
Universitaria Incompleta 38 0 0 0 1.500 5
Universitaria Incompleta 27 0 0 0 300 5
Universitaria Incompleta 22 1 22 2 500 5
a. Para cada variable
N 246
N 41
L 6

(X2) (X3) (X4) (X5) (X6) (X7)


Unidades de medida [Años] [Veces] [Años] [N° Entrevistas] [Pesos] [Personas]
Media 34,8 1,3 20,9 7,0 976,1 4,1
Varianza (de la variable) 189,2 1,6 242,8 116,7 5.159.094,4 1,3
Desviación estándar 13,8 1,3 15,6 10,8 2.271,4 1,1
Coeficiente de Variación 40% 98% 75% 153% 233% 28%
Moda 24 1 0 0 800 4
Frecuencia de la moda 5 14 12 12 5 16
Mediana 27 1 25 3 600 4
Máximo 70 5 55 40 15.000 7
Mínimo 22 0 0 0 120 1
Recorrido 48 5 55 40 14.880 6
X+𝜹 48,5 2,6 36,4 17,9 3.247,5 5,2
X–d 21,0 0,0 5,3 -3,8 -1.295,3 2,9
Datos "extraños"

Cuartiles
25% 50% 75%
Variable 1° Cuartil 2° Cuartil 3° Cuartil Recorrido Intercuartílico
(X2) 25 27 45 20
(X3) 0 1 2 2
(X4) 0 24,5 27 27
(X5) 0 3 7 7
(X6) 370 600 800 430
(X7) 3 4 5 2

b. De cada pares
COEFICIENTES DE
CORRELACIÓN

X2 Resultado X3 Resultado2 X4 Resultado3 X5 Resultado4 X6 Resultado5


(X2, X3) 0,25 (X3, X4) 0,71 (X4, X5) 0,52 (X5, X6) 0,40 (X6, X7) 0,28
(X2, X4) 0,41 (X3, X5) 0,22 (X4, X6) 0,27 (X5, X7) 0,05
(X2, X5) 0,17 (X3, X6) -0,08 (X4, X7) 0,00
(X2, X6) 0,32 (X3, X7) -0,02
(X2, X7) -0,03
Total 0,28
c. Procesamiento del modelo

Varianzas por grupo

Pesos
relativos
(nh/n) (X2) (X3) (X4) (X5) (X6) (X7)

Básica Completa 2% - - - - - -
INTRAVARIANZA

Media Completa 15% 404,8 3,1 236,3 18,7 51.666,7 1,9


Técnica Incompleta 10% 5,6 2,7 131,7 8,3 14.891,7 1,7
Técnica Completa 2% - - - - - -
Universitaria Incompleta 7% 67,0 0,3 161,3 1,3 413.333,3 -
Universitaria Completa 63% 148,0 0,8 232,9 164,6 7.915.065,8 1,1

Procedimiento
Intra-varianza para 1: Suma
variable directa 158,5 1,2 206,9 108,0 5.058.567,8 1,1
Procedimiento
𝒅𝒘𝟐 2 147,9 1,3 194,8 108,1 5.039.808,7 1,2

Promedios por grupo

Pesos
relativos
(nh/n) (X2) (X3) (X4) (X5) (X6) (X7)
Básica Completa 2% 64,0 5,0 55,0 9,0 200,0 2,0
INTERVARIANZA

Media Completa 15% 41,0 1,7 25,3 3,5 366,7 4,7


Técnica Incompleta 10% 23,8 2,0 16,9 3,3 292,5 4,5
Técnica Completa 2% 30,0 1,0 30,0 1,0 750,0 4,0
Universitaria Incompleta 7% 29,0 0,3 7,3 0,7 766,7 5,0
Universitaria Completa 63% 34,7 1,1 20,3 9,3 1.284,6 3,8

Inter-varianza para
variable 41,3 0,3 48,0 8,7 119.285,6 0,1
𝒅𝒃𝟐

Procedimiento 1: Suma
Varianza Total por variable directa 199,9 1,6 254,9 116,7 5.177.853,4 1,2

𝒅𝟐 Procedimiento 2: 189,2 1,6 242,8 116,7 5.159.094,4 1,3

Coeficiente de partición
por variable 0,22 0,21 0,20 0,07 0,02 0,07
d. Gráficos

Gráficos de variables con mayor correlación (Las 4 más significativas)

"Edad vs. Edad cesante por primera vez"


60

50

40

30

20
y = 0,469x + 4,544

10

0
0 10 20 30 40 50 60 70 80

La CORR entre las variables X2 y X4 es positiva e igual a 0,41.

"X4 vs. X3:Edad cesante 1a. Vez vs. # Veces


cesante"
6

1 y = 0,058x + 0,082

0
0 10 20 30 40 50 60

La CORR entre las variables X3 y X4 es positiva e igual a 0,71


"X4 vs. X5: Búsqueda oportunidad trabajo vs. Cesante
1a. Vez"
45
40
35
30
25
20
15
10 y = 0,358x - 0,435

5
0
-5 0 10 20 30 40 50 60

La CORR entre las variables X4 y X5 es positiva e igual a 0,52

X6 vs. X5: Ingreso mensual (miles $) vs. Búsqueda


oportunidad trabajo
16.000

14.000

12.000

10.000

8.000

6.000

4.000

2.000
y = 84,85x + 377,9

0
0 5 10 15 20 25 30 35 40 45

La CORR entre las variables X6 y X5 es positiva e igual a 0,4


Otros gráficos representativos.-

Composición de las particiones (Frecuencias


relativas)
Básica Completa
3%
15%
Media Completa
10%
Técnica Incompleta

63% 7% Técnica Completa

2% Universitaria Incompleta

Universitaria Completa

Coeficientes de Variación asociados a cada variable


Series1

(X7) 28%

(X6) 233%

(X5) 153%

(X4) 75%

(X3) 98%

(X2) 40%
II. INFERENCIA ESTADÍSTICA
La inferencia estadística es un rama que nos permite controlar el error inherente
producto de la formulación de inferencias inductivas asociadas a una muestra
específica. Para ello, y la determinación en definitiva del valor de una hipótesis, se
procede como indica el siguiente esquema:

a. Estimación Paramétrica:
En esta sección se procede a estimar puntualmente los parámetros poblacionales
asociados a la muestra, suponiendo que esta distribuye normal, de modo que,
formalmente:

𝑋~𝑁 𝜇, 𝛿 2
Para lo cual se procede cumpliendo las propiedades para que sea adecuado
(insesgado, etc…), basándose en el método de máxima verosimilitud a través del
cual, el valor obtenido es reconocido como el que generalmente ocurre dada su
mayor probabilidad.
Así:
𝑛
1
𝜇= 𝑥𝑖 = 𝑋
𝑛
𝑖=1

𝑛 𝑛
1 1
𝛿2 = 𝑥𝑖 − 𝑋 2 = 𝑥𝑖 2 − 𝑛𝜇2
(𝑛 − 1) (𝑛 − 1)
𝑖=1 𝑖=1

Al desarrollar estos conceptos obtuvimos los siguientes resultados:


(X2) (X3) (X4) (X5) (X6) (X7)
[N°
Parámetros | Unidad de medida [Años] [Veces] [Años] Entrevistas] [Pesos] [Personas]

𝝁 34,8 1,3 20,9 7,0 976,1 4,1

𝜹𝟐 189,2 1,6 242,8 116,7 5.159.094,4 1,3

b. Estimación de proporciones de interés


La estimación de proporciones de interés, se ha hecho en virtud de la observación del
comportamiento de la muestra, específicamente a través de ciertos cuartiles que han
resultado relevantes.

Se ha escogido uno por cada variable, a modo de revisar la posibilidad de que la


muestra, apoye las afirmaciones más representativas de las propiedades de la
muestra para cada una. Por tanto, en línea con las cuestiones metodológicas, junto a
las constataciones se incluyen los parámetros formales, definidas como hipótesis de
nulidad (H0) y de investigación (H1), que posteriormente se someterán a prueba.

Cabe apreciar que éstas, corresponden a test de hipótesis unilaterales, esto es,
asociadas a un intervalo ya sea, menor o mayor que un determinado valor (con cola,
inferior o superior).

De esta manera:

- A lo más el 75% de los consultados, tienen edad menor que 45 años (X2)
H0: p=0,75
H1: p=<0,75 : p: 0,7
(cola inferior)
- A lo más 50% de de los consultados han estado menos de 1 vez cesante. (X3)
unilateral
H0: p=0,5
H1: p>=0,5 (superior)
- A lo más el 75% de los consultados, fueron cesantes por primera vez a menos de
los 27 años. (X4)
H0: p=0,75
H1: p=<0,75 (inferior)
Acepta.
- A lo más el 25% de los consultados, buscaron trabajo más de 7 veces. (X5)
H0: p=0,25
H1: p>=0,25 (superior)
Rechazo.
- A lo más el 75% de los consultados, presenta un ingreso menor que 800 mil
pesos. (X6)
H0: p=0,75
H1: p>=0,75 (superior)
- A lo más el 25% de los consultados, tiene en su hogar más de 5 miembros. (X7)
H0: p=0,25
H1: p>=0,25 (superior)

c. Test de hipótesis sobre proporciones de interés


Considerando que, “E L PROPÓSITO DE LAS P RUEBAS DE HIPÓTESIS ES DETERMINAR SI HAY SUFICIENTE
EVIDENCIA ESTADÍSTICA A FAVOR DE UN CIERTO SUPUESTO O HIPÓTESIS ACERCA DE UN PARÁMETRO ”,,
PROCEDEREMOS.

Primero que todo, definiremos como nivel de significación (error inferencial) alfa =
0,05. Esto es:

Esto significa que la región crítica (también conocida como región de rechazo), es tal
que: Za < ó > 1,96.

(El criterio de Aceptación/Rechazo de Ho, cabe observar que estará dado por: Z < ó >
Za)

Ahora bien, dado que los datos ya han sido recogidos, procederemos a calcular el test
estadístico, de modo que:

El valor de la proporción muestral estandarizado está dado por:

𝒑 − 𝒑𝒐
𝒁=
𝒑𝒐 (𝟏 − 𝒑𝒐 )
𝒏(𝒏 − 𝟏)

En efecto, Z, puntaje z, es el test estadístico, y su distribución bajo H0 es aproximadamente normal:


N(0,1) . Esto viene, de la aproximación de forma de Bernoulli a la Normal (test-p).
Ahora bien, dado que los datos ya han sido recogidos, procederemos a calcular el test
estadístico, de modo que:

De este modo, empleando procedimientos computacionales llegamos a que los resultados


son los siguientes:

Botón
de Criterio de Regiones
prueba P 𝜃 aprox. P-P0 𝒑𝟎(𝟏 − 𝒑𝟎) 𝒏(𝒏 − 𝟏) z(x) críticas Resultado
X2 0,7 0,75 0,21 VERDADERO 0,05 0,5 40,5 4,4 Z <= 1,96 Acepto H0
X3 0,6 0,5 0,24 VERDADERO -0,1 0,5 40,5 -8,3 Z >= 1,96 Rechazo H0
X4 0,7 0,75 0,21 VERDADERO 0,05 0,5 40,5 4,4 Z <= 1,96 Acepto H0
X5 0,3 0,25 0,21 VERDADERO -0,05 0,5 40,5 -4,4 Z >= 1,96 Rechazo H0
X6 0,8 0,75 0,16 VERDADERO -0,05 0,4 40,5 -5,1 Z >= 1,96 Rechazo H0
X7 0,3 0,25 0,21 VERDADERO -0,05 0,5 40,5 -4,4 Z >= 1,96 Rechazo H0
III. CONCLUSIONES
Dificultades en la investigación y redefinición de la misma.

Al desarrollar la investigación nos hemos encontrado con múltiples dificultades de nivel de


investigación, dentro de las cuales la más destacable fue el hecho de modificar la
orientación de nuestro objetivo. Este era ambicioso y comprendía de emplear mayores
herramientas analíticas.

Por ejemplo, para el empleo de niveles de asociación, debíamos emplear docimaciones no-
paramétricas, para determinar el grado de independencia que poseían o no las variables.
Asimismo, para determinar la frecuencia de ciertos valores (por ejemplo para discutir
sobre el nivel de personas que poseían estudios universitarios), donde debíamos emplear
la distribución de Poisson.

Puesto que este trabajo se centraba específicamente en la docimación de hipótesis de


proporciones de interés, es que procedimos a observar la muestra, fundamentalmente a
través de los cuartiles, para escoger algunas que pudiesen ser fructíferas para el análisis.
Así, fueron determinadas proporciones de interés para cada una de las variables, y se
sometieron a investigación la validez de dichas composiciones.

Coeficientes de partición

Lo primero que podemos inferir de la muestra es que, por lo general se observa que los
coeficientes de partición están bastante cerca de 0, por lo cual existe un alto grado de
heterogeneidad. Vale decir, técnicamente que las desviaciones estándar "within" (dentro
de los grupos) son grandes.

En efecto, las particiones, esto es, la clasificación por nivel de estudio, no establecen
comportamientos diferentes para las variables en investigación (no las condicionan
prácticamente, sólo y en algunos casos, muy levemente).

Por lo tanto, no dependen los valores de las variables (edad, ingreso, búsqueda de trabajo,
etc.), de una partición específica, no dependen de la clasificación a nivel de estudios que
fue considerada en primera instancia, como determinante de un cierto comportamiento.

De la muestra y su composición

Sin embargo, esto resulta a luz de la experiencia real contradictorio. Es más, significaría
sentar la duda sobre la premisa fundamental de la teoría del capital humano. En este
sentido, atribuimos dicho comportamiento errático, al desarrollo del experimento y
muestreo aleatorio que, es bastante posible que no haya cumplido con las condiciones de
independencia e idéntica distribución. De hecho, hemos supuesto que todas tenían
comportamiento normal. Ante esta falta de rigurosidad técnica, surge la posibilidad de
obtener estos comportamientos extraños.

Al respecto, conviene revisar los gráficos adjuntos, fundamentalmente los de composición


de las particiones, cuyos frecuencias relativas, son distintas y bastantes dispares, lo que
produce un sesgo. Esto se confirma al observar los altos coeficientes de partición, que al
ser ponderados por los intervalos de confianza, reflejan un alto grado de distorsión de las
medias.

Mencionados estos aspectos, procedemos a incluir, nuestras conclusiones sobre las


observaciones sometidas a prueba, y que fueron planteadas tras el diseño de la
investigación.
Alcances sobre el sometimiento a prueba de las hipótesis

Las siguientes, son observaciones extraídas de la composición de los diversos percentiles


para las variables de la muestra.

- A lo más el 75% de los consultados, tienen edad menor que 45 años (X2)
H0: p=0,75
H1: p=<0,75 : p: 0,7
(cola inferior)

Nuestra hipótesis de investigación sostenía que el porcentaje de consultados, era


menor que 75%. Esto resultó ser Falso. El procedimento nos indicó que la hipótesis
de nulidad persiste y esto, es posible de contrastarse con estadísticas del INE, de
las cuales hay un cierto grado de proximidad con la realidad.

- A lo más 50% de los consultados han estado menos de 1 vez cesante. (X3)
Unilateral.
H0: p=0,5
H1: p>=0,5 (superior)

Nuestra hipótesis de investigación sostenía que el porcentaje de consultados, era


mayor que 50%. Esto resultó ser verdadero. El procedimento nos indicó que la
hipótesis de investigación (H1) sí se cumple, por lo tanto, el porcentaje, es mayor
que un 50%. Esto sin duda, está bastante lejano con la realidad y nos confirma
nuestros alcances sobre la distorsión de la muestra.

- A lo más el 75% de los consultados, fueron cesantes por primera vez a menos de
los 27 años. (X4)
H0: p=0,75
H1: p=<0,75 (inferior)

Nuestra hipótesis de investigación sostenía que el porcentaje de consultados, era


menor que 75%. Esto resultó ser Falso. El procedimento nos indicó que la hipótesis
de nulidad persiste y esto, es posible de contrastarse con estadísticas del INE, de
las cuales hay un cierto grado de proximidad con la realidad y hace sentido,
considerando que los procesos de formación se han extendido (más personas
siguen estudios superiores. Sin embargo, es cuestionable el alto grado y se
requiere más información para afirmar con precisión.

- A lo más el 25% de los consultados, buscaron trabajo más de 7 veces. (X5)


H0: p=0,25
H1: p>=0,25 (superior)

Nuestra hipótesis de investigación sostenía que el porcentaje de consultados, era


mayor que 25% referente a la búsqueda de trabajo por más de 7 veces. Esto
resultó ser Verdadero. El procedimento nos indicó que la hipótesis de investigación
se cumple. Vale decir, que un porcentaje mayor todavía al 25%, buscaron trabajo
más de 7 veces.

- A lo más el 75% de los consultados, presenta un ingreso menor que 800 mil
pesos. (X6)
H0: p=0,75
H1: p>=0,75 (superior)
Nuestra hipótesis de investigación sostenía que el porcentaje de consultados que
tenía un ingreso menor que 800, era mayor que el 25%. Esto resultó ser
Verdadero. El procedimento nos indicó que la hipótesis de investigación se cumple.
Esto tiene bastante coherencia con la realidad.

- A lo más el 25% de los consultados, tiene en su hogar más de 5 miembros. (X7)


H0: p=0,25
H1: p>=0,25 (superior)

Nuestra hipótesis de investigación sostenía que el porcentaje de consultados, era


mayor que 25% que convive con más de 5 personas. Esto resultó ser Verdadero. El
procedimento nos indicó que la hipótesis de investigación se cumple. Vale decir, que
un porcentaje mayor todavía al 25%, vive con más de 5 miembros.
IV. ANEXO

I. SCRIPTS
Funciones en EXCEL

CONDICIÓN DE CRITERIO DE APROXIMACIÓN


=Y($C$11*C5>10;$C$11*(1-C5)>10)

FUNCIÓN DE CONDICIÓN DE RECHAZO/ACEPTACIÓN DE H0


=SI(I5<C12;"Rechazo H0";"Acepto H0")

Las demás, están asociadas a funciones intrínsecas de EXCEL, asociadas a


procedimientos estadísticos, y para ello, sugerimos leer la ayuda del programa.

Potrebbero piacerti anche