Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I. Introducción
(i) Fuente de la Muestra
II. Desarrollo
1. Análisis descriptivo
a. Para cada variable.
b. De a pares.
c. Procesamiento del modelo.
d. Gráficos.
2. Inferencia estadística
a. Estimación paramétrica. Estimación de proporciones de interés.
b. Test de hipótesis.
III. Conclusiones
IV. Anexos
INTRODUCCIÓN
La muestra en que hemos basado el siguiente informe fue entregada por el profesor
Carlos Araujo, por lo cual es una muestra copiada. Desconocemos si es una muestra de la
Realidad Nacional.
DESARROLLO
I. ANÁLISIS DESCRIPTIVO
PARTICIÓN (X2) (X3) (X4) (X5) (X6) (X7)
Cuartiles
25% 50% 75%
Variable 1° Cuartil 2° Cuartil 3° Cuartil Recorrido Intercuartílico
(X2) 25 27 45 20
(X3) 0 1 2 2
(X4) 0 24,5 27 27
(X5) 0 3 7 7
(X6) 370 600 800 430
(X7) 3 4 5 2
b. De cada pares
COEFICIENTES DE
CORRELACIÓN
Pesos
relativos
(nh/n) (X2) (X3) (X4) (X5) (X6) (X7)
Básica Completa 2% - - - - - -
INTRAVARIANZA
Procedimiento
Intra-varianza para 1: Suma
variable directa 158,5 1,2 206,9 108,0 5.058.567,8 1,1
Procedimiento
𝒅𝒘𝟐 2 147,9 1,3 194,8 108,1 5.039.808,7 1,2
Pesos
relativos
(nh/n) (X2) (X3) (X4) (X5) (X6) (X7)
Básica Completa 2% 64,0 5,0 55,0 9,0 200,0 2,0
INTERVARIANZA
Inter-varianza para
variable 41,3 0,3 48,0 8,7 119.285,6 0,1
𝒅𝒃𝟐
Procedimiento 1: Suma
Varianza Total por variable directa 199,9 1,6 254,9 116,7 5.177.853,4 1,2
Coeficiente de partición
por variable 0,22 0,21 0,20 0,07 0,02 0,07
d. Gráficos
50
40
30
20
y = 0,469x + 4,544
10
0
0 10 20 30 40 50 60 70 80
1 y = 0,058x + 0,082
0
0 10 20 30 40 50 60
5
0
-5 0 10 20 30 40 50 60
14.000
12.000
10.000
8.000
6.000
4.000
2.000
y = 84,85x + 377,9
0
0 5 10 15 20 25 30 35 40 45
2% Universitaria Incompleta
Universitaria Completa
(X7) 28%
(X6) 233%
(X5) 153%
(X4) 75%
(X3) 98%
(X2) 40%
II. INFERENCIA ESTADÍSTICA
La inferencia estadística es un rama que nos permite controlar el error inherente
producto de la formulación de inferencias inductivas asociadas a una muestra
específica. Para ello, y la determinación en definitiva del valor de una hipótesis, se
procede como indica el siguiente esquema:
a. Estimación Paramétrica:
En esta sección se procede a estimar puntualmente los parámetros poblacionales
asociados a la muestra, suponiendo que esta distribuye normal, de modo que,
formalmente:
𝑋~𝑁 𝜇, 𝛿 2
Para lo cual se procede cumpliendo las propiedades para que sea adecuado
(insesgado, etc…), basándose en el método de máxima verosimilitud a través del
cual, el valor obtenido es reconocido como el que generalmente ocurre dada su
mayor probabilidad.
Así:
𝑛
1
𝜇= 𝑥𝑖 = 𝑋
𝑛
𝑖=1
𝑛 𝑛
1 1
𝛿2 = 𝑥𝑖 − 𝑋 2 = 𝑥𝑖 2 − 𝑛𝜇2
(𝑛 − 1) (𝑛 − 1)
𝑖=1 𝑖=1
Cabe apreciar que éstas, corresponden a test de hipótesis unilaterales, esto es,
asociadas a un intervalo ya sea, menor o mayor que un determinado valor (con cola,
inferior o superior).
De esta manera:
- A lo más el 75% de los consultados, tienen edad menor que 45 años (X2)
H0: p=0,75
H1: p=<0,75 : p: 0,7
(cola inferior)
- A lo más 50% de de los consultados han estado menos de 1 vez cesante. (X3)
unilateral
H0: p=0,5
H1: p>=0,5 (superior)
- A lo más el 75% de los consultados, fueron cesantes por primera vez a menos de
los 27 años. (X4)
H0: p=0,75
H1: p=<0,75 (inferior)
Acepta.
- A lo más el 25% de los consultados, buscaron trabajo más de 7 veces. (X5)
H0: p=0,25
H1: p>=0,25 (superior)
Rechazo.
- A lo más el 75% de los consultados, presenta un ingreso menor que 800 mil
pesos. (X6)
H0: p=0,75
H1: p>=0,75 (superior)
- A lo más el 25% de los consultados, tiene en su hogar más de 5 miembros. (X7)
H0: p=0,25
H1: p>=0,25 (superior)
Primero que todo, definiremos como nivel de significación (error inferencial) alfa =
0,05. Esto es:
Esto significa que la región crítica (también conocida como región de rechazo), es tal
que: Za < ó > 1,96.
(El criterio de Aceptación/Rechazo de Ho, cabe observar que estará dado por: Z < ó >
Za)
Ahora bien, dado que los datos ya han sido recogidos, procederemos a calcular el test
estadístico, de modo que:
𝒑 − 𝒑𝒐
𝒁=
𝒑𝒐 (𝟏 − 𝒑𝒐 )
𝒏(𝒏 − 𝟏)
Botón
de Criterio de Regiones
prueba P 𝜃 aprox. P-P0 𝒑𝟎(𝟏 − 𝒑𝟎) 𝒏(𝒏 − 𝟏) z(x) críticas Resultado
X2 0,7 0,75 0,21 VERDADERO 0,05 0,5 40,5 4,4 Z <= 1,96 Acepto H0
X3 0,6 0,5 0,24 VERDADERO -0,1 0,5 40,5 -8,3 Z >= 1,96 Rechazo H0
X4 0,7 0,75 0,21 VERDADERO 0,05 0,5 40,5 4,4 Z <= 1,96 Acepto H0
X5 0,3 0,25 0,21 VERDADERO -0,05 0,5 40,5 -4,4 Z >= 1,96 Rechazo H0
X6 0,8 0,75 0,16 VERDADERO -0,05 0,4 40,5 -5,1 Z >= 1,96 Rechazo H0
X7 0,3 0,25 0,21 VERDADERO -0,05 0,5 40,5 -4,4 Z >= 1,96 Rechazo H0
III. CONCLUSIONES
Dificultades en la investigación y redefinición de la misma.
Por ejemplo, para el empleo de niveles de asociación, debíamos emplear docimaciones no-
paramétricas, para determinar el grado de independencia que poseían o no las variables.
Asimismo, para determinar la frecuencia de ciertos valores (por ejemplo para discutir
sobre el nivel de personas que poseían estudios universitarios), donde debíamos emplear
la distribución de Poisson.
Coeficientes de partición
Lo primero que podemos inferir de la muestra es que, por lo general se observa que los
coeficientes de partición están bastante cerca de 0, por lo cual existe un alto grado de
heterogeneidad. Vale decir, técnicamente que las desviaciones estándar "within" (dentro
de los grupos) son grandes.
En efecto, las particiones, esto es, la clasificación por nivel de estudio, no establecen
comportamientos diferentes para las variables en investigación (no las condicionan
prácticamente, sólo y en algunos casos, muy levemente).
Por lo tanto, no dependen los valores de las variables (edad, ingreso, búsqueda de trabajo,
etc.), de una partición específica, no dependen de la clasificación a nivel de estudios que
fue considerada en primera instancia, como determinante de un cierto comportamiento.
De la muestra y su composición
Sin embargo, esto resulta a luz de la experiencia real contradictorio. Es más, significaría
sentar la duda sobre la premisa fundamental de la teoría del capital humano. En este
sentido, atribuimos dicho comportamiento errático, al desarrollo del experimento y
muestreo aleatorio que, es bastante posible que no haya cumplido con las condiciones de
independencia e idéntica distribución. De hecho, hemos supuesto que todas tenían
comportamiento normal. Ante esta falta de rigurosidad técnica, surge la posibilidad de
obtener estos comportamientos extraños.
- A lo más el 75% de los consultados, tienen edad menor que 45 años (X2)
H0: p=0,75
H1: p=<0,75 : p: 0,7
(cola inferior)
- A lo más 50% de los consultados han estado menos de 1 vez cesante. (X3)
Unilateral.
H0: p=0,5
H1: p>=0,5 (superior)
- A lo más el 75% de los consultados, fueron cesantes por primera vez a menos de
los 27 años. (X4)
H0: p=0,75
H1: p=<0,75 (inferior)
- A lo más el 75% de los consultados, presenta un ingreso menor que 800 mil
pesos. (X6)
H0: p=0,75
H1: p>=0,75 (superior)
Nuestra hipótesis de investigación sostenía que el porcentaje de consultados que
tenía un ingreso menor que 800, era mayor que el 25%. Esto resultó ser
Verdadero. El procedimento nos indicó que la hipótesis de investigación se cumple.
Esto tiene bastante coherencia con la realidad.
I. SCRIPTS
Funciones en EXCEL